理解php原理的opcodes(操作码)


Posted in PHP onOctober 26, 2010

Opcondes是一种php脚本编译后的中间语言,就像Java的Byte Code,或者.NET 的MSL 。(都没了解过~)

举个文中的例子

<?php 
echo "Hello World"; 

$a = 1 + 1; 

 echo $a; 

?>

PHP执行这段代码会经过如下4个步骤(确切的来说,应该是PHP的语言引擎Zend)
1.Scanning(Lexing) (扫描),将PHP代码转换为语言片段(Tokens) 

2.Parsing(语法分析), 将Tokens转换成简单而有意义的表达式 

3.Compilation(编译), 将表达式编译成Opocdes 

4.Execution(执行编译后的结果), 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能。

其中他还提到一句:“现在有的Cache比如APC,可以使得PHP缓存住Opcodes,这样,每次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 ” 这可能是php执行速度比较快的原因之一吧~

那什么是Lexing? 学过编译原理的同学都应该对编译原理中的词法分析步骤有所了解,Lex就是一个词法分析的依据表。 Zend/zend_language_scanner.c会根据Zend/zend_language_scanner.l(Lex文件),来输入的 PHP代码进行词法分析,从而得到一个一个的“词”,PHP4.2开始提供了一个函数叫token_get_all,这个函数就可以讲一段PHP代码 Scanning成Tokens;
如果用这个函数处理我们开头提到的PHP代码,将会得到如下结果:

Array 
( 
[0] => Array 
( 
[0] => 367 
[1] => Array 
( 
[0] => 316 
[1] => echo 
) 
[2] => Array 
( 
[0] => 370 
[1] => 
) 
[3] => Array 
( 
[0] => 315 
[1] => "Hello World" 
) 
[4] => ; 
[5] => Array 
( 
[0] => 370 
[1] => 
) 
[6] => = 
[7] => Array 
( 
[0] => 370 
[1] => 
) 
[8] => Array 
( 
[0] => 305 
[1] => 1 
) 
[9] => Array 
( 
[0] => 370 
[1] => 
) 
[10] => + 
[11] => Array 
( 
[0] => 370 
[1] => 
) 
[12] => Array 
( 
[0] => 305 
[1] => 1 
) 
[13] => ; 
[14] => Array 
( 
[0] => 370 
[1] => 
) 
[15] => Array 
( 
[0] => 316 
[1] => echo 
) 
[16] => Array 
( 
[0] => 370 
[1] => 
) 
[17] => ; 
)

分析这个返回结果我们可以发现,源码中的字符串,字符,空格,都会原样返回。每个源代码中的字符,都会出现在相应的顺序处。而,其他的比如标签,操作符, 语句,都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码,比如,T_ECHO,T_STRING),和源码中的原来的内容。
接下来,就是Parsing阶段了,Parsing首先会丢弃Tokens Array中的多于的空格,然后将剩余的Tokens转换成一个一个的简单的表达式
1.echo a constant string 
2.add two numbers together 
3.store the result of the prior expression to a variable 
4.echo a variable

然后就改Compilation阶段了,它会把Tokens编译成一个个op_array, 每个op_arrayd包含如下5个部分:
1.Opcode数字的标识,指明了每个op_array的操作类型,比如add , echo 
2.结果 存放Opcode结果 
3.操作数1 给Opcode的操作数 
4.操作数2 
5.扩展值 1个整形用来区别被重载的操作符

比如,我们的PHP代码会被Parsing成:
* ZEND_ECHO 'Hello World' 
* ZEND_ADD ~0 1 1 
* ZEND_ASSIGN !0 ~0 
* ZEND_ECHO !0

呵呵,你可能会问了,我们的$a去那里了?

恩,这个要介绍操作数了,每个操作数都是由以下俩个部分组成:

a)op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CVb)u,一个联合体,根据op_type的不同,分别用不同的类型保存了这个操作数的值(const)或者左值(var)而对于var来说,每个var也不一样

IS_TMP_VAR, 顾名思义,这个是一个临时变量,保存一些op_array的结果,以便接下来的op_array使用,这种的操作数的u保存着一个指向变量表的一个句柄(整数),这种操作数一般用~开头,比如~0,表示变量表的0号未知的临时变量

IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示

IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被它引用的变量的地址,当一个变量第一次被引用的时候,就会被CV起来,以后对这个变量的引用就不需要再次去查找active符号表了,CV变量以!开头表示。

这么看来,我们的$a被优化成!0了。
总结:

1.php的执行顺序是: -> php程序

-> 被Scanning(扫描转换为Tokens(语言片段))

-> 被Parsing(语法分析,将Tokens转换成简单而有意义的表达式)

-> Compilation(编译,将表达式编译成Opocdes(操作码))
-> Execution(顺序执行编译后的结果)
2. APC(Alternative PHP Cache)的缓存机制可以缓存住Opcodes,这样,下次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 这可能是php执行速度比较快的原因之一

补充:
apc,zend optimize是之所以能够加速php
就是因为他可以缓存opcode
并不是zend引擎本身自带的功能
zend引擎默认是一个轮回中任何一项都要走的

PHP 相关文章推荐
PHP获取表单所有复选框的值的方法
Aug 28 PHP
ThinkPHP做文字水印时提示call an undefined function exif_imagetype()解决方法
Oct 30 PHP
PHP模拟asp中response类实现方法
Aug 08 PHP
微信公众平台开发之天气预报功能
Aug 31 PHP
ThinkPHP中limit()使用方法详解
Apr 19 PHP
php使用get_class_methods()函数获取分类的方法
Jul 20 PHP
PHP在innodb引擎下快速代建全文搜索功能简明教程【基于xunsearch】
Oct 14 PHP
php+ajax+json 详解及实例代码
Dec 12 PHP
php实现的中文分词类完整实例
Feb 06 PHP
PHP简单装饰器模式实现与用法示例
Jun 22 PHP
PHP goto语句用法实例
Aug 06 PHP
php查看一个变量的占用内存的实例代码
Mar 29 PHP
PHP下常用正则表达式整理
Oct 26 #PHP
PHP编程最快明白(第一讲 软件环境和准备工作)
Oct 25 #PHP
微盾PHP脚本加密专家php解密算法
Sep 13 #PHP
smarty中先strip_tags过滤html标签后truncate截取文章运用
Oct 25 #PHP
php正则过滤html标签、空格、换行符的代码(附说明)
Oct 25 #PHP
PHP 强制下载文件代码
Oct 24 #PHP
php下网站防IP攻击代码,超级实用
Oct 24 #PHP
You might like
用PHP编写PDF文档生成器
2006/10/09 PHP
php生成文件
2007/01/15 PHP
海河写的 Discuz论坛帖子调用js的php代码
2007/08/23 PHP
php面向对象全攻略 (六)__set() __get() __isset() __unset()的用法
2009/09/30 PHP
同台服务器使用缓存APC效率高于Memcached的演示代码
2010/02/16 PHP
一些需要禁用的PHP危险函数(disable_functions)
2012/02/23 PHP
CodeIgniter框架数据库事务处理的设计缺陷和解决方案
2014/07/25 PHP
PHP面向对象程序设计之接口用法
2014/08/20 PHP
PHP+jquery实时显示网站在线人数的方法
2015/01/04 PHP
PHP+jQuery+Ajax实现分页效果 jPaginate插件的应用
2015/10/09 PHP
javascript FormatNumber函数实现方法
2008/12/30 Javascript
一个tab标签切换效果代码
2009/03/27 Javascript
JS对HTML标签select的获取、添加、删除操作
2013/10/17 Javascript
利用jQuery及AJAX技术定时更新GridView的某一列数据
2015/12/04 Javascript
基于jQuery实现歌词滚动版音乐播放器的代码
2016/09/17 Javascript
完美的js div拖拽实例代码
2016/09/24 Javascript
jQuery如何防止Ajax重复提交
2016/10/14 Javascript
JQuery统计input和textarea文字输入数量(代码分享)
2016/12/29 Javascript
javascript闭包功能与用法实例分析
2017/04/06 Javascript
ES6中箭头函数的定义与调用方式详解
2017/06/02 Javascript
js实现动态增加文件域表单功能
2018/10/22 Javascript
javascript异步处理与Jquery deferred对象用法总结
2019/06/04 jQuery
JS画布动态实现黑客帝国背景效果
2020/11/08 Javascript
js前端传json后台接收‘‘被转为quot的问题解决
2020/11/12 Javascript
python微信公众号之关注公众号自动回复
2018/10/25 Python
python将pandas datarame保存为txt文件的实例
2019/02/12 Python
Python3内置模块random随机方法小结
2019/07/13 Python
基于python分析你的上网行为 看看你平时上网都在干嘛
2019/08/13 Python
淘宝秒杀python脚本 扫码登录版
2019/09/19 Python
Python基于numpy模块实现回归预测
2020/05/14 Python
Linux的文件类型
2016/07/05 面试题
平面设计的岗位职责
2013/11/08 职场文书
超市仓管员岗位职责
2014/04/07 职场文书
2015年公务员转正工作总结
2015/04/24 职场文书
升学宴来宾致辞
2015/07/27 职场文书
win10如何开启ahci模式?win10开启ahci模式详细操作教程
2022/07/23 数码科技