理解php原理的opcodes(操作码)


Posted in PHP onOctober 26, 2010

Opcondes是一种php脚本编译后的中间语言,就像Java的Byte Code,或者.NET 的MSL 。(都没了解过~)

举个文中的例子

<?php 
echo "Hello World"; 

$a = 1 + 1; 

 echo $a; 

?>

PHP执行这段代码会经过如下4个步骤(确切的来说,应该是PHP的语言引擎Zend)
1.Scanning(Lexing) (扫描),将PHP代码转换为语言片段(Tokens) 

2.Parsing(语法分析), 将Tokens转换成简单而有意义的表达式 

3.Compilation(编译), 将表达式编译成Opocdes 

4.Execution(执行编译后的结果), 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能。

其中他还提到一句:“现在有的Cache比如APC,可以使得PHP缓存住Opcodes,这样,每次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 ” 这可能是php执行速度比较快的原因之一吧~

那什么是Lexing? 学过编译原理的同学都应该对编译原理中的词法分析步骤有所了解,Lex就是一个词法分析的依据表。 Zend/zend_language_scanner.c会根据Zend/zend_language_scanner.l(Lex文件),来输入的 PHP代码进行词法分析,从而得到一个一个的“词”,PHP4.2开始提供了一个函数叫token_get_all,这个函数就可以讲一段PHP代码 Scanning成Tokens;
如果用这个函数处理我们开头提到的PHP代码,将会得到如下结果:

Array 
( 
[0] => Array 
( 
[0] => 367 
[1] => Array 
( 
[0] => 316 
[1] => echo 
) 
[2] => Array 
( 
[0] => 370 
[1] => 
) 
[3] => Array 
( 
[0] => 315 
[1] => "Hello World" 
) 
[4] => ; 
[5] => Array 
( 
[0] => 370 
[1] => 
) 
[6] => = 
[7] => Array 
( 
[0] => 370 
[1] => 
) 
[8] => Array 
( 
[0] => 305 
[1] => 1 
) 
[9] => Array 
( 
[0] => 370 
[1] => 
) 
[10] => + 
[11] => Array 
( 
[0] => 370 
[1] => 
) 
[12] => Array 
( 
[0] => 305 
[1] => 1 
) 
[13] => ; 
[14] => Array 
( 
[0] => 370 
[1] => 
) 
[15] => Array 
( 
[0] => 316 
[1] => echo 
) 
[16] => Array 
( 
[0] => 370 
[1] => 
) 
[17] => ; 
)

分析这个返回结果我们可以发现,源码中的字符串,字符,空格,都会原样返回。每个源代码中的字符,都会出现在相应的顺序处。而,其他的比如标签,操作符, 语句,都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码,比如,T_ECHO,T_STRING),和源码中的原来的内容。
接下来,就是Parsing阶段了,Parsing首先会丢弃Tokens Array中的多于的空格,然后将剩余的Tokens转换成一个一个的简单的表达式
1.echo a constant string 
2.add two numbers together 
3.store the result of the prior expression to a variable 
4.echo a variable

然后就改Compilation阶段了,它会把Tokens编译成一个个op_array, 每个op_arrayd包含如下5个部分:
1.Opcode数字的标识,指明了每个op_array的操作类型,比如add , echo 
2.结果 存放Opcode结果 
3.操作数1 给Opcode的操作数 
4.操作数2 
5.扩展值 1个整形用来区别被重载的操作符

比如,我们的PHP代码会被Parsing成:
* ZEND_ECHO 'Hello World' 
* ZEND_ADD ~0 1 1 
* ZEND_ASSIGN !0 ~0 
* ZEND_ECHO !0

呵呵,你可能会问了,我们的$a去那里了?

恩,这个要介绍操作数了,每个操作数都是由以下俩个部分组成:

a)op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CVb)u,一个联合体,根据op_type的不同,分别用不同的类型保存了这个操作数的值(const)或者左值(var)而对于var来说,每个var也不一样

IS_TMP_VAR, 顾名思义,这个是一个临时变量,保存一些op_array的结果,以便接下来的op_array使用,这种的操作数的u保存着一个指向变量表的一个句柄(整数),这种操作数一般用~开头,比如~0,表示变量表的0号未知的临时变量

IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示

IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被它引用的变量的地址,当一个变量第一次被引用的时候,就会被CV起来,以后对这个变量的引用就不需要再次去查找active符号表了,CV变量以!开头表示。

这么看来,我们的$a被优化成!0了。
总结:

1.php的执行顺序是: -> php程序

-> 被Scanning(扫描转换为Tokens(语言片段))

-> 被Parsing(语法分析,将Tokens转换成简单而有意义的表达式)

-> Compilation(编译,将表达式编译成Opocdes(操作码))
-> Execution(顺序执行编译后的结果)
2. APC(Alternative PHP Cache)的缓存机制可以缓存住Opcodes,这样,下次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。 这可能是php执行速度比较快的原因之一

补充:
apc,zend optimize是之所以能够加速php
就是因为他可以缓存opcode
并不是zend引擎本身自带的功能
zend引擎默认是一个轮回中任何一项都要走的

PHP 相关文章推荐
用PHP编写PDF文档生成器
Oct 09 PHP
php中的实现trim函数代码
Mar 19 PHP
php5数字型字符串加解密代码
Apr 24 PHP
php urlencode()与urldecode()函数字符编码原理详解
Dec 06 PHP
关于PHP语言构造器介绍
Jul 08 PHP
PHPMailer发送HTML内容、带附件的邮件实例
Jul 01 PHP
php自动获取关键字的方法
Jan 06 PHP
PHP开发框架laravel安装与配置教程
Mar 13 PHP
PHP面试题之文件目录操作
Oct 15 PHP
PHP简单预防sql注入的方法
Sep 27 PHP
php的socket编程详解
Nov 20 PHP
thinkPHP5框架实现基于ajax的分页功能示例
Jun 12 PHP
PHP下常用正则表达式整理
Oct 26 #PHP
PHP编程最快明白(第一讲 软件环境和准备工作)
Oct 25 #PHP
微盾PHP脚本加密专家php解密算法
Sep 13 #PHP
smarty中先strip_tags过滤html标签后truncate截取文章运用
Oct 25 #PHP
php正则过滤html标签、空格、换行符的代码(附说明)
Oct 25 #PHP
PHP 强制下载文件代码
Oct 24 #PHP
php下网站防IP攻击代码,超级实用
Oct 24 #PHP
You might like
如何在WIN2K下安装PHP4.04
2006/10/09 PHP
php把大写命名转换成下划线分割命名
2015/04/27 PHP
php实现分页功能的详细实例方法
2019/09/29 PHP
关于PhpStorm设置点击编辑文件自动定位源文件的实现方式
2020/12/30 PHP
slice函数的用法 之不错的应用
2006/12/29 Javascript
JavaScript中的对象化编程
2008/01/16 Javascript
javascript 面向对象编程  function是方法(函数)
2009/09/17 Javascript
JS 动态获取节点代码innerHTML分析 [IE,FF]
2009/11/30 Javascript
jquery ready函数源代码研究
2009/12/06 Javascript
javascript两段代码,两个小技巧
2010/02/04 Javascript
dojo学习第二天 ajax异步请求之绑定列表
2011/08/29 Javascript
jQuery代码优化 遍历篇
2011/11/01 Javascript
禁止你的左键复制实用技巧
2013/01/04 Javascript
javascript实现列表滚动的方法
2015/07/30 Javascript
微信小程序自定义键盘 内部虚拟支付
2018/12/20 Javascript
Vue render函数实战之实现tabs选项卡组件
2019/04/22 Javascript
如何实现小程序tab栏下划线动画效果
2019/05/18 Javascript
node.js Promise对象的使用方法实例分析
2019/12/26 Javascript
Python松散正则表达式用法分析
2016/04/29 Python
Python实现简单http服务器
2018/04/12 Python
Python自然语言处理 NLTK 库用法入门教程【经典】
2018/06/26 Python
将tensorflow的ckpt模型存储为npy的实例
2018/07/09 Python
python实现对图片进行旋转,放缩,裁剪的功能
2019/08/07 Python
8种常用的Python工具
2020/08/05 Python
python ssh 执行shell命令的示例
2020/09/29 Python
HTML5打开本地app应用的方法
2016/03/31 HTML / CSS
PHP经典面试题
2016/09/03 面试题
中间件分为哪几类
2016/09/18 面试题
市场营销毕业生自荐信
2013/11/23 职场文书
《哪吒闹海》教学反思
2014/02/28 职场文书
美德少年事迹材料500字
2014/08/19 职场文书
庆祝教师节演讲稿
2014/09/03 职场文书
小学生思想品德评语
2014/12/31 职场文书
总经理致辞
2015/07/29 职场文书
导游词之丽江普济寺
2019/10/22 职场文书
详解Python类和对象内容
2021/06/22 Python