深入理解PHP之OpCode原理详解


Posted in PHP onJune 01, 2016

本文实例讲述了PHP中OpCode的原理。分享给大家供大家参考,具体如下:

OpCode是一种PHP脚本编译后的中间语言,就像Java的ByteCode,或者.NET的MSL。 此文主要基于《 Understanding OPcode》和 网络,根据个人的理解和修改,特记录下来 :

PHP代码:

<?php
  echo "Hello World";
  $a = 1 + 1;
  echo $a;
?>

PHP执行这段代码会经过如下4个步骤:

1. Scanning (Lexing) ,将PHP代码转换为语言片段(Tokens)
2. Parsing , 将Tokens转换成简单而有意义的表达式
3. Compilation , 将表达式编译成Opocdes
4. Execution , 顺次执行Opcodes,每次一条,从而实现PHP脚本的功能。

注:现在有的Cache比如:APC ,可以使得PHP缓存Opcodes ,这样,每次有请求来临的时候,就不需要重复执行前面3步,从而能大幅的提高PHP的执行速度。

首先,Zend/zend_language_scanner.c 会根据Zend/zend_language_scanner.l(Lex文件),来对输入的 PHP代码进行词法分析,从而得到一个一个的“词”,PHP4.2+开始提供了一个函数叫token_get_all ,这个函数就可以讲一段PHP代码 Scanning成Tokens;

<?php
$tokens = token_get_all('<?php
  echo "Hello World";
  $a = 1 + 1;
  echo $a;
?>');
print_r($tokens);
?>

将会得到如下结果:

Array
(
  [0] => Array
    (
      [0] => 367
      [1] => <?php
      [2] => 1
    )
  [1] => Array
    (
      [0] => 370
      [1] =>
      [2] => 2
    )
  [2] => Array
    (
      [0] => 316
      [1] => echo
      [2] => 2
    )
  [3] => Array
    (
      [0] => 370
      [1] =>
      [2] => 2
    )
  [4] => Array
    (
      [0] => 315
      [1] => "Hello World"
      [2] => 2
    )
  [5] => ;
  [6] => Array
    (
      [0] => 370
      [1] =>
      [2] => 2
    )
  [7] => Array
    (
      [0] => 309
      [1] => $a
      [2] => 3
    )
  [8] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [9] => =
  [10] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [11] => Array
    (
      [0] => 305
      [1] => 1
      [2] => 3
    )
  [12] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [13] => +
  [14] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [15] => Array
    (
      [0] => 305
      [1] => 1
      [2] => 3
    )
  [16] => ;
  [17] => Array
    (
      [0] => 370
      [1] =>
      [2] => 3
    )
  [18] => Array
    (
      [0] => 316
      [1] => echo
      [2] => 4
    )
  [19] => Array
    (
      [0] => 370
      [1] =>
      [2] => 4
    )
  [20] => Array
    (
      [0] => 309
      [1] => $a
      [2] => 4
    )
  [21] => ;
  [22] => Array
    (
      [0] => 370
      [1] =>
      [2] => 4
    )
  [23] => Array
    (
      [0] => 369
      [1] => ?>
      [2] => 5
    )
)

返回的结果, 源码中的字符串,字符,空格,都会原样返回。每个源代码中的字符,都会出现在相应的顺序处。而,其他的比如标签,操作符,语句,都会被转换成一个包含俩部分的Array: Token ID (也就是在Zend内部的改Token的对应码,比如,T_ECHO,T_STRING),和源码中的原来的内容。

接下来,就是Parsing阶段了,Parsing首先会丢弃Tokens Array中的多于的空格,然后将剩余的Tokens转换成一个一个的简单的表达式

1. echo a constant string
2. add two numbers together
3. store the result of the prior expression to a variable
4. echo a variable

然后,就改Compilation阶段了,它会把Tokens编译成一个个op_array,每个op_arrayd包含如下5个部分:

1. Opcode数字的标识,指明了每个op_array的操作类型,比如add,echo
2. 结果存放Opcode结果
3. 操作数1给Opcode的操作数
4. 操作数2
5. 扩展值1个整形用来区别被重载的操作符

比如,PHP代码会被Parsing成:

[root@localhost html]# /usr/local/php/bin/php -dvld.active=1 hello.php
Branch analysis from position: 0
Return found
filename:    /var/www/html/hello.php
function name: (null)
number of ops: 6
compiled vars: !0 = $a
line   # op              fetch     ext return operands
-------------------------------------------------------------------------------
  2   0 ECHO                           'Hello+world'
  3   1 ADD                       ~0   1, 1
     2 ASSIGN                          !0, ~0
  4   3 ECHO                           !0
  6   4 RETURN                          1
     5* ZEND_HANDLE_EXCEPTION
Hello world2

每个操作数都是由以下两个部分组成:

a) op_type : 为IS_CONST, IS_TMP_VAR, IS_VAR, IS_UNUSED, or IS_CV

b) u,一个联合体,根据op_type的不同,分别用不同的类型保存了这个操作数的值(const)或者左值(var)

而对于var来说,每个var也不一样。  IS_TMP_VAR, 顾名思义,这个是一个临时变量 ,保存一些op_array的结果,以便接下来的op_array使用,这种的操作数的u保存着一个指向变量表的一个句柄(整数),这种操作数一般用~开头,比如~0,表示变量表的0号未知的临时变量IS_VAR 这种就是我们一般意义上的变量了,他们以$开头表示IS_CV 表示ZE2.1/PHP5.1以后的编译器使用的一种cache机制,这种变量保存着被它引用的变量的地址 ,当一个变量第一次被引用的时候,就会被CV起来,以后对这个变量的引用就不需要再次去查找active符号表了,CV变量以 ! 开头表示。

$a 变量就被优化成 !0 了。

希望本文所述对大家PHP程序设计有所帮助。

PHP 相关文章推荐
使用sockets:从新闻组中获取文章(二)
Oct 09 PHP
PHP 页面跳转到另一个页面的多种方法方法总结
Jul 07 PHP
php设计模式 Composite (组合模式)
Jun 26 PHP
php入门学习知识点四 PHP正则表达式基本应用
Jul 14 PHP
PHP Global变量定义当前页面的全局变量实现探讨
Jun 05 PHP
php禁止浏览器使用缓存页面的方法
Nov 07 PHP
php解析xml方法实例详解
May 12 PHP
PHP中Session可能会引起并发问题
Jun 26 PHP
简单了解PHP编程中数组的指针的使用
Nov 30 PHP
yii分页组件用法实例分析
Dec 28 PHP
编写PHP程序检查字符串中的中文字符个数的实例分享
Mar 17 PHP
php批量修改表结构实例
May 24 PHP
深入理解PHP中的count函数
May 31 #PHP
Ubuntu server 11.04安装memcache及php使用memcache来存储session的方法
May 31 #PHP
php中json_encode不兼容JSON_UNESCAPED_UNICODE的解决方案
May 31 #PHP
让你的PHP7更快之Hugepage用法分析
May 31 #PHP
PHP表单数据写入MySQL数据库的代码
May 31 #PHP
PHP将页面中点击数量高的链接进行高亮显示的方法
May 30 #PHP
PHP如何实现跨域
May 30 #PHP
You might like
php cookie 登录验证示例代码
2009/03/16 PHP
php中取得文件的后缀名?
2012/02/20 PHP
如何使用Gitblog和Markdown建自己的博客
2015/07/31 PHP
php如何控制用户对图片的访问 PHP禁止图片盗链
2016/03/25 PHP
PHP使用php-resque库配合Redis实现MQ消息队列的教程
2016/06/29 PHP
php实现支付宝当面付(扫码支付)功能
2018/05/30 PHP
js 上传图片预览问题
2010/12/06 Javascript
jquery $.ajax相关用法分享
2012/03/16 Javascript
Javascript Object 对象学习笔记
2014/12/17 Javascript
jquery调取json数据实现省市级联的方法
2015/01/29 Javascript
jquery预加载图片的方法
2015/05/27 Javascript
JavaScript清空数组元素的两种方法简单比较
2015/07/10 Javascript
两款JS脚本判断手机浏览器类型跳转WAP手机网站
2015/10/16 Javascript
jQuery使用ajax跨域获取数据的简单实例
2016/05/18 Javascript
JS定时器使用,定时定点,固定时刻,循环执行详解
2016/05/31 Javascript
谈谈JavaScript中浏览器兼容问题的写法小议
2016/12/17 Javascript
详解JavaScript的闭包、IIFE、apply、函数与对象
2016/12/21 Javascript
jQuery学习之DOM节点的插入方法总结
2017/01/22 Javascript
详解VueJs异步动态加载块
2017/03/09 Javascript
Vue-cli3简单使用(图文步骤)
2019/04/30 Javascript
JavaScript 实现HTML DOM增删改查操作的常见方法详解
2020/01/04 Javascript
JavaScript实现图片放大预览效果
2020/11/02 Javascript
微信小程序实现底部弹出框
2020/11/18 Javascript
[01:25]2014DOTA2国际邀请赛 zhou分析LGD比赛情况
2014/07/14 DOTA
python encode和decode的妙用
2009/09/02 Python
Python实现Linux中的du命令
2017/06/12 Python
python3实现点餐系统
2019/01/24 Python
Django CSRF跨站请求伪造防护过程解析
2019/07/31 Python
Django缓存系统实现过程解析
2019/08/02 Python
如何解决tensorflow恢复模型的特定值时出错
2020/02/06 Python
Pyspark读取parquet数据过程解析
2020/03/27 Python
django 连接数据库出现1045错误的解决方式
2020/05/14 Python
英国领先的酒类网上商城:TheDrinkShop
2017/03/16 全球购物
小学生环保标语
2014/06/13 职场文书
2014小学数学教研组工作总结
2014/12/06 职场文书
党员学习中国梦心得体会
2016/01/05 职场文书