PHP源码之explode使用说明


Posted in PHP onAugust 05, 2011

当我们需要将一个数组根据某个字符或字串进行分割成数组的时候,explode用的很happy,但是你知道~explode是怎么工作的么~~
首先可以肯定的是,explode也是会分配空间的,毫无疑问。

//文件1:ext/standard/string.c 
//先来看下explode的源代码 
PHP_FUNCTION(explode) 
{ 
char *str, *delim; 
int str_len = 0, delim_len = 0; 
long limit = LONG_MAX; /* No limit */ 
zval zdelim, zstr; 
if (zend_parse_parameters(ZEND_NUM_ARGS() TSRMLS_CC, "ss|l", &delim, &delim_len, &str, &str_len, &limit) == FAILURE) { 
return; 
} 
if (delim_len == 0) { 
php_error_docref(NULL TSRMLS_CC, E_WARNING, "Empty delimiter"); 
RETURN_FALSE; 
} 
//这里会开辟一个数组,用来存放分割后的数据 
array_init(return_value); 
//因为这个,我们用explode('|', '');成为了合法的 
if (str_len == 0) { 
if (limit >= 0) { 
add_next_index_stringl(return_value, "", sizeof("") - 1, 1); 
} 
return; 
} 
//下面这两个是将原字串和分割符都构建成_zval_struct 结构, 
//ZVAL_STRINGL会分配空间哦~~源代码随后贴出 
ZVAL_STRINGL(&zstr, str, str_len, 0); 
ZVAL_STRINGL(&zdelim, delim, delim_len, 0); 
//limit值是explode中允许传递的explode的第三个参数,它允许正负 
if (limit > 1) { 
php_explode(&zdelim, &zstr, return_value, limit); 
} else if (limit < 0) { 
php_explode_negative_limit(&zdelim, &zstr, return_value, limit); 
} else { 
add_index_stringl(return_value, 0, str, str_len, 1); 
} 
}

//ZVAL_STRINGL的源代码: 
//文件2:zend/zend_API.c 
#define ZVAL_STRINGL(z, s, l, duplicate) { \ 
const char *__s=(s); int __l=l; \ 
Z_STRLEN_P(z) = __l; \ 
Z_STRVAL_P(z) = (duplicate?estrndup(__s, __l):(char*)__s);\ 
Z_TYPE_P(z) = IS_STRING; \ 
} 
.... 
//estrndup才是主菜: 
//文件3:zend/zend_alloc.h 
#define estrndup(s, length) _estrndup((s), (length) ZEND_FILE_LINE_CC ZEND_FILE_LINE_EMPTY_CC) 
.... 
//_estrndup的实现: zend/zend_alloc.c 
ZEND_API char *_estrndup(const char *s, uint length ZEND_FILE_LINE_DC ZEND_FILE_LINE_ORIG_DC) 
{ 
char *p; 
p = (char *) _emalloc(length+1 ZEND_FILE_LINE_RELAY_CC ZEND_FILE_LINE_ORIG_RELAY_CC); 
if (UNEXPECTED(p == NULL)) { 
return p; 
} 
memcpy(p, s, length); //分配空间 
p[length] = 0; 
return p; 
} 
//另外在substr和strrchr strstr中用到的ZVAL_STRING也是使用了上诉的实现

下面根据explode的第三个参数limit来分析调用:条件对应的是explode中最后的三行,对limit条件的不同
注: limit在缺省的时候(没有传递),他的默认值是LONG_MAX,也就是属于分支1的情况
1、limit > 1 :
调用php_explode方法,该方法也可以在ext/standard/string.c中找到,并且是紧接着explode实现的上面出现(所以在查找本函数中调用来自本文件的方法的时候很方便,几乎无一列外都是在该函数的紧接着的上面^_^),
PHPAPI void php_explode(zval *delim, zval *str, zval *return_value, long limit) 
{ 
char *p1, *p2, *endp; 
//先得到的是源字串的末尾位置的指针 
endp = Z_STRVAL_P(str) + Z_STRLEN_P(str); 
//记录开始位置 
p1 = Z_STRVAL_P(str); 
//下面这个是获得分割符在str中的位置,可以看到在strrpos和strpos中也用到了这个方法去定位 
p2 = php_memnstr(Z_STRVAL_P(str), Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp); 
if (p2 == NULL) { 
//因为这个,所以当我们调用explode('|', 'abc');是合法的,出来的的就是array(0 => 'abc') 
add_next_index_stringl(return_value, p1, Z_STRLEN_P(str), 1); 
} else { 
//依次循环获得下一个分隔符的位置,直到结束 
do { 
//将得到的子字串(上个位置到这个位置中间的一段,第一次的时候上个位置就是开始 
add_next_index_stringl(return_value, p1, p2 - p1, 1); 
//定位到分隔符位置p2+分隔符的长度的位置 
//比如,分隔符='|', 原字串= 'ab|c', p2 = 2, 则p1=2+1=3 
p1 = p2 + Z_STRLEN_P(delim); 
} while ((p2 = php_memnstr(p1, Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp)) != NULL && 
--limit > 1); 
//将最后的一个分隔符后面的字串放到结果数组中 
//explode('|', 'avc|sdf'); => array(0 => 'avc', 1= > 'sdf') 
if (p1 <= endp) 
add_next_index_stringl(return_value, p1, endp-p1, 1); 
} 
}

2、limit < 0 :
调用php_explode_negative_limit方法
PHPAPI void php_explode_negative_limit(zval *delim, zval *str, zval *return_value, long limit) 
{ 
#define EXPLODE_ALLOC_STEP 64 
char *p1, *p2, *endp; 
endp = Z_STRVAL_P(str) + Z_STRLEN_P(str); 
p1 = Z_STRVAL_P(str); 
p2 = php_memnstr(Z_STRVAL_P(str), Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp); 
if (p2 == NULL) { 
//它这里竟然没有处理,那explode('|', 'abc', -1) 就成非法的了,获得不了任何值 
/* 
do nothing since limit <= -1, thus if only one chunk - 1 + (limit) <= 0 
by doing nothing we return empty array 
*/ 
} else { 
int allocated = EXPLODE_ALLOC_STEP, found = 0; 
long i, to_return; 
char **positions = emalloc(allocated * sizeof(char *)); 
//注意这里的positions的声明,这个数组是用来保存所有子字串的读取位置 
positions[found++] = p1; //当然起始位置还是需要保存 
//下面两个循环,第一个是循环所有在字符串中出现的分隔符位置,并保存下一个子字串读取位置起来 
do { 
if (found >= allocated) { 
allocated = found + EXPLODE_ALLOC_STEP;/* make sure we have enough memory */ 
positions = erealloc(positions, allocated*sizeof(char *)); 
} 
positions[found++] = p1 = p2 + Z_STRLEN_P(delim); 
} while ((p2 = php_memnstr(p1, Z_STRVAL_P(delim), Z_STRLEN_P(delim), endp)) != NULL); 
//这个就是从数组中开始获得返回的结果将从哪个子字串开始读 
to_return = limit + found; 
/* limit is at least -1 therefore no need of bounds checking : i will be always less than found */ 
for (i = 0;i < to_return;i++) { /* this checks also for to_return > 0 */ 
add_next_index_stringl(return_value, positions[i], 
(positions[i+1] - Z_STRLEN_P(delim)) - positions[i], 
1 
); 
} 
efree(positions);//很重要,释放内存 
} 
#undef EXPLODE_ALLOC_STEP 
}

3、limit = 1 or limit = 0 :
当所有第一和第二条件都不满足的时候,就进入的这个分支,这个分支很简单就是将源字串放到输出数组中,explode('|', 'avc|sd', 1) or explode('|', 'avc|sd', 0) 都将返回array(0 => 'avc|sd');
//add_index_stringl源代码 
//文件4:zend/zend_API.c 
ZEND_API int add_next_index_stringl(zval *arg, const char *str, uint length, int duplicate) /* {{{ */ 
{ 
zval *tmp; 
MAKE_STD_ZVAL(tmp); 
ZVAL_STRINGL(tmp, str, length, duplicate); 
return zend_hash_next_index_insert(Z_ARRVAL_P(arg), &tmp, sizeof(zval *), NULL); 
} 
//zend_hash_next_index_insert 
//zend/zend_hash.h 
#define zend_hash_next_index_insert(ht, pData, nDataSize, pDest) \ 
_zend_hash_index_update_or_next_insert(ht, 0, pData, nDataSize, pDest, HASH_NEXT_INSERT ZEND_FILE_LINE_CC) 
//zend/zend_hash.c 
///太长了~~~~不贴了

可见(不包含分配空间这些),
当limit>1的时候,效率是O(N)【N为limit值】,
当limit<0的时候,效率是O(N+M)【N为limit值, M 为分割符出现次数】,
当limit=1 or limit=0 的时候, 效率是O(1)
PHP 相关文章推荐
如何对PHP程序中的常见漏洞进行攻击(上)
Oct 09 PHP
一个漂亮的php验证码类(分享)
Aug 06 PHP
php过滤html标记属性类用法实例
Sep 23 PHP
symfony2.4的twig中date用法分析
Mar 18 PHP
PHP MySql增删改查的简单实例
Jun 21 PHP
php解决和避免form表单重复提交的几种方法
Aug 31 PHP
php中让人头疼的浮点数运算分析
Oct 10 PHP
php函数mkdir实现递归创建层级目录
Oct 27 PHP
php利用gd库为图片添加水印
Nov 09 PHP
PHP获取访问设备信息的方法示例
Feb 20 PHP
Laravel框架数据库迁移操作实例详解
Apr 06 PHP
discuz论坛更换域名,详细文件修改步骤
Dec 09 PHP
PHP在获取指定目录下的目录,在获取的目录下面再创建文件,多平台
Aug 03 #PHP
php中获取远程客户端的真实ip地址的方法
Aug 03 #PHP
用PHP实现的四则运算表达式计算实现代码
Aug 02 #PHP
PHP5 的对象赋值机制介绍
Aug 02 #PHP
利用PHP实现智能文件类型检测的实现代码
Aug 02 #PHP
10条PHP高级技巧[修正版]
Aug 02 #PHP
PHP获取url的函数代码
Aug 02 #PHP
You might like
第五章 php数组操作
2011/12/30 PHP
PHP从FLV文件获取视频预览图的方法
2015/03/12 PHP
php中实现字符串翻转的方法
2017/02/22 PHP
Laravel使用swoole实现websocket主动消息推送的方法介绍
2019/10/20 PHP
CSS JavaScript 实现菜单功能 改进版
2008/12/09 Javascript
javascript void(0)的妙用
2009/10/21 Javascript
js本身的局限性 别让javascript做太多事
2010/03/23 Javascript
JS中处理时间之setUTCMinutes()方法的使用
2015/06/12 Javascript
深入理解jquery自定义动画animate()
2016/05/24 Javascript
jQuery设置单选按钮radio选中/不可用的实例代码
2016/06/24 Javascript
如何理解jQuery中的ajaxSubmit方法
2017/03/13 Javascript
JavaScript选取(picking)和反选(rejecting)对象的属性方法
2017/08/16 Javascript
Validform验证时可以为空否则按照指定格式验证
2017/10/20 Javascript
swiper插件自定义切换箭头按钮
2017/12/28 Javascript
Vue 实现双向绑定的四种方法
2018/03/16 Javascript
微信小程序webview 脚手架使用详解
2019/07/22 Javascript
微信小程序 轮播图实现原理及优化详解
2019/09/29 Javascript
Python做文本按行去重的实现方法
2016/10/19 Python
tensorflow 使用flags定义命令行参数的方法
2018/04/23 Python
解决Python安装后pip不能用的问题
2018/06/12 Python
详解Django中六个常用的自定义装饰器
2018/07/04 Python
离线状态下在jupyter notebook中使用plotly实例
2020/04/24 Python
Banana Republic欧盟:美国都市简约风格的代表品牌
2018/05/09 全球购物
工程造价与管理专业应届生求职信
2013/11/23 职场文书
冰淇淋店创业计划书范文
2013/12/27 职场文书
总经理助理工作职责
2014/02/06 职场文书
电视购物广告词
2014/03/19 职场文书
教师自我鉴定范文
2014/03/20 职场文书
三分钟英语演讲稿
2014/04/24 职场文书
市场开发计划书
2014/05/07 职场文书
中国梦读书活动总结
2014/07/10 职场文书
节水倡议书
2015/01/19 职场文书
工会文体活动总结
2015/05/07 职场文书
SpringCloud Alibaba项目实战之nacos-server服务搭建过程
2021/06/21 Java/Android
浅谈MySQL之浅入深出页原理
2021/06/23 MySQL
十大动画制作软件,Adobe产品上榜两款,第一是行业标准软件
2022/03/18 杂记