php中file_get_contents与curl性能比较分析


Posted in PHP onNovember 08, 2014

本文实例讲述了php中file_get_contents与curl性能比较分析。分享给大家供大家参考。具体如下:

在php中如果不仔细的去分析性能会发现file_get_contents与curl两个同很多共同点的,他们都可以采集文件打开文件,但是如果仔细一对比会发现很多不同点,下面我们一起来看看file_get_contents与curl区别。

PHP中fopen,file_get_contents,curl函数的区别:

1.fopen /file_get_contents 每次请求都会重新做DNS查询,并不对 DNS信息进行缓存。但是CURL会自动对DNS信息进行缓存。对同一域名下的网页或者图片的请求只需要一次DNS查询。这大大减少了DNS查询的次数。所以CURL的性能比fopen /file_get_contents 好很多。

2.fopen /file_get_contents 在请求HTTP时,使用的是http_fopen_wrapper,不会keeplive。而curl却可以。这样在多次请求多个链接时,curl效率会好一些。

3.fopen / file_get_contents 函数会受到php.ini文件中allow_url_open选项配置的影响。如果该配置关闭了,则该函数也就失效了。而curl不受该配置的影响。

4.curl 可以模拟多种请求,例如:POST数据,表单提交等,用户可以按照自己的需求来定制请求。而fopen / file_get_contents只能使用get方式获取数据。
file_get_contents 获取远程文件时会把结果都存在一个字符串中 fiels函数则会储存成数组形式

因此,我还是比较倾向于使用curl来访问远程url。Php有curl模块扩展,功能很是强大。

说了半天大家可能说性能怎么没对比呢,那我们就来看看

最近需要获取别人网站上的音乐数据。用了file_get_contents函数,但是总是会遇到获取失败的问题,尽管按照手册中的 例子设置了超时,可多数时候不会奏效:

$config['context'] = stream_context_create(array('http' => array('method' => "GET",

   'timeout' => 5//这个超时时间不稳定,经常不奏效

   )

));

这时候,看一下服务器的连接池,会发现一堆类似的错误,让我头疼万分:

file_get_contents(http://***): failed to open stream…
现在改用了curl库,写了一个函数替换:

function curl_file_get_contents($durl){

  $ch = curl_init();

  curl_setopt($ch, CURLOPT_URL, $durl);

  curl_setopt($ch, CURLOPT_TIMEOUT, 5);

  curl_setopt($ch, CURLOPT_USERAGENT, _USERAGENT_);

  curl_setopt($ch, CURLOPT_REFERER,_REFERER_);

  curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

  $r = curl_exec($ch);

  curl_close($ch);

   return $r;

}

如此,除了真正的网络问题外,没再出现任何问题。
这是别人做过的关于curl和file_get_contents的测试:
file_get_contents抓取google.com需用秒数:
 
2.31319094
2.30374217
2.21512604
3.30553889
2.30124092
curl使用的时间:
 
0.68719101
0.64675593
0.64326
0.81983113
0.63956594

差距很大?呵呵,从我使用的经验来说,这两个工具不只是速度有差异,稳定性也相差很大。

建议对网络数据抓取稳定性要求比较高的朋友使用上面的 curl_file_get_contents函数,不但稳定速度快,还能假冒浏览器欺骗目标地址哦

再看一个实例

后续贴出了curl和file_get_contents的对比结果,这边除了curl与file_get_contents的性能对比,还包含了他们的性能对比,讲之前看下如下的结果图:

php中file_get_contents与curl性能比较分析

curl与file_get_contents性能对比PHP源代码如下:

<?php 

/** 

 

* 通过淘宝IP接口获取IP地理位置 

 

* @param string $ip 

 

* @return: string 

 

**/

function getCityCurl($ip) 

{ 

    $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip; 

    $ch = curl_init(); 

    $timeout = 5; 

    curl_setopt ($ch, CURLOPT_URL, $url); 

    curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); 

    curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout); 

    $file_contents = curl_exec($ch); 

    curl_close($ch); 

  

    $ipinfo=json_decode($file_contents); 

    if($ipinfo->code=='1'){ 

        return false; 

    } 

    $city = $ipinfo->data->region.$ipinfo->data->city; 

    return $city; 

} 

  

function getCity($ip) 

{ 

    $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip; 

    $ipinfo=json_decode(file_get_contents($url)); 

    if($ipinfo->code=='1'){ 

        return false; 

    } 

    $city = $ipinfo->data->region.$ipinfo->data->city; 

    return $city; 

} 

  

// for file_get_contents 

$startTime=explode(' ',microtime()); 

$startTime=$startTime[0] + $startTime[1]; 

for($i=1;$i<=10;$i++) 

{ 

   echo getCity("121.207.247.202")."</br>"; 

} 

$endTime = explode(' ',microtime()); 

$endTime = $endTime[0] + $endTime[1]; 

$totalTime = $endTime - $startTime; 

echo 'file_get_contents:'.number_format($totalTime, 10, '.', "")." seconds</br>"; 

  

//for curl 

$startTime2=explode(' ',microtime()); 

$startTime2=$startTime2[0] + $startTime2[1]; 

for($i=1;$i<=10;$i++) 

{ 

   echo getCityCurl('121.207.247.202')."</br>"; 

} 

$endTime2 = explode(' ',microtime()); 

$endTime2=$endTime2[0] + $endTime2[1]; 

$totalTime2 = $endTime2 - $startTime2; 

echo "curl:".number_format($totalTime2, 10, '.', "")." seconds"; 

?>

测试访问
https://3water.com
file_get_contents速度:4.2404510975 seconds
curl速度:2.8205530643 seconds
curl比file_get_contents速度快了30%左右,最重要的是服务器负载更低.

总结

file_get_contents处理频繁小的时候,用它感觉挺好的。没什么异常。如果你的文件被1k+人处理。那么你的服务器cpu就等着高升吧。所以建议自己和大家在以后写php代码的时候使用curl库。

希望本文所述对大家的PHP程序设计有所帮助。

PHP 相关文章推荐
解决phpmyadmin 乱码,支持gb2312和utf-8
Nov 20 PHP
php提示无法加载或mcrypt没有找到 PHP 扩展 mbstring解决办法
Mar 27 PHP
PHP实现通过中文字符比率来判断垃圾评论的方法
Oct 20 PHP
php调用新浪短链接API的方法
Nov 08 PHP
php修改文件上传限制方法汇总
Apr 07 PHP
php简单判断两个字符串是否相等的方法
Jul 13 PHP
教大家制作简单的php日历
Nov 17 PHP
PHP树-不需要递归的实现方法
Jun 21 PHP
php微信公众平台开发(三)订阅事件处理
Dec 06 PHP
PHP封装函数实现生成随机的字符串验证码
Jan 24 PHP
PHP mongodb操作类定义与用法示例【适合mongodb2.x和mongodb3.x】
Jun 16 PHP
php多进程并发编程防止出现僵尸进程的方法分析
Feb 28 PHP
Fatal error: Allowed memory size of 134217728 bytes exhausted (tried to allocate 2611816 bytes)
Nov 08 #PHP
PHP中使用循环实现的金字塔图形
Nov 08 #PHP
php调用新浪短链接API的方法
Nov 08 #PHP
php禁止浏览器使用缓存页面的方法
Nov 07 #PHP
php实现把url转换迅雷thunder资源下载地址的方法
Nov 07 #PHP
php采用file_get_contents代替使用curl实例
Nov 07 #PHP
php采用curl模仿登录人人网发布动态的方法
Nov 07 #PHP
You might like
PHP中调用JAVA
2006/10/09 PHP
初级的用php写的采集程序
2007/03/16 PHP
php 短链接算法收集与分析
2011/12/30 PHP
如何取得中文字符串中出现次数最多的子串
2013/08/08 PHP
zf框架的数据库追踪器使用示例
2014/03/13 PHP
PHP获取文件相对路径的方法
2015/02/26 PHP
PHP加密解密类实例代码
2016/07/20 PHP
一些Javascript的IE和Firefox(火狐)兼容性的问题总结及常用例子
2009/05/21 Javascript
jquery text,radio,checkbox,select操作实现代码
2009/07/09 Javascript
firefox下对ajax的onreadystatechange的支持情况分析
2009/12/14 Javascript
JavaScript的继承的封装介绍
2013/10/15 Javascript
jQuery操作JSON的CRUD用法实例
2015/02/25 Javascript
JQuery查找DOM节点的方法
2015/06/11 Javascript
使用Meteor配合Node.js编写实时聊天应用的范例
2015/06/23 Javascript
jQuery获取DOM节点实例分析(2种方式)
2015/12/15 Javascript
非常棒的jQuery图片轮播效果
2016/04/17 Javascript
Vue.js快速入门教程
2016/09/07 Javascript
谈谈对JavaScript原生拖放的深入理解
2016/09/20 Javascript
JavaScript实现使用Canvas绘制图形的基本教程
2016/10/27 Javascript
Vue 2中ref属性的使用方法及注意事项
2017/06/12 Javascript
jQuery查找和过滤_动力节点节点Java学院整理
2017/07/04 jQuery
JavaScript门面模式详解
2017/10/19 Javascript
vue实现城市列表选择功能
2018/07/16 Javascript
element-ui表格合并span-method的实现方法
2019/05/21 Javascript
JS数组Object.keys()方法的使用示例
2019/06/05 Javascript
vuex actions异步修改状态的实例详解
2019/11/06 Javascript
python实现监控linux性能及进程消耗性能的方法
2014/07/25 Python
使用Python的PEAK来适配协议的教程
2015/04/14 Python
如何通过python实现全排列
2020/02/11 Python
Python要如何实现列表排序的几种方法
2020/02/21 Python
python3.8动态人脸识别的实现示例
2020/09/21 Python
澳大利亚旅游网站:Lastminute
2017/08/07 全球购物
Linux如何为某个操作添加别名
2013/03/01 面试题
大学生逃课检讨书
2015/05/04 职场文书
Mac M1安装mnmp (Mac+Nginx+MySQL+PHP) 开发环境
2021/03/29 PHP
python scipy 稀疏矩阵的使用说明
2021/05/26 Python