php中file_get_contents与curl性能比较分析


Posted in PHP onNovember 08, 2014

本文实例讲述了php中file_get_contents与curl性能比较分析。分享给大家供大家参考。具体如下:

在php中如果不仔细的去分析性能会发现file_get_contents与curl两个同很多共同点的,他们都可以采集文件打开文件,但是如果仔细一对比会发现很多不同点,下面我们一起来看看file_get_contents与curl区别。

PHP中fopen,file_get_contents,curl函数的区别:

1.fopen /file_get_contents 每次请求都会重新做DNS查询,并不对 DNS信息进行缓存。但是CURL会自动对DNS信息进行缓存。对同一域名下的网页或者图片的请求只需要一次DNS查询。这大大减少了DNS查询的次数。所以CURL的性能比fopen /file_get_contents 好很多。

2.fopen /file_get_contents 在请求HTTP时,使用的是http_fopen_wrapper,不会keeplive。而curl却可以。这样在多次请求多个链接时,curl效率会好一些。

3.fopen / file_get_contents 函数会受到php.ini文件中allow_url_open选项配置的影响。如果该配置关闭了,则该函数也就失效了。而curl不受该配置的影响。

4.curl 可以模拟多种请求,例如:POST数据,表单提交等,用户可以按照自己的需求来定制请求。而fopen / file_get_contents只能使用get方式获取数据。
file_get_contents 获取远程文件时会把结果都存在一个字符串中 fiels函数则会储存成数组形式

因此,我还是比较倾向于使用curl来访问远程url。Php有curl模块扩展,功能很是强大。

说了半天大家可能说性能怎么没对比呢,那我们就来看看

最近需要获取别人网站上的音乐数据。用了file_get_contents函数,但是总是会遇到获取失败的问题,尽管按照手册中的 例子设置了超时,可多数时候不会奏效:

$config['context'] = stream_context_create(array('http' => array('method' => "GET",

   'timeout' => 5//这个超时时间不稳定,经常不奏效

   )

));

这时候,看一下服务器的连接池,会发现一堆类似的错误,让我头疼万分:

file_get_contents(http://***): failed to open stream…
现在改用了curl库,写了一个函数替换:

function curl_file_get_contents($durl){

  $ch = curl_init();

  curl_setopt($ch, CURLOPT_URL, $durl);

  curl_setopt($ch, CURLOPT_TIMEOUT, 5);

  curl_setopt($ch, CURLOPT_USERAGENT, _USERAGENT_);

  curl_setopt($ch, CURLOPT_REFERER,_REFERER_);

  curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);

  $r = curl_exec($ch);

  curl_close($ch);

   return $r;

}

如此,除了真正的网络问题外,没再出现任何问题。
这是别人做过的关于curl和file_get_contents的测试:
file_get_contents抓取google.com需用秒数:
 
2.31319094
2.30374217
2.21512604
3.30553889
2.30124092
curl使用的时间:
 
0.68719101
0.64675593
0.64326
0.81983113
0.63956594

差距很大?呵呵,从我使用的经验来说,这两个工具不只是速度有差异,稳定性也相差很大。

建议对网络数据抓取稳定性要求比较高的朋友使用上面的 curl_file_get_contents函数,不但稳定速度快,还能假冒浏览器欺骗目标地址哦

再看一个实例

后续贴出了curl和file_get_contents的对比结果,这边除了curl与file_get_contents的性能对比,还包含了他们的性能对比,讲之前看下如下的结果图:

php中file_get_contents与curl性能比较分析

curl与file_get_contents性能对比PHP源代码如下:

<?php 

/** 

 

* 通过淘宝IP接口获取IP地理位置 

 

* @param string $ip 

 

* @return: string 

 

**/

function getCityCurl($ip) 

{ 

    $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip; 

    $ch = curl_init(); 

    $timeout = 5; 

    curl_setopt ($ch, CURLOPT_URL, $url); 

    curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); 

    curl_setopt ($ch, CURLOPT_CONNECTTIMEOUT, $timeout); 

    $file_contents = curl_exec($ch); 

    curl_close($ch); 

  

    $ipinfo=json_decode($file_contents); 

    if($ipinfo->code=='1'){ 

        return false; 

    } 

    $city = $ipinfo->data->region.$ipinfo->data->city; 

    return $city; 

} 

  

function getCity($ip) 

{ 

    $url="http://ip.taobao.com/service/getIpInfo.php?ip=".$ip; 

    $ipinfo=json_decode(file_get_contents($url)); 

    if($ipinfo->code=='1'){ 

        return false; 

    } 

    $city = $ipinfo->data->region.$ipinfo->data->city; 

    return $city; 

} 

  

// for file_get_contents 

$startTime=explode(' ',microtime()); 

$startTime=$startTime[0] + $startTime[1]; 

for($i=1;$i<=10;$i++) 

{ 

   echo getCity("121.207.247.202")."</br>"; 

} 

$endTime = explode(' ',microtime()); 

$endTime = $endTime[0] + $endTime[1]; 

$totalTime = $endTime - $startTime; 

echo 'file_get_contents:'.number_format($totalTime, 10, '.', "")." seconds</br>"; 

  

//for curl 

$startTime2=explode(' ',microtime()); 

$startTime2=$startTime2[0] + $startTime2[1]; 

for($i=1;$i<=10;$i++) 

{ 

   echo getCityCurl('121.207.247.202')."</br>"; 

} 

$endTime2 = explode(' ',microtime()); 

$endTime2=$endTime2[0] + $endTime2[1]; 

$totalTime2 = $endTime2 - $startTime2; 

echo "curl:".number_format($totalTime2, 10, '.', "")." seconds"; 

?>

测试访问
https://3water.com
file_get_contents速度:4.2404510975 seconds
curl速度:2.8205530643 seconds
curl比file_get_contents速度快了30%左右,最重要的是服务器负载更低.

总结

file_get_contents处理频繁小的时候,用它感觉挺好的。没什么异常。如果你的文件被1k+人处理。那么你的服务器cpu就等着高升吧。所以建议自己和大家在以后写php代码的时候使用curl库。

希望本文所述对大家的PHP程序设计有所帮助。

PHP 相关文章推荐
php xfocus防注入资料
Apr 27 PHP
php将数据库中的电话号码读取出来并生成图片
Aug 31 PHP
PHP与C#分别格式化文件大小的代码
May 14 PHP
浅析十款PHP开发框架的对比
Jul 05 PHP
php中socket通信机制实例详解
Jan 03 PHP
PHP编程入门的基本语法知识点总结
Jan 26 PHP
ThinkPHP中limit()使用方法详解
Apr 19 PHP
PHP类相关知识点实例总结
Sep 28 PHP
PHP结合Vue实现滚动底部加载效果
Dec 17 PHP
thinkPHP5框架设置404、403等http状态页面的方法
Jun 05 PHP
Yii2.0实现的批量更新及批量插入功能示例
Jan 29 PHP
PHP 枚举类型的管理与设计知识点总结
Feb 13 PHP
Fatal error: Allowed memory size of 134217728 bytes exhausted (tried to allocate 2611816 bytes)
Nov 08 #PHP
PHP中使用循环实现的金字塔图形
Nov 08 #PHP
php调用新浪短链接API的方法
Nov 08 #PHP
php禁止浏览器使用缓存页面的方法
Nov 07 #PHP
php实现把url转换迅雷thunder资源下载地址的方法
Nov 07 #PHP
php采用file_get_contents代替使用curl实例
Nov 07 #PHP
php采用curl模仿登录人人网发布动态的方法
Nov 07 #PHP
You might like
DISCUZ在win2003环境下 Unable to access ./include/common.inc.php in... 的问题终极解决方案
2011/11/21 PHP
PHP实现支持SSL连接的SMTP邮件发送类
2015/03/05 PHP
windows7配置Nginx+php+mysql的详细教程
2016/09/04 PHP
PHP foreach遍历多维数组实现方式
2016/11/16 PHP
js 无提示关闭浏览器页面的代码
2010/03/09 Javascript
jquery左右滚动焦点图banner图片鼠标经过显示上下页按钮
2013/10/11 Javascript
Javascript实现页面跳转的几种方式分享
2013/10/26 Javascript
JavaScript实现生成GUID(全局统一标识符)
2014/09/05 Javascript
javascript中通过arguments参数伪装方法重载
2014/10/08 Javascript
Javascript中String的常用方法实例分析
2015/06/13 Javascript
JS 实现 ajax 异步浏览器兼容问题
2017/01/21 Javascript
JS中静态页面实现微信分享功能
2017/02/06 Javascript
JS模拟实现ECMAScript5新增的数组方法
2017/03/20 Javascript
vue打包使用Nginx代理解决跨域问题
2018/08/27 Javascript
如何通过javaScript去除字符串两端的空白字符
2020/02/06 Javascript
vue-cli4.x创建企业级项目的方法步骤
2020/06/18 Javascript
Python实现将xml导入至excel
2015/11/20 Python
Python的几个高级语法概念浅析(lambda表达式闭包装饰器)
2016/05/28 Python
Python判断两个list是否是父子集关系的实例
2018/05/04 Python
selenium+python环境配置教程详解
2019/05/28 Python
python 返回一个列表中第二大的数方法
2019/07/09 Python
浅谈Django中view对数据库的调用方法
2019/07/18 Python
python使用tomorrow实现多线程的例子
2019/07/20 Python
CSS3实现大小不一的粒子旋转加载动画
2016/04/21 HTML / CSS
匈牙利最大的健身制造商和销售商:inSPORTline
2018/10/30 全球购物
Visual-Click葡萄牙:欧洲领先的在线眼镜商
2020/02/17 全球购物
Linux开机引导的步骤是什么
2015/10/19 面试题
毕业生求职简历的自我评价
2013/10/07 职场文书
工作迟到检讨书
2014/02/21 职场文书
2014年医学生毕业自我鉴定
2014/03/26 职场文书
五一促销活动总结
2014/07/01 职场文书
2015年评职称工作总结范文
2015/04/20 职场文书
欠款起诉书范文
2015/05/19 职场文书
Python 线程池模块之多线程操作代码
2021/05/20 Python
Oracle创建只读账号的详细步骤
2021/06/07 Oracle
Java8利用Stream对列表进行去除重复的方法详解
2022/04/14 Java/Android