php获取网页请求状态程序示例


Posted in PHP onJune 17, 2014

对于网页返回状态代码一般情况下我们都会去查自己网站状态码是不是200或错误页面是不是404代码,并且多数情况下我们的查看方法就是使用站长工具或ff浏览器等来查看,极少有人想到自己写一个查看状态代码的功能。

本文就此简述php获取网页请求状态程序示例如下:

方法一,使用 fsockopen
(不推荐使用curl_getinfo!)

function get_http_code($url="localhost", $port=80, $fsock_timeout=10){
    set_time_limit(0);
    ignore_user_abort(true);    // 记录开始时间
    list($usec, $sec) = explode(" ", microtime(true));
    $timer['start'] = (float)$usec + (float)$sec;
    // 校验URL
    if(!preg_match("/^https?:\/\//i", $url)){
        $url = "http://".$url;
    }
    // 支持HTTPS
    if(preg_match("/^https:\/\//i", $url)){
        $port = 443;
    }
    // 解析URL
    $urlinfo = parse_url($url);
    if(empty($urlinfo['path'])){
        $urlinfo['path'] = '/';
    }
    $host = $urlinfo['host'];
    $uri = $urlinfo['path'] . (empty($urlinfo['query'])?'':$urlinfo['query']);
    // 通过fsock打开连接
    if(!$fp = fsockopen($host, $port, $errno, $error, $fsock_timeout)){
        list($usec, $sec) = explode(" ", microtime(true));
        $timer['end'] = (float)$usec + (float)$sec;
        $usetime = (float)$timer['end'] - (float)$timer['start'];
        return array('code'=>-1, 'usetime'=>$usetime);
    }
    // 提交请求
    $status = socket_get_status($fp);
    $out = "GET {$uri} HTTP/1.1\r\n";
    $out .= "Host: {$host}\r\n";
    $out .= "Connection: Close\r\n\r\n";
    $write = fwrite($fp, $out);
    if(!$write){
        list($usec, $sec) = explode(" ", microtime(true));
        $timer['end'] = (float)$usec + (float)$sec;
        $usetime = (float)$timer['end'] - (float)$timer['start'];
        return array('code'=>-2, 'usetime'=>$usetime);
    }
    $ret = fgets($fp, 1024);
    preg_match("/http\/\d\.\d\s(\d+)/i", $ret, $m);
    $code = $m[1];
    fclose($fp);
    list($usec, $sec) = explode(" ", microtime(true));
    $timer['end'] = (float)$usec + (float)$sec;
    $usetime = (float)$timer['end'] - (float)$timer['start'];
    return array('code'=>$code, 'usetime'=>$usetime);
}

file_get_contents 是 fsockopen 功能的简单打包,效率稍低些,但是抓取成功率很高,所以在 snoopy 出问题的时候我一般拿他来用。5.0.0 添加了对 context 的支持,有了context,他也可以发送 header 信息,自定义用户 agent, referer, cookies 都不在话下。5.1.0 添加了 offset 和 maxlen 参数,可以只读文件的一部分内容。

方法二,使用snoopy.class.php

Snoopy是一个php类,用来模拟浏览器的功能,可以获取网页内容,发送表单。

$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'https://3water.com/');
curl_setopt($ch, CURLOPT_RANGE, '0-500');
curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$result = curl_exec($ch);
curl_close($ch);
echo $result;
$writefn = function($ch, $chunk) {
  static $data='';
  static $limit = 500; // 500 bytes, it's only a test
  $len = strlen($data) + strlen($chunk);
  if ($len >= $limit ) {
    $data .= substr($chunk, 0, $limit-strlen($data));
    echo strlen($data) , ' ', $data;
    return -1;
  }
  $data .= $chunk;
  return strlen($chunk);
};
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL, 'https://3water.com/');
curl_setopt($ch, CURLOPT_RANGE, '0-500');
curl_setopt($ch, CURLOPT_BINARYTRANSFER, 1);
curl_setopt($ch, CURLOPT_WRITEFUNCTION, $writefn);
$result = curl_exec($ch);
curl_close($ch);

一些常见的状态码为:
200 - 服务器成功返回网页
404 - 请求的网页不存在
503 - 服务器超时
301 - 页面重定向

PHP 相关文章推荐
ThinkPHP采用模块和操作分析
Apr 18 PHP
下拉列表多级联动dropDownList示例代码
Jun 27 PHP
php颜色转换函数hex-rgb(将十六进制格式转成十进制格式)
Sep 23 PHP
PHP实现定时执行任务的方法
Oct 05 PHP
php跨站攻击实例分析
Oct 28 PHP
WordPress中访客登陆实现邮件提醒的PHP脚本实例分享
Dec 14 PHP
详解WordPress开发中的get_post与get_posts函数使用
Jan 04 PHP
php打乱数组二维数组多维数组的简单实例
Jun 17 PHP
ThinkPHP 模板引擎使用详解
May 07 PHP
Laravel使用消息队列需要注意的一些问题
Dec 13 PHP
PHP中单例模式的使用场景与使用方法讲解
Mar 18 PHP
php操作redis常见方法示例【key与value操作】
Apr 14 PHP
php版淘宝网查询商品接口代码示例
Jun 17 #PHP
php+ajax实现图片文件上传功能实例
Jun 17 #PHP
PHP实现删除非站内外部链接实例代码
Jun 17 #PHP
php的SimpleXML方法读写XML接口文件实例解析
Jun 16 #PHP
Thinkphp中Create方法深入探究
Jun 16 #PHP
ThinkPHP中的关联模型注意点
Jun 16 #PHP
用PHP代替JS玩转DOM的思路及示例代码
Jun 15 #PHP
You might like
PHP面向对象法则
2012/02/23 PHP
php excel reader读取excel内容存入数据库实现代码
2012/12/06 PHP
php限制上传文件类型并保存上传文件的方法
2015/03/13 PHP
php实现mysql数据库分表分段备份
2015/06/18 PHP
返回对象在当前级别中是第几个元素的实现代码
2011/01/20 Javascript
Extjs显示从数据库取出时间转换JSON后的出现问题
2012/11/20 Javascript
javascript获取xml节点的最大值(实现代码)
2013/12/11 Javascript
JS实现div居中示例
2014/04/17 Javascript
js实现按钮加背景图片常用方法
2014/11/01 Javascript
如何编写高质量JS代码(续)
2015/02/25 Javascript
自定义百度分享的分享按钮
2015/03/18 Javascript
jquery实现隐藏在左侧的弹性弹出菜单效果
2015/09/18 Javascript
asp知识整理笔记3(问答模式)
2015/09/27 Javascript
Bootstrap 粘页脚效果
2016/03/28 Javascript
Bootstrap3 内联单选和多选框
2016/12/29 Javascript
Angular 开发学习之Angular CLI的安装使用
2017/12/31 Javascript
JS实现基于拖拽改变物体大小的方法
2018/01/23 Javascript
NestJs 静态目录配置详解
2019/03/12 Javascript
Element ui 下拉多选时新增一个选择所有的选项
2019/08/21 Javascript
vue实现tab栏点击高亮效果
2020/08/19 Javascript
python 字符串格式化代码
2013/03/17 Python
tornado框架blog模块分析与使用
2013/11/21 Python
浅析python3中的os.path.dirname(__file__)的使用
2018/08/30 Python
python字典排序的方法
2019/10/12 Python
python 伯努利分布详解
2020/02/25 Python
python 解决selenium 中的 .clear()方法失效问题
2020/09/01 Python
使用phonegap查找联系人的实现方法
2017/03/31 HTML / CSS
女大学生个人求职信
2013/12/09 职场文书
土建资料员岗位职责
2014/01/04 职场文书
竞选大队委员演讲稿
2014/04/28 职场文书
高中教师个人工作总结
2015/02/10 职场文书
2015年乡镇工作总结范文
2015/04/22 职场文书
小学生教师节广播稿
2015/08/19 职场文书
正确使用MySQL update语句
2021/05/26 MySQL
php png失真的原因及解决办法
2021/11/17 PHP
如何利用python实现列表嵌套字典取值
2022/06/10 Python