php基于Snoopy解析网页html的方法


Posted in PHP onJuly 09, 2015

本文实例讲述了php基于Snoopy解析网页html的方法。分享给大家供大家参考。具体实现方法如下:

set_time_limit(0);
$user = array('20517', '20518');
header("content-Type: text/html; charset=utf-8");
require_once './Snoopy.php';
$snoopy = new Snoopy();
//$uri = 'http://www.juzimi.com/meitumeiju';
$uri = 'http://www.juzimi.com/meitumeiju?page=1';
$snoopy->fetch($uri);
$con = $snoopy->getResults();
$doc = new DOMDocument();
$doc->loadHTML($con);
/* make a result array ... */
$result = [];
/* go through all nodes which have class="baby" ... */
$i = 0;
foreach( ( new DOMXPath( $doc ) )->query( '//*[@id="bdshare"]' ) as $element ) {
  $row = $doc->saveHTML($element);
  $start = stripos($row, '{');
  $end = stripos($row, '}');
  $len = $end - $start + 1;
  $json = substr($row, $start, $len);
  $json = str_replace("'", '"', $json);
  $obj = json_decode($json);
  $pic = $obj->pic;
  $desc = $obj->desc;
  $filename = '/Uploads/meiju/card' . date('ymdhis') . $i . '.png';
  $file = '/alidata/www/test' . $filename;
  $image = file_get_contents($pic);
  file_put_contents($file, $image);
}

希望本文所述对大家的php程序设计有所帮助。

PHP 相关文章推荐
深入理解require与require_once与include以及include_once的区别
Jun 05 PHP
如何修改和添加Apache的默认站点目录
Jul 05 PHP
Codeigniter生成Excel文档的简单方法
Jun 12 PHP
提高php编程效率技巧
Aug 13 PHP
Joomla框架实现字符串截取的方法示例
Jul 18 PHP
Ubuntu上安装yaf扩展的方法
Jan 29 PHP
TP(thinkPHP)框架多层控制器和多级控制器的使用示例
Jun 13 PHP
PDO::getAvailableDrivers讲解
Jan 28 PHP
浅析PHP7 的垃圾回收机制
Sep 06 PHP
PHP数组array类常见操作示例
May 15 PHP
php实现图片压缩处理
Sep 09 PHP
解决Laravel使用验证时跳转到首页的问题
Nov 17 PHP
php生成固定长度纯数字编码的方法
Jul 09 #PHP
php随机获取金山词霸每日一句的方法
Jul 09 #PHP
PHP实现的QQ空间g_tk加密算法
Jul 09 #PHP
PHP自毁程序(慎用)
Jul 09 #PHP
PHP模板解析类实例
Jul 09 #PHP
PHP多文件上传实例
Jul 09 #PHP
php判断linux下程序问题实例
Jul 09 #PHP
You might like
《五等分的花嫁》漫画完结!2020年10月第2期TV动画制作组换血!
2020/03/06 日漫
如何跨站抓取别的站点的页面的补充
2006/10/09 PHP
WIN8.1下搭建PHP5.6环境
2015/04/29 PHP
php.ini中的request_order推荐设置
2015/05/10 PHP
CodeIgniter针对lighttpd服务器URL重写的方法
2015/06/10 PHP
thinkphp项目部署到Linux服务器上报错“模板不存在”如何解决
2016/04/27 PHP
php7安装mongoDB扩展的方法分析
2017/08/02 PHP
kindeditor 加入七牛云上传的实例讲解
2017/11/12 PHP
使用Rancher在K8S上部署高性能PHP应用程序的教程
2020/07/10 PHP
Javascript this 的一些学习总结
2012/08/31 Javascript
Js操作Select大全(取值、设置选中等等)
2013/10/29 Javascript
我的Node.js学习之路(四)--单元测试
2014/07/06 Javascript
JS基础随笔(菜鸟必看篇)
2016/07/13 Javascript
angular route中使用resolve在uglify压缩后问题解决
2016/09/21 Javascript
easyui中combotree循环获取父节点至根节点并输出路径实现方法
2016/11/10 Javascript
vue实现留言板todolist功能
2017/08/16 Javascript
vuejs使用递归组件实现树形目录的方法
2017/09/30 Javascript
vue注册组件的几种方式总结
2018/03/08 Javascript
JS基于封装函数实现的表格分页完整示例
2018/06/26 Javascript
Vue实现固定定位图标滑动隐藏效果
2019/05/30 Javascript
vue实现评论列表功能
2019/10/25 Javascript
javascript 使用sleep函数的常见方法详解
2020/04/26 Javascript
python采集百度百科的方法
2015/06/05 Python
使用Eclipse如何开发python脚本
2018/04/11 Python
Linux下python3.7.0安装教程
2018/07/30 Python
Django+RestFramework API接口及接口文档并返回json数据操作
2020/07/12 Python
python利用蒙版抠图(使用PIL.Image和cv2)输出透明背景图
2020/08/04 Python
详解HTML5 Canvas绘制时指定颜色与透明度的方法
2016/03/25 HTML / CSS
The Athlete’s Foot新西兰:新西兰最大的运动鞋零售商
2019/12/23 全球购物
我们的节日国庆活动方案
2014/08/19 职场文书
求职导师推荐信范文
2015/03/27 职场文书
2015年社区关工委工作总结
2015/04/03 职场文书
收银员岗位职责范本
2015/04/07 职场文书
辩护词范文大全
2015/05/21 职场文书
八年级英语教学反思
2016/02/15 职场文书
Win11 21h2可以升级22h2吗?看看你的电脑符不符合要求
2022/07/07 数码科技