php基于Snoopy解析网页html的方法


Posted in PHP onJuly 09, 2015

本文实例讲述了php基于Snoopy解析网页html的方法。分享给大家供大家参考。具体实现方法如下:

set_time_limit(0);
$user = array('20517', '20518');
header("content-Type: text/html; charset=utf-8");
require_once './Snoopy.php';
$snoopy = new Snoopy();
//$uri = 'http://www.juzimi.com/meitumeiju';
$uri = 'http://www.juzimi.com/meitumeiju?page=1';
$snoopy->fetch($uri);
$con = $snoopy->getResults();
$doc = new DOMDocument();
$doc->loadHTML($con);
/* make a result array ... */
$result = [];
/* go through all nodes which have class="baby" ... */
$i = 0;
foreach( ( new DOMXPath( $doc ) )->query( '//*[@id="bdshare"]' ) as $element ) {
  $row = $doc->saveHTML($element);
  $start = stripos($row, '{');
  $end = stripos($row, '}');
  $len = $end - $start + 1;
  $json = substr($row, $start, $len);
  $json = str_replace("'", '"', $json);
  $obj = json_decode($json);
  $pic = $obj->pic;
  $desc = $obj->desc;
  $filename = '/Uploads/meiju/card' . date('ymdhis') . $i . '.png';
  $file = '/alidata/www/test' . $filename;
  $image = file_get_contents($pic);
  file_put_contents($file, $image);
}

希望本文所述对大家的php程序设计有所帮助。

PHP 相关文章推荐
PHP用mysql数据库存储session的代码
Mar 05 PHP
ubuntu 编译安装php 5.3.3+memcache的方法
Aug 05 PHP
php 5.6版本中编写一个PHP扩展的简单示例
Jan 20 PHP
smarty高级特性之过滤器的使用方法
Dec 25 PHP
php实现简单爬虫的开发
Mar 28 PHP
Yii2框架实现数据库常用操作总结
Feb 08 PHP
php实现数据库的增删改查
Feb 26 PHP
php动态读取数据清除最右边距的方法
Apr 12 PHP
PHP 7安装使用体验之性能大提升,兼容性强,扩展支持不够(升级PHP要谨慎)
Jul 27 PHP
三个思路解决laravel上传文件报错:413 Request Entity Too Large问题
Nov 13 PHP
php实现表单提交上传文件功能
May 28 PHP
Thinkphp5.0框架的Db操作实例分析【连接、增删改查、链式操作等】
Oct 11 PHP
php生成固定长度纯数字编码的方法
Jul 09 #PHP
php随机获取金山词霸每日一句的方法
Jul 09 #PHP
PHP实现的QQ空间g_tk加密算法
Jul 09 #PHP
PHP自毁程序(慎用)
Jul 09 #PHP
PHP模板解析类实例
Jul 09 #PHP
PHP多文件上传实例
Jul 09 #PHP
php判断linux下程序问题实例
Jul 09 #PHP
You might like
php 删除一个数组中的某个值.兼容多维数组!
2012/02/18 PHP
用PHP实现 上一篇、下一篇的代码
2012/09/29 PHP
PHP生成Gif图片验证码
2013/10/27 PHP
php控制文件下载速度的方法
2015/03/24 PHP
PHP时间和日期函数详解
2015/05/08 PHP
PHP创建word文档的方法(平台无关)
2016/03/29 PHP
PHP上传图片时判断上传文件是否为可用图片的方法
2016/10/20 PHP
学习ExtJS border布局
2009/10/08 Javascript
jquery 最简单易用的表单验证插件
2010/02/27 Javascript
JS 事件绑定函数代码
2010/04/28 Javascript
javascript模拟地球旋转效果代码实例
2013/12/02 Javascript
jquery获取当前点击对象的value方法
2014/02/28 Javascript
JS实现的竖向折叠菜单代码
2015/10/21 Javascript
JavaScript脚本库编写的方法
2015/12/09 Javascript
教你一步步用jQyery实现轮播器
2016/12/18 Javascript
node.js平台下的mysql数据库配置及连接
2017/03/31 Javascript
阿里大于短信验证码node koa2的实现代码(最新)
2017/09/07 Javascript
超详细动手搭建一个VuePress 站点及开启PWA与自动部署的方法
2019/01/27 Javascript
express.js中间件说明详解
2019/03/19 Javascript
Vue开发中遇到的跨域问题及解决方法
2020/02/11 Javascript
微信分享invalid signature签名错误踩过的坑
2020/04/11 Javascript
python算法学习之计数排序实例
2013/12/18 Python
Python连接mysql数据库的正确姿势
2016/02/03 Python
对numpy Array [: ,] 的取值方法详解
2018/07/02 Python
win10子系统python开发环境准备及kenlm和nltk的使用教程
2019/10/14 Python
详解python 破解网站反爬虫的两种简单方法
2020/02/09 Python
python实现mask矩阵示例(根据列表所给元素)
2020/07/30 Python
python实现人性化显示金额数字实例详解
2020/09/25 Python
python xlsxwriter模块的使用
2020/12/24 Python
用Python制作音乐海报
2021/01/26 Python
环保专业大学生职业规划设计
2014/01/10 职场文书
《北大荒的秋天》教学反思
2014/04/14 职场文书
社会发展项目建议书
2014/08/25 职场文书
教师党员批评与自我批评
2014/10/15 职场文书
人代会简报
2015/07/21 职场文书
2016高校自主招生自荐信范文
2016/01/28 职场文书