PHP实现爬虫爬取图片代码实例


Posted in PHP onMarch 03, 2021

文字信息

我们尝试获取表的信息,这里,我们就用某校的课表来代替: 

PHP实现爬虫爬取图片代码实例 

接下来我们就上代码:

a.php

<?php  
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url ="表的链接";
curl_setopt ( $ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
preg_match_all("/<td rowspan=\"\d\">(.*?)<\/td>\n<td rowspan=\"\d\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td rowspan=\"\d\" align=\"\w+\">(.*?)<\/td><td>(.*?)<\/td>\n<td>(.*?)<\/td><td>(.*?)<\/td>/",$content,$matchs,PREG_SET_ORDER);
//匹配该表所用的正则
var_dump($matchs);

然后咱们就运行一下: 

PHP实现爬虫爬取图片代码实例

成功获取到课表;

图片获取

绝对链接

我们以百度图库的首页为例 

PHP实现爬虫爬取图片代码实例

b.php

<?php 
header( "Content-type:text/html;Charset=utf-8" );
$ch = curl_init();
$url="http://image.baidu.com/";
curl_setopt ($ch , CURLOPT_USERAGENT ,"Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.113 Safari/537.36" );
curl_setopt($ch,CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER, 1);
$content=curl_exec($ch);
$string=file_get_contents($url);
preg_match_all("/<img([^>]*)\s*src=('|\")([^'\"]+)('|\")/", $string,$matches);
$new_arr=array_unique($matches[3]);
foreach($new_arr as $key) {
	echo "<img src=$key>";
}

然后,我们就获得了下面的页面: 

PHP实现爬虫爬取图片代码实例

相对链接

百度图库的图片的链接大部分是绝对链接,那么当我们遇到网页图片为相对链接的时候,我们该怎么处理呢?其实很简单,我们只需要将循环那部分改为 

PHP实现爬虫爬取图片代码实例 

那么我们就可以同样在浏览器中输出图片了;

到此这篇关于PHP实现爬虫爬取图片代码实例的文章就介绍到这了,更多相关PHP实现爬虫内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

PHP 相关文章推荐
用PHP和ACCESS写聊天室(九)
Oct 09 PHP
PHP数组实例总结与说明
Aug 23 PHP
php 中英文语言转换类
Sep 07 PHP
php excel reader读取excel内容存入数据库实现代码
Dec 06 PHP
thinkphp中连接oracle时封装方法无法用的解决办法
Jun 17 PHP
php 修改、增加xml结点属性的实现代码
Oct 22 PHP
php查找任何页面上的所有链接的方法
Dec 03 PHP
php中的curl_multi系列函数使用例子
Jul 29 PHP
php轻松实现文件上传功能
Mar 03 PHP
PHP 在数组中搜索给定的简单实例 array_search 函数
Jun 13 PHP
分享PHP-pcntl 实现多进程代码
Sep 30 PHP
PHP简单实现二维数组的矩阵转置操作示例
Nov 24 PHP
PHP执行系统命令函数实例讲解
Mar 03 #PHP
Git命令之分支详解
Mar 02 #PHP
PHP之header函数详解
Mar 02 #PHP
laravel与thinkphp之间的区别与优缺点
Mar 02 #PHP
php中array_fill函数的实例用法
Mar 02 #PHP
PHP网站常见安全漏洞,及相应防范措施总结
Mar 01 #PHP
php框架知识点的整理和补充
Mar 01 #PHP
You might like
PHP提示Deprecated: mysql_connect(): The mysql extension is deprecated的解决方法
2014/08/28 PHP
thinkPHP5框架导出Excel文件简单操作示例
2018/08/03 PHP
User Scripts: Video Download by User Scripts
2007/05/14 Javascript
javascript 强制刷新页面的实现代码
2009/12/13 Javascript
含有CKEditor的表单如何提交
2014/01/09 Javascript
详解JavaScript ES6中的模板字符串
2015/07/28 Javascript
JS从一组数据中找到指定的单条数据的方法
2016/06/02 Javascript
详解微信小程序开发之下拉刷新 上拉加载
2016/11/24 Javascript
JavaScript实现垂直滚动条效果
2017/01/18 Javascript
jQuery窗口拖动功能的实现代码
2017/02/04 Javascript
Vue生命周期示例详解
2017/04/12 Javascript
浅谈JavaScript中的属性:如何遍历属性
2017/09/14 Javascript
vue.js  父向子组件传参的实例代码
2017/10/29 Javascript
vue.js删除列表中的一行
2018/06/30 Javascript
微信小程序利用canvas 绘制幸运大转盘功能
2018/07/06 Javascript
解决vue router组件状态刷新消失的问题
2018/08/01 Javascript
vue项目中实现图片预览的公用组件功能
2018/10/26 Javascript
React学习之受控组件与数据共享实例分析
2020/01/06 Javascript
python字符串排序方法
2014/08/29 Python
Python标准库内置函数complex介绍
2014/11/25 Python
浅析Python编写函数装饰器
2016/03/18 Python
django站点管理详解
2017/12/12 Python
python绘制双柱形图代码实例
2017/12/14 Python
Python切片操作实例分析
2018/03/16 Python
python读取csv文件并把文件放入一个list中的实例讲解
2018/04/27 Python
详解pycharm连接不上mysql数据库的解决办法
2020/01/10 Python
踩坑:pytorch中eval模式下结果远差于train模式介绍
2020/06/23 Python
什么是Linux虚拟文件系统VFS
2015/08/25 面试题
女大学生个人求职信
2013/12/09 职场文书
医药专业应届毕业生求职信范文
2014/01/01 职场文书
项目建议书格式
2014/03/12 职场文书
校长竞聘演讲稿
2014/05/16 职场文书
文明和谐家庭事迹材料
2014/05/18 职场文书
总经理年会致辞
2015/07/29 职场文书
Python list去重且保持原顺序不变的方法
2021/04/03 Python
一文搞懂PHP中的抽象类和接口
2022/05/25 PHP