Python爬虫:通过关键字爬取百度图片


Posted in Python onFebruary 17, 2017

使用工具:Python2.7 点我下载

scrapy框架

sublime text3

一。搭建python(Windows版本)

 1.安装python2.7 ---然后在cmd当中输入python,界面如下则安装成功

Python爬虫:通过关键字爬取百度图片

 2.集成Scrapy框架----输入命令行:pip install Scrapy

Python爬虫:通过关键字爬取百度图片

安装成功界面如下:

Python爬虫:通过关键字爬取百度图片

失败的情况很多,举例一种:

Python爬虫:通过关键字爬取百度图片

解决方案:

其余错误可百度搜索。

二。开始编程。

1.爬取无反爬虫措施的静态网站。例如百度贴吧,豆瓣读书。

例如-《桌面吧》的一个帖子https://tieba.baidu.com/p/2460150866?red_tag=3569129009

python代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:引入了两个模块urllib,re。定义两个函数,第一个函数是获取整个目标网页数据,第二个函数是在目标网页中获取目标图片,遍历网页,并且给获取的图片按照0开始排序。

注:re模块知识点:

Python爬虫:通过关键字爬取百度图片

爬取图片效果图:

Python爬虫:通过关键字爬取百度图片

图片保存路径默认在建立的.py同目录文件下。

2.爬取有反爬虫措施的百度图片。如百度图片等。

例如关键字搜索“表情包”https://image.baidu.com/search/index?tn=baiduimage&ct=201326592&lm=-1&cl=2&ie=gbk&word=%B1%ED%C7%E9%B0%FC&fr=ala&ori_query=%E8%A1%A8%E6%83%85%E5%8C%85&ala=0&alatpl=sp&pos=0&hs=2&xthttps=111111

图片采用滚动式加载,先爬取最优先的30张。

代码如下:

Python爬虫:通过关键字爬取百度图片

代码注释:导入4个模块,os模块用于指定保存路径。前两个函数同上。第三个函数使用了if语句,并tryException异常。

爬取过程如下:

Python爬虫:通过关键字爬取百度图片

爬取结果:

Python爬虫:通过关键字爬取百度图片

注:编写python代码注重对齐,and不能混用Tab和空格,易报错。

以上就是本文的全部内容,希望本文的内容对大家的学习或者工作能带来一定的帮助,同时也希望多多支持三水点靠木!

Python 相关文章推荐
python 随机数生成的代码的详细分析
May 15 Python
python回调函数用法实例分析
May 09 Python
八大排序算法的Python实现
Jan 28 Python
python 自动化将markdown文件转成html文件的方法
Sep 23 Python
python的pip安装以及使用教程
Sep 18 Python
Python安装及Pycharm安装使用教程图解
Sep 20 Python
Python timer定时器两种常用方法解析
Jan 20 Python
Python OpenCV读取中文路径图像的方法
Jul 02 Python
Python 开发工具通过 agent 代理使用的方法
Sep 27 Python
Opencv python 图片生成视频的方法示例
Nov 18 Python
Django 如何实现文件上传下载
Apr 08 Python
Python中的程序流程控制语句
Feb 24 Python
Python 遍历列表里面序号和值的方法(三种)
Feb 17 #Python
浅谈python中的实例方法、类方法和静态方法
Feb 17 #Python
Python之日期与时间处理模块(date和datetime)
Feb 16 #Python
python字符串中的单双引
Feb 16 #Python
使用PyV8在Python爬虫中执行js代码
Feb 16 #Python
Python错误提示:[Errno 24] Too many open files的分析与解决
Feb 16 #Python
Python变量和数据类型详解
Feb 15 #Python
You might like
PHP持久连接mysql_pconnect()函数使用介绍
2012/02/05 PHP
PHP7 mongoDB扩展使用的方法分享
2019/05/02 PHP
新闻内页-JS分页
2006/06/07 Javascript
Javascript Tab 导航插件 (23个)
2009/06/11 Javascript
jquery 操作日期、星期、元素的追加的实现代码
2012/02/07 Javascript
javascript 判断中文字符长度的函数代码
2012/08/27 Javascript
js关闭当前页面(窗口)的几种方式总结
2013/03/05 Javascript
jQuery实现的输入框选择时间插件用法实例
2015/02/28 Javascript
JavaScript中调用函数的4种方式代码实例
2015/07/08 Javascript
angularjs自定义ng-model标签的属性
2016/01/21 Javascript
基于jquery实现智能提示控件intellSeach.js
2016/03/17 Javascript
JavaScript实现页面无操作倒计时退出
2016/10/22 Javascript
获取今天,昨天,本周,上周,本月,上月时间(实例分享)
2017/01/04 Javascript
JavaScript解析任意形式的json树型结构展示
2017/07/23 Javascript
vue-cli中使用高德地图的方法示例
2019/03/28 Javascript
JS操作字符串转数字的常见方法示例
2019/10/29 Javascript
Javascript柯里化实现原理及作用解析
2020/10/22 Javascript
js实现扫雷源代码
2020/11/27 Javascript
Pycharm学习教程(4) Python解释器的相关配置
2017/05/03 Python
python基础之入门必看操作
2017/07/26 Python
利用python GDAL库读写geotiff格式的遥感影像方法
2018/11/29 Python
DES加密解密算法之python实现版(图文并茂)
2018/12/06 Python
Python中py文件转换成exe可执行文件的方法
2019/06/14 Python
Python学习笔记之错误和异常及访问错误消息详解
2019/08/08 Python
在pycharm中使用matplotlib.pyplot 绘图时报错的解决
2020/06/01 Python
python实现简单的五子棋游戏
2020/09/01 Python
HTML table 表格边框的实现思路
2019/10/12 HTML / CSS
世界首屈一指的钓鱼用品商店:TackleDirect
2016/07/26 全球购物
95%的面试官都会问到的50道Java线程题,附答案
2012/08/03 面试题
巡警年度自我鉴定
2014/02/21 职场文书
2014年度思想工作总结
2014/11/27 职场文书
机器人瓦力观后感
2015/06/12 职场文书
党员电教片《信仰》心得体会
2016/01/15 职场文书
Python实战之用tkinter库做一个鼠标模拟点击器
2021/04/27 Python
Python 数据科学 Matplotlib图库详解
2021/07/07 Python
LeetCode189轮转数组python示例
2022/08/05 Python