python实现爬取百度图片的方法示例


Posted in Python onJuly 06, 2019

本文实例讲述了python实现爬取百度图片的方法。分享给大家供大家参考,具体如下:

import json
import itertools
import urllib
import requests
import os
import re
import sys
word=input("请输入关键字:")
path="./ok"
if not os.path.exists(path):
  os.mkdir(path)
word=urllib.parse.quote(word)
url = r"http://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&fp=result&queryWord={word}&cl=2&lm=-1&ie=utf-8&oe=utf-8&st=-1&ic=0&word={word}&face=0&istype=2nc=1&pn={pn}&rn=60"
urls=(url.format(word=word,pn=x)for x in itertools.count(start=0,step=60))
index=0
str_table = {
  '_z2C$q': ':',
  '_z&e3B': '.',
  'AzdH3F': '/'
}
char_table = {
  'w': 'a',
  'k': 'b',
  'v': 'c',
  '1': 'd',
  'j': 'e',
  'u': 'f',
  '2': 'g',
  'i': 'h',
  't': 'i',
  '3': 'j',
  'h': 'k',
  's': 'l',
  '4': 'm',
  'g': 'n',
  '5': 'o',
  'r': 'p',
  'q': 'q',
  '6': 'r',
  'f': 's',
  'p': 't',
  '7': 'u',
  'e': 'v',
  'o': 'w',
  '8': '1',
  'd': '2',
  'n': '3',
  '9': '4',
  'c': '5',
  'm': '6',
  '0': '7',
  'b': '8',
  'l': '9',
  'a': '0'
}
i=1
char_table = {ord(key): ord(value) for key, value in char_table.items()}
for url in urls:
  html=requests.get(url,timeout=10).text
  a=re.compile(r'"objURL":"(.*?)"')
  downURL=re.findall(a,html)
  for t in downURL:
    for key, value in str_table.items():
        t = t.replace(key, value)
    t=t.translate(char_table)
    try:
      html_1=requests.get(t)
      if str(html_1.status_code)[0]=="4":
        print('失败1')
        continue
    except Exception as e:
      print('失败2')
      continue
    with open(path+"/"+str(i)+".jpg",'wb') as f:
      f.write(html_1.content)
    i=i+1

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python多线程爬虫简单示例
Mar 04 Python
python多进程和多线程究竟谁更快(详解)
May 29 Python
python实现比较文件内容异同
Jun 22 Python
python中int与str互转方法
Jul 02 Python
Python实现语音识别和语音合成功能
Sep 20 Python
安装Pycharm2019以及配置anconda教程的方法步骤
Nov 11 Python
python中p-value的实现方式
Dec 16 Python
Django import export实现数据库导入导出方式
Apr 03 Python
关于python的缩进规则的知识点详解
Jun 22 Python
推荐值得学习的12款python-web开发框架
Aug 10 Python
利用python查看数组中的所有元素是否相同
Jan 08 Python
关于Python中*args和**kwargs的深入理解
Aug 07 Python
python实现控制电脑鼠标和键盘,登录QQ的方法示例
Jul 06 #Python
python3 打印输出字典中特定的某个key的方法示例
Jul 06 #Python
python使用 zip 同时迭代多个序列示例
Jul 06 #Python
Python搭建Spark分布式集群环境
Jul 05 #Python
详解python解压压缩包的五种方法
Jul 05 #Python
用python3 返回鼠标位置的实现方法(带界面)
Jul 05 #Python
python中的colorlog库使用详解
Jul 05 #Python
You might like
php4的session功能评述(三)
2006/10/09 PHP
PHP 引用是个坏习惯
2010/03/12 PHP
php截取字符串并保留完整xml标签的函数代码
2013/02/06 PHP
PHP中鲜为人知的10个函数
2014/02/28 PHP
php限制ip地址范围的方法
2015/03/31 PHP
实现PHP框架系列文章(6)mysql数据库方法
2016/03/04 PHP
PHP实现验证码校验功能
2017/11/16 PHP
Jquery AJAX 框架的使用方法
2009/11/03 Javascript
用jquery实现下拉菜单效果的代码
2010/07/25 Javascript
理解Javascript_09_Function与Object
2010/10/16 Javascript
基于KMP算法JavaScript的实现方法分析
2013/05/03 Javascript
浅析Node在构建超媒体API中的作用
2014/07/30 Javascript
用JavaScript实现使用鼠标画线的示例代码
2014/08/19 Javascript
JavaScript中Number对象的toFixed() 方法详解
2016/09/02 Javascript
ASP.NET jquery ajax传递参数的实例
2016/11/02 Javascript
简单实现bootstrap导航效果
2017/02/07 Javascript
JavaScript 字符串数字左补位,右补位,取固定长度,截位扩展函数代码
2017/03/25 Javascript
JS中Promise函数then的奥秘探究
2018/07/30 Javascript
layui实现给某一列加点击事件
2019/10/26 Javascript
vue实现页面切换滑动效果
2020/06/29 Javascript
[43:24]2018DOTA2亚洲邀请赛3月29日 小组赛A组 LGD VS Liquid
2018/03/30 DOTA
[58:32]EG vs Liquid 2018国际邀请赛小组赛BO2 第一场 8.18
2018/08/19 DOTA
[48:00]EG vs LGD 2018国际邀请赛淘汰赛BO3 第二场 8.26
2018/08/29 DOTA
用Python编程实现语音控制电脑
2014/04/01 Python
python Selenium爬取内容并存储至MySQL数据库的实现代码
2017/03/16 Python
python利用urllib实现爬取京东网站商品图片的爬虫实例
2017/08/24 Python
python rsa实现数据加密和解密、签名加密和验签功能
2019/09/18 Python
python字符串替换re.sub()实例解析
2020/02/09 Python
通过实例简单了解Python sys.argv[]使用方法
2020/08/04 Python
查找廉价航班和发现新目的地:Kiwi.com
2019/02/25 全球购物
List、Map、Set三个接口,存取元素时,各有什么特点?
2015/09/27 面试题
最新党员的自我评价分享
2013/11/04 职场文书
医院岗前培训心得体会
2016/01/08 职场文书
十大必看国产动漫排名,魁拔上线,第二曾在日本播出
2022/03/18 国漫
使用Java去实现超市会员管理系统
2022/03/18 Java/Android
python内置模块之上下文管理contextlib
2022/06/14 Python