python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
使用Python脚本来获取Cisco设备信息的示例
May 04 Python
python开发中range()函数用法实例分析
Nov 12 Python
简单易懂的python环境安装教程
Jul 13 Python
PyTorch线性回归和逻辑回归实战示例
May 22 Python
python自动化报告的输出用例详解
May 30 Python
pyenv与virtualenv安装实现python多版本多项目管理
Aug 17 Python
python3 写一个WAV音频文件播放器的代码
Sep 27 Python
解决python 上传图片限制格式问题
Oct 30 Python
解决os.path.isdir() 判断文件夹却返回false的问题
Nov 29 Python
Python实现将蓝底照片转化为白底照片功能完整实例
Dec 13 Python
通过实例学习Python Excel操作
Jan 06 Python
pytorch 自定义参数不更新方式
Jan 06 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
一个简单的域名注册情况查询程序
2006/10/09 PHP
php $_SERVER当前完整url的写法
2009/11/12 PHP
PHP获取当前相对于域名目录的方法
2015/06/26 PHP
PHP请求远程地址设置超时时间的解决方法
2016/10/29 PHP
学习JS面向对象成果 借国庆发布个最新作品与大家交流
2009/10/03 Javascript
js动态加载以及确定加载完成的代码
2011/07/31 Javascript
node.js中的fs.unlink方法使用说明
2014/12/15 Javascript
JS+CSS实现电子商务网站导航模板效果代码
2015/09/10 Javascript
jQuery插件Timelinr 实现时间轴特效
2015/10/04 Javascript
Bootstrap按钮组件详解
2016/04/26 Javascript
设计模式中的facade外观模式在JavaScript开发中的运用
2016/05/18 Javascript
javascript RegExp 使用说明
2016/05/21 Javascript
jQuery插件fullPage.js实现全屏滚动效果
2016/12/02 Javascript
javascript 判断当前浏览器版本并判断ie版本
2017/02/17 Javascript
3种vue组件的书写形式
2017/11/29 Javascript
简述vue状态管理模式之vuex
2018/08/29 Javascript
微信小程序scroll-view锚点链接滚动跳转功能
2019/12/12 Javascript
vue中解决微信html5原生ios虚拟键返回不刷新问题
2020/10/20 Javascript
js实现头像上传并且可预览提交
2020/12/25 Javascript
[01:02:34]TFT vs VGJ.T Supermajor 败者组 BO3 第二场 6.5
2018/06/06 DOTA
wxPython中文教程入门实例
2014/06/09 Python
在Python中使用Mako模版库的简单教程
2015/04/08 Python
用Python生成器实现微线程编程的教程
2015/04/13 Python
django 基于中间件实现限制ip频繁访问过程详解
2019/07/30 Python
Django使用django-simple-captcha做验证码的实现示例
2021/01/07 Python
Python3+Appium安装及Appium模拟微信登录方法详解
2021/02/16 Python
聊聊Python pandas 中loc函数的使用,及跟iloc的区别说明
2021/03/03 Python
英国女性时尚鞋类的潮流制造者:Koi Footwear
2018/10/19 全球购物
随机分配座位,共50个学生,使学号相邻的同学座位不能相邻
2014/01/18 面试题
酒店管理专业毕业生推荐信
2013/11/10 职场文书
佛光寺导游词
2015/02/10 职场文书
贪污检举信范文
2015/03/02 职场文书
2015年信访工作总结
2015/04/07 职场文书
2016年教师节贺卡寄语
2015/12/04 职场文书
Windows Server 2019 配置远程控制以及管理方法
2022/04/28 Servers
利用正则表达式匹配浮点型数据
2022/05/30 Java/Android