python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中声明只包含一个元素的元组数据方法
Aug 25 Python
用Python登录Gmail并发送Gmail邮件的教程
Apr 17 Python
Django框架中处理URLconf中特定的URL的方法
Jul 20 Python
利用python将图片转换成excel文档格式
Dec 30 Python
用python实现k近邻算法的示例代码
Sep 06 Python
使用Python脚本zabbix自定义key监控oracle连接状态
Aug 28 Python
Python imread、newaxis用法详解
Nov 04 Python
Python面向对象之继承原理与用法案例分析
Dec 31 Python
pytorch使用tensorboardX进行loss可视化实例
Feb 24 Python
Python使用requests xpath 并开启多线程爬取西刺代理ip实例
Mar 06 Python
如何理解python面向对象编程
Jun 01 Python
关于Python中*args和**kwargs的深入理解
Aug 07 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
现磨咖啡骗局!现磨咖啡=新鲜咖啡?现磨咖啡背后的猫腻你不懂!
2019/03/28 冲泡冲煮
在Windows系统上安装PHP运行环境文字教程
2010/07/19 PHP
php获取当前时间的毫秒数的方法
2014/01/26 PHP
php下Memcached入门实例解析
2015/01/05 PHP
Yii2框架自定义验证规则操作示例
2019/02/08 PHP
php设计模式之抽象工厂模式分析【星际争霸游戏案例】
2020/01/23 PHP
Extjs入门之动态加载树代码
2010/04/09 Javascript
jquery自定义滚动条插件示例分享
2014/02/21 Javascript
jquery实现一个全局计时器(商城可用)
2017/06/30 jQuery
JavaScript反射与依赖注入实例详解
2018/05/29 Javascript
利用原生的JavaScript实现简单拼图游戏
2018/11/18 Javascript
Vuejs学习笔记之使用指令v-model完成表单的数据双向绑定
2019/04/29 Javascript
js实现金山打字通小游戏
2020/07/24 Javascript
vue.js click点击事件获取当前元素对象的操作
2020/08/07 Javascript
[01:28]2014DOTA2国际邀请赛中国区预选赛四大豪门直升机抵达会场
2014/05/24 DOTA
[58:11]守擂赛第二周擂主赛 DeMonsTer vs Leopard
2020/04/28 DOTA
Python中除法使用的注意事项
2014/08/21 Python
Python使用scrapy采集数据过程中放回下载过大页面的方法
2015/04/08 Python
python实现从ftp服务器下载文件的方法
2015/04/30 Python
Win7下搭建python开发环境图文教程(安装Python、pip、解释器)
2016/05/17 Python
python使用mysql数据库示例代码
2017/05/21 Python
通过shell+python实现企业微信预警
2019/03/07 Python
python实现弹窗祝福效果
2019/04/07 Python
python实现递归查找某个路径下所有文件中的中文字符
2019/08/31 Python
详解Python3迁移接口变化采坑记
2019/10/11 Python
Python实现图像的垂直投影示例
2020/01/17 Python
基于python实现数组格式参数加密计算
2020/04/21 Python
基于python生成英文版词云图代码实例
2020/05/16 Python
分布式全文检索引擎ElasticSearch原理及使用实例
2020/11/14 Python
HTML5标签使用方法详解
2015/11/27 HTML / CSS
Dodax奥地利:音乐、电影、书籍、玩具、电子产品等
2019/08/31 全球购物
利用异或运算实现两个无符号数的加法运算
2013/12/20 面试题
保安的辞职报告怎么写
2014/01/20 职场文书
2014年幼儿园园长工作总结
2014/12/17 职场文书
学校食堂食品安全承诺书
2015/04/29 职场文书
python实现图片批量压缩
2021/04/24 Python