python爬不同图片分别保存在不同文件夹中的实现


Posted in Python onApril 02, 2021

例如,爬取赵丽颖,赵本山,赵文卓,赵欢,赵日天的图片分别保存在赵丽颖,赵本山,赵文卓,赵欢,赵日天命名的文件夹中,

测试代码

python爬不同图片分别保存在不同文件夹中的实现

python爬不同图片分别保存在不同文件夹中的实现

别的图就不放了

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# keyword = '云斑白条天牛' # 关键字
keywords = ['赵丽颖','赵本山','赵文卓','赵欢','赵日天']
max_page = 2
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1
print('End!')

你要修改的参数

将你想要爬的数据填入keywords 数组中即可

# 这里放你要查询的数组
keywords = ['','','',']

max_page是爬取百度图片的页数,一页是30张,这里写2的话就能爬30张,3能爬60张,以此类推

max_page = 3

你要的代码

代码如下:

import requests
import time
import os
# 请求头,伪装成浏览器
headers = {
    'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/53.0.2785.116 Safari/537.36'
}
# 这里放你要查询的数组
keywords = ['','','',']
max_page = 4
i=1 # 记录图片数
for keyword in keywords:
  
  os.makedirs(keyword)
  for page in range(1,max_page):
    page = page*30
    # 网址
    url = 'https://image.baidu.com/search/acjson?tn=resultjson_com&ipn=rj&ct=201326592&is=&fp=result&queryWord='\
        +keyword+'&cl=2&lm=-1&ie=utf-8&oe=utf-8&adpicid=&st=-1&z=&ic=0&hd=&latest=&copyright=&word='\
        +keyword+'&s=&se=&tab=&width=&height=&face=0&istype=2&qc=&nc=1&fr=&expermode=&force=&cg=wallpaper&pn='\
        +str(page)+'&rn=30&gsm=1e&1596899786625='
    # 请求响应
    response = requests.get(url=url,headers=headers)
    # 得到相应的json数据
    json = response.json()
    if json.get('data'):
      for item in json.get('data')[:30]:
        # 图片地址
        img_url = item.get('thumbURL')
        # 获取图片
        image = requests.get(url=img_url)
        # 下载图片
        newstr = './'+keyword+'/'+str(i)+'.jpg'
        # with open('./%s/%d.jpg'%keywords ,%i,'wb') as f:
        with open(newstr,'wb') as f:
          f.write(image.content) # 图片二进制数据
        time.sleep(1) # 等待1s
        print('第%d张%s图片下载完成...'%(i,keyword))
        i+=1  
print('End!')

到此这篇关于python爬不同图片分别保存在不同文件夹中的实现的文章就介绍到这了,更多相关python爬图片保存不同文件夹内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python实现动态添加类的属性或成员函数的解决方法
Jul 16 Python
python登陆asp网站页面的实现代码
Jan 14 Python
Python 序列的方法总结
Oct 18 Python
python多线程socket编程之多客户端接入
Sep 12 Python
python3 判断列表是一个空列表的方法
May 04 Python
python对list中的每个元素进行某种操作的方法
Jun 29 Python
浅析python的Lambda表达式
Feb 27 Python
Python面向对象封装操作案例详解 II
Jan 02 Python
pycharm工具连接mysql数据库失败问题
Apr 01 Python
Jupyter Notebook折叠输出的内容实例
Apr 22 Python
关于tf.matmul() 和tf.multiply() 的区别说明
Jun 18 Python
【超详细】八大排序算法的各项比较以及各自特点
Mar 31 Python
Python读取文件夹下的所有文件实例代码
如何用python识别滑块验证码中的缺口
python 实现定时任务的四种方式
Apr 01 #Python
python读取pdf格式文档的实现代码
Python中使用Lambda函数的5种用法
Apr 01 #Python
python 实现mysql自动增删分区的方法
Apr 01 #Python
pygame面向对象的飞行小鸟实现(Flappy bird)
You might like
一个简单的PHP&MYSQL留言板源码
2020/07/19 PHP
php xfocus防注入资料
2008/04/27 PHP
Zend Framework动作控制器用法示例
2016/12/09 PHP
如何用js控制frame的隐藏或显示的解决办法
2013/03/20 Javascript
js借助ActiveXObject实现创建文件
2013/09/29 Javascript
Js实现当前点击a标签变色突出显示其他a标签回复原色
2013/11/27 Javascript
jQuery操作基本控件方法实例分析
2015/12/31 Javascript
jQuery实现的导航下拉菜单效果
2016/07/04 Javascript
Three.js学习之Lamber材质和Phong材质
2016/08/04 Javascript
JQuery遍历元素的后代和同胞实现方法
2016/09/18 Javascript
js闭包用法实例详解
2016/12/13 Javascript
jquery实现静态搜索功能(可输入搜索文字)
2017/03/28 jQuery
Vue键盘事件用法总结
2017/04/18 Javascript
vue: WebStorm设置快速编译运行的方法
2018/10/18 Javascript
解决layui动态加载复选框无法选中的问题
2019/09/20 Javascript
vue自定义指令和动态路由实现权限控制
2020/08/28 Javascript
Python聚类算法之基本K均值实例详解
2015/11/20 Python
手把手教你如何安装Pycharm(详细图文教程)
2018/11/28 Python
浅谈PYTHON 关于文件的操作
2019/03/19 Python
通过python改变图片特定区域的颜色详解
2019/07/15 Python
css3.0新属性效果在ie下的解决方案
2010/05/10 HTML / CSS
HTML5语义化元素你真的用对了吗
2019/08/22 HTML / CSS
世界上最好的帽子:Tilley
2016/11/27 全球购物
Stubhub英国:购买体育、演唱会和剧院门票
2018/06/10 全球购物
美国单身专业人士在线约会网站:EliteSingles
2019/03/19 全球购物
保洁主管岗位职责
2013/11/20 职场文书
测控技术与仪器个人求职信范文
2013/12/30 职场文书
新农村建设标语
2014/06/24 职场文书
2014年学校禁毒工作总结
2014/12/23 职场文书
2015年专项整治工作总结
2015/04/03 职场文书
公司行政主管岗位职责
2015/04/09 职场文书
2015年政协委员工作总结
2015/05/20 职场文书
公司业务员管理制度
2015/08/05 职场文书
入党申请书怎么写?
2019/06/11 职场文书
如何用 Python 子进程关闭 Excel 自动化中的弹窗
2021/05/07 Python
vue3不同环境下实现配置代理
2022/05/25 Vue.js