基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python标准库之sqlite3使用实例
Nov 25 Python
python脚本监控docker容器
Apr 27 Python
python安装numpy&安装matplotlib& scipy的教程
Nov 02 Python
浅谈解除装饰器作用(python3新增)
Oct 15 Python
python 输出所有大小写字母的方法
Jan 02 Python
python对列进行平移变换的方法(shift)
Jan 10 Python
Python多线程处理实例详解【单进程/多进程】
Jan 30 Python
python ChainMap 合并字典的实现步骤
Jun 11 Python
如何利用Python模拟GitHub登录详解
Jul 15 Python
手把手教你Python yLab的绘制折线图的画法
Oct 23 Python
Python实现自动签到脚本的示例代码
Aug 19 Python
通过Python pyecharts输出保存图片代码实例
Nov 25 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
PHP使用DOM和simplexml读取xml文档的方法示例
2017/02/08 PHP
PHP实现UTF8二进制及明文字符串的转化功能示例
2017/11/20 PHP
php伪静态验证码不显示的解决方案
2019/09/26 PHP
最新优化收藏到网摘代码(digg,diigo)
2007/02/07 Javascript
比较搞笑的js陷阱题
2010/02/07 Javascript
Jquery ui css framework
2010/06/28 Javascript
深入理解javascript学习笔记(一) 编写高质量代码
2012/08/09 Javascript
jquery实现的一个文章自定义分段显示功能
2014/05/23 Javascript
JS中的Replace方法使用经验分享
2015/05/20 Javascript
详解Javascript事件驱动编程
2016/01/03 Javascript
图片旋转、鼠标滚轮缩放、镜像、切换图片js代码
2020/12/13 Javascript
javascript+HTML5 Canvas绘制转盘抽奖
2020/05/16 Javascript
深入解析桶排序算法及Node.js上JavaScript的代码实现
2016/07/06 Javascript
Java中int与integer的区别(基本数据类型与引用数据类型)
2017/02/19 Javascript
jquery实现商品sku多属性选择功能(商品详情页)
2019/12/20 jQuery
Vue+penlayers实现多边形绘制及展示
2020/12/24 Vue.js
[04:07]显微镜下的DOTA2第八期——英雄复活动作
2014/06/24 DOTA
详解Python3.1版本带来的核心变化
2015/04/07 Python
python定时器(Timer)用法简单实例
2015/06/04 Python
简单学习Python time模块
2016/04/29 Python
利用python写个下载teahour音频的小脚本
2017/05/08 Python
python和ruby,我选谁?
2017/09/13 Python
Selenium及python实现滚动操作多种方法
2020/07/21 Python
python+flask编写一个简单的登录接口
2020/11/13 Python
Python使用pyenv实现多环境管理
2021/02/05 Python
Merrell迈乐澳大利亚网站:购买户外登山鞋
2017/05/28 全球购物
迪卡侬印尼体育用品商店:Decathlon印尼
2020/03/11 全球购物
竞选部门副经理的自荐书范文
2014/02/11 职场文书
中班上学期幼儿评语
2014/04/30 职场文书
个人诉讼委托书范本
2014/10/17 职场文书
党员“一帮一”活动总结
2015/05/07 职场文书
北京青年观后感
2015/06/15 职场文书
python中Matplotlib绘制直线的实例代码
2021/07/04 Python
解析探秘fescar分布式事务实现原理
2022/02/28 Java/Android
Java并发编程之原子性-Atomic的使用
2022/03/16 Java/Android
vue判断按钮是否可以点击
2022/04/09 Vue.js