基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现验证码识别功能
Jun 07 Python
Python中pandas模块DataFrame创建方法示例
Jun 20 Python
python处理两种分隔符的数据集方法
Dec 12 Python
python如何读取bin文件并下发串口
Jul 05 Python
Python人工智能之路 jieba gensim 最好别分家之最简单的相似度实现
Aug 13 Python
pytorch 可视化feature map的示例代码
Aug 20 Python
Pycharm+django2.2+python3.6+MySQL实现简单的考试报名系统
Sep 05 Python
浅谈PyQt5中异步刷新UI和Python多线程总结
Dec 13 Python
关于python pycharm中输出的内容不全的解决办法
Jan 10 Python
Python执行时间的几种计算方法
Jul 31 Python
Python自动化测试中yaml文件读取操作
Aug 20 Python
Pandas替换及部分替换(replace)实现流程详解
Oct 12 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
laravel批量生成假数据的方法
2019/10/09 PHP
PHP基于进程控制函数实现多线程
2020/12/09 PHP
filemanage功能中用到的lib.js
2007/04/08 Javascript
javascript实现的动态添加表单元素input,button等(appendChild)
2007/11/24 Javascript
javascript 的Document属性和方法集合
2010/01/25 Javascript
JavaScript与Div对层定位和移动获得坐标的实现代码
2010/09/08 Javascript
菜鸟javascript基础资料整理2
2010/12/06 Javascript
自己动手制作jquery插件之自动添加删除行的实现
2011/10/13 Javascript
JS页面延迟执行一些方法(整理)
2013/11/11 Javascript
Jquery easyUI 更新行示例
2014/03/06 Javascript
AngularJS基础 ng-keypress 指令简单示例
2016/08/02 Javascript
jQuery图片拖动组件Dropzone用法示例
2017/01/17 Javascript
jQuery实现的点击按钮改变样式功能示例
2018/07/21 jQuery
JS实现给数组对象排序的方法分析
2019/06/24 Javascript
小小聊天室Python代码实现
2016/08/17 Python
玩转python selenium鼠标键盘操作(ActionChains)
2020/04/12 Python
python学习之面向对象【入门初级篇】
2017/01/21 Python
python 调用win32pai 操作cmd的方法
2017/05/28 Python
对Python中type打开文件的方式介绍
2018/04/28 Python
Python数据分析:手把手教你用Pandas生成可视化图表的教程
2018/12/15 Python
python3实现点餐系统
2019/01/24 Python
python 为什么说eval要慎用
2019/03/26 Python
Django实现跨域的2种方法
2019/07/31 Python
使用 PyTorch 实现 MLP 并在 MNIST 数据集上验证方式
2020/01/08 Python
python函数中将变量名转换成字符串实例
2020/05/11 Python
Python使用Selenium实现淘宝抢单的流程分析
2020/06/23 Python
html5 更新图片颜色示例代码
2014/07/29 HTML / CSS
巴西Bo.Bô官方在线商店:经营奢侈品时尚业务
2020/03/16 全球购物
物业总经理岗位职责
2014/02/28 职场文书
2014小学植树节活动总结
2014/03/10 职场文书
司法建议书范文
2014/05/13 职场文书
企业安全生产承诺书
2014/05/22 职场文书
个人对照检查剖析材料
2014/10/13 职场文书
2015年度优秀员工推荐信
2015/03/23 职场文书
房地产置业顾问岗位职责
2015/04/11 职场文书
mysql自增长id用完了该怎么办
2022/02/12 MySQL