基于Python爬取素材网站音频文件


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel

相关模块pip安装即可

目标网页

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

请求网页

import requests
url = 'https://www.tukuppt.com/peiyue/zonghe_0_0_0_0_0_0_1.html'
 headers = {
   'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36',
 }
 response = requests.get(url=url, headers=headers)

解析网页,提取数据

import parsel
selector = parsel.Selector(response.text)
urls = selector.css('#audio850995 source::attr(src)').getall()
titles = selector.css('.b-box .info .title::text').getall()
data = zip(urls, titles)
for i in data:
  mp3_url = 'https:' + i[0]
  title = i[1]

保存数据

def download(url, title):
  response = requests.get(url=url, headers=headers)
  path = 'D:\\python\\demo\\熊猫办公素材\\背景音乐\\' + title + '.mp3'
  with open(path, mode='wb') as f:
    f.write(response.content)

基于Python爬取素材网站音频文件
基于Python爬取素材网站音频文件

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python方向键控制上下左右代码
Jan 20 Python
python线程池threadpool实现篇
Apr 27 Python
利用python循环创建多个文件的方法
Oct 25 Python
对Python信号处理模块signal详解
Jan 09 Python
selenium2.0中常用的python函数汇总
Aug 05 Python
解决pycharm 安装numpy失败的问题
Dec 05 Python
解决Django提交表单报错:CSRF token missing or incorrect的问题
Mar 13 Python
keras 回调函数Callbacks 断点ModelCheckpoint教程
Jun 18 Python
Python numpy矩阵处理运算工具用法汇总
Jul 13 Python
Python 列表推导式需要注意的地方
Oct 23 Python
如何使用pdb进行Python调试
Jun 30 Python
Python List remove()实例用法详解
Aug 02 Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
PyQt5的QWebEngineView使用示例
Oct 20 #Python
Python测试框架:pytest学习笔记
Oct 20 #Python
如何快速一次性卸载所有python包(第三方库)呢
Oct 20 #Python
You might like
多文件上载系统完整版
2006/10/09 PHP
PHP读取数据库并按照中文名称进行排序实现代码
2013/01/29 PHP
php简单判断文本编码的方法
2015/07/30 PHP
CodeIgniter配置之SESSION用法实例分析
2016/01/19 PHP
PHP API接口必备之输出json格式数据示例代码
2017/06/27 PHP
Laravel中日期时间处理包Carbon的简单使用
2017/09/21 PHP
jQuery控制图片的hover效果(smartRollover.js)
2012/03/18 Javascript
疯狂Jquery第一天(Jquery学习笔记)
2012/05/11 Javascript
设为首页和收藏的Javascript代码(亲测兼容IE,Firefox,chrome等浏览器)
2013/11/18 Javascript
JavaScript实现的日期控件具体代码
2013/11/18 Javascript
扩展JS Date对象时间格式化功能的小例子
2013/12/02 Javascript
无刷新预览所选择的图片示例代码
2014/04/02 Javascript
JavaScript框架(iframe)操作总结
2014/04/16 Javascript
AngularJS HTML编译器介绍
2014/12/06 Javascript
js实现非常简单的焦点图切换特效实例
2015/05/07 Javascript
js简单设置与使用cookie的方法
2016/01/22 Javascript
所见即所得的富文本编辑器bootstrap-wysiwyg使用方法详解
2016/05/27 Javascript
js 判断登录界面的账号密码是否为空
2017/02/08 Javascript
基于ES6 Array.of的用法(实例讲解)
2017/09/05 Javascript
详解处理Vue单页面应用SEO的另一种思路
2018/11/09 Javascript
针对Vue路由history模式下Nginx后台配置操作
2020/10/22 Javascript
vue实现简易计算器功能
2021/01/20 Vue.js
详解Python的Django框架中的templates设置
2015/05/11 Python
Python实现将Excel转换为json的方法示例
2017/08/05 Python
详解如何在python中读写和存储matlab的数据文件(*.mat)
2018/02/24 Python
python调用摄像头显示图像的实例
2018/08/03 Python
python添加菜单图文讲解
2019/06/04 Python
pycharm 批量修改变量名称的方法
2019/08/01 Python
python打印文件的前几行或最后几行教程
2020/02/13 Python
Python3如何实现Win10桌面自动切换
2020/08/11 Python
html5指南-1.html5全局属性(html5 global attributes)深入理解
2013/01/07 HTML / CSS
澳大利亚体育和露营装备在线/实体零售商:Find Sports
2020/06/03 全球购物
电子商务专业实习生自我鉴定
2013/09/24 职场文书
大学生职业生涯规划书参考模板
2014/03/05 职场文书
2014年体育教学工作总结
2014/12/09 职场文书
餐饮店长岗位职责
2015/04/14 职场文书