Python爬取某平台短视频的方法


Posted in Python onFebruary 08, 2021

前言

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,如有问题请及时联系我们以作处理。

基本开发环境

Python 3.6

Pycharm

相关模块的使用

import os
import requests

安装Python并添加到环境变量,pip安装需要的相关模块即可。

一、确定需求

Python爬取某平台短视频的方法

爬取搞笑趣味栏目的视频内容。

二、网站数据分析

首先需要明确一点,好看视频网站加载方式是懒加载的方式,需要你下滑网页才会加载出新的内容

Python爬取某平台短视频的方法

加载出来的内容里面有音频播放地址以及标题。

内容比较简单,看代码就行

import os
import requests

url = 'https://haokan.baidu.com/videoui/api/videorec?tab=gaoxiao&act=pcFeed&pd=pc&num=20&shuaxin_id=1612592171486'
headers = {
  'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)
json_data = response.json()
videos = json_data['data']['response']['videos']
for index in videos:
  title = index['title']
  play_url = index['play_url']
  video_content = requests.get(url=play_url, headers=headers).content
  path = 'video\\'
  if not os.path.exists(path):
    os.mkdir(path)
  with open(path + title + '.mp4', mode='wb') as f:
    f.write(video_content)
    print('正在保存:', title)

Python爬取某平台短视频的方法

Python爬取某平台短视频的方法

到此这篇关于Python爬取某平台短视频的方法的文章就介绍到这了,更多相关Python爬取短视频内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python3处理文件中每个词的方法
May 22 Python
python3实现字符串的全排列的方法(无重复字符)
Jul 07 Python
Python实现DDos攻击实例详解
Feb 02 Python
python web框架中实现原生分页
Sep 08 Python
Python 复平面绘图实例
Nov 21 Python
利用python实现.dcm格式图像转为.jpg格式
Jan 13 Python
解决python ThreadPoolExecutor 线程池中的异常捕获问题
Apr 08 Python
Python socket服务常用操作代码实例
Jun 22 Python
python简单实现9宫格图片实例
Sep 03 Python
详解scrapy内置中间件的顺序
Sep 28 Python
详解Python遍历列表时删除元素的正确做法
Jan 07 Python
python - asyncio异步编程
Apr 06 Python
利用Python批量识别电子账单数据的方法
Feb 08 #Python
Python命令行参数argv和argparse该如何使用
Feb 08 #Python
python 实现Requests发送带cookies的请求
Feb 08 #Python
PyCharm2020.3.2安装超详细教程
Feb 08 #Python
python 30行代码实现蚂蚁森林自动偷能量
Feb 08 #Python
如何用Python编写一个电子考勤系统
Feb 08 #Python
python编程的核心知识点总结
Feb 08 #Python
You might like
Terran历史背景
2020/03/14 星际争霸
phpMyAdmin 安装配置方法和问题解决
2009/06/08 PHP
php 执行系统命令的方法
2009/07/07 PHP
小文件php+SQLite存储方案
2010/09/04 PHP
PHP 将逗号、空格、回车分隔的字符串转换为数组的函数
2012/06/07 PHP
php中将汉字转换成拼音的函数代码
2012/09/08 PHP
php MessagePack介绍
2013/10/06 PHP
php实现按天数、星期、月份查询的搜索框
2016/05/02 PHP
php用户密码加密算法分析【Discuz加密算法】
2016/10/12 PHP
[原创]PHPCMS遭遇会员投稿审核无效的解决方法
2017/01/11 PHP
PHP无限极分类函数的实现方法详解
2017/04/15 PHP
PHP获取ttf格式文件字体名的方法示例
2019/03/06 PHP
filemanage功能中用到的lib.js
2007/04/08 Javascript
ExtJS的FieldSet的column列布局
2009/11/20 Javascript
JS父页面与子页面相互传值方法
2014/03/05 Javascript
jQuery中add()方法用法实例
2015/01/08 Javascript
Angularjs实现多个页面共享数据的方式
2016/03/29 Javascript
Bootstrap CSS组件之下拉菜单(dropdown)
2016/12/17 Javascript
jquery 实现拖动文件上传加载进度条功能
2018/03/18 jQuery
[46:16]2018DOTA2亚洲邀请赛3月30日 小组赛B组 iG VS VP
2018/03/31 DOTA
python3 与python2 异常处理的区别与联系
2016/06/19 Python
python使用PyCharm进行远程开发和调试
2017/11/02 Python
Python读写docx文件的方法
2018/05/08 Python
Python3处理HTTP请求的实例
2018/05/10 Python
django admin后管定制-显示字段的实例
2020/03/11 Python
Python-jenkins模块获取jobs的执行状态操作
2020/05/12 Python
Python实现疫情通定时自动填写功能(附代码)
2020/05/27 Python
解决Python安装cryptography报错问题
2020/09/03 Python
详解使用双缓存解决Canvas clearRect引起的闪屏问题
2019/04/29 HTML / CSS
倡议书范文
2014/04/16 职场文书
机电系毕业生求职信
2014/07/11 职场文书
公司证明怎么写
2014/09/22 职场文书
应急管理工作总结2015
2015/05/04 职场文书
农村婚庆主持词
2015/06/29 职场文书
Winsows11性能如何? win11性能测评多核竟比Win10差了10%
2021/11/21 数码科技
解决flex布局中子项目尺寸不受flex-shrink限制
2022/05/11 HTML / CSS