Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python在命令行下使用google翻译(带语音)
Jan 16 Python
python 实现UTC时间加减的方法
Dec 31 Python
详解Python基础random模块随机数的生成
Mar 23 Python
Python 的字典(Dict)是如何存储的
Jul 05 Python
Django框架反向解析操作详解
Nov 28 Python
tensorflow 模型权重导出实例
Jan 24 Python
python传到前端的数据,双引号被转义的问题
Apr 03 Python
5行Python代码实现图像分割的步骤详解
May 25 Python
python用什么编辑器进行项目开发
Jun 17 Python
解决pytorch多GPU训练保存的模型,在单GPU环境下加载出错问题
Jun 23 Python
Django中Aggregation聚合的基本使用方法
Jul 09 Python
python实现将中文日期转换为数字日期
Jul 14 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
PHP is_dir() 判断给定文件名是否是一个目录
2010/05/10 PHP
PHP实现通过URL提取根域名
2016/03/31 PHP
javascript编程起步(第六课)
2007/02/27 Javascript
用Javascript同时提交多个Web表单的方法
2009/12/26 Javascript
JQuery从头学起第二讲
2010/07/04 Javascript
js下用eval生成JSON对象
2010/09/17 Javascript
JavaScript sort数组排序方法和自我实现排序方法小结
2016/06/06 Javascript
js利用正则表达式检验输入内容是否为网址
2016/07/05 Javascript
jQuery实现鼠标经过显示动画边框特效
2017/03/24 jQuery
Vue项目部署的实现(阿里云+Nginx代理+PM2)
2019/03/26 Javascript
vue 解决setTimeOut和setInterval函数无效报错的问题
2020/07/30 Javascript
Vue自定义组件双向绑定实现原理及方法详解
2020/09/03 Javascript
Vue 实例中使用$refs的注意事项
2021/01/29 Vue.js
python返回昨天日期的方法
2015/05/13 Python
详解Python操作RabbitMQ服务器消息队列的远程结果返回
2016/06/30 Python
聊聊Python中的pypy
2018/01/12 Python
对pandas处理json数据的方法详解
2019/02/08 Python
Python简单基础小程序的实例代码
2019/04/28 Python
Django中ORM外键和表的关系详解
2019/05/20 Python
Python中的pathlib.Path为什么不继承str详解
2019/06/23 Python
python实现复制大量文件功能
2019/08/31 Python
Python列表元素常见操作简单示例
2019/10/25 Python
基于Django实现日志记录报错信息
2019/12/17 Python
简单了解python装饰器原理及使用方法
2019/12/18 Python
xadmin使用formfield_for_dbfield函数过滤下拉表单实例
2020/04/07 Python
详细分析Python垃圾回收机制
2020/07/01 Python
python如何实现读取并显示图片(不需要图形界面)
2020/07/08 Python
马来西亚排名第一的宠物用品店:Pets Wonderland
2020/04/16 全球购物
C++面试题:关于链表和指针
2013/06/05 面试题
市场营销专业个人自荐信格式
2013/09/21 职场文书
党员公开承诺书内容
2014/05/20 职场文书
党支部创先争优活动总结
2014/08/28 职场文书
爱护环境卫生倡议书
2015/04/29 职场文书
评测 | 大屏显示带收音机的高端音箱,JBL TUNE2便携式插卡音箱实测
2021/04/24 无线电
Java 深入探究讲解简单工厂模式
2022/04/07 Java/Android
Python Pytorch查询图像的特征从集合或数据库中查找图像
2022/04/09 Python