Python视频爬虫实现下载头条视频功能示例


Posted in Python onMay 07, 2018

本文实例讲述了Python视频爬虫实现下载头条视频功能。分享给大家供大家参考,具体如下:

一、需求分析

抓取头条短视频

思路:

分析网页源码,查找解析出视频资源url(查看源代码,搜mp4)
对该url发起请求,返回二进制数据
将二进制数据保存为视频格式

视频链接:
http://video.eastday.com/a/170612170956054127565.html

二、代码实现

# encoding: utf-8
import sys
reload(sys)
sys.setdefaultencoding('utf-8')
import requests
import re
import time
time1=time.time()
main_url = 'http://video.eastday.com/a/170612170956054127565.html'
resp = requests.get(main_url)
#没有这行,打印的结果中文是乱码
resp.encoding = 'utf-8'
html = resp.text
link = re.findall(r'var mp4 = "(.*?)";', html)[0]
link = 'http:'+link
dest_resp = requests.get(link)
#视频是二进制数据流,content就是为了获取二进制数据的方法
data = dest_resp.content
#保存数据的路径及文件名
path = u'C:/赵丽颖.mp4'
f = open(path, 'wb')
f.write(data)
f.close()
time2 = time.time()
print u'ok,下载完成!'
print u'总共耗时:' + str(time2 - time1) + 's

"D:\Program Files\Python27\python.exe" D:/PycharmProjects/learn2017/testwechat.py
ok,下载完成!
总共耗时:3.20499992371s
Process finished with exit code 0

成功下载可以播放~

Python视频爬虫实现下载头条视频功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python 正则式 概述及常用字符
May 07 Python
Python实现网站文件的全备份和差异备份
Nov 30 Python
Python 多线程实例详解
Mar 25 Python
python 读取excel文件生成sql文件实例详解
May 12 Python
Python判断两个对象相等的原理
Dec 12 Python
详解Python中的动态属性和特性
Apr 07 Python
在python中利用numpy求解多项式以及多项式拟合的方法
Jul 03 Python
基于Python数据结构之递归与回溯搜索
Feb 26 Python
什么是python类属性
Jun 10 Python
利用python中的matplotlib打印混淆矩阵实例
Jun 16 Python
Python3开发环境搭建详细教程
Jun 18 Python
详解Python 中的容器 collections
Aug 17 Python
十分钟利用Python制作属于你自己的个性logo
May 07 #Python
Redis使用watch完成秒杀抢购功能的代码
May 07 #Python
Python文本统计功能之西游记用字统计操作示例
May 07 #Python
Python中的函数作用域
May 07 #Python
Php多进程实现代码
May 07 #Python
Python格式化输出%s和%d
May 07 #Python
python获取代理IP的实例分享
May 07 #Python
You might like
php连接mssql的一些相关经验及注意事项
2013/02/05 PHP
php中ob函数缓冲机制深入理解
2015/08/03 PHP
动态加载iframe
2006/06/16 Javascript
javascript onkeydown,onkeyup,onkeypress,onclick,ondblclick
2009/02/04 Javascript
jQuery EasyUI API 中文文档 - ComboGrid 组合表格
2011/10/13 Javascript
Extjs中使用extend(js继承) 的代码
2012/03/15 Javascript
减少访问DOM的次数提升javascript性能
2014/02/24 Javascript
简单实现bootstrap导航效果
2017/02/07 Javascript
AngularJS 仿微信图片手势缩放的实例
2017/09/28 Javascript
AngularJS实现表单验证功能详解
2017/10/12 Javascript
使用vue构建多页面应用的示例
2020/10/22 Javascript
[42:11]TNC vs Pain 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/20 DOTA
python编写简单爬虫资料汇总
2016/03/22 Python
深入理解python函数递归和生成器
2016/06/06 Python
Python类属性的延迟计算
2016/10/22 Python
Python排序搜索基本算法之希尔排序实例分析
2017/12/09 Python
pytorch 把MNIST数据集转换成图片和txt的方法
2018/05/20 Python
python入门:这篇文章带你直接学会python
2018/09/14 Python
python基础梳理(一)(推荐)
2019/04/06 Python
django项目登录中使用图片验证码的实现方法
2019/08/15 Python
python中的global关键字的使用方法
2019/08/20 Python
Python新手学习装饰器
2020/06/04 Python
Python pymysql模块安装并操作过程解析
2020/10/13 Python
基于python爬取链家二手房信息代码示例
2020/10/21 Python
从当地商店送来的杂货:Instacart
2018/08/19 全球购物
总裁办公室主任职责
2014/01/02 职场文书
九年级历史教学反思
2014/01/27 职场文书
军训教官感言
2014/03/02 职场文书
法制宣传教育方案
2014/05/09 职场文书
文艺演出策划方案
2014/06/07 职场文书
计算机毕业大学生求职信
2014/06/26 职场文书
新郎婚礼答谢词
2015/01/04 职场文书
红色革命电影观后感
2015/06/18 职场文书
幼儿园科学课教学反思
2016/03/03 职场文书
使用feign服务调用添加Header参数
2021/06/23 Java/Android
MySQL的安装与配置详细教程
2021/06/26 MySQL