Python爬取爱奇艺电影信息代码实例


Posted in Python onNovember 26, 2019

这篇文章主要介绍了Python爬取爱奇艺电影信息代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

一,使用库

1.requests

2.re

3.json

二,抓取html文件

def get_page(url):
  response = requests.get(url)
  if response.status_code == 200:
    return response.text
  return None

三,解析html文件

我们需要的电影信息的部分如下图(评分,片名,主演):

Python爬取爱奇艺电影信息代码实例

抓取到的html文件对应的代码:

Python爬取爱奇艺电影信息代码实例

可以分析出,每部电影的信息都在一个<li>标签内,用正则表达式解析:

def parse_page(html):
  pattern = re.compile('<li.*?qy-mod-li.*?text-score">(.*?)<.*?title.*?>(.*?)<.*?title.*?>(.*?)<', re.S)
  items = re.findall(pattern, html)
  for item in items:#转换为字典形式保存
    yield {
      'score': item[0],
      'name': item[1],
      'actor': item[2].strip()[3:]#将‘主演:'去掉
    }

四,写入文件

def write_to_file(content):
  with open('result.txt', 'a', encoding='utf-8')as f:
    f.write(json.dumps(content, ensure_ascii=False) + '\n')#将字典格式转换为字符串加以保存,并设置中文格式
    f.close()

五,调用函数

def main():
  url = 'https://list.iqiyi.com/www/1/-------------8-1-1-iqiyi--.html'
  html = get_page(url)
  for item in parse_page(html):
    print(item)
    write_to_file(item)

六,运行结果

Python爬取爱奇艺电影信息代码实例

Python爬取爱奇艺电影信息代码实例

七,完整代码

import json
import requests
import re


# 抓取html文件
# 解析html文件
# 存储文件


def get_page(url):
  response = requests.get(url)
  if response.status_code == 200:
    return response.text
  return None


def parse_page(html):
  pattern = re.compile('<li.*?qy-mod-li.*?text-score">(.*?)<.*?title.*?>(.*?)<.*?title.*?>(.*?)<', re.S)
  items = re.findall(pattern, html)
  for item in items:
    yield {
      'score': item[0],
      'name': item[1],
      'actor': item[2].strip()[3:]
    }


def write_to_file(content):
  with open('result.txt', 'a', encoding='utf-8')as f:
    f.write(json.dumps(content, ensure_ascii=False) + '\n')
    f.close()

def main():
  url = 'https://list.iqiyi.com/www/1/-------------8-1-1-iqiyi--.html'
  html = get_page(url)
  for item in parse_page(html):
    print(item)
    write_to_file(item)
if __name__ == '__main__':
  main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python利用前序和中序遍历结果重建二叉树的方法
Apr 27 Python
python字符类型的一些方法小结
May 16 Python
python中文分词,使用结巴分词对python进行分词(实例讲解)
Nov 14 Python
python3+PyQt5实现自定义窗口部件Counters
Apr 20 Python
如何使用Python实现自动化水军评论
Jun 26 Python
对Python3中列表乘以某一个数的示例详解
Jul 20 Python
python 画函数曲线示例
Dec 04 Python
40行Python代码实现天气预报和每日鸡汤推送功能
Feb 27 Python
Django 自定义404 500等错误页面的实现
Mar 08 Python
Python爬取网页信息的示例
Sep 24 Python
Python 带星号(* 或 **)的函数参数详解
Feb 23 Python
python双向链表实例详解
May 25 Python
numpy ndarray 按条件筛选数组,关联筛选的例子
Nov 26 #Python
浅谈python已知元素,获取元素索引(numpy,pandas)
Nov 26 #Python
Python如何使用BeautifulSoup爬取网页信息
Nov 26 #Python
python实现在多维数组中挑选符合条件的全部元素
Nov 26 #Python
Python实现图片添加文字
Nov 26 #Python
从numpy数组中取出满足条件的元素示例
Nov 26 #Python
python实现图片上添加图片
Nov 26 #Python
You might like
PHP中数组的分组排序实例
2014/06/01 PHP
php5.3以后的版本连接sqlserver2000的方法
2014/07/28 PHP
php实现随机显示图片方法汇总
2015/05/21 PHP
php下载文件,添加响应头的简单实例
2016/09/22 PHP
PHP unset函数原理及使用方法解析
2020/08/14 PHP
js停止冒泡和阻止浏览器默认行为的简单方法
2016/05/15 Javascript
jQuery Easyui使用(一)之可折叠面板的布局手风琴菜单
2016/08/17 Javascript
javascript 内置对象及常见API详细介绍
2016/11/01 Javascript
JS仿JQuery选择器功能
2017/03/08 Javascript
vue axios 表单提交上传图片的实例
2018/03/16 Javascript
react中实现搜索结果中关键词高亮显示
2018/07/31 Javascript
vue.js实现的幻灯片功能示例
2019/01/18 Javascript
[00:36]我的中国心——Serenity vs Fnatic
2018/08/21 DOTA
python将文本转换成图片输出的方法
2015/04/28 Python
Python实现对象转换为xml的方法示例
2017/06/08 Python
Windows 7下Python Web环境搭建图文教程
2018/03/20 Python
一份python入门应该看的学习资料
2018/04/11 Python
Python实现的括号匹配判断功能示例
2018/08/25 Python
一行代码让 Python 的运行速度提高100倍
2018/10/08 Python
六行python代码的爱心曲线详解
2019/05/17 Python
django和vue实现数据交互的方法
2019/08/21 Python
Pytorch 数据加载与数据预处理方式
2019/12/31 Python
Python就将所有的英文单词首字母变成大写
2021/02/12 Python
HTML5 Canvas像素处理使用接口介绍
2012/12/02 HTML / CSS
毕业生简单求职信
2013/11/19 职场文书
和平主题的演讲稿
2014/01/12 职场文书
航空学院求职信
2014/06/11 职场文书
给妈妈洗脚活动方案
2014/08/16 职场文书
部门群众路线教育实践活动对照检查材料思想汇报
2014/10/07 职场文书
党的群众路线教育实践活动个人对照检查材料(校长)
2014/11/05 职场文书
公司股份合作协议书
2014/12/07 职场文书
2015年党风廉政建设工作总结
2015/04/09 职场文书
法律进社区活动总结
2015/05/07 职场文书
2015年学校精神文明工作总结
2015/05/27 职场文书
关于艺术节的开幕致辞
2016/03/04 职场文书
《三国志》赏析
2019/08/27 职场文书