Python爬取爱奇艺电影信息代码实例


Posted in Python onNovember 26, 2019

这篇文章主要介绍了Python爬取爱奇艺电影信息代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

一,使用库

1.requests

2.re

3.json

二,抓取html文件

def get_page(url):
  response = requests.get(url)
  if response.status_code == 200:
    return response.text
  return None

三,解析html文件

我们需要的电影信息的部分如下图(评分,片名,主演):

Python爬取爱奇艺电影信息代码实例

抓取到的html文件对应的代码:

Python爬取爱奇艺电影信息代码实例

可以分析出,每部电影的信息都在一个<li>标签内,用正则表达式解析:

def parse_page(html):
  pattern = re.compile('<li.*?qy-mod-li.*?text-score">(.*?)<.*?title.*?>(.*?)<.*?title.*?>(.*?)<', re.S)
  items = re.findall(pattern, html)
  for item in items:#转换为字典形式保存
    yield {
      'score': item[0],
      'name': item[1],
      'actor': item[2].strip()[3:]#将‘主演:'去掉
    }

四,写入文件

def write_to_file(content):
  with open('result.txt', 'a', encoding='utf-8')as f:
    f.write(json.dumps(content, ensure_ascii=False) + '\n')#将字典格式转换为字符串加以保存,并设置中文格式
    f.close()

五,调用函数

def main():
  url = 'https://list.iqiyi.com/www/1/-------------8-1-1-iqiyi--.html'
  html = get_page(url)
  for item in parse_page(html):
    print(item)
    write_to_file(item)

六,运行结果

Python爬取爱奇艺电影信息代码实例

Python爬取爱奇艺电影信息代码实例

七,完整代码

import json
import requests
import re


# 抓取html文件
# 解析html文件
# 存储文件


def get_page(url):
  response = requests.get(url)
  if response.status_code == 200:
    return response.text
  return None


def parse_page(html):
  pattern = re.compile('<li.*?qy-mod-li.*?text-score">(.*?)<.*?title.*?>(.*?)<.*?title.*?>(.*?)<', re.S)
  items = re.findall(pattern, html)
  for item in items:
    yield {
      'score': item[0],
      'name': item[1],
      'actor': item[2].strip()[3:]
    }


def write_to_file(content):
  with open('result.txt', 'a', encoding='utf-8')as f:
    f.write(json.dumps(content, ensure_ascii=False) + '\n')
    f.close()

def main():
  url = 'https://list.iqiyi.com/www/1/-------------8-1-1-iqiyi--.html'
  html = get_page(url)
  for item in parse_page(html):
    print(item)
    write_to_file(item)
if __name__ == '__main__':
  main()

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python实现汉诺塔递归算法经典案例
Mar 01 Python
Python实现Mysql数据库连接池实例详解
Apr 11 Python
Python对象类型及其运算方法(详解)
Jul 05 Python
python利用标准库如何获取本地IP示例详解
Nov 01 Python
Python中对象的引用与复制代码示例
Dec 04 Python
局域网内python socket实现windows与linux间的消息传送
Apr 19 Python
Python爬虫运用正则表达式的方法和优缺点
Aug 25 Python
Python使用tkinter模块实现推箱子游戏
Oct 08 Python
Django用户身份验证完成示例代码
Apr 03 Python
TensorFLow 数学运算的示例代码
Apr 21 Python
如何在vscode中安装python库的方法步骤
Jan 06 Python
PYTHON基于Pyecharts绘制常见的直角坐标系图表
Apr 28 Python
numpy ndarray 按条件筛选数组,关联筛选的例子
Nov 26 #Python
浅谈python已知元素,获取元素索引(numpy,pandas)
Nov 26 #Python
Python如何使用BeautifulSoup爬取网页信息
Nov 26 #Python
python实现在多维数组中挑选符合条件的全部元素
Nov 26 #Python
Python实现图片添加文字
Nov 26 #Python
从numpy数组中取出满足条件的元素示例
Nov 26 #Python
python实现图片上添加图片
Nov 26 #Python
You might like
php 文件夹删除、php清除缓存程序
2009/08/25 PHP
PHP请求远程地址设置超时时间的解决方法
2016/10/29 PHP
非常强大的 jQuery.AsyncBox 弹出对话框插件
2011/08/29 Javascript
弹出层之1:JQuery.Boxy (一) 使用介绍
2011/10/06 Javascript
封装html的select标签的js操作实例
2013/07/02 Javascript
基于jquery实现的文字淡入淡出效果
2013/11/14 Javascript
jquery显示隐藏元素的实现代码
2016/05/19 Javascript
JS中对象与字符串的互相转换详解
2016/05/20 Javascript
jQuery.ajax 跨域请求webapi设置headers的解决方案
2016/08/08 Javascript
BootStrap树状图显示功能
2016/11/24 Javascript
vue服务端渲染的实例代码
2017/08/28 Javascript
react学习笔记之state以及setState的使用
2017/12/07 Javascript
js实时监控文本框输入字数的实例代码
2018/01/18 Javascript
js实现自动播放匀速轮播图
2020/02/06 Javascript
vue 内联样式style中的background用法说明
2020/08/05 Javascript
vue-cli+webpack项目打包到服务器后,ttf字体找不到的解决操作
2020/08/28 Javascript
Openlayers测量距离与面积的实现方法
2020/09/25 Javascript
原生JavaScript实现进度条
2021/02/19 Javascript
[59:36]2018DOTA2亚洲邀请赛 4.3 突围赛 Secret vs VG 第二场
2018/04/04 DOTA
Python函数中*args和**kwargs来传递变长参数的用法
2016/01/26 Python
解决Python pandas plot输出图形中显示中文乱码问题
2018/12/12 Python
python画图系列之个性化显示x轴区段文字的实例
2018/12/13 Python
python控制nao机器人身体动作实例详解
2019/04/29 Python
Django values()和value_list()的使用
2020/03/31 Python
Python基于tkinter canvas实现图片裁剪功能
2020/11/05 Python
HTML5 Plus 实现手机APP拍照或相册选择图片上传功能
2016/07/13 HTML / CSS
c语言常见笔试题总结
2016/09/05 面试题
SQL Server面试题
2016/10/17 面试题
语文教学随笔感言
2014/02/18 职场文书
主题实践活动总结
2014/05/08 职场文书
保研专家推荐信范文
2015/03/25 职场文书
2015年创先争优工作总结
2015/05/23 职场文书
学会感恩主题班会
2015/08/12 职场文书
演讲稿:​快乐,从不抱怨开始!
2019/04/02 职场文书
创业计划书之珠宝饰品
2019/08/26 职场文书
详解Html5项目适配系统深色模式方案总结
2021/04/14 HTML / CSS