编程 Python

python爬虫用scrapy获取影片的实例分析

Posted in Python onNovember 23, 2020

我们平时生活的娱乐中，看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论，有什么影片上映，好不好看之类的话题，没事的时候谈论电影是非常不错的话题。那么，一些好看的影片如果不去电影院的话，在其他地方看都会有大大小小的限制，今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist（your_project_name）

python爬虫用scrapy获取影片的实例分析

注意：一般创建爬虫文件时，以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类，并继承scrapy.spiders.Spider

必须定义name，即爬虫名，如果没有name，会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据，这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL；

start-urls: 蜘蛛开始爬行的URL列表；

parse(): 这是提取并解析刮下数据的方法；

下面的代码演示了蜘蛛代码的样子：

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木！

python爬虫用scrapy获取影片的实例分析

- Author -

小妮浅浅

声明：登载此文出于传递更多信息之目的，并不意味着赞同其观点或证实其描述。

Python 相关文章推荐

Python使用PIL库实现验证码图片的方法

Mar 11 Python

解决python读取几千万行的大表内存问题

Jun 26 Python

python计算两个数的百分比方法

Jun 29 Python

python3学生名片管理v2.0版

Nov 29 Python

Flask框架学习笔记之使用Flask实现表单开发详解

Aug 12 Python

matplotlib绘制多个子图(subplot)的方法

Dec 03 Python

Python GUI库PyQt5图形和特效样式QSS介绍

Feb 25 Python

python简单实现最大似然估计&scipy库的使用详解

Apr 15 Python

Python分类测试代码实例汇总

Jul 23 Python

基于python实现图片转字符画代码实例

Sep 04 Python

python 制作网站筛选工具(附源码)

Jan 21 Python

Python必备技巧之字符数据操作详解

Mar 23 Python

python爬虫scrapy图书分类实例讲解

Nov 23 #Python

scrapy处理python爬虫调度详解

Nov 23 #Python

利用Python将多张图片合成视频的实现

Nov 23 #Python

Python系统公网私网流量监控实现流程

Nov 23 #Python

Python 调用 ES、Solr、Phoenix的示例代码

Nov 23 #Python

10个示例带你掌握python中的元组

Nov 23 #Python

详解anaconda安装步骤

Nov 23 #Python

You might like

实用函数9

2007/11/08 PHP

PHP截断标题且兼容utf8和gb2312编码

2013/09/22 PHP

javascript textContent与innerText的异同分析

2010/10/22 Javascript

web性能优化之javascript性能调优

2012/12/28 Javascript

nodejs命令行参数处理模块commander使用实例

2014/09/17 NodeJs

JavaScript运行机制之事件循环(Event Loop)详解

2014/10/10 Javascript

js绘制圆形和矩形的方法

2015/08/05 Javascript

JavaScript+CSS实现仿天猫侧边网页菜单效果

2015/08/25 Javascript

WEB前端开发都应知道的jquery小技巧及jquery三个简写

2015/11/15 Javascript

jQuery height()、innerHeight()、outerHeight()函数的区别详解

2016/05/23 Javascript

Angular懒加载机制刷新后无法回退的快速解决方法

2016/08/30 Javascript

fullpage.js全屏滚动插件使用实例

2016/09/06 Javascript

Vue2路由动画效果的实现代码

2017/07/10 Javascript

详解关于vue2.0工程发布上线操作步骤

2018/09/27 Javascript

详解vuex之store拆分即多模块状态管理(modules)篇

2018/11/13 Javascript

微信小程序swiper使用网络图片不显示问题解决

2019/12/13 Javascript

JS数组方法reverse()用法实例分析

2020/01/18 Javascript

vue-router 2.0 跳转之router.push()用法说明

2020/08/12 Javascript

跟老齐学Python之玩转字符串(3)

2014/09/14 Python

Python实现的飞速中文网小说下载脚本

2015/04/23 Python

浅谈Python中的闭包

2015/07/08 Python

使用Nginx+uWsgi实现Python的Django框架站点动静分离

2016/03/21 Python

python实现将excel文件转化成CSV格式

2018/03/22 Python

python关闭占用端口方式

2019/12/17 Python

Python unittest装饰器实现原理及代码

2020/09/08 Python

美国老牌主机服务商：iPage

2016/07/22 全球购物

Sneaker Studio波兰：购买运动鞋

2018/04/28 全球购物

翻译专业应届生求职信

2013/11/23 职场文书

机械设计及其自动化求职推荐信

2014/02/17 职场文书

职位说明书范文

2014/05/07 职场文书

开除员工通知

2015/04/22 职场文书

中国合伙人观后感

2015/06/02 职场文书

班主任工作经验交流会总结

2015/11/02 职场文书

团干部培训班心得体会

2016/01/06 职场文书

创业计划书之都市休闲农庄

2019/12/28 职场文书

详细介绍python操作RabbitMq

2022/04/12 Python