python爬虫用scrapy获取影片的实例分析


Posted in Python onNovember 23, 2020

我们平时生活的娱乐中,看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论,有什么影片上映,好不好看之类的话题,没事的时候谈论电影是非常不错的话题。那么,一些好看的影片如果不去电影院的话,在其他地方看都会有大大小小的限制,今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist(your_project_name)

python爬虫用scrapy获取影片的实例分析

文件说明: 名称 | 作用 --|-- scrapy.cfg | 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py | 设置数据存储模板,用于结构化数据,如:Django的Model pipelines | 数据处理行为,如:一般结构化的数据持久化 settings.py | 配置文件,如:递归的层数、并发数,延迟下载等 spiders | 爬虫目录,如:创建文件,编写爬虫规则

注意:一般创建爬虫文件时,以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类,并继承scrapy.spiders.Spider

必须定义name,即爬虫名,如果没有name,会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据,这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL;

start-urls: 蜘蛛开始爬行的URL列表;

parse(): 这是提取并解析刮下数据的方法;

下面的代码演示了蜘蛛代码的样子:

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python使用PIL库实现验证码图片的方法
Mar 11 Python
解决python读取几千万行的大表内存问题
Jun 26 Python
python计算两个数的百分比方法
Jun 29 Python
python3学生名片管理v2.0版
Nov 29 Python
Flask框架学习笔记之使用Flask实现表单开发详解
Aug 12 Python
matplotlib绘制多个子图(subplot)的方法
Dec 03 Python
Python GUI库PyQt5图形和特效样式QSS介绍
Feb 25 Python
python简单实现最大似然估计&scipy库的使用详解
Apr 15 Python
Python分类测试代码实例汇总
Jul 23 Python
基于python实现图片转字符画代码实例
Sep 04 Python
python 制作网站筛选工具(附源码)
Jan 21 Python
Python必备技巧之字符数据操作详解
Mar 23 Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
详解anaconda安装步骤
Nov 23 #Python
You might like
实用函数9
2007/11/08 PHP
PHP截断标题且兼容utf8和gb2312编码
2013/09/22 PHP
javascript textContent与innerText的异同分析
2010/10/22 Javascript
web性能优化之javascript性能调优
2012/12/28 Javascript
nodejs命令行参数处理模块commander使用实例
2014/09/17 NodeJs
JavaScript运行机制之事件循环(Event Loop)详解
2014/10/10 Javascript
js绘制圆形和矩形的方法
2015/08/05 Javascript
JavaScript+CSS实现仿天猫侧边网页菜单效果
2015/08/25 Javascript
WEB前端开发都应知道的jquery小技巧及jquery三个简写
2015/11/15 Javascript
jQuery height()、innerHeight()、outerHeight()函数的区别详解
2016/05/23 Javascript
Angular懒加载机制刷新后无法回退的快速解决方法
2016/08/30 Javascript
fullpage.js全屏滚动插件使用实例
2016/09/06 Javascript
Vue2路由动画效果的实现代码
2017/07/10 Javascript
详解关于vue2.0工程发布上线操作步骤
2018/09/27 Javascript
详解vuex之store拆分即多模块状态管理(modules)篇
2018/11/13 Javascript
微信小程序swiper使用网络图片不显示问题解决
2019/12/13 Javascript
JS数组方法reverse()用法实例分析
2020/01/18 Javascript
vue-router 2.0 跳转之router.push()用法说明
2020/08/12 Javascript
跟老齐学Python之玩转字符串(3)
2014/09/14 Python
Python实现的飞速中文网小说下载脚本
2015/04/23 Python
浅谈Python中的闭包
2015/07/08 Python
使用Nginx+uWsgi实现Python的Django框架站点动静分离
2016/03/21 Python
python实现将excel文件转化成CSV格式
2018/03/22 Python
python关闭占用端口方式
2019/12/17 Python
Python unittest装饰器实现原理及代码
2020/09/08 Python
美国老牌主机服务商:iPage
2016/07/22 全球购物
Sneaker Studio波兰:购买运动鞋
2018/04/28 全球购物
翻译专业应届生求职信
2013/11/23 职场文书
机械设计及其自动化求职推荐信
2014/02/17 职场文书
职位说明书范文
2014/05/07 职场文书
开除员工通知
2015/04/22 职场文书
中国合伙人观后感
2015/06/02 职场文书
班主任工作经验交流会总结
2015/11/02 职场文书
团干部培训班心得体会
2016/01/06 职场文书
创业计划书之都市休闲农庄
2019/12/28 职场文书
详细介绍python操作RabbitMq
2022/04/12 Python