python爬虫用scrapy获取影片的实例分析


Posted in Python onNovember 23, 2020

我们平时生活的娱乐中,看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论,有什么影片上映,好不好看之类的话题,没事的时候谈论电影是非常不错的话题。那么,一些好看的影片如果不去电影院的话,在其他地方看都会有大大小小的限制,今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist(your_project_name)

python爬虫用scrapy获取影片的实例分析

文件说明: 名称 | 作用 --|-- scrapy.cfg | 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py | 设置数据存储模板,用于结构化数据,如:Django的Model pipelines | 数据处理行为,如:一般结构化的数据持久化 settings.py | 配置文件,如:递归的层数、并发数,延迟下载等 spiders | 爬虫目录,如:创建文件,编写爬虫规则

注意:一般创建爬虫文件时,以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类,并继承scrapy.spiders.Spider

必须定义name,即爬虫名,如果没有name,会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据,这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL;

start-urls: 蜘蛛开始爬行的URL列表;

parse(): 这是提取并解析刮下数据的方法;

下面的代码演示了蜘蛛代码的样子:

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python通过BF算法实现关键词匹配的方法
Mar 13 Python
把项目从Python2.x移植到Python3.x的经验总结
Apr 20 Python
python抽象基类用法实例分析
Jun 04 Python
Python3爬虫之urllib携带cookie爬取网页的方法
Dec 28 Python
python os模块简单应用示例
May 23 Python
Python read函数按字节(字符)读取文件的实现
Jul 03 Python
django 扩展user用户字段inlines方式
Mar 30 Python
Django Admin后台添加数据库视图过程解析
Apr 01 Python
Django 解决上传文件时,request.FILES为空的问题
May 20 Python
基于opencv的selenium滑动验证码的实现
Jul 24 Python
python 使用建议与技巧分享(四)
Aug 18 Python
python 使用xlsxwriter循环向excel中插入数据和图片的操作
Jan 01 Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
详解anaconda安装步骤
Nov 23 #Python
You might like
Apache2 httpd.conf 中文版
2006/11/17 PHP
通过具体程序来理解PHP里面的抽象类
2010/01/28 PHP
PHP chmod 函数与批量修改文件目录权限
2010/05/10 PHP
PHP ignore_user_abort函数详细介绍和使用实例
2014/07/15 PHP
destoon数据库表说明汇总
2014/07/15 PHP
php创建和删除目录函数介绍和递归删除目录函数分享
2014/11/18 PHP
php的sso单点登录实现方法
2015/01/08 PHP
yii实现model添加默认值的方法(2种方法)
2016/01/06 PHP
PHP执行linux命令6个函数代码实例
2020/11/24 PHP
firefox和IE系列的相关区别整理 以备后用
2009/12/28 Javascript
js读取本地excel文档数据的代码
2010/11/11 Javascript
jquery获取tr并更改tr内容示例代码
2014/02/13 Javascript
JS使用for循环遍历Table的所有单元格内容
2014/08/21 Javascript
js控制网页背景音乐播放与停止的方法
2015/02/06 Javascript
javascript实现抽奖程序的简单实例
2016/06/07 Javascript
jquery过滤特殊字符',防sql注入的实现方法
2016/08/17 Javascript
浅析Ajax语法
2016/12/05 Javascript
百度地图JavascriptApi Marker平滑移动及车头指向行径方向
2017/03/13 Javascript
JS+canvas实现的五子棋游戏【人机大战版】
2017/07/19 Javascript
基于js中document.cookie全面解析
2017/09/14 Javascript
js 原生判断内容区域是否滚动到底部的实例代码
2017/11/15 Javascript
anime.js 实现带有描边动画效果的复选框(推荐)
2017/12/24 Javascript
Angular4 Select选择改变事件的方法
2018/10/09 Javascript
深入理解 Koa 框架中间件原理
2018/10/18 Javascript
关于微信公众号开发无法支付的问题解决
2018/12/28 Javascript
js实现数字滚动特效
2019/12/16 Javascript
基于vue-simple-uploader封装文件分片上传、秒传及断点续传的全局上传插件功能
2021/02/23 Vue.js
Python实现打砖块小游戏代码实例
2019/05/18 Python
详解Pycharm出现out of memory的终极解决方法
2020/03/03 Python
HTML5 拖拽批量上传文件的示例代码
2018/03/28 HTML / CSS
英国自行车商店:AW Cycles
2021/02/24 全球购物
社区志愿者心得体会
2014/01/03 职场文书
护理人员的自我评价分享
2014/03/15 职场文书
公司自我介绍演讲稿
2014/08/21 职场文书
SQL 窗口函数实现高效分页查询的案例分析
2021/05/21 SQL Server
Java 超详细讲解十大排序算法面试无忧
2022/04/08 Java/Android