python爬虫用scrapy获取影片的实例分析


Posted in Python onNovember 23, 2020

我们平时生活的娱乐中,看电影是大部分小伙伴都喜欢的事情。周围的人总会有意无意的在谈论,有什么影片上映,好不好看之类的话题,没事的时候谈论电影是非常不错的话题。那么,一些好看的影片如果不去电影院的话,在其他地方看都会有大大小小的限制,今天小编就教大家用python中的scrapy获取影片的办法吧。

1. 创建项目

运行命令:

scrapy startproject myfrist(your_project_name)

python爬虫用scrapy获取影片的实例分析

文件说明: 名称 | 作用 --|-- scrapy.cfg | 项目的配置信息,主要为Scrapy命令行工具提供一个基础的配置信息。(真正爬虫相关的配置信息在settings.py文件中) items.py | 设置数据存储模板,用于结构化数据,如:Django的Model pipelines | 数据处理行为,如:一般结构化的数据持久化 settings.py | 配置文件,如:递归的层数、并发数,延迟下载等 spiders | 爬虫目录,如:创建文件,编写爬虫规则

注意:一般创建爬虫文件时,以网站域名命名

2 编写 spdier

在spiders目录中新建 daidu_spider.py 文件

2.1 注意

爬虫文件需要定义一个类,并继承scrapy.spiders.Spider

必须定义name,即爬虫名,如果没有name,会报错。因为源码中是这样定义的

2.2 编写内容

在这里可以告诉 scrapy 。要如何查找确切数据,这里必须要定义一些属性

name: 它定义了蜘蛛的唯一名称

allowed_domains: 它包含了蜘蛛抓取的基本URL;

start-urls: 蜘蛛开始爬行的URL列表;

parse(): 这是提取并解析刮下数据的方法;

下面的代码演示了蜘蛛代码的样子:

import scrapy
class DoubanSpider(scrapy.Spider):
  name = 'douban'
  allwed_url = 'douban.com'
  start_urls = [
    'https://movie.douban.com/top250/'
  ]
  def parse(self, response):
    movie_name = response.xpath("//div[@class='item']//a/span[1]/text()").extract()
    movie_core = response.xpath("//div[@class='star']/span[2]/text()").extract()
    yield {
      'movie_name':movie_name,
      'movie_core':movie_core
    }

到此这篇关于python爬虫用scrapy获取影片的实例分析的文章就介绍到这了,更多相关python爬虫如何用scrapy获取影片内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python中列表、字典、元组、集合数据结构整理
Nov 20 Python
在Django框架中编写Contact表单的教程
Jul 17 Python
Python使用multiprocessing实现一个最简单的分布式作业调度系统
Mar 14 Python
用tensorflow实现弹性网络回归算法
Jan 09 Python
对python周期性定时器的示例详解
Feb 19 Python
Django中ORM外键和表的关系详解
May 20 Python
tensor和numpy的互相转换的实现示例
Aug 02 Python
Python二元赋值实用技巧解析
Oct 25 Python
Python破解BiliBili滑块验证码的思路详解(完美避开人机识别)
Feb 17 Python
opencv 阈值分割的具体使用
Jul 08 Python
Python实现排序方法常见的四种
Jul 15 Python
python热力图实现的完整实例
Jun 25 Python
python爬虫scrapy图书分类实例讲解
Nov 23 #Python
scrapy处理python爬虫调度详解
Nov 23 #Python
利用Python将多张图片合成视频的实现
Nov 23 #Python
Python系统公网私网流量监控实现流程
Nov 23 #Python
Python 调用 ES、Solr、Phoenix的示例代码
Nov 23 #Python
10个示例带你掌握python中的元组
Nov 23 #Python
详解anaconda安装步骤
Nov 23 #Python
You might like
php读取csv实现csv文件下载功能
2013/12/18 PHP
php实现的支持断点续传的文件下载类
2014/09/23 PHP
基于jquery的复制网页内容到WORD的实现代码
2011/02/16 Javascript
jQuery 自定义函数写法分享
2012/03/30 Javascript
jQuery div层的放大与缩小简单实现代码
2013/03/28 Javascript
javascript基于HTML5 canvas制作画箭头组件
2014/06/25 Javascript
jquery.validate使用时遇到的问题
2015/05/25 Javascript
JavaScript学习笔记(三):JavaScript也有入口Main函数
2015/09/12 Javascript
Node.js的MongoDB驱动Mongoose基本使用教程
2016/03/01 Javascript
AngularJS之自定义服务详解(factory、service、provider)
2017/04/14 Javascript
js实现水平滚动菜单导航
2017/07/21 Javascript
JS实现简单的选择题测评系统代码思路详解(demo)
2017/09/03 Javascript
VueJs组件prop验证简单介绍
2017/09/12 Javascript
Vue.js项目模板搭建图文教程
2017/09/20 Javascript
javascript实现点亮灯泡特效示例
2019/10/15 Javascript
[14:50]2018DOTA2亚洲邀请赛开幕式
2018/04/03 DOTA
[03:18]【TI9纪实】社区大触GL与木木
2019/08/25 DOTA
Python模拟登录12306的方法
2014/12/30 Python
python中pass语句用法实例分析
2015/04/30 Python
Django中的CACHE_BACKEND参数和站点级Cache设置
2015/07/23 Python
详解Python编程中基本的数学计算使用
2016/02/04 Python
python 用正则表达式筛选文本信息的实例
2018/06/05 Python
Python后台开发Django的教程详解(启动)
2019/04/08 Python
python读写csv文件的方法
2019/08/13 Python
python如何实现word批量转HTML
2020/09/30 Python
详解java调用python的几种用法(看这篇就够了)
2020/12/10 Python
CSS3制作翻转效果_动力节点Java学院整理
2017/07/11 HTML / CSS
x-ua-compatible content=”IE=7, IE=9″意思理解
2013/07/22 HTML / CSS
英国名牌男装店:Standout
2021/02/17 全球购物
2014植树节活动总结
2014/03/11 职场文书
成龙霸王洗发水广告词
2014/03/14 职场文书
安全责任书范文
2014/08/25 职场文书
党的群众路线教育实践活动个人整改方案
2014/09/21 职场文书
致运动员的广播稿
2015/08/19 职场文书
Golang全局变量加锁的问题解决
2021/05/08 Golang
如何用PHP实现分布算法之一致性哈希算法
2021/05/26 PHP