python使用scrapy解析js示例


Posted in Python onJanuary 23, 2014
from selenium import selenium
class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['https://3water.com']
    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),
        # Extract links matching 'item.php' and parse them with the spider's method parse_item
    )
    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "https://3water.com")
        self.selenium.start()
    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)

    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem
        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time
        time.sleep(2.5)
Python 相关文章推荐
Python解释执行原理分析
Aug 22 Python
Python中Continue语句的用法的举例详解
May 14 Python
最近Python有点火? 给你7个学习它的理由!
Jun 26 Python
使用python进行文本预处理和提取特征的实例
Jun 05 Python
Python Scapy随心所欲研究TCP协议栈
Nov 20 Python
Python的高阶函数用法实例分析
Apr 11 Python
详解Python下载图片并保存本地的两种方式
May 15 Python
python数据库开发之MongoDB安装及Python3操作MongoDB数据库详细方法与实例
Mar 18 Python
python利用Excel读取和存储测试数据完成接口自动化教程
Apr 30 Python
基于python实现matlab filter函数过程详解
Jun 08 Python
python 读取串口数据的示例
Nov 09 Python
Python基于execjs运行js过程解析
Nov 27 Python
php使用递归与迭代实现快速排序示例
Jan 23 #Python
python实现批量转换文件编码(批转换编码示例)
Jan 23 #Python
python写的一个文本编辑器
Jan 23 #Python
python生成指定长度的随机数密码
Jan 23 #Python
python使用beautifulsoup从爱奇艺网抓取视频播放
Jan 23 #Python
python3使用urllib示例取googletranslate(谷歌翻译)
Jan 23 #Python
pyside写ui界面入门示例
Jan 22 #Python
You might like
phpfans留言版用到的install.php
2007/01/04 PHP
PHP中图片等比缩放的实例
2013/03/24 PHP
解析PHP跳出循环的方法以及continue、break、exit的区别介绍
2013/07/01 PHP
分享PHP函数实现数字与文字分页代码
2015/07/28 PHP
Thinkphp实现站点静态化的方法详解
2017/03/21 PHP
PHP批量删除jQuery操作
2017/07/23 PHP
PHP 7.1中AES加解密方法mcrypt_module_open()的替换方案
2017/10/17 PHP
Js(JavaScript)中,弹出是或否的选择框示例(confirm用法的实例分析)
2013/07/09 Javascript
Extjs4中Form的使用之本地hiddenfield
2013/11/26 Javascript
原始XMLHttpRequest方法详情回顾
2013/11/28 Javascript
JavaScript自定义函数实现查找两个字符串最长公共子串的方法
2016/11/24 Javascript
bootstrap weebox 支持ajax的模态弹出框
2017/02/23 Javascript
Angular2使用Angular CLI快速搭建工程(一)
2017/05/21 Javascript
JS实现上传图片实时预览功能
2017/05/22 Javascript
新手入门js闭包学习过程解析
2019/10/08 Javascript
Element Rate 评分的使用方法
2020/07/27 Javascript
小程序实现密码输入框
2020/11/16 Javascript
vue+iview实现分页及查询功能
2020/11/17 Vue.js
[01:14]3.19DOTA2发布会 三代刀塔人第二代
2014/03/25 DOTA
用Python程序抓取网页的HTML信息的一个小实例
2015/05/02 Python
Python运算符重载用法实例
2015/05/28 Python
基于Django用户认证系统详解
2018/02/21 Python
python搭建服务器实现两个Android客户端间收发消息
2018/04/12 Python
使用python实现ftp的文件读写方法
2019/07/02 Python
详解pandas数据合并与重塑(pd.concat篇)
2019/07/09 Python
详解CSS3中常用的样式【基本文本和字体样式】
2020/10/20 HTML / CSS
html5 canvas简单封装一个echarts实现不了的饼图
2018/06/12 HTML / CSS
健身场所或家用健身设备:Life Fitness
2017/11/01 全球购物
波兰快递服务:Globkurier.pl
2019/11/08 全球购物
2013届毕业生求职信范文
2013/11/20 职场文书
商务日语专业自荐信
2014/04/17 职场文书
政风行风评议整改方案
2014/09/15 职场文书
谢师宴邀请函
2015/02/02 职场文书
部门经理迟到检讨书
2015/02/16 职场文书
Nginx虚拟主机的配置步骤过程全解
2022/03/31 Servers
Python实现双向链表
2022/05/25 Python