python使用scrapy解析js示例


Posted in Python onJanuary 23, 2014
from selenium import selenium
class MySpider(CrawlSpider):
    name = 'cnbeta'
    allowed_domains = ['cnbeta.com']
    start_urls = ['https://3water.com']
    rules = (
        # Extract links matching 'category.php' (but not matching 'subsection.php')
        # and follow links from them (since no callback means follow=True by default).
        Rule(SgmlLinkExtractor(allow=('/articles/.*\.htm', )),
             callback='parse_page', follow=True),
        # Extract links matching 'item.php' and parse them with the spider's method parse_item
    )
    def __init__(self):
        CrawlSpider.__init__(self)
        self.verificationErrors = []
        self.selenium = selenium("localhost", 4444, "*firefox", "https://3water.com")
        self.selenium.start()
    def __del__(self):
        self.selenium.stop()
        print self.verificationErrors
        CrawlSpider.__del__(self)

    def parse_page(self, response):
        self.log('Hi, this is an item page! %s' % response.url)
        sel = Selector(response)
        from webproxy.items import WebproxyItem
        sel = self.selenium
        sel.open(response.url)
        sel.wait_for_page_to_load("30000")
        import time
        time.sleep(2.5)
Python 相关文章推荐
利用Python实现颜色色值转换的小工具
Oct 27 Python
Python实现将sqlite数据库导出转成Excel(xls)表的方法
Jul 17 Python
详解python上传文件和字符到PHP服务器
Nov 24 Python
python实现基于SVM手写数字识别功能
May 27 Python
python sys.argv[]用法实例详解
May 25 Python
对Python发送带header的http请求方法详解
Jan 02 Python
Python实现FTP弱口令扫描器的方法示例
Jan 31 Python
python自带tkinter库实现棋盘覆盖图形界面
Jul 17 Python
Python中的上下文管理器相关知识详解
Sep 19 Python
Python可变参数会自动填充前面的默认同名参数实例
Nov 18 Python
解决python 虚拟环境删除包无法加载的问题
Jul 13 Python
Python 在 VSCode 中使用 IPython Kernel 的方法详解
Sep 05 Python
php使用递归与迭代实现快速排序示例
Jan 23 #Python
python实现批量转换文件编码(批转换编码示例)
Jan 23 #Python
python写的一个文本编辑器
Jan 23 #Python
python生成指定长度的随机数密码
Jan 23 #Python
python使用beautifulsoup从爱奇艺网抓取视频播放
Jan 23 #Python
python3使用urllib示例取googletranslate(谷歌翻译)
Jan 23 #Python
pyside写ui界面入门示例
Jan 22 #Python
You might like
国外比较好的几个的Php开源建站平台小结
2010/04/22 PHP
PHP调用VC编写的COM组件实例
2014/03/29 PHP
php使用array_chunk函数将一个数组分割成多个数组
2018/12/05 PHP
laravel5.6 框架邮件队列database驱动简单demo示例
2020/01/26 PHP
js 通用javascript函数库整理
2011/08/14 Javascript
jQuery实现点击文本框弹出热门标签的提示效果
2013/11/17 Javascript
Nodejs学习笔记之Global Objects全局对象
2015/01/13 NodeJs
js树插件zTree获取所有选中节点数据的方法
2015/01/28 Javascript
浅谈在js传递参数中含加号(+)的处理方式
2016/10/11 Javascript
薪资那么高的Web前端必看书单
2017/10/13 Javascript
vue里面使用mui的弹出日期选择插件实例
2018/09/16 Javascript
vue刷新页面时去闪烁提升用户体验效果的实现方法
2018/12/10 Javascript
通过vue手动封装on、emit、off的代码详解
2019/05/29 Javascript
layui监听工具栏的实例(操作列表按钮)
2019/09/10 Javascript
vue 动态给每个页面添加title、关键词和描述的方法
2020/08/28 Javascript
[49:18]2018DOTA2亚洲邀请赛 3.31 小组赛 A组 OG vs TNC
2018/04/01 DOTA
跟老齐学Python之集成开发环境(IDE)
2014/09/12 Python
Python中非常实用的一些功能和函数分享
2015/02/14 Python
Django学习笔记之Class-Based-View
2017/02/15 Python
Python批量查询域名是否被注册过
2017/06/21 Python
tensorflow 获取模型所有参数总和数量的方法
2018/06/14 Python
python实现京东订单推送到测试环境,提供便利操作示例
2019/08/09 Python
python+jinja2实现接口数据批量生成工具
2019/08/28 Python
Python Tensor FLow简单使用方法实例详解
2020/01/14 Python
python使用bs4爬取boss直聘静态页面
2020/10/10 Python
澳大利亚自然和有机的健康美容产品一站式商店:Ziani Beauty
2017/12/28 全球购物
Antonioli美国在线商店:时尚前卫奢华
2019/07/29 全球购物
荷兰天然和有机产品网上商城:BigGreenSmile.nl
2020/07/26 全球购物
工程部经理岗位职责
2013/12/08 职场文书
夜班门卫岗位职责
2013/12/09 职场文书
工商管理专业毕业生求职信
2014/05/26 职场文书
邀请函的格式
2015/01/30 职场文书
毕业证明模板
2015/06/19 职场文书
幼儿园园长新年寄语
2015/08/17 职场文书
《静夜思》教学反思
2016/02/17 职场文书
如何创建一个创建MySQL数据库中的datetime类型
2022/03/21 MySQL