python抓取京东价格分析京东商品价格走势


Posted in Python onJanuary 09, 2014
from creepy import Crawler
from BeautifulSoup import BeautifulSoup
import urllib2
import json
class MyCrawler(Crawler):
    def process_document(self, doc):
        if doc.status == 200:
            print '[%d] %s' % (doc.status, doc.url)
            try:
                soup = BeautifulSoup(doc.text.decode('gb18030').encode('utf-8'))
            except Exception as e:
                print e
                soup = BeautifulSoup(doc.text)
            print soup.find(id="product-intro").div.h1.text
            url_id=urllib2.unquote(doc.url).decode('utf8').split('/')[-1].split('.')[0]
            f = urllib2.urlopen('http://p.3.cn/prices/get?skuid=J_'+url_id,timeout=5)
            price=json.loads(f.read())
            f.close()
            print price[0]['p']
        else:
            pass
crawler = MyCrawler()
crawler.set_follow_mode(Crawler.F_SAME_HOST)
crawler.set_concurrency_level(16)
crawler.add_url_filter('\.(jpg|jpeg|gif|png|js|css|swf)$')
crawler.crawl('http://item.jd.com/982040.html')
Python 相关文章推荐
python使用range函数计算一组数和的方法
May 07 Python
轻松实现python搭建微信公众平台
Feb 16 Python
win10系统中安装scrapy-1.1
Jul 03 Python
flask使用session保存登录状态及拦截未登录请求代码
Jan 19 Python
python如何在循环引用中管理内存
Mar 20 Python
浅谈python numpy中nonzero()的用法
Apr 02 Python
Django如何自定义分页
Sep 25 Python
Python 实用技巧之利用Shell通配符做字符串匹配
Aug 23 Python
python关闭占用端口方式
Dec 17 Python
Python3.7实现验证码登录方式代码实例
Feb 14 Python
Django表单提交后实现获取相同name的不同value值
May 14 Python
Python快速优雅的批量修改Word文档样式
May 20 Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
python切换hosts文件代码示例
Dec 31 #Python
使用Python进行稳定可靠的文件操作详解
Dec 31 #Python
python连接mongodb操作数据示例(mongodb数据库配置类)
Dec 31 #Python
You might like
15种PHP Encoder的比较
2007/04/17 PHP
Mysql数据库操作类( 1127版,提供源码下载 )
2010/12/02 PHP
php地址引用(php地址引用的效率问题)
2012/03/23 PHP
php实现的获取网站备案信息查询代码(360)
2013/09/23 PHP
PHP基于CURL进行POST数据上传实例
2014/11/10 PHP
php短网址和数字之间相互转换的方法
2015/03/13 PHP
PHP实现的迪科斯彻(Dijkstra)最短路径算法实例
2017/09/16 PHP
js点击事件链接的问题解决
2014/04/25 Javascript
SeaJS 与 RequireJS 的差异对比
2014/12/08 Javascript
JavaScript实现简单图片翻转的方法
2015/04/17 Javascript
javascript表单验证大全
2015/08/12 Javascript
AngularJS基础 ng-model 指令详解及示例代码
2016/08/02 Javascript
Vuejs第十一篇组件之slot内容分发实例详解
2016/09/09 Javascript
Bootstrap导航条可点击和鼠标悬停显示下拉菜单
2016/11/25 Javascript
js 获取图像缩放后的实际宽高,位置等信息
2017/03/07 Javascript
js技巧之十几行的代码实现vue.watch代码
2018/06/09 Javascript
你可能不知道的CORS跨域资源共享
2019/03/13 Javascript
vue 里面的 $forceUpdate() 强制实例重新渲染操作
2020/09/21 Javascript
详解Python中time()方法的使用的教程
2015/05/22 Python
Python实现多线程抓取妹子图
2015/08/08 Python
Python读取文件内容的三种常用方式及效率比较
2017/10/07 Python
python如何定义带参数的装饰器
2018/03/20 Python
python实现批量按比例缩放图片效果
2018/03/30 Python
PyCharm配置mongo插件的方法
2018/11/30 Python
详解【python】str与json类型转换
2019/04/29 Python
基于Django signals 信号作用及用法详解
2020/03/28 Python
如何在python中判断变量的类型
2020/07/29 Python
浅谈python锁与死锁问题
2020/08/14 Python
eHarmony英国:全球领先的认真恋爱约会平台之一
2020/11/16 全球购物
汽修专业学生自我鉴定
2013/11/16 职场文书
社会保险接收函
2014/01/12 职场文书
办理房产证委托书
2014/09/18 职场文书
Matlab求解数组中的最大值及它所在的具体位置
2021/04/16 Python
简单介绍Python的第三方库yaml
2021/06/18 Python
嵌入式Redis服务器在Spring Boot测试中的使用教程
2021/07/21 Redis
mybatis中注解与xml配置的对应关系和对比分析
2021/08/04 Java/Android