python抓取京东价格分析京东商品价格走势


Posted in Python onJanuary 09, 2014
from creepy import Crawler
from BeautifulSoup import BeautifulSoup
import urllib2
import json
class MyCrawler(Crawler):
    def process_document(self, doc):
        if doc.status == 200:
            print '[%d] %s' % (doc.status, doc.url)
            try:
                soup = BeautifulSoup(doc.text.decode('gb18030').encode('utf-8'))
            except Exception as e:
                print e
                soup = BeautifulSoup(doc.text)
            print soup.find(id="product-intro").div.h1.text
            url_id=urllib2.unquote(doc.url).decode('utf8').split('/')[-1].split('.')[0]
            f = urllib2.urlopen('http://p.3.cn/prices/get?skuid=J_'+url_id,timeout=5)
            price=json.loads(f.read())
            f.close()
            print price[0]['p']
        else:
            pass
crawler = MyCrawler()
crawler.set_follow_mode(Crawler.F_SAME_HOST)
crawler.set_concurrency_level(16)
crawler.add_url_filter('\.(jpg|jpeg|gif|png|js|css|swf)$')
crawler.crawl('http://item.jd.com/982040.html')
Python 相关文章推荐
Python的Flask框架标配模板引擎Jinja2的使用教程
Jul 12 Python
Python中is与==判断的区别
Mar 28 Python
Python使用Selenium模块模拟浏览器抓取斗鱼直播间信息示例
Jul 18 Python
windows下搭建python scrapy爬虫框架步骤
Dec 23 Python
Python从文件中读取指定的行以及在文件指定位置写入
Sep 06 Python
python kafka 多线程消费者&手动提交实例
Dec 21 Python
Pytorch根据layers的name冻结训练方式
Jan 06 Python
如何在Python 游戏中模拟引力
Mar 27 Python
jupyter notebook oepncv 显示一张图像的实现
Apr 24 Python
在Keras中CNN联合LSTM进行分类实例
Jun 29 Python
Python self用法详解
Nov 28 Python
python实现模拟器爬取抖音评论数据的示例代码
Jan 06 Python
python实现电子词典
Apr 23 #Python
python中cPickle用法例子分享
Jan 03 #Python
使用python获取CPU和内存信息的思路与实现(linux系统)
Jan 03 #Python
Python群发邮件实例代码
Jan 03 #Python
python切换hosts文件代码示例
Dec 31 #Python
使用Python进行稳定可靠的文件操作详解
Dec 31 #Python
python连接mongodb操作数据示例(mongodb数据库配置类)
Dec 31 #Python
You might like
PHP中file_exists()判断中文文件名无效的解决方法
2014/11/12 PHP
php构造函数的继承方法
2015/02/09 PHP
php递归遍历多维数组的方法
2015/04/18 PHP
PHP使用PHPExcel删除Excel单元格指定列的方法
2016/07/06 PHP
php框架CodeIgniter使用redis的方法分析
2018/04/13 PHP
关于Yii中模型场景的一些简单介绍
2019/09/22 PHP
PHP架构及原理知识点详解
2019/12/22 PHP
js 鼠标拖动对象 可让任何div实现拖动效果
2009/11/09 Javascript
javascript setAttribute, getAttribute 在不同浏览器上的不同表现
2010/08/05 Javascript
Javascript中innerHTML用法实例分析
2015/01/12 Javascript
JS获取时间的方法
2015/01/21 Javascript
js鼠标点击按钮切换图片-图片自动切换-点击左右按钮切换特效代码
2015/09/02 Javascript
jQuery实现的超简单点赞效果实例分析
2015/12/31 Javascript
移动端 一个简单易懂的弹出框
2016/07/06 Javascript
JavaScript SHA1加密算法实现详细代码
2016/10/06 Javascript
js与jquery分别实现tab标签页功能的方法
2016/11/18 Javascript
jQuery事件_动力节点Java学院整理
2017/07/05 jQuery
Vue 动态组件components和v-once指令的实现
2019/08/30 Javascript
js获取 gif 的帧数的代码实例
2019/09/10 Javascript
Python处理JSON时的值报错及编码报错的两则解决实录
2016/06/26 Python
对于Python中RawString的理解介绍
2016/07/07 Python
python实现画一颗树和一片森林
2018/06/25 Python
python算法与数据结构之冒泡排序实例详解
2019/06/22 Python
python 一个figure上显示多个图像的实例
2019/07/08 Python
wxPython实现分隔窗口
2019/11/19 Python
Python Unittest原理及基本使用方法
2020/11/06 Python
Agoda台湾官网:国内外订房2折起
2018/03/20 全球购物
军校本科大学生自我评价
2014/01/14 职场文书
小学教师师德感言
2014/02/10 职场文书
计算机应届毕业生自荐信范文
2014/02/23 职场文书
2014年质检工作总结
2014/11/26 职场文书
2015年人事工作总结范文
2015/04/09 职场文书
法律意见书范文
2015/05/20 职场文书
nginx+lua单机上万并发的实现
2021/05/31 Servers
SpringCloud Feign请求头删除修改的操作代码
2022/03/20 Java/Android
Redis如何使用乐观锁(CAS)保证数据一致性
2022/03/25 Redis