python抓取京东商城手机列表url实例代码


Posted in Python onDecember 18, 2013
#-*- coding: UTF-8 -*-
'''
Created on 2013-12-5
@author: good-temper
'''
import urllib2
import bs4
import time
def getPage(urlStr):
    '''
                获取页面内容
    '''
    content = urllib2.urlopen(urlStr).read()
    return content
def getNextPageUrl(currPageNum):
    #http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-页码-1-1-72-4137-33.html
    url =  u'http://list.jd.com/9987-653-655-0-0-0-0-0-0-0-1-1-'+str(currPageNum+1)+'-1-1-72-4137-33.html'
    #是否有下一页
    content = getPage(url);
    soup = bs4.BeautifulSoup(content)
    list = soup.findAll('span',{'class':'next-disabled'});
    if(len(list) == 0):
        return url
    return ''
def analyzeList():
    pageNum = 0
    list = []
    url = getNextPageUrl(pageNum)
    while url !='':
        soup = bs4.BeautifulSoup(getPage(url))
        pagelist = soup.findAll('div',{'class':'p-name'})
        for elem in pagelist:
            soup1 =  bs4.BeautifulSoup(str(elem))
            list.append(soup1.find('a')['href'])
        pageNum = pageNum+1
        print pageNum
        url = getNextPageUrl(pageNum)
    return list
def analyzeContent(url):
    return ''
def writeToFile(list, path):
    f = open(path, 'a')
    for elem in list:
        f.write(elem+'\n')
    f.close()
if __name__ == '__main__':
    list = analyzeList()
    print '共抓取'+str(len(list))+'条\n'
    writeToFile(list, u'E:\\jd_phone_list.dat');
Python 相关文章推荐
Python跳出循环语句continue与break的区别
Aug 25 Python
Python中的匿名函数使用简介
Apr 27 Python
Python实现的端口扫描功能示例
Apr 08 Python
PyQt5每天必学之创建窗口居中效果
Apr 19 Python
基于python的图片修复程序(实现水印去除)
Jun 04 Python
详解python中Numpy的属性与创建矩阵
Sep 10 Python
pymongo中聚合查询的使用方法
Mar 22 Python
Python 线性回归分析以及评价指标详解
Apr 02 Python
Python暴力破解Mysql数据的示例
Nov 09 Python
详解pycharm连接远程linux服务器的虚拟环境的方法
Nov 13 Python
Python将QQ聊天记录生成词云的示例代码
Feb 10 Python
Python爬取科目四考试题库的方法实现
Mar 30 Python
python获取糗百图片代码实例
Dec 18 #Python
python算法学习之计数排序实例
Dec 18 #Python
python算法学习之基数排序实例
Dec 18 #Python
python算法学习之桶排序算法实例(分块排序)
Dec 18 #Python
python计算最大优先级队列实例
Dec 18 #Python
python计算最小优先级队列代码分享
Dec 18 #Python
python查找第k小元素代码分享
Dec 18 #Python
You might like
PHP 和 MySQL 开发的 8 个技巧
2006/10/09 PHP
图书管理程序(三)
2006/10/09 PHP
php读取xml实例代码
2010/01/28 PHP
php中mkdir函数用法实例分析
2014/11/15 PHP
学习php设计模式 php实现合成模式(composite)
2015/12/08 PHP
Thinkphp3.2实用篇之计算型验证码示例
2017/02/09 PHP
laravel 实现划分admin和home 模块分组
2019/10/15 PHP
解决laravel中日志权限莫名变成了root的问题
2019/10/17 PHP
phpQuery采集网页实现代码实例
2020/04/02 PHP
js实现完全自定义可带多级目录的网页鼠标右键菜单方法
2015/02/28 Javascript
javascript变量声明实例分析
2015/04/25 Javascript
用JavaScript实现对话框的教程
2015/06/04 Javascript
jQuery实现的简洁下拉菜单导航效果代码
2015/08/26 Javascript
Bootstrap Table的使用总结
2016/10/08 Javascript
React Js 微信禁止复制链接分享禁止隐藏右上角菜单功能
2017/05/26 Javascript
最全的JavaScript开发工具列表 总有一款适合你
2017/06/29 Javascript
vue不通过路由直接获取url中参数的方法示例
2017/08/24 Javascript
Angular 4.x+Ionic3踩坑之Ionic3.x pop反向传值详解
2018/03/13 Javascript
vue实现分页组件
2020/06/16 Javascript
在Linux中通过Python脚本访问mdb数据库的方法
2015/05/06 Python
Saltstack快速入门简单汇总
2016/03/01 Python
pycharm 将django中多个app放到同个文件夹apps的处理方法
2018/05/30 Python
详解python里的命名规范
2018/07/16 Python
PyCharm License Activation激活码失效问题的解决方法(图文详解)
2020/03/12 Python
python实现代码审查自动回复消息
2021/02/01 Python
3D动画《斗罗大陆》上线当日播放过亿
2021/03/16 国漫
利用CSS3动画实现圆圈由小变大向外扩散的效果实例
2018/09/10 HTML / CSS
小狗电器官方商城:中国高端吸尘器品牌
2017/03/29 全球购物
英国珠宝和手表专家:Pleasance & Harper
2020/10/21 全球购物
材料加工硕士生求职信
2013/10/10 职场文书
农民工工资发放承诺书
2014/03/31 职场文书
幼儿评语大全
2014/04/30 职场文书
学校地质灾害防治方案
2014/06/10 职场文书
关于十八大的演讲稿
2014/09/15 职场文书
合同和协议有什么区别?
2014/10/08 职场文书
酒店辞职书怎么写
2015/02/26 职场文书