使用python BeautifulSoup库抓取58手机维修信息


Posted in Python onNovember 21, 2013

直接上代码:

#!/usr/bin/python
# -*- coding: utf-8 -*-
import urllib
import os,datetime,string
import sys
from bs4 import BeautifulSoup
reload(sys)
sys.setdefaultencoding('utf-8')
__BASEURL__ = 'http://bj.58.com/'
__INITURL__ = "http://bj.58.com/shoujiweixiu/"
soup = BeautifulSoup(urllib.urlopen(__INITURL__))
lvlELements = soup.html.body.find('div','selectbarTable').find('tr').find_next_sibling('tr')('a',href=True)
f = open('data1.txt','a')
for element in lvlELements[1:]:
    f.write((element.get_text()+'\n\r' ))
    url = __BASEURL__ + element.get('href')
    print url
    soup = BeautifulSoup(urllib.urlopen(url))
    lv2ELements = soup.html.body.find('table','tblist').find_all('tr')
    for item in lv2ELements:
        addr = item.find('td','t').find('a').get_text()
        phone = item.find('td','tdl').find('b','tele').get_text()
        f.write('地址:'+addr +' 电话:'+ phone + '\r\n\r')
f.close()

直接执行后,存在 data1.txt中就会有商家的地址和电话等信息。
BeautifulSoup  api 的地址为: http://www.crummy.com/software/BeautifulSoup/bs4/doc/

Python 相关文章推荐
从Python的源码浅要剖析Python的内存管理
Apr 16 Python
解析Python中的异常处理
Apr 28 Python
一篇文章入门Python生态系统(Python新手入门指导)
Dec 11 Python
Python模拟百度登录实例详解
Jan 20 Python
Python黑魔法Descriptor描述符的实例解析
Jun 02 Python
python3实现域名查询和whois查询功能
Jun 21 Python
pytorch: tensor类型的构建与相互转换实例
Jul 26 Python
Python高级编程之消息队列(Queue)与进程池(Pool)实例详解
Nov 01 Python
VSCode中自动为Python文件添加头部注释
Nov 14 Python
Python实现ATM系统
Feb 17 Python
基于Tensorflow读取MNIST数据集时网络超时的解决方式
Jun 22 Python
python基础之错误和异常处理
Oct 24 Python
python BeautifulSoup使用方法详解
Nov 21 #Python
python装饰器使用方法实例
Nov 21 #Python
tornado框架blog模块分析与使用
Nov 21 #Python
python迭代器的使用方法实例
Nov 21 #Python
python生成器的使用方法
Nov 21 #Python
python单链表实现代码实例
Nov 21 #Python
python双向链表实现实例代码
Nov 21 #Python
You might like
Oracle 常见问题解答
2006/10/09 PHP
php 图像函数大举例(非原创)
2009/06/20 PHP
DedeCMS dede_channeltype表字段注释
2010/04/07 PHP
yii2.0整合阿里云oss上传单个文件的示例
2017/09/19 PHP
跟着JQuery API学Jquery 之二 属性
2010/04/09 Javascript
jquery中:input和input的区别分析
2011/07/13 Javascript
使用javascript实现Iframe自适应高度
2014/12/24 Javascript
javascript中一些util方法汇总
2015/06/10 Javascript
JavaScript入门基础
2015/08/12 Javascript
javascript每日必学之封装
2016/02/23 Javascript
JavaScript实现经典排序算法之冒泡排序
2016/12/28 Javascript
详解Web使用webpack构建前端项目
2017/09/23 Javascript
微信小程序仿朋友圈发布动态功能
2018/07/15 Javascript
flask中使用SQLAlchemy进行辅助开发的代码
2013/02/10 Python
Python中函数的多种格式和使用实例及小技巧
2015/04/13 Python
对web.py设置favicon.ico的方法详解
2018/12/04 Python
linux中如何使用python3获取ip地址
2019/07/15 Python
flask框架json数据的拿取和返回操作示例
2019/11/28 Python
Flask项目中实现短信验证码和邮箱验证码功能
2019/12/05 Python
Java多线程实现四种方式原理详解
2020/06/02 Python
django 实现后台从富文本提取纯文本
2020/07/02 Python
Python基于gevent实现文件字符串查找器
2020/08/11 Python
html5超简单的localStorage实现记住密码的功能实现
2017/09/07 HTML / CSS
台湾百利市购物中心:e-Payless
2017/08/16 全球购物
阿迪达斯印尼官方网站:adidas印尼
2020/02/10 全球购物
酒店管理专业学生求职信
2013/09/27 职场文书
护理专业的自荐信
2013/10/22 职场文书
高中体育教学反思
2014/01/29 职场文书
高三霸气励志标语
2014/06/24 职场文书
应届生找工作求职信
2014/06/24 职场文书
2014应届本科生自我评价
2014/09/13 职场文书
会计电算化实训报告
2014/11/04 职场文书
公司租车协议书
2015/01/29 职场文书
年度考核登记表个人总结
2015/03/06 职场文书
2015新生加入学生会自荐书
2015/03/24 职场文书
详解OpenCV获取高动态范围(HDR)成像
2022/04/29 Python