使用python BeautifulSoup库抓取58手机维修信息


Posted in Python onNovember 21, 2013

直接上代码:

#!/usr/bin/python
# -*- coding: utf-8 -*-
import urllib
import os,datetime,string
import sys
from bs4 import BeautifulSoup
reload(sys)
sys.setdefaultencoding('utf-8')
__BASEURL__ = 'http://bj.58.com/'
__INITURL__ = "http://bj.58.com/shoujiweixiu/"
soup = BeautifulSoup(urllib.urlopen(__INITURL__))
lvlELements = soup.html.body.find('div','selectbarTable').find('tr').find_next_sibling('tr')('a',href=True)
f = open('data1.txt','a')
for element in lvlELements[1:]:
    f.write((element.get_text()+'\n\r' ))
    url = __BASEURL__ + element.get('href')
    print url
    soup = BeautifulSoup(urllib.urlopen(url))
    lv2ELements = soup.html.body.find('table','tblist').find_all('tr')
    for item in lv2ELements:
        addr = item.find('td','t').find('a').get_text()
        phone = item.find('td','tdl').find('b','tele').get_text()
        f.write('地址:'+addr +' 电话:'+ phone + '\r\n\r')
f.close()

直接执行后,存在 data1.txt中就会有商家的地址和电话等信息。
BeautifulSoup  api 的地址为: http://www.crummy.com/software/BeautifulSoup/bs4/doc/

Python 相关文章推荐
使用PYTHON接收多播数据的代码
Mar 01 Python
跟老齐学Python之list和str比较
Sep 20 Python
python在windows下创建隐藏窗口子进程的方法
Jun 04 Python
Python 字典与字符串的互转实例
Jan 13 Python
Python实现对字符串的加密解密方法示例
Apr 29 Python
Python cookbook(数据结构与算法)同时对数据做转换和换算处理操作示例
Mar 23 Python
python3中获取文件当前绝对路径的两种方法
Apr 26 Python
Numpy array数据的增、删、改、查实例
Jun 04 Python
python实现两张图片的像素融合
Feb 23 Python
pycharm开发一个简单界面和通用mvc模板(操作方法图解)
May 27 Python
浅析Python 责任链设计模式
Sep 11 Python
利用python实现汉诺塔游戏
Mar 01 Python
python BeautifulSoup使用方法详解
Nov 21 #Python
python装饰器使用方法实例
Nov 21 #Python
tornado框架blog模块分析与使用
Nov 21 #Python
python迭代器的使用方法实例
Nov 21 #Python
python生成器的使用方法
Nov 21 #Python
python单链表实现代码实例
Nov 21 #Python
python双向链表实现实例代码
Nov 21 #Python
You might like
PHP微信支付开发实例
2016/06/22 PHP
php批量修改表结构实例
2017/05/24 PHP
IE innerHTML,outerHTML所引起的问题
2009/06/04 Javascript
js实现拉伸拖动iframe的具体代码
2013/08/03 Javascript
Firefox和IE兼容性问题及解决方法总结
2013/10/08 Javascript
在easyUI开发中,出现jquery.easyui.min.js函数库问题的解决办法
2015/09/11 Javascript
jquery实现简单的表单验证
2015/11/17 Javascript
jQuery mobile类库使用时加载导航历史的方法简介
2015/12/04 Javascript
AngularJS 表达式详细讲解及实例代码
2016/07/26 Javascript
jQuery插件echarts实现的循环生成图效果示例【附demo源码下载】
2017/03/04 Javascript
Vuex之理解state的用法实例
2017/04/19 Javascript
Js实现中国公民身份证号码有效性验证实例代码
2017/05/03 Javascript
vuejs使用递归组件实现树形目录的方法
2017/09/30 Javascript
微信小程序block的使用教程
2018/04/01 Javascript
layer ui 导入文件之前传入数据的实例
2019/09/23 Javascript
[00:56]2014DOTA2国际邀请赛 DK、iG 赛前探访
2014/07/10 DOTA
Python基于PycURL实现POST的方法
2015/07/25 Python
Python数据分析之真实IP请求Pandas详解
2016/11/18 Python
Python中的id()函数指的什么
2017/10/17 Python
matplotlib在python上绘制3D散点图实例详解
2017/12/09 Python
python并发2之使用asyncio处理并发
2017/12/21 Python
python中dict字典的查询键值对 遍历 排序 创建 访问 更新 删除基础操作方法
2018/09/13 Python
Python matplotlib画图与中文设置操作实例分析
2019/04/23 Python
pyqt 实现在Widgets中显示图片和文字的方法
2019/06/13 Python
Python字符串的修改方法实例
2019/12/19 Python
python同义词替换的实现(jieba分词)
2020/01/21 Python
tensorflow中tf.reduce_mean函数的使用
2020/04/19 Python
Django中文件上传和文件访问微项目的方法
2020/04/27 Python
使用Python制作一盏 3D 花灯喜迎元宵佳节
2021/02/26 Python
HTML5 Canvas实现玫瑰曲线和心形图案的代码实例
2014/04/10 HTML / CSS
John Hardy官方网站:手工设计首饰的奢侈品牌
2017/07/05 全球购物
法国在线药房:Shop Pharmacie
2019/11/26 全球购物
物业公司采购员岗位职责
2013/12/31 职场文书
干部培训自我鉴定
2014/01/22 职场文书
黄金搭档广告词
2014/03/21 职场文书
昆虫记读书笔记
2015/06/26 职场文书