Python使用bs4获取58同城城市分类的方法


Posted in Python onJuly 08, 2015

本文实例讲述了Python使用bs4获取58同城城市分类的方法。分享给大家供大家参考。具体如下:

# -*- coding:utf-8 -*-
#! /usr/bin/python
import urllib
import os, datetime, sys
from bs4 import BeautifulSoup
reload(sys) 
sys.setdefaultencoding( "utf-8" ) 
__BASEURL__ = "http://bj.58.com/"
__INITURL__ = "http://bj.58.com/hezu/"
soup=BeautifulSoup(urllib.urlopen(__INITURL__))
lv1Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem')('a',href=True)
f=open('data.txt', 'w')
for element in lv1Elements[1:]:
  f.write((element.get_text() + '\r\n'))
  print element.get_text()
  url = __BASEURL__ + element.get('href')
  print url
  soup=BeautifulSoup(urllib.urlopen(url))
  lv2Elements = soup.html.body.section.find('div', 'relative').find('dl', 'secitem').find('div', 'subarea').find_all('a')
  texts = [t.get_text() for t in lv2Elements]
  f.write(' '.join(texts) + '\r\n\r\n')
f.close()

希望本文所述对大家的Python程序设计有所帮助。

Python 相关文章推荐
Python中几个比较常见的名词解释
Jul 04 Python
Python简单实现Base64编码和解码的方法
Apr 29 Python
Python+selenium实现截图图片并保存截取的图片
Jan 05 Python
Python读取properties配置文件操作示例
Mar 29 Python
python的set处理二维数组转一维数组的方法示例
May 31 Python
python pytest进阶之fixture详解
Jun 27 Python
pygame库实现俄罗斯方块小游戏
Oct 29 Python
Flask框架 CSRF 保护实现方法详解
Oct 30 Python
python tornado使用流生成图片的例子
Nov 18 Python
Win10里python3创建虚拟环境的步骤
Jan 31 Python
python中Ansible模块的Playbook的具体使用
May 28 Python
如何把python项目部署到linux服务器
Aug 26 Python
Python实现批量修改文件名实例
Jul 08 #Python
Python查询阿里巴巴关键字排名的方法
Jul 08 #Python
浅谈Python中的闭包
Jul 08 #Python
Python中atexit模块的基本使用示例
Jul 08 #Python
python登录豆瓣并发帖的方法
Jul 08 #Python
python发送HTTP请求的方法小结
Jul 08 #Python
python友情链接检查方法
Jul 08 #Python
You might like
PHP字符串长度计算 - strlen()函数使用介绍
2013/10/15 PHP
Laravel的throttle中间件失效问题解决方法
2016/10/09 PHP
PHP实现根据数组某个键值大小进行排序的方法
2018/03/13 PHP
php curl优化下载微信头像的方法总结
2018/09/07 PHP
PHP常用正则表达式精选(推荐)
2019/05/28 PHP
用javascript连接access数据库的方法
2006/11/17 Javascript
Add a Table to a Word Document
2007/06/15 Javascript
Js中setTimeout()和setInterval() 何时被调用执行的用法
2013/04/12 Javascript
Javascript中常见的校验如域名、手机、邮箱等等
2014/01/02 Javascript
JavaScript类属性的访问方式详解
2014/02/11 Javascript
如何防止INPUT按回车自动提交表单FORM
2016/12/06 Javascript
Vue.js基础知识小结
2017/01/13 Javascript
js常用DOM方法详解
2017/02/04 Javascript
Vue.js实现备忘录功能
2019/06/26 Javascript
layui按条件隐藏表格列的实例
2019/09/19 Javascript
如何使用 JavaScript 操作浏览器历史记录 API
2020/11/24 Javascript
[57:53]Secret vs Pain 2018国际邀请赛小组赛BO2 第二场 8.17
2018/08/20 DOTA
Python linecache.getline()读取文件中特定一行的脚本
2008/09/06 Python
Python守护进程(daemon)代码实例
2015/03/06 Python
详解Django中间件执行顺序
2018/07/16 Python
python简单实现AES加密和解密
2019/03/28 Python
Python实现银行账户资金交易管理系统
2020/01/03 Python
图解CSS3制作圆环形进度条的实例教程
2016/05/26 HTML / CSS
CSS3 创建网页动画实现弹跳球动效果
2018/10/30 HTML / CSS
Kneipp克奈圃美国官网:德国百年精油配方的传承
2018/02/07 全球购物
配置管理计划的主要内容有哪些
2014/06/20 面试题
艺术应用与设计专业个人的自我评价
2013/11/19 职场文书
安全生产先进个人材料
2014/02/06 职场文书
产品质量承诺书范文
2014/03/27 职场文书
教师节活动总结
2014/08/29 职场文书
公务员年度考核个人总结
2015/02/12 职场文书
2015年上半年物业工作总结
2015/03/30 职场文书
Nginx配置并兼容HTTP实现代码解析
2021/03/31 Servers
pytorch 一行代码查看网络参数总量的实现
2021/05/12 Python
logback如何自定义日志存储
2021/08/30 Java/Android
高性能跳频抗干扰宽带自组网电台
2022/02/18 无线电