基于python爬取链家二手房信息代码示例


Posted in Python onOctober 21, 2020

基本环境配置

  • python 3.6
  • pycharm
  • requests
  • parsel
  • time

相关模块pip安装即可

确定目标网页数据

基于python爬取链家二手房信息代码示例

哦豁,这个价格..................看到都觉得脑阔疼

通过开发者工具,可以直接找到网页返回的数据~

基于python爬取链家二手房信息代码示例
基于python爬取链家二手房信息代码示例

每一个二手房的数据,都在网页的 li 标签里面,咱们可以获取网页返回的数据,然后通过解析,就可以获取到自己想要的数据了~

获取网页数据

import requests
headers = {
  'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'
}
response = requests.get(url=url, headers=headers)

解析网页数据

import parsel
selector = parsel.Selector(response.text)
lis = selector.css('.sellListContent li')
dit = {}
for li in lis:
  title = li.css('.title a::text').get()
  dit['标题'] = title
  positionInfo = li.css('.positionInfo a::text').getall()
  info = '-'.join(positionInfo)
  dit['开发商'] = info
  houseInfo = li.css('.houseInfo::text').get()
  dit['房子信息'] = houseInfo
  followInfo = li.css('.followInfo::text').get()
  dit['发布周期'] = followInfo
  Price = li.css('.totalPrice span::text').get()
  dit['售价/万'] = Price
  unitPrice = li.css('.unitPrice span::text').get()
  dit['单价'] = unitPrice
  csv_writer.writerow(dit)
  print(dit)

基于python爬取链家二手房信息代码示例

保存数据

import csv
f = open('二手房信息.csv', mode='a', encoding='utf-8-sig', newline='')
csv_writer = csv.DictWriter(f, fieldnames=['标题', '开发商', '房子信息', '发布周期', '售价/万', '单价'])
csv_writer.writeheader()
csv_writer.writerow(dit)
f.close()

基于python爬取链家二手房信息代码示例

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python 网络编程起步(Socket发送消息)
Sep 06 Python
跟老齐学Python之for循环语句
Oct 02 Python
Python socket实现简单聊天室
Apr 01 Python
Python实现求解一元二次方程的方法示例
Jun 20 Python
Django中使用Celery的方法示例
Nov 29 Python
Python API 自动化实战详解(纯代码)
Jun 11 Python
python 设置输出图像的像素大小方法
Jul 04 Python
django创建超级用户过程解析
Sep 18 Python
最新2019Pycharm安装教程 亲测
Feb 28 Python
python 最简单的实现适配器设计模式的示例
Jun 30 Python
Python configparser模块应用过程解析
Aug 14 Python
Django操作cookie的实现
May 26 Python
如何让PyQt5中QWebEngineView与JavaScript交互
Oct 21 #Python
Python为何不支持switch语句原理详解
Oct 21 #Python
基于Python爬取素材网站音频文件
Oct 21 #Python
ffmpeg+Python实现B站MP4格式音频与视频的合并示例代码
Oct 21 #Python
运行Python编写的程序方法实例
Oct 21 #Python
Python读写csv文件流程及异常解决
Oct 20 #Python
Python脚本打包成可执行文件过程解析
Oct 20 #Python
You might like
第十四节--命名空间
2006/11/16 PHP
php生成excel列序号代码实例
2013/12/24 PHP
php function用法如何递归及return和echo区别
2014/03/07 PHP
Fatal error: session_start(): Failed to initialize storage module: files问题解决方法
2014/05/04 PHP
基于thinkPHP实现的微信自定义分享功能示例
2016/09/23 PHP
PHP批量删除jQuery操作
2017/07/23 PHP
thinkPHP5.0框架验证码调用及点击图片刷新简单实现方法
2018/09/07 PHP
JS获取后台Cookies值的小例子
2013/03/04 Javascript
Javascript实现真实字符串剩余字数提示的实例代码
2013/10/22 Javascript
jQuery点击自身以外地方关闭弹出层的简单实例
2013/12/24 Javascript
分享10个原生JavaScript技巧
2015/04/20 Javascript
使用jQuery+EasyUI实现CheckBoxTree的级联选中特效
2015/12/06 Javascript
Node.js Addons翻译(C/C++扩展)
2016/06/12 Javascript
Javascript中的arguments对象
2016/06/20 Javascript
AngularJS实现单独作用域内的数据操作
2016/09/05 Javascript
如何使用jquery实现文字上下滚动效果
2016/10/12 Javascript
AngularJS中的Promise详细介绍及实例代码
2016/12/13 Javascript
原生js实现返回顶部缓冲效果
2017/01/18 Javascript
JS 实现随机验证码功能
2017/02/15 Javascript
layui分页效果实现代码
2017/05/19 Javascript
js脚本编写简单刷票投票系统
2017/06/27 Javascript
Vue filter格式化时间戳时间成标准日期格式的方法
2018/09/16 Javascript
WebSocket的简单介绍及应用
2019/05/23 Javascript
微信sdk实现禁止微信分享(使用原生php实现)
2019/11/15 Javascript
微信小程序实现简单文字跑马灯
2020/05/26 Javascript
JavaScript图片旋转效果实现方法详解
2020/06/28 Javascript
python 从远程服务器下载日志文件的程序
2013/02/10 Python
python中 chr unichr ord函数的实例详解
2017/08/06 Python
获取python运行输出的数据并解析存为dataFrame实例
2020/07/07 Python
详解如何通过H5(浏览器/WebView/其他)唤起本地app
2017/12/11 HTML / CSS
BONIA官方网站:国际奢侈品牌和皮革专家
2016/11/27 全球购物
亚洲颇具影响力的男性在线购物零售商:His
2019/11/24 全球购物
Sahajan美国:阿育吠陀护肤品牌
2021/01/09 全球购物
应届生妇产科护士求职信
2013/10/27 职场文书
电钳专业个人求职信
2014/01/04 职场文书
试用期转正后的自我评价
2014/09/21 职场文书