Python基于BeautifulSoup和requests实现的爬虫功能示例


Posted in Python onAugust 02, 2019

本文实例讲述了Python基于BeautifulSoup和requests实现的爬虫功能。分享给大家供大家参考,具体如下:

爬取的目标网页:http://www.qianlima.com/zb/area_305/

Python基于BeautifulSoup和requests实现的爬虫功能示例

这是一个招投标网站,我们使用python脚本爬取红框中的信息,包括链接网址、链接名称、时间等三项内容。

使用到的Python库:BeautifulSoup、requests

代码如下:

# -*- coding:utf-8 -*-
import requests
from bs4 import BeautifulSoup
url = 'http://www.qianlima.com/zb/area_305/'
user_agent = 'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/45.0.2454.101 Safari/537.36'
headers = { 'User-Agent' : user_agent}
r = requests.get(url,headers=headers)#连接
content = r.text#获取内容,自动转码unicode
soup = BeautifulSoup(content,"lxml")
tags1 = soup.select('div .shixian_zhaobiao')
tag1 = tags1[0]
tag2 = tag1.find(name = 'dl')
tags2 = tag2.find_all(name = 'a')
tags3 = tag2.find_all(name = 'dd')
for tag in tags2:
 print tag.get('href')
 print tag.string
 print tag.next_element.next_element.string

运行结果如下

Python基于BeautifulSoup和requests实现的爬虫功能示例

更多关于Python相关内容可查看本站专题:《Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
浅要分析Python程序与C程序的结合使用
Apr 07 Python
python爬虫框架scrapy实战之爬取京东商城进阶篇
Apr 24 Python
Python中装饰器高级用法详解
Dec 25 Python
Django中的forms组件实例详解
Nov 08 Python
对python中Json与object转化的方法详解
Dec 31 Python
Python简直是万能的,这5大主要用途你一定要知道!(推荐)
Apr 03 Python
Django框架验证码用法实例分析
May 10 Python
python tkinter canvas 显示图片的示例
Jun 13 Python
python安装和pycharm环境搭建设置方法
May 27 Python
python中的错误如何查看
Jul 08 Python
python zip()函数的使用示例
Sep 23 Python
PyQt QMainWindow的使用示例
Mar 24 Python
详解pandas DataFrame的查询方法(loc,iloc,at,iat,ix的用法和区别)
Aug 02 #Python
pandas DataFrame创建方法的方式
Aug 02 #Python
django项目环境搭建及在虚拟机本地创建django项目的教程
Aug 02 #Python
Django缓存系统实现过程解析
Aug 02 #Python
tensor和numpy的互相转换的实现示例
Aug 02 #Python
Django文件存储 自己定制存储系统解析
Aug 02 #Python
使用pycharm在本地开发并实时同步到服务器
Aug 02 #Python
You might like
支持中文字母数字、自定义字体php验证码代码
2012/02/27 PHP
php 检查电子邮件函数(自写)
2014/01/16 PHP
php登录超时检测功能实例详解
2017/03/21 PHP
js 实现在离开页面时提醒未保存的信息(减少用户重复操作)
2013/01/16 Javascript
jquery form 隐藏的input 选择
2014/04/29 Javascript
javascript实现日期格式转换
2014/12/16 Javascript
jQuery实现瀑布流的取巧做法分享
2015/01/12 Javascript
浅析Node.js中的内存泄漏问题
2015/06/23 Javascript
基于JS实现EOS隐藏错误提示层代码
2016/04/25 Javascript
bootstrap下拉列表与输入框组结合的样式调整
2016/10/08 Javascript
第一次接触Bootstrap框架
2016/10/24 Javascript
angular2中使用第三方js库的实例
2018/02/26 Javascript
vee-validate vue 2.0自定义表单验证的实例
2018/08/28 Javascript
详解Vue之父子组件传值
2019/04/01 Javascript
使用 vue 实现灭霸打响指英雄消失的效果附demo
2019/05/06 Javascript
layui table表格数据的新增,修改,删除,查询,双击获取行数据方式
2019/11/14 Javascript
jQuery实现鼠标移入显示蒙版效果
2020/01/11 jQuery
Vue表单提交点击事件只允许点击一次的实例
2020/10/23 Javascript
Python3字符串学习教程
2015/08/20 Python
python 通过类中一个方法获取另一个方法变量的实例
2019/01/22 Python
python sort、sort_index方法代码实例
2019/03/28 Python
python删除列表元素的三种方法(remove,pop,del)
2019/07/22 Python
乌克兰品牌化妆品和香水在线商店:Bomond
2020/01/14 全球购物
法学毕业生自我鉴定
2013/11/08 职场文书
个人收入证明范本
2014/01/12 职场文书
在校硕士自我鉴定
2014/01/23 职场文书
优秀共产党员先进事迹材料
2014/05/06 职场文书
计算机应用专业自荐信
2014/07/05 职场文书
党政领导班子民主生活会整改措施
2014/09/18 职场文书
2015年校长新年寄语
2014/12/08 职场文书
物业保安辞职信
2015/05/12 职场文书
大国崛起日本观后感
2015/06/02 职场文书
2016年五四青年节校园广播稿
2015/12/17 职场文书
年终奖金发放管理制度,中小企业适用,拿去救急吧!
2019/07/12 职场文书
django 认证类配置实现
2021/11/11 Python
windows系统安装配置nginx环境
2022/06/28 Servers