python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据示例


Posted in Python onNovember 28, 2019

本文实例讲述了python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据。分享给大家供大家参考,具体如下:

# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作
from bs4 import BeautifulSoup
import urllib.request
import re
#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc) 
#webpage = urllib.request.urlopen(req) 
#html = webpage.read()
html="""
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title" name="dromouse"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng"><!-- Elsie --></a>,
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow" class="sister" id="link3">Tillie</a>;
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng">Lacie</a>
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
soup = BeautifulSoup(html, 'html.parser') #文档对象
#查找a标签,只会查找出一个a标签
#print(soup.a)#<a class="sister" href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" id="xiaodeng"><!-- Elsie --></a>
for k in soup.find_all('a'):
 print(k)
 print(k['class'])#查a标签的class属性
 print(k['id'])#查a标签的id值
 print(k['href'])#查a标签的href值
 print(k.string)#查a标签的string
#如果,标签中含有其他标签,比如..,此时要提取中的数据,需要用k.get_text()
#tag.get('calss'),也可以达到这个效果

Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

更多关于Python相关内容可查看本站专题:《

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
零基础写python爬虫之使用urllib2组件抓取网页内容
Nov 04 Python
python中函数传参详解
Jul 03 Python
如何用itertools解决无序排列组合的问题
May 18 Python
Python多进程库multiprocessing中进程池Pool类的使用详解
Nov 24 Python
Python的地形三维可视化Matplotlib和gdal使用实例
Dec 09 Python
Python实现识别手写数字大纲
Jan 29 Python
Python简单计算文件MD5值的方法示例
Apr 11 Python
浅谈Python里面小数点精度的控制
Jul 16 Python
Python标准库使用OrderedDict类的实例讲解
Feb 14 Python
python 同时读取多个文件的例子
Jul 16 Python
python循环输出三角形图案的例子
Nov 22 Python
PyCharm无法识别PyQt5的2种解决方法,ModuleNotFoundError: No module named 'pyqt5'
Feb 17 Python
解决Python二维数组赋值问题
Nov 28 #Python
python之array赋值技巧分享
Nov 28 #Python
python3 实现函数写文件路径的正确方法
Nov 27 #Python
关于Python3 lambda函数的深入浅出
Nov 27 #Python
python3中rank函数的用法
Nov 27 #Python
Python values()与itervalues()的用法详解
Nov 27 #Python
python3 assert 断言的使用详解 (区别于python2)
Nov 27 #Python
You might like
php上传文件的增强函数
2010/07/21 PHP
php几个预定义变量$_SERVER用法小结
2014/11/07 PHP
typecho插件编写教程(三):保存配置
2015/05/28 PHP
配置eAccelerator和XCache扩展来加速PHP程序的执行
2015/12/22 PHP
Smarty实现页面静态化(生成HTML)的方法
2016/05/23 PHP
PHP中检索字符串的方法分析【strstr与substr_count方法】
2017/02/17 PHP
php获取ajax的headers方法与内容实例
2017/12/27 PHP
js文字滚动停顿效果代码
2008/06/28 Javascript
JavaScript 变量基础知识
2009/11/07 Javascript
js调用AJAX时Get和post的乱码解决方法
2013/06/04 Javascript
JS动态调用方法名示例介绍
2013/12/18 Javascript
在firefox和Chrome下关闭浏览器窗口无效的解决方法
2014/01/16 Javascript
Jquery $.getJSON 在IE下的缓存问题解决方法
2014/10/10 Javascript
JavaScript定义全局对象的方法示例
2017/01/12 Javascript
详解前后端分离之VueJS前端
2017/05/24 Javascript
nodejs密码加密中生成随机数的实例代码
2017/07/17 NodeJs
vue-cli中使用高德地图的方法示例
2019/03/28 Javascript
[56:00]DOTA2上海特级锦标赛主赛事日 - 4 胜者组决赛Secret VS Liquid第一局
2016/03/05 DOTA
[00:52]DOTA2齐天大圣预告片
2016/08/13 DOTA
[46:21]Liquid vs LGD 2018国际邀请赛淘汰赛BO3 第一场 8.23
2018/08/24 DOTA
对python中GUI,Label和Button的实例详解
2019/06/27 Python
python画图——实现在图上标注上具体数值的方法
2019/07/08 Python
Python实现K折交叉验证法的方法步骤
2019/07/11 Python
pytorch中tensor张量数据类型的转化方式
2019/12/31 Python
详解Canvas事件绑定
2018/06/27 HTML / CSS
html5模拟平抛运动(模拟小球平抛运动过程)
2013/07/25 HTML / CSS
HomeAway的巴西品牌:Alugue Temporada
2018/04/10 全球购物
马德里运动鞋商店:Nigra Mercato
2020/02/16 全球购物
艺术学院毕业生自荐信
2014/07/05 职场文书
2014年最新个人对照检查材料范文
2014/09/25 职场文书
办公室班子四风问题对照检查材料
2014/10/04 职场文书
学习雷锋精神活动总结
2015/02/06 职场文书
工作简报格式范文
2015/07/21 职场文书
营销策划分析:怎么策划才能更好销量产品?
2019/09/04 职场文书
CSS 文字装饰 text-decoration & text-emphasis 详解
2021/04/06 HTML / CSS
Python数据分析之绘图和可视化详解
2021/06/02 Python