python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据示例


Posted in Python onNovember 28, 2019

本文实例讲述了python3 BeautifulSoup模块使用字典的方法抓取a标签内的数据。分享给大家供大家参考,具体如下:

# -*- coding:utf-8 -*-
#python 2.7
#XiaoDeng
#http://tieba.baidu.com/p/2460150866
#标签操作
from bs4 import BeautifulSoup
import urllib.request
import re
#如果是网址,可以用这个办法来读取网页
#html_doc = "http://tieba.baidu.com/p/2460150866"
#req = urllib.request.Request(html_doc) 
#webpage = urllib.request.urlopen(req) 
#html = webpage.read()
html="""
<html><head><title>The Dormouse's story</title></head>
<body>
<p class="title" name="dromouse"><b>The Dormouse's story</b></p>
<p class="story">Once upon a time there were three little sisters; and their names were
<a href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng"><!-- Elsie --></a>,
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="link2">Lacie</a> and
<a href="http://example.com/tillie" rel="external nofollow" class="sister" id="link3">Tillie</a>;
<a href="http://example.com/lacie" rel="external nofollow" rel="external nofollow" class="sister" id="xiaodeng">Lacie</a>
and they lived at the bottom of a well.</p>
<p class="story">...</p>
"""
soup = BeautifulSoup(html, 'html.parser') #文档对象
#查找a标签,只会查找出一个a标签
#print(soup.a)#<a class="sister" href="http://example.com/elsie" rel="external nofollow" rel="external nofollow" id="xiaodeng"><!-- Elsie --></a>
for k in soup.find_all('a'):
 print(k)
 print(k['class'])#查a标签的class属性
 print(k['id'])#查a标签的id值
 print(k['href'])#查a标签的href值
 print(k.string)#查a标签的string
#如果,标签中含有其他标签,比如..,此时要提取中的数据,需要用k.get_text()
#tag.get('calss'),也可以达到这个效果

Python Socket编程技巧总结》、《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》

更多关于Python相关内容可查看本站专题:《

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
Python时区设置方法与pytz查询时区教程
Nov 27 Python
Python XML RPC服务器端和客户端实例
Nov 22 Python
详解Python的Django框架中的Cookie相关处理
Jul 22 Python
Python实现的双色球生成功能示例
Dec 18 Python
Python实现爬取百度贴吧帖子所有楼层图片的爬虫示例
Apr 26 Python
Python装饰器原理与用法分析
Apr 30 Python
Python中判断输入是否为数字的实现代码
May 26 Python
python统计字符的个数代码实例
Feb 07 Python
Python3.9又更新了:dict内置新功能
Feb 28 Python
关于tf.matmul() 和tf.multiply() 的区别说明
Jun 18 Python
解决pycharm修改代码后第一次运行不生效的问题
Feb 06 Python
python geopandas读取、创建shapefile文件的方法
Jun 29 Python
解决Python二维数组赋值问题
Nov 28 #Python
python之array赋值技巧分享
Nov 28 #Python
python3 实现函数写文件路径的正确方法
Nov 27 #Python
关于Python3 lambda函数的深入浅出
Nov 27 #Python
python3中rank函数的用法
Nov 27 #Python
Python values()与itervalues()的用法详解
Nov 27 #Python
python3 assert 断言的使用详解 (区别于python2)
Nov 27 #Python
You might like
PHP_Flame(Version:Progress)的原代码
2006/10/09 PHP
mysql 全文搜索 技巧
2007/04/27 PHP
PHP异步调用socket实现代码
2012/01/12 PHP
smarty模板引擎之内建函数用法
2015/03/30 PHP
深入理解PHP中的count函数
2016/05/31 PHP
smarty循环嵌套用法示例分析
2016/07/19 PHP
让textarea控件的滚动条怎是位与最下方
2007/04/20 Javascript
JavaScript 关键字屏蔽实现函数
2009/08/02 Javascript
js利用与或运算符优先级实现if else条件判断表达式
2010/04/15 Javascript
JavaScript高级程序设计 XML、Ajax 学习笔记
2011/09/10 Javascript
jQuery EasyUI API 中文文档 - Panel面板
2011/09/30 Javascript
一个简单的JS时间控件示例代码(JS时分秒时间控件)
2013/11/22 Javascript
jquery原创弹出层折叠效果点击折叠弹出一个层
2014/03/12 Javascript
js操作iframe父子窗体示例
2014/05/22 Javascript
JavaScript中setUTCFullYear()方法的使用简介
2015/06/12 Javascript
针对后台列表table拖拽比较实用的jquery拖动排序
2016/10/10 Javascript
基于Vue单文件组件详解
2017/09/15 Javascript
Angular将填入表单的数据渲染到表格的方法
2017/09/22 Javascript
深入理解Vuex 模块化(module)
2017/09/26 Javascript
JS实现中文汉字按拼音排序的方法
2017/10/09 Javascript
jackson解析json字符串,首字母大写会自动转为小写的方法
2017/12/22 Javascript
微信小程序实现单个或多个倒计时功能
2020/11/01 Javascript
JavaScript中展开运算符及应用的实例代码
2021/01/14 Javascript
用Python进行基础的函数式编程的教程
2015/03/31 Python
Python中__new__与__init__方法的区别详解
2015/05/04 Python
浅谈终端直接执行py文件,不需要python命令
2017/01/23 Python
python Spyder界面无法打开的解决方法
2018/04/27 Python
Python调用C语言的实现
2019/07/26 Python
对Django中static(静态)文件详解以及{% static %}标签的使用方法
2019/07/28 Python
使用python和pygame制作挡板弹球游戏
2019/12/03 Python
Python判断三段线能否构成三角形的代码
2020/04/12 Python
PyCharm Community安装与配置的详细教程
2020/11/24 Python
应届大学生自荐信格式
2013/09/21 职场文书
用React Native制作一个简单的游戏引擎
2021/05/27 Javascript
Flask使用SQLAlchemy实现持久化数据
2021/07/16 Python
JS开发前端团队展示控制器来为成员引流
2022/08/14 Javascript