python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python操作 hbase 数据的方法
Dec 18 Python
Python paramiko模块的使用示例
Apr 11 Python
python实现类之间的方法互相调用
Apr 29 Python
实例讲解Python脚本成为Windows中运行的exe文件
Jan 24 Python
python pytest进阶之fixture详解
Jun 27 Python
Python 二叉树的层序建立与三种遍历实现详解
Jul 29 Python
解决Python使用列表副本的问题
Dec 19 Python
Python3.7将普通图片(png)转换为SVG图片格式(网站logo图标)动起来
Apr 21 Python
使用python+poco+夜神模拟器进行自动化测试实例
Apr 23 Python
多个版本的python共存时使用pip的正确做法
Oct 26 Python
使用Python爬取小姐姐图片(beautifulsoup法)
Feb 11 Python
利用 Python 的 Pandas和 NumPy 库来清理数据
Apr 13 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
比较discuz和ecshop的截取字符串函数php版
2012/09/03 PHP
分享PHP header函数使用教程
2013/09/05 PHP
php常用字符串比较函数实例汇总
2014/11/24 PHP
PHP实现数组array转换成xml的方法
2016/07/19 PHP
Laravel5框架自定义错误页面配置操作示例
2019/04/17 PHP
php中对象引用和复制实例分析
2019/08/14 PHP
WEB页子窗口(showModalDialog和showModelessDialog)使用说明
2009/10/25 Javascript
网页中CDATA标记的说明
2010/09/12 Javascript
jQuery学习基础知识小结
2010/11/25 Javascript
Jquery Validate 正则表达式实用验证代码大全
2013/08/23 Javascript
js如何取消事件冒泡
2013/09/23 Javascript
javascript中的=等号个数问题两个跟三个有什么区别
2013/10/23 Javascript
Jquery Uploadify上传带进度条的简单实例
2014/02/12 Javascript
jQuery中delegate()方法用法实例
2015/01/19 Javascript
老司机带你解读jQuery插件开发流程
2016/05/16 Javascript
jQuery基础_入门必看知识点
2016/07/04 Javascript
原生js实现旋转木马轮播图效果
2017/02/27 Javascript
Vue.js递归组件实现组织架构树和选人功能案例分析
2019/07/03 Javascript
layui加载表格,绑定新增,编辑删除,查看按钮事件的例子
2019/09/06 Javascript
微信小程序本地存储实现每日签到、连续签到功能
2019/10/09 Javascript
[28:57]EG vs VGJ.T 2018国际邀请赛小组赛BO2 第二场 8.16
2018/08/16 DOTA
Python输出PowerPoint(ppt)文件中全部文字信息的方法
2015/04/28 Python
发布你的Python模块详解
2016/09/15 Python
pygame实现弹力球及其变速效果
2017/07/03 Python
Python Tkinter实现简易计算器功能
2018/01/30 Python
python+opencv打开摄像头,保存视频、拍照功能的实现方法
2019/01/08 Python
Python第三方库face_recognition在windows上的安装过程
2019/05/03 Python
Django框架基础模板标签与filter使用方法详解
2019/07/23 Python
Python使用scrapy爬取阳光热线问政平台过程解析
2019/08/14 Python
Python中pyecharts安装及安装失败的解决方法
2020/02/18 Python
python 使用elasticsearch 实现翻页的三种方式
2020/07/31 Python
金融事务专业毕业生求职信
2014/02/23 职场文书
服装设计师职业生涯规划范文
2014/02/28 职场文书
《少年王冕》教学反思
2014/04/11 职场文书
幼儿园中班评语大全
2014/04/17 职场文书
好学生评语大全
2014/05/05 职场文书