python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python3+PyQt5实现使用剪贴板做复制与粘帖示例
Jan 24 Python
Django添加KindEditor富文本编辑器的使用
Oct 24 Python
python的set处理二维数组转一维数组的方法示例
May 31 Python
python 判断字符串中是否含有汉字或非汉字的实例
Jul 15 Python
Python 分发包中添加额外文件的方法
Aug 16 Python
python+tkinter实现学生管理系统
Aug 20 Python
基于pytorch padding=SAME的解决方式
Feb 18 Python
python GUI库图形界面开发之PyQt5时间控件QTimer详细使用方法与实例
Feb 26 Python
python3 使用openpyxl将mysql数据写入xlsx的操作
May 15 Python
Spark处理数据排序问题如何避免OOM
May 21 Python
Python获取江苏疫情实时数据及爬虫分析
Aug 02 Python
python如何读取和存储dict()与.json格式文件
Jun 25 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
PHP应用JSON技巧讲解
2013/02/03 PHP
php CI框架插入一条或多条sql记录示例
2014/07/29 PHP
php修改指定文件后缀的方法
2014/09/11 PHP
使用PHPCMS搭建wap手机网站
2015/09/20 PHP
深入剖析浏览器退出之后php还会继续执行么
2016/05/17 PHP
超强多功能php绿色集成环境详解
2017/01/25 PHP
laravel配置Redis多个库的实现方法
2019/04/10 PHP
JQuery给元素绑定click事件多次执行的解决方法
2014/05/29 Javascript
jQuery点缩略图弹出层显示大图片
2015/02/13 Javascript
JQuery+CSS实现图片上放置按钮的方法
2015/05/29 Javascript
详解JavaScript中setSeconds()方法的使用
2015/06/11 Javascript
javascript基于prototype实现类似OOP继承的方法
2015/12/16 Javascript
jQuery 如何给Carousel插件添加新的功能
2016/04/18 Javascript
同步异步动态引入js文件的几种方法总结
2016/09/23 Javascript
Angular实现图片裁剪工具ngImgCrop实践
2017/08/17 Javascript
基于Fixed定位的框选功能的实现代码
2019/05/13 Javascript
layui table 获取分页 limit的方法
2019/09/20 Javascript
[06:43]2018DOTA2国际邀请赛寻真——VGJ.Thunder
2018/08/11 DOTA
Python科学计算包numpy用法实例详解
2018/02/08 Python
Python基于Tkinter模块实现的弹球小游戏
2018/12/27 Python
python字典的常用方法总结
2019/07/31 Python
python-numpy-指数分布实例详解
2019/12/07 Python
python中numpy.empty()函数实例讲解
2021/02/05 Python
Edwaybuy西班牙:小米在线商店
2019/12/04 全球购物
幼师专业求职推荐信
2013/11/08 职场文书
医院实习接收函
2014/01/12 职场文书
酒店节能降耗方案
2014/05/08 职场文书
父亲节活动策划方案
2014/08/24 职场文书
北京天坛导游词
2015/02/12 职场文书
学生会辞职信
2015/03/02 职场文书
总经理岗位职责范本
2015/04/01 职场文书
2016年清明节寄语
2015/12/04 职场文书
Spring Boot mybatis-config 和 log4j 输出sql 日志的方式
2021/07/26 Java/Android
前端JavaScript大管家 package.json
2021/11/02 Javascript
React Fragment介绍与使用详解
2021/11/11 Javascript
Python tensorflow卷积神经Inception V3网络结构
2022/05/06 Python