python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python2.5/2.6实用教程 入门基础篇
Nov 29 Python
详解python中的装饰器
Jul 10 Python
Python 实现两个列表里元素对应相乘的方法
Nov 14 Python
Python 使用Numpy对矩阵进行转置的方法
Jan 28 Python
详解python爬虫系列之初识爬虫
Apr 06 Python
python opencv 图像拼接的实现方法
Jun 27 Python
python利用re,bs4,requests模块获取股票数据
Jul 29 Python
解决django同步数据库的时候app models表没有成功创建的问题
Aug 09 Python
Python Web框架之Django框架Model基础详解
Aug 16 Python
Python3.7.0 Shell添加清屏快捷键的实现示例
Mar 23 Python
Python selenium自动化测试模型图解
Apr 15 Python
python,Java,JavaScript实现indexOf
Sep 09 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
支付宝接口开发集成支付环境小结
2015/03/17 PHP
Joomla数据库操作之JFactory::getDBO用法
2016/05/05 PHP
CI框架实现优化文件上传及多文件上传的方法
2017/01/04 PHP
PHP实现添加购物车功能
2017/03/06 PHP
JavaScript 学习笔记(十四) 正则表达式
2010/01/22 Javascript
js select常用操作控制代码
2010/03/16 Javascript
基于jquery实现瀑布流布局
2020/06/28 Javascript
JS实现简单的右下角弹出提示窗口完整实例
2016/06/21 Javascript
echarts整合多个类似option的方法实例
2018/07/10 Javascript
Layui给数据表格动态添加一行并跳转到添加行所在页的方法
2018/08/20 Javascript
在vue中使用v-bind:class的选项卡方法
2018/09/27 Javascript
vue组件数据传递、父子组件数据获取,slot,router路由功能示例
2019/03/19 Javascript
IE浏览器下JS脚本提交表单后,不能自动提示问题解决方法
2019/06/04 Javascript
Layui Form 自定义验证的实例代码
2019/09/14 Javascript
vue中touch和click共存的解决方式
2020/07/28 Javascript
JS typeof fn === 'function' && fn()详解
2020/08/22 Javascript
举例区分Python中的浅复制与深复制
2015/07/02 Python
在Linux系统上部署Apache+Python+Django+MySQL环境
2015/12/24 Python
Python缩进和冒号详解
2016/06/01 Python
导入tensorflow:ImportError: libcublas.so.9.0 报错
2020/01/06 Python
详解pytorch中squeeze()和unsqueeze()函数介绍
2020/09/03 Python
解决tensorflow模型压缩的问题_踩坑无数,总算搞定
2021/03/02 Python
一款纯css3实现简单的checkbox复选框和radio单选框
2014/11/05 HTML / CSS
html5的画布canvas——画出弧线、旋转的图形实例代码+效果图
2013/06/09 HTML / CSS
html5 offlline 缓存使用示例
2013/06/24 HTML / CSS
从零实现一个自定义html5播放器的示例代码
2017/08/01 HTML / CSS
泰国的头号网上婴儿用品店:Motherhood.co.th
2019/04/09 全球购物
教育专业个人求职信
2013/12/02 职场文书
九一八事变演讲稿范文
2014/09/14 职场文书
村党支部书记个人对照材料汇报
2014/10/26 职场文书
校长师德表现自我评价
2015/03/04 职场文书
2015纪念九一八事变84周年演讲稿
2015/03/19 职场文书
仰望星空观后感
2015/06/10 职场文书
优秀团员主要事迹材料
2015/11/05 职场文书
【海涛教你打DOTA】剑圣第一人称视角解说
2022/04/01 DOTA
搭建Yolov5服务器
2022/04/30 Servers