python中bs4.BeautifulSoup的基本用法


Posted in Python onJuly 27, 2019

导入模块

from bs4 import BeautifulSoup
 
soup = BeautifulSoup(html_doc,"html.parser")

下面看下常见的用法

print(soup.a)
  # 拿到soup中的第一个a标签
 
 
 
  print(soup.a.name)
  # 获取a标签的名称
 
 
  print(soup.a.string)
  # 获取a标签的文本内容
 
 
  print(soup.a.text)
  # 获取a标签的文本内容
 
 
  print(soup.a["href"])
  # 获取a标签的href属性的值
 
  print(soup.a.get("href"))
  # 查找第一个a标签的href的属性
 
  print(soup.a.attrs)
  # 获取a标签的所有的属性,返回一个字典
 
 
 
  print(soup.find("a"))
  # 查找第一个a标签
 
 
  print(soup.find_all("a"))
  # 查找所有的a标签
 
 
  print(soup.find_all(id="a1"))
  # 查找所有的的id为a1的标签
 
 
  print(soup.find_all(class_="sistex"))
  # 这里需要注意,如果需要通过class去查找,则需要一个下划线
 
 
  print(soup.find_all(["a","p","br"]))
  # 查找所有的啊标签,p标签和br标签
 
 
  soup.find("a").attrs["class"] = "2b"
  # 修改某个标签的属性值
 
  del soup.find(id="a1").attrs["class"]
  # 删除某个标签的class属性
import re
 
soup.find(re.compile("b"))
# 标签中有b这个字符的标签
 
 
soup.select("a.syster")
# 这个可以放标签选择器
 
soup.select(".syster .abcd")
# 这个可以放标签选择器
 
 
soup.find("a").decompose()
# 从当前字符串中删除第一个a标签,是在原位置进行删除

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
用Python将IP地址在整型和字符串之间轻松转换
Mar 22 Python
Python简单操作sqlite3的方法示例
Mar 22 Python
Python基础语言学习笔记总结(精华)
Nov 14 Python
Python 删除连续出现的指定字符的实例
Jun 29 Python
可能是最全面的 Python 字符串拼接总结【收藏】
Jul 09 Python
Flask入门之上传文件到服务器的方法示例
Jul 18 Python
将string类型的数据类型转换为spark rdd时报错的解决方法
Feb 18 Python
python针对mysql数据库的连接、查询、更新、删除操作示例
Sep 11 Python
pytorch中nn.Conv1d的用法详解
Dec 31 Python
django admin后管定制-显示字段的实例
Mar 11 Python
Python二元算术运算常用方法解析
Sep 15 Python
python单元测试之pytest的使用
Jun 07 Python
Django的Modelforms用法简介
Jul 27 #Python
在django admin中添加自定义视图的例子
Jul 26 #Python
深入了解Django中间件及其方法
Jul 26 #Python
如何在Django项目中引入静态文件
Jul 26 #Python
Python 画出来六维图
Jul 26 #Python
django做form表单的数据验证过程详解
Jul 26 #Python
python用win32gui遍历窗口并设置窗口位置的方法
Jul 26 #Python
You might like
让你同时上传 1000 个文件 (一)
2006/10/09 PHP
PHP循环获取GET和POST值的代码
2008/04/09 PHP
php cookie名使用点号(句号)会被转换
2014/10/23 PHP
PHP数组相加操作及与array_merge的区别浅析
2016/11/26 PHP
php设计模式之策略模式实例分析【星际争霸游戏案例】
2020/03/26 PHP
jQueryUI如何自定义组件实现代码
2010/11/14 Javascript
javascript之bind使用介绍
2011/10/09 Javascript
使用jQuery的attr方法来修改onclick值
2014/07/07 Javascript
Node.js开发者必须了解的4个JS要点
2016/02/21 Javascript
原生javascript实现解析XML文档与字符串
2016/03/01 Javascript
谈一谈js中的执行环境及作用域
2016/03/30 Javascript
jQuery实现的简单拖拽功能示例
2016/09/13 Javascript
BootStrap的select2既可以查询又可以输入的实现代码
2017/02/17 Javascript
Node.js console控制台简单用法分析
2019/01/04 Javascript
详解javascript void(0)
2020/07/13 Javascript
[02:29]完美世界高校联赛上海赛区回顾
2015/12/15 DOTA
[05:24]TI9采访——教练
2019/08/24 DOTA
Python实现生成简单的Makefile文件代码示例
2015/03/10 Python
Python中使用语句导入模块或包的机制研究
2015/03/30 Python
python爬虫_自动获取seebug的poc实例
2017/08/05 Python
python实现两个文件合并功能
2018/04/01 Python
在Python中通过getattr获取对象引用的方法
2019/01/21 Python
Python二元赋值实用技巧解析
2019/10/25 Python
python GUI库图形界面开发之PyQt5结合Qt Designer创建信号与槽的详细方法与实例
2020/03/08 Python
在pytorch中动态调整优化器的学习率方式
2020/06/24 Python
你需要学会的8个Python列表技巧
2020/06/24 Python
浅析移动设备HTML5页面布局
2015/12/01 HTML / CSS
html5的input的required使用中遇到的问题及解决方法
2018/04/24 HTML / CSS
新加坡网上美容店:Hermo新加坡
2019/06/19 全球购物
SQL里面如何插入自动增长序列号字段
2012/03/29 面试题
爱岗敬业演讲稿
2014/05/05 职场文书
四风问题查摆剖析材料
2014/10/11 职场文书
2015年中职班主任工作总结
2015/05/25 职场文书
党员反四风学习心得体会
2016/01/22 职场文书
ES6 解构赋值的原理及运用
2021/05/25 Javascript
Spring中的使用@Async异步调用方法
2021/11/01 Java/Android