如何使用Python抓取网页tag操作


Posted in Python onFebruary 14, 2020

这篇文章主要介绍了如何使用Python抓取网页tag操作,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

1. 获取操作tag

  • 获取操作tag的接种方式:
  • soup.find_all(name=None, attrs={}, recursive=True, text=None, limit=None, **kwargs),返回符合条件的所有标签,查找不到则返回[],可以传递标签名,标签属性,关键字参数,函数,True等
  • soup.find(name=None, attrs={}, recursive=True, text=None, **kwargs),返回第一个符合条件的标签,查找不到则返回None
  • soup.select(selector, _candidate_generator=None, limit=None),根据css选择器返回所有符合条件的标签
  • soup.select_one(selector),返回符合css选择器的第一个标签

2. 操作tag

  • tag.name ,获取标签名,例如:'div'
  • tag['attr_name'] , 获取标签的某个属性的值,string类型
  • tag['class'] ,获取标签的class属性值,list类型,例如:['orange', 'login']
  • tag.attrs ,获取标签的所有属性,dict类型
  • tag.get_text() ,返回标签的内容,或者 tag.text

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python中join和split用法实例
Apr 14 Python
asyncio 的 coroutine对象 与 Future对象使用指南
Sep 11 Python
浅析python实现scrapy定时执行爬虫
Mar 04 Python
python使用scrapy发送post请求的坑
Sep 04 Python
用Python编写一个简单的CS架构后门的方法
Nov 20 Python
Linux上使用Python统计每天的键盘输入次数
Apr 17 Python
如何爬取通过ajax加载数据的网站
Aug 15 Python
python3 配置logging日志类的操作
Apr 08 Python
Anaconda详细安装步骤图文教程
Nov 12 Python
python Scrapy框架原理解析
Jan 04 Python
python如何进行基准测试
Apr 26 Python
关于的python五子棋的算法
May 02 Python
python使用python-pptx删除ppt某页实例
Feb 14 #Python
使用python-pptx包批量修改ppt格式的实现
Feb 14 #Python
python在不同条件下的输入与输出
Feb 13 #Python
深入浅析python的第三方库pandas
Feb 13 #Python
使用python的pyplot绘制函数实例
Feb 13 #Python
Python3读写Excel文件(使用xlrd,xlsxwriter,openpyxl3种方式读写实例与优劣)
Feb 13 #Python
python输出pdf文档的实例
Feb 13 #Python
You might like
php disk_free_space 返回目录可用空间
2010/05/10 PHP
destoon找回管理员密码的方法
2014/06/21 PHP
mantis安装、配置和使用中的问题小结
2014/07/14 PHP
基于PHP实现微信小程序客服消息功能
2019/08/12 PHP
Javascript 中的 call 和 apply使用介绍
2012/02/22 Javascript
JavaScript操纵窗口的方法小结
2013/06/28 Javascript
js定时器的使用(实例讲解)
2014/01/06 Javascript
js取float型小数点后两位数的方法
2014/01/18 Javascript
动态设置form表单的action属性的值的简单方法
2016/05/25 Javascript
Mac下使用charles遇到的问题以及解决办法
2017/01/10 Javascript
jQuery表格的维护和删除操作
2017/02/03 Javascript
Bootstrap.css与layDate日期选择样式起冲突的解决办法
2017/04/07 Javascript
vue2中的keep-alive使用总结及注意事项
2017/12/21 Javascript
详解Ubuntu安装angular-cli遇到的坑
2018/09/08 Javascript
Python中optparser库用法实例详解
2018/01/26 Python
PyQt4实现下拉菜单可供选择并打印出来
2018/04/20 Python
python 日志增量抓取实现方法
2018/04/28 Python
python 根据网易云歌曲的ID 直接下载歌曲的实例
2019/08/24 Python
python实现的读取网页并分词功能示例
2019/10/29 Python
详解使用django-mama-cas快速搭建CAS服务的实现
2019/10/30 Python
Python面向对象程序设计之类和对象、实例变量、类变量用法分析
2020/03/23 Python
canvas像素画板的实现代码
2018/11/21 HTML / CSS
倩碧美国官网:Clinique美国
2016/07/20 全球购物
施华洛世奇加拿大官网:SWAROVSKI加拿大
2018/06/03 全球购物
韩国乐天网上商城:Lotte iMall
2021/02/03 全球购物
Java中实现多态的机制是什么?
2014/12/07 面试题
新闻记者个人求职的自我评价
2013/11/28 职场文书
国税会议欢迎词
2014/01/16 职场文书
语文教学感言
2014/02/06 职场文书
社区文艺活动方案
2014/08/19 职场文书
武侯祠导游词
2015/02/04 职场文书
董事长助理岗位职责
2015/02/11 职场文书
2019年教师节祝福语精选,给老师送上真诚的祝福
2019/09/09 职场文书
vue-router中hash模式与history模式的区别
2021/06/23 Vue.js
python的列表生成式,生成器和generator对象你了解吗
2022/03/16 Python
Python的代理类实现,控制访问和修改属性的权限你都了解吗
2022/03/21 Python