Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python将xml xsl文件生成html文件存储示例讲解
Dec 03 Python
Python的Socket编程过程中实现UDP端口复用的实例分享
Mar 19 Python
Python3网络爬虫之使用User Agent和代理IP隐藏身份
Nov 23 Python
Python+matplotlib实现华丽的文本框演示代码
Jan 22 Python
使用Python制作微信跳一跳辅助
Jan 31 Python
python实现读Excel写入.txt的方法
Apr 29 Python
python3实现字符串的全排列的方法(无重复字符)
Jul 07 Python
Python爬虫之pandas基本安装与使用方法示例
Aug 08 Python
分析python请求数据
Aug 19 Python
Python3字符串encode与decode的讲解
Apr 02 Python
Python小程序之在图片上加入数字的代码
Nov 26 Python
上手简单,功能强大的Python爬虫框架——feapder
Apr 27 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
php获取文件大小的方法
2014/02/26 PHP
PHP网页游戏学习之Xnova(ogame)源码解读(一)
2014/06/23 PHP
改写ThinkPHP的U方法使其路由下分页正常
2014/07/02 PHP
PHP中关键字interface和implements详解
2017/06/14 PHP
PHP简单实现防止SQL注入的方法
2018/03/13 PHP
详解laravel安装使用Passport(Api认证)
2018/07/27 PHP
thinkphp框架类库扩展操作示例
2019/11/26 PHP
JS 建立对象的方法
2007/04/21 Javascript
js清除input中type等于file的值域(示例代码)
2013/12/24 Javascript
jquery append()方法与html()方法的区别及使用介绍
2014/08/01 Javascript
jQuery删除一个元素后淡出效果展示删除过程的方法
2015/03/18 Javascript
分享10个原生JavaScript技巧
2015/04/20 Javascript
Bootstrap页面布局基础知识全面解析
2016/06/13 Javascript
jQuery ajax MD5实现用户注册即时验证功能
2016/10/11 Javascript
JS复制对应id的内容到粘贴板(Ctrl+C效果)
2017/01/23 Javascript
JS实现非首屏图片延迟加载的示例
2018/01/06 Javascript
Vue项目中如何引入icon图标
2018/03/28 Javascript
微信小程序实现跳转的几种方式总结(推荐)
2019/04/24 Javascript
nodejs开发一个最简单的web服务器实例讲解
2020/01/02 NodeJs
js前端对于大量数据的展示方式及处理方法
2020/12/02 Javascript
[46:58]完美世界DOTA2联赛PWL S3 Forest vs LBZS 第一场 12.17
2020/12/19 DOTA
Python检测网站链接是否已存在
2016/04/07 Python
python 第三方库的安装及pip的使用详解
2017/05/11 Python
使用paramiko远程执行命令、下发文件的实例
2017/10/01 Python
python保存文件方法小结
2018/07/27 Python
解决Numpy中sum函数求和结果维度的问题
2019/12/06 Python
Python新手如何进行闭包时绑定变量操作
2020/05/29 Python
Matplotlib.pyplot 三维绘图的实现示例
2020/07/28 Python
CSS3 3D立方体效果示例-transform也不过如此
2016/12/05 HTML / CSS
日本著名的平价时尚女性购物网站:Fifth
2016/08/24 全球购物
教师求职信范文分享
2013/12/27 职场文书
交通事故赔偿协议书
2014/10/16 职场文书
廉政承诺书范文
2015/04/28 职场文书
单位计划生育责任书
2015/05/09 职场文书
撤回我也能看到!教你用Python制作微信防撤回脚本
2021/06/11 Python
Spring Bean的实例化之属性注入源码剖析过程
2021/06/13 Java/Android