Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
在Python中处理日期和时间的基本知识点整理汇总
May 22 Python
Python通过poll实现异步IO的方法
Jun 04 Python
Python在图片中添加文字的两种方法
Apr 29 Python
Python之re操作方法(详解)
Jun 14 Python
python3使用SMTP发送HTML格式邮件
Jun 19 Python
python用列表生成式写嵌套循环的方法
Nov 08 Python
Pycharm如何打断点的方法步骤
Jun 13 Python
利用pandas将非数值数据转换成数值的方式
Dec 18 Python
python列表切片和嵌套列表取值操作详解
Feb 27 Python
OpenCV-Python实现怀旧滤镜与连环画滤镜
Jun 09 Python
python库sklearn常用操作
Aug 23 Python
Python机器学习应用之工业蒸汽数据分析篇详解
Jan 18 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
萌王史莱姆”萌王性别尴尬!那“萌战”归女组还是男?
2018/12/17 日漫
浅谈php冒泡排序
2014/12/30 PHP
基于PHP实现短信验证码接口(容联运通讯)
2016/09/06 PHP
php mysql PDO 查询操作的实例详解
2017/09/23 PHP
javascript类继承机制的原理分析
2009/09/12 Javascript
JavaScript中setInterval的用法总结
2013/11/20 Javascript
js检测判断日期大于多少天的方法
2015/05/04 Javascript
手机端转盘抽奖代码分享
2015/09/10 Javascript
jquery实用技巧之输入框提示语句
2016/07/28 Javascript
jQuery Password Validation密码验证
2016/12/30 Javascript
jQuery页面弹出框实现文件上传
2017/02/09 Javascript
js实现日历与定时器
2017/02/22 Javascript
移动端刮刮乐的实现方式(js+HTML5)
2017/03/23 Javascript
jQuery获取table下某一行某一列的值实现代码
2017/04/07 jQuery
angular6.0使用教程之父组件通过url传递id给子组件的方法
2018/06/30 Javascript
vue中使用protobuf的过程记录
2018/10/26 Javascript
Node.js JSON模块用法实例分析
2019/01/04 Javascript
Vue实现根据hash高亮选项卡
2019/05/27 Javascript
微信小程序简单的canvas裁剪图片功能详解
2019/07/12 Javascript
JavaScript 接口原理与用法实例详解
2020/05/12 Javascript
Python基于twisted实现简单的web服务器
2014/09/29 Python
python获取指定路径下所有指定后缀文件的方法
2015/05/26 Python
Python 中Django安装和使用教程详解
2019/07/03 Python
基于YUV 数据格式详解及python实现方式
2019/12/09 Python
基于Python 中函数的 收集参数 机制
2019/12/21 Python
新西兰网上购物,折扣店:BestDeals.co.nz
2019/03/20 全球购物
Prototype如何为一个Ajax添加一个参数
2015/12/06 面试题
会计电算化专业毕业生求职信范文
2013/12/10 职场文书
创业计划书如何吸引他人眼球
2014/01/10 职场文书
环保倡议书400字
2014/05/15 职场文书
医学专业毕业生推荐信
2014/07/12 职场文书
工伤事故证明
2014/10/20 职场文书
2015年大学班长个人工作总结
2015/04/24 职场文书
作弊检讨书范文
2015/05/06 职场文书
JavaScript嵌入百度地图API的最详细方法
2021/04/16 Javascript
Python+Appium自动化测试的实战
2021/06/30 Python