Python获取基金网站网页内容、使用BeautifulSoup库分析html操作示例


Posted in Python onJune 04, 2019

本文实例讲述了Python获取基金网站网页内容、使用BeautifulSoup库分析html操作。分享给大家供大家参考,具体如下:

利用 urllib包 获取网页内容

#引入包
from urllib.request import urlopen
response = urlopen("http://fund.eastmoney.com/fund.html")
html = response.read();
#这个网页编码是gb2312
#print(html.decode("gb2312"))
#把html内容保存到一个文件
with open("1.txt","wb") as f:
  f.write(html.decode("gb2312").encode("utf8"))
  f.close()

使用BeautifulSoup分析html

from bs4 import BeautifulSoup
# 读取文件内容
with open("1.txt", "rb") as f:
  html = f.read().decode("utf8")
  f.close()
# 分析html内容
soup = BeautifulSoup(html,"html.parser")
# 取出网页title
print(soup.title) #<title>每日开放式基金净值表 _ 天天基金网</title>
# 基金编码
codes = soup.find("table",id="oTable").tbody.find_all("td","bzdm")
result = () # 初始化一个元组
for code in codes:
  result += ({
    "code":code.get_text(),
    "name":code.next_sibling.find("a").get_text(),
    "NAV":code.next_sibling.next_sibling.get_text(),
    "ACCNAV":code.next_sibling.next_sibling.next_sibling.get_text()
   },)
# 打印结果
print(result[0]["name"])

希望本文所述对大家Python程序设计有所帮助。

Python 相关文章推荐
python使用urllib2实现发送带cookie的请求
Apr 28 Python
用Python实现web端用户登录和注册功能的教程
Apr 30 Python
详解python进行mp3格式判断
Dec 23 Python
Python实现控制台中的进度条功能代码
Dec 22 Python
python机器学习案例教程——K最近邻算法的实现
Dec 28 Python
Python数字图像处理之霍夫线变换实现详解
Jan 12 Python
python 2.7.13 安装配置方法图文教程
Sep 18 Python
使用EduBlock轻松学习Python编程
Oct 08 Python
Python统计一个字符串中每个字符出现了多少次的方法【字符串转换为列表再统计】
May 05 Python
tensorflow实现训练变量checkpoint的保存与读取
Feb 10 Python
python 写一个文件分发小程序
Dec 05 Python
DjangoRestFramework 使用 simpleJWT 登陆认证完整记录
Jun 22 Python
Python使用MyQR制作专属动态彩色二维码功能
Jun 04 #Python
Python流行ORM框架sqlalchemy安装与使用教程
Jun 04 #Python
Python3日期与时间戳转换的几种方法详解
Jun 04 #Python
Falsk 与 Django 过滤器的使用与区别详解
Jun 04 #Python
python儿童学游戏编程知识点总结
Jun 03 #Python
Python控制Firefox方法总结
Jun 03 #Python
python+webdriver自动化环境搭建步骤详解
Jun 03 #Python
You might like
德劲1102收音机的打理维修案例
2021/03/02 无线电
第六节--访问属性和方法
2006/11/16 PHP
PHP生成二维码与识别二维码的方法详解【附源码下载】
2019/03/07 PHP
php实现的数组转xml案例分析
2019/09/28 PHP
jQuery 方法大全方便学习参考
2010/02/25 Javascript
两种简单实现菜单高亮显示的JS类代码
2010/06/27 Javascript
contains和compareDocumentPosition 方法来确定是否HTML节点间的关系
2011/09/13 Javascript
javascript分页代码(当前页码居中)
2012/09/20 Javascript
jQuery中:visible选择器用法实例
2014/12/30 Javascript
javascript实现数组内值索引随机化及创建随机数组的方法
2015/08/10 Javascript
JavaScript的字符串方法汇总
2016/07/31 Javascript
vue-cli3.0 脚手架搭建项目的过程详解
2018/10/19 Javascript
详解一次Vue低版本安卓白屏问题的解决过程
2019/05/30 Javascript
怎么使用javascript深度拷贝一个数组
2019/06/06 Javascript
VUE 直接通过JS 修改html对象的值导致没有更新到数据中解决方法分析
2019/12/02 Javascript
[01:00:59]VP VS VG Supermajor小组赛胜者组第二轮 BO3第二场 6.2
2018/06/03 DOTA
Python的subprocess模块总结
2014/11/07 Python
python matlibplot绘制3D图形
2018/07/02 Python
python 实现矩阵上下/左右翻转,转置的示例
2019/01/23 Python
Python 私有化操作实例分析
2019/11/21 Python
Pytorch Tensor基本数学运算详解
2019/12/30 Python
在Python中利用pickle保存变量的实例
2019/12/30 Python
Python模块future用法原理详解
2020/01/20 Python
Python对wav文件的重采样实例
2020/02/25 Python
python3实现将json对象存入Redis以及数据的导入导出
2020/07/16 Python
css3中新增的样式使用示例附效果图
2014/08/19 HTML / CSS
意大利在线药房:Saninforma
2021/02/11 全球购物
为什么会有内存对齐
2016/10/10 面试题
DBA数据库管理员JAVA程序员架构师必看
2016/02/07 面试题
项目投资建议书
2014/05/16 职场文书
工会工作先进事迹
2014/08/18 职场文书
组工干部对照检查材料
2014/08/25 职场文书
个人廉政承诺书
2015/04/28 职场文书
Spring实现内置监听器
2021/07/09 Java/Android
Oracle表空间与权限的深入讲解
2021/11/17 Oracle
Python 匹配文本并在其上一行追加文本
2022/05/11 Python