python处理“


Posted in Python onJune 10, 2019

python如何处理“&#”开头加数字的html字符,比如:风水这类数据。

用python抓取数据时,有时会遇到想要数据是以“&#”开头加数字的字符,比如图中所示的这些:

风水大术士

python处理“

python处理“

这些字符需要再次转换才能变回中文内容。这些字符需要再次转换才能变回中文内容。

Python2.7版本

在python2.7版本中,使用import HTMLParser

python处理“

定义变量,再定义转换代码。

python处理“

代码中最重要的是“data_parser = HTMLParser.HTMLParser()”,通过此才能用“.unescape()”方法。 

python处理“

测试运行,这串字符串正常输出了中文。

python处理“

Python3.7+版本

在最新python版本中,不能用上面的导入方法。可以用"import html"或者“from html import unescape”。这里使用"import html"做测试。

python处理“

导入html后,直接用".unescape()"来处理字符串。

python处理“

运行后,正常转换成了中文字符。

python处理“

感谢大家的阅读和对三水点靠木的支持。

Python 相关文章推荐
Python操作MySQL简单实现方法
Jan 26 Python
Python获取DLL和EXE文件版本号的方法
Mar 10 Python
python使用Flask框架获取用户IP地址的方法
Mar 21 Python
python编码最佳实践之总结
Feb 14 Python
Python之日期与时间处理模块(date和datetime)
Feb 16 Python
Python实现爬虫设置代理IP和伪装成浏览器的方法分享
May 07 Python
在双python下设置python3为默认的方法
Oct 31 Python
详解PyTorch手写数字识别(MNIST数据集)
Aug 16 Python
使用Python3 poplib模块删除服务器多天前的邮件实现代码
Apr 24 Python
Python实现迪杰斯特拉算法过程解析
Sep 18 Python
Python根据URL地址下载文件并保存至对应目录的实现
Nov 15 Python
Opencv+Python识别PCB板图片的步骤
Jan 07 Python
python-pyinstaller、打包后获取路径的实例
Jun 10 #Python
详解Python 切片语法
Jun 10 #Python
使用Python OpenCV为CNN增加图像样本的实现
Jun 10 #Python
Python 虚拟空间的使用代码详解
Jun 10 #Python
在Python中过滤Windows文件名中的非法字符方法
Jun 10 #Python
对Python 检查文件名是否规范的实例详解
Jun 10 #Python
java判断三位数的实例讲解
Jun 10 #Python
You might like
php+mysql开源XNA 聚合程序发布 下载
2007/07/13 PHP
深入PHP magic quotes的详解
2013/06/17 PHP
PHP四舍五入、取整、round函数使用示例
2015/02/06 PHP
php相对当前文件include其它文件的方法
2015/03/13 PHP
php实现留言板功能
2017/03/05 PHP
php常用日期时间函数实例小结
2019/07/04 PHP
PHP+Apache实现二级域名之间共享cookie的方法
2019/07/24 PHP
PHP实现微信提现功能(微信商城)
2019/11/21 PHP
jquery实现隐藏与显示动画效果/输入框字符动态递减/导航按钮切换
2013/07/01 Javascript
javascript简单事件处理和with用法介绍
2013/09/16 Javascript
jquery对象和javascript对象即DOM对象相互转换
2014/08/07 Javascript
jQuery中:last-child选择器用法实例
2014/12/31 Javascript
JS+CSS实现下拉列表框美化效果(3款)
2015/08/15 Javascript
javascript 动态修改css样式方法汇总(四种方法)
2015/08/27 Javascript
基于JavaScript操作DOM常用的API小结
2015/12/01 Javascript
关于Vue.js 2.0的Vuex 2.0 你需要更新的知识库
2016/11/30 Javascript
用原生JS实现简单的多选框功能
2017/06/12 Javascript
基于Vue2-Calendar改进的日历组件(含中文使用说明)
2019/04/14 Javascript
说说如何使用Vuex进行状态管理(小结)
2019/04/14 Javascript
在vue中使用setInterval的方法示例
2019/04/16 Javascript
学前端,css与javascript重难点浅析
2020/06/11 Javascript
Python抓取Discuz!用户名脚本代码
2013/12/30 Python
python 文件转成16进制数组的实例
2018/07/09 Python
Python基于Tkinter模块实现的弹球小游戏
2018/12/27 Python
关于python scrapy中添加cookie踩坑记录
2020/11/17 Python
HTML5的标签的代码的简单介绍 HTML5标签的简介
2012/05/28 HTML / CSS
中邮全球便购:中国邮政速递物流
2017/03/04 全球购物
比利时买床:Beter Bed
2017/12/06 全球购物
美国购买体育、音乐会和剧院门票网站:SelectATicket
2019/09/08 全球购物
高中毕业生自我鉴定
2013/11/03 职场文书
医学院四年学习生活的自我评价
2013/11/06 职场文书
班组长的岗位职责
2013/12/09 职场文书
2014年五一活动策划方案
2014/03/15 职场文书
银行先进个人事迹材料
2014/05/11 职场文书
2016猴年春节问候语
2015/11/11 职场文书
方法汇总:Python 安装第三方库常用
2022/04/26 Python