python3.x提取中文的正则表达式示例代码


Posted in Python onJuly 23, 2019

实例一: 读取txt文件中含有中文的字符

import re ##此处使用的编辑器是python3.x 
d="[\u4e00-\u9fa5]+" #中文匹配的符号
f=open('test.txt','rb') #这里以二进制读取,方便中文的转义 ,不设置回报错 这里的TXT文档
#文档内容:
Hello world
China
你好,你好好
This is a txt File
s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3
#此处涉及到文本的读取工作,先读取文件,再进行文档行的识别匹配
L=[]#创建一个列表进行存储即将生成的中文
for i in f: #遍历txt文档中的行
  i=i.decode('utf-8')#转意utf-8
  l=re.findall(d,i) #正则匹配中文
  L+=l #将中文放到列表中
print(L)
f.close()

***********************************************

***********************************************

实例二: 读取给定字符串的中文字符

import re ##此处使用的编辑器是python3.x 
s = "s2f程序员杂志一2d3程序员杂志二2d3程序员杂志三2d3程序员杂志四2d3".encode() #此处必须进行字符串转义
temp = s.decode('utf-8') 
pattern="[\u4e00-\u9fa5]+"#中文正则表达式
regex = re.compile(pattern) #生成正则对象 
results = regex.findall(temp) #匹配
for result in results : #迭代遍历出内容
  print (result)

总结

以上所述是小编给大家介绍的python3.x提取中文的正则表达式示例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对三水点靠木网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

Python 相关文章推荐
Python中的两个内置模块介绍
Apr 05 Python
Python3使用requests包抓取并保存网页源码的方法
Mar 15 Python
浅谈python中的变量默认是什么类型
Sep 11 Python
python 计算文件的md5值实例
Jan 13 Python
Pycharm学习教程(1) 定制外观
May 02 Python
使用python读取.text文件特定行的数据方法
Jan 28 Python
python的sorted用法详解
Jun 25 Python
python爬虫 2019中国好声音评论爬取过程解析
Aug 26 Python
Python算法中的时间复杂度问题
Nov 19 Python
python 实现人和电脑猜拳的示例代码
Mar 02 Python
python为什么要安装到c盘
Jul 20 Python
如何使用python自带IDLE的几种方法
Oct 10 Python
Python Pandas 箱线图的实现
Jul 23 #Python
Django 开发调试工具 Django-debug-toolbar使用详解
Jul 23 #Python
Pandas分组与排序的实现
Jul 23 #Python
Python项目 基于Scapy实现SYN泛洪攻击的方法
Jul 23 #Python
Django logging配置及使用详解
Jul 23 #Python
Python利用scapy实现ARP欺骗的方法
Jul 23 #Python
OpenCV3.0+Python3.6实现特定颜色的物体追踪
Jul 23 #Python
You might like
详细介绍:Apache+PHP+MySQL配置攻略
2006/09/05 PHP
PHP 实现判断用户是否手机访问
2015/01/21 PHP
PHP使用openssl扩展实现加解密方法示例
2020/02/20 PHP
javascript 冒号 使用说明
2009/06/06 Javascript
js实现兼容IE6与IE7的DIV高度
2010/05/13 Javascript
分页栏的web标准实现
2011/11/01 Javascript
js如何取消事件冒泡
2013/09/23 Javascript
jQuery中:checked选择器用法实例
2015/01/04 Javascript
JavaScript 性能优化小结
2015/10/12 Javascript
JavaScript+html5 canvas绘制渐变区域完整实例
2016/01/26 Javascript
jQuery.parseHTML() 函数详解
2017/01/09 Javascript
jQuery UI 实例讲解 - 日期选择器(Datepicker)
2017/09/18 jQuery
javascript浏览器用户代理检测脚本实现方法
2017/10/27 Javascript
微信小程序实现获取准确的腾讯定位地址功能示例
2019/03/27 Javascript
Vue实现微信支付功能遇到的坑
2019/06/05 Javascript
ES6 Object属性新的写法实例小结
2019/06/25 Javascript
javascript实现留言板功能
2020/02/08 Javascript
Vue 中使用lodash对事件进行防抖和节流操作
2020/07/26 Javascript
python处理json数据中的中文
2014/03/06 Python
Python编程实现粒子群算法(PSO)详解
2017/11/13 Python
Python快速排序算法实例分析
2017/11/29 Python
python3 拼接字符串的7种方法
2018/09/12 Python
Django使用list对单个或者多个字段求values值实例
2020/03/31 Python
CSS3实现圆角、阴影、透明效果并兼容各大浏览器
2014/08/08 HTML / CSS
大码女装:Ulla Popken
2019/08/06 全球购物
波兰珠宝品牌:YES
2019/08/09 全球购物
美容院经理岗位职责
2014/04/03 职场文书
幼儿园中班评语大全
2014/04/17 职场文书
企业家王石演讲稿:坚持与放下
2014/04/27 职场文书
党支部党的群众路线对照检查材料
2014/09/24 职场文书
幼儿园大班教师个人总结
2015/02/05 职场文书
职工培训工作总结
2015/08/10 职场文书
MySQL root密码的重置方法
2021/04/21 MySQL
PHP遍历数组的6种方式总结
2021/11/17 PHP
Python机器学习应用之工业蒸汽数据分析篇详解
2022/01/18 Python
游戏《我的世界》澄清Xbox版暂无计划加入光追
2022/04/03 其他游戏