Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
Python的Django框架中的数据过滤功能
Jul 17 Python
python3实现ftp服务功能(客户端)
Mar 24 Python
使用pandas的DataFrame的plot方法绘制图像的实例
May 24 Python
Python3爬虫教程之利用Python实现发送天气预报邮件
Dec 16 Python
通过cmd进入python的实例操作
Jun 26 Python
Python秒算24点实现及原理详解
Jul 29 Python
Python空间数据处理之GDAL读写遥感图像
Aug 01 Python
浅谈Tensorflow 动态双向RNN的输出问题
Jan 20 Python
Python基于paramunittest模块实现excl参数化
Apr 26 Python
python爬虫使用requests发送post请求示例详解
Aug 05 Python
python 如何使用find和find_all爬虫、找文本的实现
Oct 16 Python
Python超简单容易上手的画图工具库推荐
May 10 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
Windows下IIS6/Apache2.2.4+MySQL5.2+PHP5.2.1安装配置方法
2007/05/03 PHP
PHP使用逆波兰式计算工资的方法
2015/07/29 PHP
PHP+MySQL实现无极限分类栏目的方法
2015/12/23 PHP
php自定义时间转换函数示例
2016/12/07 PHP
PHP正则判断一个变量是否为正整数的方法
2019/02/27 PHP
使用TextRange获取输入框中光标的位
2006/10/14 Javascript
Javascript引用指针使用介绍
2012/11/07 Javascript
从jquery的过滤器.filter()方法想到的
2013/09/29 Javascript
jQuery jcrop插件截图使用方法
2013/11/20 Javascript
BootStrap实现树形目录组件代码详解
2016/06/21 Javascript
js实现一个可以兼容PC端和移动端的div拖动效果实例
2016/12/09 Javascript
浅谈javascript的闭包
2017/01/23 Javascript
ES6新特性四:变量的解构赋值实例
2017/04/21 Javascript
javascript实现二叉树遍历的代码
2017/06/08 Javascript
仿淘宝JSsearch搜索下拉深度用法
2018/01/15 Javascript
微信小程序绘制图片发送朋友圈
2019/07/25 Javascript
Vue + Element-ui的下拉框el-select获取额外参数详解
2020/08/14 Javascript
nodejs+koa2 实现模仿springMVC框架
2020/10/21 NodeJs
Python实现将DOC文档转换为PDF的方法
2015/07/25 Python
Python for Informatics 第11章 正则表达式(一)
2016/04/21 Python
Python使用matplotlib绘制余弦的散点图示例
2018/03/14 Python
基于python requests库中的代理实例讲解
2018/05/07 Python
pandas Dataframe行列读取的实例
2018/06/08 Python
Python爬虫包BeautifulSoup异常处理(二)
2018/06/17 Python
python3 读取Excel表格中的数据
2018/10/16 Python
pymongo中group by的操作方法教程
2019/03/22 Python
解析python实现Lasso回归
2019/09/11 Python
numpy创建单位矩阵和对角矩阵的实例
2019/11/29 Python
PageFactory设计模式基于python实现
2020/04/14 Python
pycharm远程连接vagrant虚拟机中mariadb数据库
2020/06/05 Python
Python Django路径配置实现过程解析
2020/11/05 Python
什么是用户模式(User Mode)与内核模式(Kernel Mode) ?
2015/09/07 面试题
高考寄语大全
2014/04/08 职场文书
小学教师学习党的群众路线教育实践活动心得体会
2014/10/31 职场文书
《普罗米修斯》教学反思
2016/02/22 职场文书
Python实现byte转integer
2021/06/03 Python