Python语言检测模块langid和langdetect的使用实例


Posted in Python onFebruary 19, 2019

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

def langidFunc():
  '''
  https://github.com/yishuihanhan/langid.py
  '''
  print langid.classify("We Are Family")
  print langid.classify("Questa e una prova")
  print langid.classify("我们都有一个家")
  identifier=LanguageIdentifier.from_modelstring(model,norm_probs=True)
  print identifier.classify("We Are Family")
 
def langdetectFunc():
  '''
  https://github.com/yishuihanhan/langdetect
  '''
  s1=u"本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言,"
  s2=u'We are pleased to introduce today a new technology'
  print detect(s1)
  print detect(s2)
  print detect_langs(s2)  # detect_langs()输出探测出的所有语言类型及其所占的比例
  print detect_langs("Otec matka syn.")

结果如下:

('en', 9.061840057373047)
('it', -35.41771221160889)
('zh', -85.79573845863342)
('en', 0.16946150595865334)
zh-cn
en
[en:0.999998109575]
[pl:0.571426592237, fi:0.428568772028]

总结

以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对三水点靠木的支持。如果你想了解更多相关内容请查看下面相关链接

Python 相关文章推荐
对pandas中apply函数的用法详解
Apr 10 Python
利用nohup来开启python文件的方法
Jan 14 Python
python实现狄克斯特拉算法
Jan 17 Python
python频繁写入文件时提速的方法
Jun 26 Python
python使用sklearn实现决策树的方法示例
Sep 12 Python
python通过matplotlib生成复合饼图
Feb 06 Python
Django ModelForm操作及验证方式
Mar 30 Python
python实现飞船游戏的纵向移动
Apr 24 Python
python中的对数log函数表示及用法
Dec 09 Python
python中@contextmanager实例用法
Feb 07 Python
FP-growth算法发现频繁项集——发现频繁项集
Jun 24 Python
Python&Matlab实现灰狼优化算法的示例代码
Mar 21 Python
对python周期性定时器的示例详解
Feb 19 #Python
Python3数字求和的实例
Feb 19 #Python
对Python定时任务的启动和停止方法详解
Feb 19 #Python
python的schedule定时任务模块二次封装方法
Feb 19 #Python
Python3 max()函数基础用法
Feb 19 #Python
Python3 log10()函数简单用法
Feb 19 #Python
Python3中exp()函数用法分析
Feb 19 #Python
You might like
discuz 首页四格:最新话题+最新回复+热门话题+精华文章插件
2007/08/19 PHP
php实现源代码加密的方法
2015/07/11 PHP
php及codeigniter使用session-cookie的方法(详解)
2017/04/06 PHP
laravel config文件配置全局变量的例子
2019/10/13 PHP
Yii框架组件的事件机制原理与用法分析
2020/04/07 PHP
文本链接逐个出现的js脚本
2007/12/12 Javascript
jquery HotKeys轻松搞定键盘事件代码
2008/08/30 Javascript
js event事件的传递与冒泡处理
2009/12/06 Javascript
javascript如何动态加载表格与动态添加表格行
2013/11/27 Javascript
jQuery实现DIV层收缩展开的方法
2015/02/27 Javascript
js给selected添加options的方法
2015/05/06 Javascript
浅谈Jquery核心函数
2015/06/18 Javascript
JavaScript类型系统之基本数据类型与包装类型
2016/01/06 Javascript
AngularJs Understanding the Model Component
2016/09/02 Javascript
Vue表单demo v-model双向绑定问题
2018/06/29 Javascript
js简单的分页器插件代码实例
2019/09/11 Javascript
vue element自定义表单验证请求后端接口验证
2019/12/11 Javascript
JavaScript实现像雪花一样的Hexaflake分形
2020/07/07 Javascript
详解uniapp的全局变量实现方式
2021/01/11 Javascript
python基础教程之面向对象的一些概念
2014/08/29 Python
python基于pyDes库实现des加密的方法
2017/04/29 Python
python3实现跳一跳点击跳跃
2018/01/08 Python
PYQT5设置textEdit自动滚屏的方法
2019/06/14 Python
python实现回旋矩阵方式(旋转矩阵)
2019/12/04 Python
PyQt5实现登录页面
2020/05/30 Python
python3.5的包存放的具体路径
2020/08/16 Python
婚鞋、新娘鞋、礼服鞋、童鞋:Nina Shoes
2019/09/04 全球购物
PHP高级工程师面试问题推荐
2013/01/18 面试题
关于Assembly命名空间的三个面试题
2015/07/23 面试题
师范生的个人求职信范文
2014/01/04 职场文书
大学竞选班长演讲稿
2014/04/24 职场文书
政治学专业毕业生求职信
2014/08/11 职场文书
支行行长岗位职责
2015/02/15 职场文书
工地食品安全责任书
2015/05/09 职场文书
新手入门Mysql--概念
2021/06/18 MySQL
mysql查询结果实现多列拼接查询
2022/04/03 MySQL