Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
python3.0 字典key排序
Dec 24 Python
python学习之编写查询ip程序
Feb 27 Python
python 读写、创建 文件的方法(必看)
Sep 12 Python
Python scikit-learn 做线性回归的示例代码
Nov 01 Python
python调用Delphi写的Dll代码示例
Dec 05 Python
centos 安装python3.6环境并配置虚拟环境的详细教程
Feb 22 Python
用python生成(动态彩色)二维码的方法(使用myqr库实现)
Jun 24 Python
django框架面向对象ORM模型继承用法实例分析
Jul 29 Python
Python 中判断列表是否为空的方法
Nov 24 Python
python字典和json.dumps()的遇到的坑分析
Mar 11 Python
Python读取excel文件中带公式的值的实现
Apr 17 Python
Numpy实现卷积神经网络(CNN)的示例
Oct 09 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
一个简单的PHP验证码实现代码
2014/05/10 PHP
PHP使用ActiveMQ实现消息队列的方法详解
2019/05/31 PHP
laravel入门知识点整理
2020/09/15 PHP
js 优化次数过多的循环 考虑到性能问题
2011/03/05 Javascript
jquery下div 的resize事件示例代码
2014/03/09 Javascript
一款基于jQuery的图片场景标注提示弹窗特效
2015/01/05 Javascript
整理Javascript函数学习笔记
2015/12/01 Javascript
jQuery根据name属性进行查找的用法分析
2016/06/23 Javascript
BootStrap Validator使用注意事项(必看篇)
2016/09/28 Javascript
jQuery插件echarts实现的去掉X轴、Y轴和网格线效果示例【附demo源码下载】
2017/03/04 Javascript
ThinkPHP+jquery实现“加载更多”功能代码
2017/03/11 Javascript
ES6(ECMAScript 6)新特性之模板字符串用法分析
2017/04/01 Javascript
BootStrap表单控件之文本域textarea
2017/05/23 Javascript
nodejs实现的简单web服务器功能示例
2018/03/15 NodeJs
Nuxt配合Node在实际生产中的应用详解
2018/08/07 Javascript
Vue axios设置访问基础路径方法
2018/09/19 Javascript
通过jQuery学习js类型判断的技巧
2019/05/27 jQuery
JavaScript HTML DOM 元素 (节点)新增,编辑,删除操作实例分析
2020/03/02 Javascript
ES6新增的数组知识实例小结
2020/05/23 Javascript
wxpython 学习笔记 第一天
2009/03/16 Python
批处理与python代码混合编程的方法
2016/05/19 Python
关于Python中浮点数精度处理的技巧总结
2017/08/10 Python
微信小程序跳一跳游戏 python脚本跳一跳刷高分技巧
2018/01/04 Python
python3之模块psutil系统性能信息使用
2018/05/30 Python
python pandas读取csv后,获取列标签的方法
2018/11/12 Python
对pandas处理json数据的方法详解
2019/02/08 Python
使用pyinstaller打包PyQt4程序遇到的问题及解决方法
2019/06/24 Python
简单了解python的一些位运算技巧
2019/07/13 Python
Django之编辑时根据条件跳转回原页面的方法
2019/08/21 Python
python中导入 train_test_split提示错误的解决
2020/06/19 Python
一个入门级python爬虫教程详解
2021/01/27 Python
中国跨境海淘网站:考拉海购
2016/08/01 全球购物
Urban Outfitters德国官网:美国跨国生活方式零售公司
2018/05/21 全球购物
2014年数学教研组工作总结
2014/12/06 职场文书
golang通过递归遍历生成树状结构的操作
2021/04/28 Golang
Python字符串的转义字符
2022/04/07 Python