Python jieba库分词模式实例用法


Posted in Python onJanuary 13, 2021

在中文分词中,jiebe库是最为常见的,主要的原因还是它独特的支持分词模式如:精确模式全模式搜索引擎模式。也对应着三种方式,包括jieba.cut()方法、jieba.lcut()方法、jieba.cut_for_search()方法。下面就为大家实例操作这些分词模式,以及方法的使用,一起来了解下吧。

全模式:

import jieba
seg_list = jieba.cut("南京市长江大桥欢迎你。", cut_all=True)
print(type(seg_list),seg_list)

精确模式:

seg_list1 = jieba.lcut("南京市长江大桥欢迎你。", cut_all=False)
print(type(seg_list1),seg_list1)

搜索模式:

seg_list2 = jieba.cut_for_search("南京市长江大桥欢迎你。")
print(type(seg_list2),seg_list2)
print("全模式:" + "/ ".join(seg_list))
print("精确模式:" + "/ ".join(seg_list1))
print("搜索引擎模式:" + "/ ".join(seg_list2))

输出结果:

全模式:南京/ 南京市/ 京市/ 市长/ 长江/ 长江大桥/ 大桥/ 欢迎/ 你/ 。

精确模式:南京市/ 长江大桥/ 欢迎/ 你/ 。

搜索引擎模式:南京/ 京市/ 南京市/ 长江/ 大桥/ 长江大桥/ 欢迎/ 你/ 。

内容扩展:

获取词性

我们还可以通过jiaba这个库把词性进行区分,比如动词,名词等

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list])
# [('我', 'r'), ('要', 'v'), ('进行', 'v'), ('关键词', 'n'), ('提取', 'v')]

我们还可以提取动词或者名词,我们来提取下里面的动词

import jieba.posseg as psg

seg_list = psg.cut("我要进行关键词提取")
print([(s.word, s.flag) for s in seg_list if s.flag.startswith('v')])

到此这篇关于Python jieba库分词模式实例用法的文章就介绍到这了,更多相关Python jieba库分词模式怎么用内容请搜索三水点靠木以前的文章或继续浏览下面的相关文章希望大家以后多多支持三水点靠木!

Python 相关文章推荐
Python 条件判断的缩写方法
Sep 06 Python
Python内置数据类型详解
Aug 18 Python
Python中取整的几种方法小结
Jan 06 Python
《Python学习手册》学习总结
Jan 17 Python
Django 限制用户访问频率的中间件的实现
Aug 23 Python
Python3.5 Pandas模块之DataFrame用法实例分析
Apr 23 Python
Python单元测试与测试用例简析
Nov 09 Python
Python decimal模块使用方法详解
Jun 08 Python
python 读取、写入txt文件的示例
Sep 27 Python
关于PyCharm安装后修改路径名称使其可重新打开的问题
Oct 20 Python
python读取excel数据绘制简单曲线图的完整步骤记录
Oct 30 Python
详解Python描述符的工作原理
Jun 11 Python
python中yield的用法详解
Jan 13 #Python
利用python+request通过接口实现人员通行记录上传功能
Jan 13 #Python
selenium如何定位span元素的实现
Jan 13 #Python
python 进制转换 int、bin、oct、hex的原理
Jan 13 #Python
python pillow库的基础使用教程
Jan 13 #Python
用python-webdriver实现自动填表的示例代码
Jan 13 #Python
python 装饰器的基本使用
Jan 13 #Python
You might like
根据中文裁减字符串函数的php代码
2013/12/03 PHP
PHP 只允许指定IP访问(允许*号通配符过滤IP)
2014/07/08 PHP
yii操作session实例简介
2014/07/31 PHP
PHP5.2中PDO的简单使用方法
2016/03/25 PHP
PHP中include和require的区别实例分析
2017/05/07 PHP
php实现简易计算器
2020/08/28 PHP
对字符串进行HTML编码和解码的JavaScript函数
2010/02/01 Javascript
Raphael一个用于在网页中绘制矢量图形的Javascript库
2013/01/08 Javascript
对table和ul实现js分页示例分享
2014/02/24 Javascript
调整小数的格式保留小数点后两位
2014/05/14 Javascript
getElementById().innerHTML与getElementById().value的区别
2016/10/27 Javascript
原生js轮播(仿慕课网)
2017/02/15 Javascript
原生nodejs使用websocket代码分享
2018/04/07 NodeJs
JS常见错误(Error)及处理方案详解
2020/07/02 Javascript
vue+iview框架实现左侧动态菜单功能的示例代码
2020/07/23 Javascript
Python实现从url中提取域名的几种方法
2014/09/26 Python
Python实现的简单dns查询功能示例
2017/05/24 Python
取numpy数组的某几行某几列方法
2018/04/03 Python
Python实现的网页截图功能【PyQt4与selenium组件】
2018/07/12 Python
Python打开文件,将list、numpy数组内容写入txt文件中的方法
2018/10/26 Python
python3中eval函数用法使用简介
2019/08/02 Python
python 接口实现 供第三方调用的例子
2019/08/13 Python
Django实现前台上传并显示图片功能
2020/05/29 Python
python 下载m3u8视频的示例代码
2020/11/11 Python
解决python3.x安装numpy成功但import出错的问题
2020/11/17 Python
python drf各类组件的用法和作用
2021/01/12 Python
美国领先的机场停车聚合商:Airport Parking Reservations
2020/02/28 全球购物
护理职业生涯规划书
2014/01/24 职场文书
黄河的主人教学反思
2014/02/07 职场文书
2015年度物业公司工作总结
2015/04/27 职场文书
书法社团活动总结
2015/05/07 职场文书
乡镇安全生产月活动总结
2015/05/08 职场文书
勇敢的心观后感
2015/06/09 职场文书
企业法人代表证明书
2015/06/18 职场文书
2019年入党思想汇报
2019/03/25 职场文书
CentOS7安装MySQL8的超级详细教程(无坑!)
2022/06/10 Servers