python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python version 2.7 required, which was not found in the registry
Aug 26 Python
Python网络爬虫实例讲解
Apr 28 Python
Python+matplotlib绘制不同大小和颜色散点图实例
Jan 19 Python
python文本数据相似度的度量
Mar 12 Python
python的turtle库使用详解
May 10 Python
详解如何减少python内存的消耗
Aug 09 Python
Python 模拟动态产生字母验证码图片功能
Dec 24 Python
Django 博客实现简单的全文搜索的示例代码
Feb 17 Python
django 扩展user用户字段inlines方式
Mar 30 Python
解决PyCharm IDE环境下,执行unittest不生成测试报告的问题
Sep 03 Python
Python中对象的比较操作==和is区别详析
Feb 12 Python
python中tkinter复选框使用操作
Nov 11 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
PHP最常用的2种设计模式工厂模式和单例模式介绍
2012/08/14 PHP
CodeIgniter框架URL路由总结
2014/09/03 PHP
smarty模板判断数组为空的方法
2015/06/10 PHP
PHP实现执行外部程序的方法详解
2017/08/17 PHP
php设计模式之观察者模式实例详解【星际争霸游戏案例】
2020/03/30 PHP
php7连接MySQL实现简易查询程序的方法
2020/10/13 PHP
js程序中美元符号$是什么
2008/06/05 Javascript
Riot.js 快速的JavaScript单元测试框架
2009/11/09 Javascript
JavaScript实现俄罗斯方块游戏过程分析及源码分享
2015/03/23 Javascript
jQuery+html5+css3实现圆角无刷新表单带输入验证功能代码
2015/08/21 Javascript
AngularJs入门教程之环境搭建+创建应用示例
2016/11/01 Javascript
js仿百度音乐全选操作
2017/01/13 Javascript
微信小程序wx.request实现后台数据交互功能分析
2017/11/25 Javascript
Vue验证码60秒倒计时功能简单实例代码
2018/06/22 Javascript
Angularjs中date过滤器失效的问题及解决方法
2018/07/06 Javascript
JavaScript遍历数组的三种方法map、forEach与filter实例详解
2019/02/27 Javascript
uniapp,微信小程序中使用 MQTT的问题
2020/07/11 Javascript
[01:09:16]DOTA2-DPC中国联赛 正赛 SAG vs Dynasty BO3 第一场 1月25日
2021/03/11 DOTA
Python面向对象之反射/自省机制实例分析
2018/08/24 Python
python判断数字是否是超级素数幂
2018/09/27 Python
python协程之动态添加任务的方法
2019/02/19 Python
Python3 实现减少可调用对象的参数个数
2019/12/20 Python
如何基于Python + requests实现发送HTTP请求
2020/01/13 Python
Python递归函数特点及原理解析
2020/03/04 Python
Python监听剪切板实现方法代码实例
2020/11/11 Python
Python .py生成.pyd文件并打包.exe 的注意事项说明
2021/03/04 Python
CSS3按钮鼠标悬浮实现光圈效果源码
2016/09/11 HTML / CSS
html5 利用canvas手写签名并保存的实现方法
2018/07/12 HTML / CSS
JAVA和C++的区别
2013/10/06 面试题
班级活动策划书
2014/02/06 职场文书
语文教育专业求职信
2014/06/28 职场文书
优秀大专毕业生求职信
2014/08/04 职场文书
2015年人民调解工作总结
2015/05/18 职场文书
基于Python实现的购物商城管理系统
2021/04/27 Python
解析Java异步之call future
2021/06/14 Java/Android
Python数据处理的三个实用技巧分享
2022/04/01 Python