python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
压缩包密码破解示例分享(类似典破解)
Jan 17 Python
使用Python装饰器在Django框架下去除冗余代码的教程
Apr 16 Python
在 Python 应用中使用 MongoDB的方法
Jan 05 Python
Python做简单的字符串匹配详解
Mar 21 Python
Python删除Java源文件中全部注释的实现方法
Aug 30 Python
神经网络理论基础及Python实现详解
Dec 15 Python
Python 实现使用dict 创建二维数据、DataFrame
Apr 13 Python
给我一面国旗 python帮你实现
Sep 30 Python
解决pycharm 安装numpy失败的问题
Dec 05 Python
在python tkinter界面中添加按钮的实例
Mar 04 Python
Python字符串split及rsplit方法原理详解
Jun 29 Python
Python urllib3软件包的使用说明
Nov 18 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
全国FM电台频率大全 - 29 青海省
2020/03/11 无线电
德生PL660的电路分析和打磨
2021/03/02 无线电
用PHP4访问Oracle815
2006/10/09 PHP
php读取文件内容的方法汇总
2015/01/24 PHP
php命令行(cli)模式下报require 加载路径错误的解决方法
2015/11/23 PHP
初学JavaScript第二章
2008/09/30 Javascript
JavaScript Event学习补遗 addEventSimple
2010/02/11 Javascript
详解JavaScript的AngularJS框架中的作用域与数据绑定
2016/03/04 Javascript
5个最顶级jQuery图表类库插件【jquery插件库】
2016/05/05 Javascript
jquery获取复选框checkbox的值的简单实现方法
2016/05/26 Javascript
AngularJS入门教程之过滤器详解
2016/08/19 Javascript
利用AngularJs实现京东首页轮播图效果
2016/09/08 Javascript
简单快速的实现js计算器功能
2017/08/17 Javascript
微信小程序自定义组件实现tabs选项卡功能
2018/07/14 Javascript
vee-validate vue 2.0自定义表单验证的实例
2018/08/28 Javascript
JS开发自己的类库实例分析
2019/08/28 Javascript
VUE-ElementUI 自定义Loading图操作
2020/11/11 Javascript
Python数据结构之单链表详解
2017/09/12 Python
Python基于time模块求程序运行时间的方法
2017/09/18 Python
Python列表删除的三种方法代码分享
2017/10/31 Python
Selenium控制浏览器常见操作示例
2018/08/13 Python
Win10下python3.5和python2.7环境变量配置教程
2018/09/18 Python
python广度优先搜索得到两点间最短路径
2019/01/17 Python
Django框架之登录后自定义跳转页面的实现方法
2019/07/18 Python
Python爬虫使用浏览器cookies:browsercookie过程解析
2019/10/22 Python
Python操作列表常用方法实例小结【创建、遍历、统计、切片等】
2019/10/25 Python
Django框架之中间件MiddleWare的实现
2019/12/30 Python
Python SMTP配置参数并发送邮件
2020/06/16 Python
Python如何读写字节数据
2020/08/05 Python
南威尔士家居商店:Leekes
2016/10/25 全球购物
迷你唐卡软皮鞋:Minnetonka Moccasin
2018/05/01 全球购物
Oracle性能调优原则
2012/05/03 面试题
个人年终总结怎么写
2015/03/09 职场文书
个人总结与自我评价2015
2015/03/11 职场文书
Java GUI编程菜单组件实例详解
2022/04/07 Java/Android
Valheim服务器 Mod修改安装教程 【ValheimPlus】
2022/12/24 Servers