python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python实现的选择排序算法原理与用法实例分析
Nov 22 Python
python 删除非空文件夹的实例
Apr 26 Python
matplotlib 输出保存指定尺寸的图片方法
May 24 Python
python抓取网页内容并进行语音播报的方法
Dec 24 Python
python实现三维拟合的方法
Dec 29 Python
Python3解释器知识点总结
Feb 19 Python
用Python实现最速下降法求极值的方法
Jul 10 Python
python多进程下实现日志记录按时间分割
Jul 22 Python
Python2比较当前图片跟图库哪个图片相似的方法示例
Sep 28 Python
学习Python爬虫的几点建议
Aug 05 Python
Python2及Python3如何实现兼容切换
Sep 01 Python
python turtle绘制多边形和跳跃和改变速度特效
Mar 16 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
PHP 字符截取 解决中文的截取问题,不用mb系列
2009/09/29 PHP
纯PHP生成的一个树叶图片画图例子
2014/04/16 PHP
php正则匹配文章中的远程图片地址并下载图片至本地
2015/09/29 PHP
深入理解PHP之OpCode原理详解
2016/06/01 PHP
PDO实现学生管理系统
2020/03/21 PHP
thinkphp5 框架结合plupload实现图片批量上传功能示例
2020/04/04 PHP
PHP safe_mode开启对于PHP系统函数有什么影响
2020/11/10 PHP
一些常用弹出窗口/拖放/异步文件上传等实用代码
2013/01/06 Javascript
鼠标滑在标题上显示图片的JS代码
2013/11/19 Javascript
JavaScript中的变量定义与储存介绍
2014/12/31 Javascript
使用Jasmine和Karma对AngularJS页面程序进行测试
2016/03/05 Javascript
利用浮层使select不可选的实现方法
2016/12/03 Javascript
Node.js如何实现注册邮箱激活功能 (常见)
2017/07/23 Javascript
jQuery EasyUI开发技巧总结
2017/09/26 jQuery
微信小程序中this.data与this.setData的区别详解
2018/09/17 Javascript
原生JS实现的自动轮播图功能详解
2018/12/28 Javascript
微信小程序实现左侧滑动导航栏
2020/04/08 Javascript
Vue项目移动端滚动穿透问题的实现
2020/05/19 Javascript
vue插件--仿微信小程序showModel实现模态提示窗功能
2020/08/19 Javascript
[01:07:22]2014 DOTA2华西杯精英邀请赛 5 24 DK VS VG加赛
2014/05/26 DOTA
python实现异步回调机制代码分享
2014/01/10 Python
部署Python的框架下的web app的详细教程
2015/04/30 Python
Python中文字符串截取问题
2015/06/15 Python
python 将json数据提取转化为txt的方法
2018/10/26 Python
Python爬虫requests库多种用法实例
2020/05/28 Python
IRO美国官网:法国服装品牌
2018/03/06 全球购物
Ajax的优点和缺点
2014/11/21 面试题
打架检讨书800字
2014/01/10 职场文书
网络程序员自荐信
2014/01/25 职场文书
装饰公司活动策划方案
2014/08/23 职场文书
2014年车间工作总结
2014/11/21 职场文书
给领导的感谢信范文
2015/01/23 职场文书
2016年优秀团员事迹材料
2016/02/25 职场文书
三好学生评选事迹材料(2016精选版)
2016/02/25 职场文书
2016年社区服务活动总结
2016/04/06 职场文书
MySQL查询学习之基础查询操作
2021/05/08 MySQL