python同义词替换的实现(jieba分词)


Posted in Python onJanuary 21, 2020

TihuanWords.txt文档格式

注意:同一行的词用单个空格隔开,每行第一个词为同行词的替换词。

年休假 年假 年休
究竟 到底
回家场景 我回来了

代码

import jieba


def replaceSynonymWords(string1):
 # 1读取同义词表,并生成一个字典。
 combine_dict = {}
 # synonymWords.txt是同义词表,每行是一系列同义词,用空格分割
 for line in open("TihuanWords.txt", "r", encoding='utf-8'):
   seperate_word = line.strip().split(" ")
   num = len(seperate_word)
   for i in range(1, num):
     combine_dict[seperate_word[i]] = seperate_word[0]
   print(seperate_word)
 print(combine_dict)

 # 2提升某些词的词频,使其能够被jieba识别出来
 jieba.suggest_freq("年休假", tune=True)

 # 3将语句切分成单词
 seg_list = jieba.cut(string1, cut_all=False)

 f = "/".join(seg_list).encode("utf-8")
 f = f.decode("utf-8")
 print(f)
 # 4返回同义词替换后的句子
 final_sentence = " "
 for word in f.split('/'):
   if word in combine_dict:
     word = combine_dict[word]
     final_sentence += word
   else:
     final_sentence += word
 # print final_sentence
 return final_sentence


string1 = '年休到底放几天?'
print(replaceSynonymWords(string1))

结果

python同义词替换的实现(jieba分词)

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python创建线程示例
May 06 Python
跟老齐学Python之永远强大的函数
Sep 14 Python
Python+MongoDB自增键值的简单实现
Nov 04 Python
Python max内置函数详细介绍
Nov 17 Python
python编程实现12306的一个小爬虫实例
Dec 27 Python
使用python装饰器计算函数运行时间的实例
Apr 21 Python
对TensorFlow中的variables_to_restore函数详解
Jul 30 Python
django表单的Widgets使用详解
Jul 22 Python
python [:3] 实现提取数组中的数
Nov 27 Python
Python跑循环时内存泄露的解决方法
Jan 13 Python
python字符串判断密码强弱
Mar 18 Python
Python Tornado批量上传图片并显示功能
Mar 26 Python
tensorflow模型保存、加载之变量重命名实例
Jan 21 #Python
tensorflow实现测试时读取任意指定的check point的网络参数
Jan 21 #Python
tensorflow如何继续训练之前保存的模型实例
Jan 21 #Python
在tensorflow中设置保存checkpoint的最大数量实例
Jan 21 #Python
TensorFlow——Checkpoint为模型添加检查点的实例
Jan 21 #Python
tensorflow estimator 使用hook实现finetune方式
Jan 21 #Python
Python实现FLV视频拼接功能
Jan 21 #Python
You might like
这部番真是良心,画质好到像风景区,剧情让人跟着小公会热血沸腾
2020/03/10 日漫
php实现水仙花数的4个示例分享
2014/04/08 PHP
Javascript变量函数浅析
2011/09/02 Javascript
50个比较实用jQuery代码段
2011/09/18 Javascript
用jquery实现输入框获取焦点消失文字
2013/04/27 Javascript
JavaScript实现将文本框的值插入指定位置的方法
2015/08/13 Javascript
vue.js表格分页示例
2016/10/18 Javascript
Bootstrap基本组件学习笔记之input输入框组(9)
2016/12/07 Javascript
JS触摸事件、手势事件详解
2017/05/04 Javascript
jquery实现简单实用的轮播器
2017/05/23 jQuery
js中变量的连续赋值(实例讲解)
2017/07/08 Javascript
vue的style绑定background-image的方式和其他变量数据的区别详解
2018/09/03 Javascript
javascript获取元素的计算样式
2019/05/24 Javascript
js实现简单的秒表
2020/01/16 Javascript
JS 5种遍历对象的方式
2020/06/16 Javascript
[03:17]史诗级大片应援2018DOTA2国际邀请赛 致敬每一位坚守遗迹的勇士
2018/07/20 DOTA
Python实现二分法算法实例
2015/02/02 Python
Linux 发邮件磁盘空间监控(python)
2016/04/23 Python
Python模拟用户登录验证
2017/09/11 Python
Python中Scrapy爬虫图片处理详解
2017/11/29 Python
python多进程提取处理大量文本的关键词方法
2018/06/05 Python
Python实现App自动签到领取积分功能
2018/09/29 Python
pycharm修改文件的默认打开方式的步骤
2019/07/29 Python
基于Tensorflow高阶读写教程
2020/02/10 Python
Python多重继承之菱形继承的实例详解
2020/02/12 Python
Python获取android设备cpu和内存占用情况
2020/11/15 Python
python+selenium自动化实战携带cookies模拟登陆微博
2021/01/19 Python
ProBikeKit澳大利亚:自行车套件,跑步和铁人三项装备
2016/11/30 全球购物
孤独星球出版物:Lonely Planet Publications
2018/03/17 全球购物
世界顶级俱乐部的官方球衣和套装:Subside Sports
2018/04/22 全球购物
Lentiamo丹麦:购买便宜的隐形眼镜
2021/01/13 全球购物
八一建军节部队活动方案
2014/02/04 职场文书
护理不良事件检讨书
2014/02/06 职场文书
工会主席岗位责任制
2014/02/11 职场文书
小学英语教学随笔
2015/08/14 职场文书
Django一小时写出账号密码管理系统
2021/04/29 Python