Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
浅析python打包工具distutils、setuptools
Apr 20 Python
python 获取毫秒数,计算调用时长的方法
Feb 20 Python
如何通过50行Python代码获取公众号全部文章
Jul 12 Python
python对验证码降噪的实现示例代码
Nov 12 Python
python中从for循环延申到推导式的具体使用
Nov 29 Python
pytorch中的卷积和池化计算方式详解
Jan 03 Python
Pycharm如何运行.py文件的方法步骤
Mar 03 Python
PHP基于phpqrcode类库生成二维码过程解析
May 28 Python
python支持多继承吗
Jun 19 Python
Python pytesseract验证码识别库用法解析
Jun 29 Python
python 实现"神经衰弱"翻牌游戏
Nov 09 Python
接口自动化多层嵌套json数据处理代码实例
Nov 20 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
深入PHP获取随机数字和字母的方法详解
2013/06/06 PHP
ThinkPHP单字母函数(快捷方法)使用总结
2014/07/23 PHP
PHP判断手机是IOS还是Android
2015/12/09 PHP
WordPress中用于创建以及获取侧边栏的PHP函数讲解
2015/12/29 PHP
JQuery 拾色器插件发布-jquery.icolor.js
2010/10/20 Javascript
onkeydown事件解决按回车键直接提交数据的需求
2013/04/11 Javascript
JS复制到剪贴板示例代码
2013/10/30 Javascript
jquery制作弹窗提示窗口代码分享
2014/03/02 Javascript
js中定义一个变量并判断其是否为空的方法
2014/05/13 Javascript
容易造成JavaScript内存泄露几个方面
2014/09/04 Javascript
javascript显示中文日期的方法
2015/06/18 Javascript
jquery悬浮提示框完整实例
2016/01/13 Javascript
关于JavaScript限制字数的输入框的那些事
2016/08/14 Javascript
AngularJS bootstrap启动详解及实例代码
2016/09/14 Javascript
轻松实现jquery选项卡切换效果
2016/10/10 Javascript
javascript中的后退和刷新实现方法
2016/11/10 Javascript
微信小程序 实现拖拽事件监听实例详解
2016/11/16 Javascript
Vuejs仿网易云音乐实现听歌及搜索功能
2017/03/30 Javascript
jQuery实现按比例缩放图片的方法
2017/04/29 jQuery
JavaScript基础进阶之数组方法总结(推荐)
2017/09/04 Javascript
JavaScript实现简单音乐播放器
2020/04/17 Javascript
vue-cli 项目打包完成后运行文件路径报错问题
2019/07/19 Javascript
微信小程序pinker组件使用实现自动相减日期
2020/05/07 Javascript
Pandas探索之高性能函数eval和query解析
2017/10/28 Python
使用python画个小猪佩奇的示例代码
2018/06/06 Python
python逆序打印各位数字的方法
2018/06/25 Python
Python中调用其他程序的方式详解
2019/08/06 Python
python函数参数(必须参数、可变参数、关键字参数)
2019/08/16 Python
Python第三方包之DingDingBot钉钉机器人
2020/04/09 Python
HTML5中使用postMessage实现Ajax跨域请求的方法
2016/04/19 HTML / CSS
Bowflex美国官方网站:高级家庭健身器材
2017/12/22 全球购物
专注澳大利亚特产和新西兰特产的澳洲中文网:0061澳洲制造
2019/03/24 全球购物
上海方立数码笔试题
2013/10/18 面试题
2014年双拥工作总结
2014/11/21 职场文书
城管个人总结
2015/02/28 职场文书
Java生成读取条形码和二维码的简单示例
2021/07/09 Java/Android