Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python同时给两个收件人发送邮件的方法
Apr 30 Python
如何优雅地改进Django中的模板碎片缓存详解
Jul 04 Python
python3 cvs将数据读取为字典的方法
Dec 22 Python
Python实现图片转字符画的代码实例
Feb 22 Python
python使用MQTT给硬件传输图片的实现方法
May 05 Python
Python参数类型以及常见的坑详解
Jul 08 Python
利用python实现汉字转拼音的2种方法
Aug 12 Python
python并发编程多进程 互斥锁原理解析
Aug 20 Python
Python @property及getter setter原理详解
Mar 31 Python
jupyter notebook中美观显示矩阵实例
Apr 17 Python
Django启动时找不到mysqlclient问题解决方案
Nov 11 Python
Django 如何实现文件上传下载
Apr 08 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
PHP开发中常用的十个代码样例
2016/02/02 PHP
PHP在弹框中获取foreach中遍历的id值并传递给地址栏
2017/06/13 PHP
PHP基于imagick扩展实现合成图片的两种方法【附imagick扩展下载】
2017/11/14 PHP
PHP的RSA加密解密方法以及开发接口使用
2018/02/11 PHP
thinkphp5.1框架模板布局与模板继承用法分析
2019/07/19 PHP
基于jQuery的倒计时插件代码
2011/05/07 Javascript
js中将HTMLCollection/NodeList/伪数组转换成数组的代码
2011/07/31 Javascript
浅谈javascript 函数属性和方法
2015/01/21 Javascript
最基础的vue.js双向绑定操作
2017/08/23 Javascript
vue.js中引入vuex储存接口数据及调用的详细流程
2017/12/14 Javascript
jquery写出PC端轮播图实例
2018/01/26 jQuery
vue实现简单loading进度条
2018/06/06 Javascript
详解vue+webpack+express中间件接口使用
2018/07/17 Javascript
微信小程序公用参数与公用方法用法示例
2019/01/09 Javascript
vue+elementUI实现表单和图片上传及验证功能示例
2019/05/14 Javascript
vue+element实现表格新增、编辑、删除功能
2019/05/28 Javascript
深入了解JavaScript 私有化
2019/05/30 Javascript
layer 刷新某个页面的实现方法
2019/09/05 Javascript
node事件循环和process模块实例分析
2020/02/14 Javascript
如何手写一个简易的 Vuex
2020/10/10 Javascript
[48:32]VGJ.T vs Fnatic 2018国际邀请赛小组赛BO2 第一场 8.16
2018/08/17 DOTA
解决Tensorflow使用pip安装后没有model目录的问题
2018/06/13 Python
python爬取个性签名的方法
2018/06/17 Python
Linux下Python安装完成后使用pip命令的详细教程
2018/11/22 Python
Python3.5模块的定义、导入、优化操作图文详解
2019/04/27 Python
Tensorflow实现神经网络拟合线性回归
2019/07/19 Python
python实现将两个文件夹合并至另一个文件夹(制作数据集)
2020/04/03 Python
Python 将 QQ 好友头像生成祝福语的实现代码
2020/05/03 Python
python实现PolynomialFeatures多项式的方法
2021/01/06 Python
一款简洁的纯css3代码实现的动画导航
2014/10/31 HTML / CSS
Nike挪威官网:Nike.com (NO)
2018/11/26 全球购物
护理专业应届毕业生推荐信
2013/11/15 职场文书
揭牌仪式策划方案
2014/05/28 职场文书
ktv好的活动方案
2014/08/17 职场文书
先进个人推荐材料
2014/12/29 职场文书
酒店圣诞节活动总结
2015/05/06 职场文书