Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
python高并发异步服务器核心库forkcore使用方法
Nov 26 Python
Django集成百度富文本编辑器uEditor攻略
Jul 04 Python
python使用pyhook监控键盘并实现切换歌曲的功能
Jul 18 Python
python安装与使用redis的方法
Apr 19 Python
Python反射的用法实例分析
Feb 11 Python
Python实现针对给定字符串寻找最长非重复子串的方法
Apr 21 Python
Django model序列化为json的方法示例
Oct 16 Python
浅谈python连续赋值可能引发的错误
Nov 10 Python
使用python的pandas为你的股票绘制趋势图
Jun 26 Python
Python格式化输出--%s,%d,%f的代码解析
Apr 29 Python
Python 多线程C段扫描、检测 Ping扫描脚本的实现
Sep 03 Python
DjangoRestFramework 使用 simpleJWT 登陆认证完整记录
Jun 22 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
帅气的琦玉老师
2020/03/02 日漫
PHP 遍历文件实现代码
2011/05/04 PHP
PHP CURL 内存泄露问题解决方法
2015/02/12 PHP
php opendir()列出目录下所有文件的实例代码
2016/10/02 PHP
laravel框架使用FormRequest进行表单验证,验证异常返回JSON操作示例
2020/02/18 PHP
漂亮的widgets,支持换肤和后期开发新皮肤(2007-4-27已更新1.7alpha)
2007/04/27 Javascript
javascript firefox不显示本地预览图片问题的解决方法
2008/11/12 Javascript
Javascript 代码也可以变得优美的实现方法
2009/06/22 Javascript
js操作ajax返回的json的注意问题!
2010/02/23 Javascript
js定义对象或数组直接量时各浏览器对多余逗号的处理(json)
2011/03/05 Javascript
使用focus方法让光标默认停留在INPUT框
2014/07/29 Javascript
JavaScript实现倒计时代码段Item1(非常实用)
2015/11/03 Javascript
jQuery实现为控件添加水印文字效果(附源码)
2015/12/02 Javascript
javascript HTML+CSS实现经典橙色导航菜单
2016/02/16 Javascript
javascript闭包概念简单解析(推荐)
2016/06/03 Javascript
BootStrap 智能表单实战系列(五) 表单依赖插件处理
2016/06/13 Javascript
nodejs中art-template模板语法的引入及冲突解决方案
2017/11/07 NodeJs
nodejs结合socket.io实现websocket通信功能的方法
2018/01/12 NodeJs
详解如何在React组件“外”使用父组件的Props
2018/01/12 Javascript
微信小程序整个页面的自动适应布局的实现
2020/07/12 Javascript
Python使用sftp实现上传和下载功能(实例代码)
2017/03/14 Python
python实时分析日志的一个小脚本分享
2017/05/07 Python
python opencv将表格图片按照表格框线分割和识别
2019/10/30 Python
浅谈keras的深度模型训练过程及结果记录方式
2020/01/24 Python
python实现的分层随机抽样案例
2020/02/25 Python
python中@contextmanager实例用法
2021/02/07 Python
Currentbody澳大利亚:美容仪专家
2019/11/11 全球购物
市场营销专业个人自荐信格式
2013/09/21 职场文书
公司领导推荐信
2013/11/12 职场文书
学生手册家长评语
2014/02/10 职场文书
大学国际贸易专业自荐信
2014/06/05 职场文书
春游踏青活动方案
2014/08/14 职场文书
2014年项目工作总结
2014/11/24 职场文书
行政介绍信范文
2015/05/04 职场文书
离开雷锋的日子观后感
2015/06/09 职场文书
centos8安装nginx1.9.1的详细过程
2021/08/02 Servers