Python实现word2Vec model过程解析


Posted in Python onDecember 16, 2019

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec,所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程,最后会出现saving Word2vec的语句,代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后 所反馈的词语 --- administration, 他们之间的相关性是0.508

当我在输入 women 和 man ,他们显示的相关性的0.638 ,已经是非常高的一个数字。

值得一提的是,我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话,可以自己建立该模型,通过传入不同的语料库,来calc 一些term的 相关性噢

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持三水点靠木。

Python 相关文章推荐
Python判断文件和文件夹是否存在的方法
May 21 Python
python 的列表遍历删除实现代码
Apr 12 Python
使用python调用zxing库生成二维码图片详解
Jan 10 Python
python实现稀疏矩阵示例代码
Jun 09 Python
Python网络爬虫与信息提取(实例讲解)
Aug 29 Python
python 实现判断ip连通性的方法总结
Apr 22 Python
python3实现名片管理系统
Nov 29 Python
Python中文件的写入读取以及附加文字方法
Jan 23 Python
Python模拟百度自动输入搜索功能的实例
Feb 14 Python
pyqt 实现QlineEdit 输入密码显示成圆点的方法
Jun 24 Python
Django工程的分层结构详解
Jul 18 Python
Django用数据库表反向生成models类知识点详解
Mar 25 Python
Python爬虫爬取煎蛋网图片代码实例
Dec 16 #Python
python实现监控阿里云账户余额功能
Dec 16 #Python
Python实现密码薄文件读写操作
Dec 16 #Python
如何基于Python实现电子邮件的发送
Dec 16 #Python
Python如何基于selenium实现自动登录博客园
Dec 16 #Python
Python正则表达式急速入门(小结)
Dec 16 #Python
如何基于Python制作有道翻译小工具
Dec 16 #Python
You might like
php Undefined index的问题
2009/06/01 PHP
yii2分页之实现跳转到具体某页的实例代码
2016/06/02 PHP
基于Laravel-admin 后台的自定义页面用法详解
2019/09/30 PHP
(function(){})()的用法与优点
2007/03/11 Javascript
基于逻辑运算的简单权限系统(实现) JS 版
2007/03/24 Javascript
JavaScript 判断浏览器类型及版本
2009/02/21 Javascript
javascript 写类方式之二
2009/07/05 Javascript
IE和Firefox下event事件杂谈
2009/12/18 Javascript
基于Jquery的简单&简陋Tabs插件代码
2010/02/09 Javascript
JavaScript实现点击文字切换登录窗口的方法
2015/05/11 Javascript
JS实现两表格里数据来回转移的方法
2015/05/28 Javascript
JS实现的左侧竖向滑动菜单效果代码
2015/10/19 Javascript
jquery实现的点击翻书效果代码
2015/11/04 Javascript
window.onerror()的用法与实例分析
2016/01/27 Javascript
vue.js学习笔记:如何加载本地json文件
2017/01/17 Javascript
推荐三款日期选择插件(My97DatePicker、jquery.datepicker、Mobiscroll)
2017/04/21 jQuery
利用vue + element实现表格分页和前端搜索的方法
2017/12/25 Javascript
axios 处理 302 状态码的解决方法
2018/04/10 Javascript
通过实例学习React中事件节流防抖
2019/06/17 Javascript
element-ui 中使用upload多文件上传只请求一次接口
2019/07/19 Javascript
VUE 实现element upload上传图片到阿里云
2020/08/12 Javascript
微信小程序自定义底部弹出框动画
2020/11/18 Javascript
[56:18]DOTA2上海特级锦标赛主赛事日 - 4 败者组第四轮#2 MVP.Phx VS Fnatic第二局
2016/03/05 DOTA
Python 处理数据的实例详解
2017/08/10 Python
pandas groupby 分组取每组的前几行记录方法
2018/04/20 Python
详解Python安装scrapy的正确姿势
2018/06/26 Python
Series和DataFrame使用简单入门
2019/11/13 Python
python计算波峰波谷值的方法(极值点)
2020/02/18 Python
eDreams澳大利亚:预订机票、酒店和度假产品
2017/04/19 全球购物
Tommy Hilfiger美国官网:美国高端休闲领导品牌
2019/01/14 全球购物
英国在线药房:Chemist.co.uk
2019/03/26 全球购物
英国名牌服装购物网站:OD’s Designer
2019/09/02 全球购物
PHP高级工程师面试问题推荐
2013/01/18 面试题
MIS软件工程师的面试题
2016/04/22 面试题
幼儿园教师请假制度
2014/01/16 职场文书
SQL之各种join小结详细讲解
2021/08/04 MySQL