Python实现word2Vecmodel过程解析-创新互联-快上网网站建设公司

Python实现word2Vecmodel过程解析-创新互联

这篇文章将为大家详细讲解有关Python实现word2Vec model过程解析，小编觉得挺实用的，因此分享给大家做个参考，希望大家阅读完这篇文章后可以有所收获。

10年专注成都网站制作，成都定制网站，个人网站制作服务，为大家分享网站制作知识、方案，网站设计流程、步骤,成功服务上千家企业。为您提供网站建设,网站制作,网页设计及定制高端网站建设服务,专注于成都定制网站,高端网页制作,对围栏护栏等多个行业，拥有多年的营销推广经验。

这篇文章主要介绍了Python实现word2Vec model过程解析,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

import gensim, logging, os
logging.basicConfig(format='%(asctime)s : %(levelname)s : %(message)s', level=logging.INFO)
import nltk

corpus = nltk.corpus.brown.sents()

fname = 'brown_skipgram.model'
if os.path.exists(fname):
  # load the file if it has already been trained, to save repeating the slow training step below
  model = gensim.models.Word2Vec.load(fname)
else:
  # can take a few minutes, grab a cuppa
  model = gensim.models.Word2Vec(corpus, size=100, min_count=5, workers=2, iter=50)
  model.save(fname)

words = "woman women man girl boy green blue".split()
for w1 in words:
  for w2 in words:
    print(w1, w2, model.similarity(w1, w2))

print(model.most_similar(positive=['woman', ''], topn=1))
print(model.similarity('woman', 'girl'))girl

在gensim模块中已经封装了13年提出的model--word2vec，所以我们直接开始建立模型

Python实现word2Vec model过程解析

这是建立模型的过程，最后会出现saving Word2vec的语句，代表已经成功建立了模型

Python实现word2Vec model过程解析

这是输入了 gorvement和news关键词后所反馈的词语 --- administration，他们之间的相关性是0.508

当我在输入 women 和 man ，他们显示的相关性的0.638 ，已经是非常高的一个数字。

值得一提的是，我用的语料库是直接从nltk里的brown语料库。其中大概包括了一些新闻之类的数据。

大家如果感兴趣的话，可以自己建立该模型，通过传入不同的语料库，来calc 一些term的相关性噢

关于“Python实现word2Vec model过程解析”这篇文章就分享到这里了，希望以上内容可以对大家有一定的帮助，使各位可以学到更多知识，如果觉得文章不错，请把它分享出去让更多的人看到。

当前题目：Python实现word2Vecmodel过程解析-创新互联
网页链接：http://cdkjz.cn/article/dgjscd.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Python实现word2Vecmodel过程解析-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Python实现word2Vecmodel过程解析-创新互联

相关资讯

linux命令太强大了 linux命令有啥用

阿里云服务器win 阿里云服务器win10系统

包含SAP系统头像高级文案的词条

路由器信号干扰 路由器信号干扰严重

.co域名怎么样 cn域名怎么样

南宁阿里云服务器价格表 南宁阿里云服务器价格表

电脑不能联接阿里云服务器 电脑不能联接阿里云服务器吗

提示错误代码乱码java java编程错误

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

路由器信号干扰路由器信号干扰严重

南宁阿里云服务器价格表南宁阿里云服务器价格表

电脑不能联接阿里云服务器电脑不能联接阿里云服务器吗

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接