Python中gensim库word2vec怎么用-创新互联-快上网网站建设公司

Python中gensim库word2vec怎么用-创新互联

这篇文章主要介绍了Python中gensim库word2vec怎么用，具有一定借鉴价值，感兴趣的朋友可以参考下，希望大家阅读完这篇文章之后大有收获，下面让小编带着大家一起了解一下。

成都创新互联公司秉承实现全网价值营销的理念，以专业定制企业官网，网站设计制作、成都网站制作，微信平台小程序开发，网页设计制作，手机网站开发，网络营销推广帮助传统企业实现“互联网+”转型升级专业定制企业官网,公司注重人才、技术和管理，汇聚了一批优秀的互联网技术人才,对客户都以感恩的心态奉献自己的专业和所长。

pip install gensim安装好库后，即可导入使用：

1、训练模型定义

from gensim.models import Word2Vec 
model = Word2Vec(sentences, sg=1, size=100, window=5, min_count=5, negative=3, sample=0.001, hs=1, workers=4)

参数解释：

1.sg=1是skip-gram算法，对低频词敏感；默认sg=0为CBOW算法。

2.size是输出词向量的维数，值太小会导致词映射因为冲突而影响结果，值太大则会耗内存并使算法计算变慢，一般值取为100到200之间。

3.window是句子中当前词与目标词之间的大距离，3表示在目标词前看3-b个词，后面看b个词（b在0-3之间随机）。

4.min_count是对词进行过滤，频率小于min-count的单词则会被忽视，默认值为5。

5.negative和sample可根据训练结果进行微调，sample表示更高频率的词被随机下采样到所设置的阈值，默认值为1e-3。

6.hs=1表示层级softmax将会被使用，默认hs=0且negative不为0，则负采样将会被选择使用。

7.workers控制训练的并行，此参数只有在安装了Cpython后才有效，否则只能使用单核。

详细参数说明可查看word2vec源代码。

2、训练后的模型保存与加载

model.save(fname) 
model = Word2Vec.load(fname)

3、模型使用（词语相似度计算等）

model.most_similar(positive=['woman', 'king'], negative=['man']) 
#输出[('queen', 0.50882536), ...] 
 
model.doesnt_match("breakfast cereal dinner lunch".split()) 
#输出'cereal' 
 
model.similarity('woman', 'man') 
#输出0.73723527 
 
model['computer'] # raw numpy vector of a word 
#输出array([-0.00449447, -0.00310097, 0.02421786, ...], dtype=float32)

感谢你能够认真阅读完这篇文章，希望小编分享的“Python中gensim库word2vec怎么用”这篇文章对大家有帮助，同时也希望大家多多支持创新互联，关注创新互联行业资讯频道，更多相关知识等着你来学习!

当前文章：Python中gensim库word2vec怎么用-创新互联
当前网址：http://cdkjz.cn/article/dpohog.html

多年建站经验

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

咨询相关问题或预约面谈，可以通过以下方式与我们联系

网站建设

网站推广

案例

方案

电商网站开发

微信小程序

我们

联系

精准传达 • 有效沟通

查看其它板块

Python中gensim库word2vec怎么用-创新互联

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接

网络推广

Network promotion

网站方案

Solution

电商网站开发

E-commerce & System

我们

About Us

联系

Contact Us

精准传达 • 有效沟通

查看其它板块

Python中gensim库word2vec怎么用-创新互联

相关资讯

zblog安装结果 zblog使用教程

mysql中怎么求和函数 mysql数据库中,求和函数怎么用

c语言函数头有分号 c语言中一个分号算语句吗

c语言中调用函数怎们使用 c语言中调用函数怎们使用的

帝国cms显示外联字段 帝国cms显示外联字段异常

pl0编译器java代码的简单介绍

linux常用命令20个 linux100个常用命令

帝国cms手机打不开 帝国cms开发api

多一份参考，总有益处

联系快上网，免费获得专属《策划方案》及报价

大客户专线 成都：13518219792 座机：028-86922220

友情链接 交换友情链接

帝国cms显示外联字段帝国cms显示外联字段异常

帝国cms手机打不开帝国cms开发api

大客户专线成都：13518219792 座机：028-86922220

友情链接交换友情链接