Python 从h2o.word2vec对象中提取每个单词的嵌入向量
我试图使用Python 从h2o.word2vec对象中提取每个单词的嵌入向量,python,r,nlp,h2o,Python,R,Nlp,H2o,我试图使用h2o.word2vec创建一个预训练的嵌入层,我希望提取模型中的每个单词及其等效的嵌入向量 代码: 库(data.table) 图书馆(h2o) h2o.init(n读数=-1) 注释您可以使用方法w2v\u model.transform(words=words) (完整选项包括:w2v\u model.transform(words=,aggregate\u method=) 其中,words是一个H2O框架,由包含源单词的单列组成(请注意,您可以指定包含此框架的子集),而agg
h2o.word2vec
创建一个预训练的嵌入层,我希望提取模型中的每个单词及其等效的嵌入向量
代码:
库(data.table)
图书馆(h2o)
h2o.init(n读数=-1)
注释您可以使用方法w2v\u model.transform(words=words)
(完整选项包括:w2v\u model.transform(words=,aggregate\u method=)
其中,words
是一个H2O框架,由包含源单词的单列组成(请注意,您可以指定包含此框架的子集),而aggregate\u method
指定如何聚合单词序列
如果未指定聚合方法,则不执行聚合,并且每个输入字都映射到单个字向量。如果该方法为平均值,则将输入视为由NA分隔的字序列
例如:
av_vecs = w2v_model.transform(words, aggregate_method = "AVERAGE")
以下是Word2Vec用户指南的链接,提供了其他信息:
av_vecs = w2v_model.transform(words, aggregate_method = "AVERAGE")