Model 属性错误:';树&x27;对象没有属性';单词';。Doc2Vec错误
我试图在预处理的段落上训练Doc2Vec单词嵌入。我删除了标点符号,并进行了标记化、pos标记和分块Model 属性错误:';树&x27;对象没有属性';单词';。Doc2Vec错误,model,nltk,gensim,attributeerror,doc2vec,Model,Nltk,Gensim,Attributeerror,Doc2vec,我试图在预处理的段落上训练Doc2Vec单词嵌入。我删除了标点符号,并进行了标记化、pos标记和分块 import nltk from nltk import word_tokenize, pos_tag, ne_chunk from gensim.models.doc2vec import Doc2Vec ne_tree = ne_chunk(pos_tag(word_tokenize(sent_pun))) model = Doc2Vec(ne_tree) 当我运行Doc2Vec模型时
import nltk
from nltk import word_tokenize, pos_tag, ne_chunk
from gensim.models.doc2vec import Doc2Vec
ne_tree = ne_chunk(pos_tag(word_tokenize(sent_pun)))
model = Doc2Vec(ne_tree)
当我运行Doc2Vec模型时,出现错误“AttributeError:'Tree'对象没有属性'words'。应该采取什么措施来纠正这一点?谢谢。Gensim
Doc2Vec
需要您提供的文本语料库成为一个可编辑的对象序列,每个对象都有一个words
属性(字符串标记列表)和tags
属性(标记名称列表,通常是字符串标记)
gensim中的示例类TaggedDocument
是一种合适的对象。显然,ne_chunk()
没有返回与TaggedDocument
兼容的对象
您应该逐步阅读gensim文档/教程笔记本中的工作示例,以了解工作原理。例如,见: