Model 属性错误:';树&x27;对象没有属性';单词';。Doc2Vec错误

Model 属性错误:';树&x27;对象没有属性';单词';。Doc2Vec错误,model,nltk,gensim,attributeerror,doc2vec,Model,Nltk,Gensim,Attributeerror,Doc2vec,我试图在预处理的段落上训练Doc2Vec单词嵌入。我删除了标点符号,并进行了标记化、pos标记和分块 import nltk from nltk import word_tokenize, pos_tag, ne_chunk from gensim.models.doc2vec import Doc2Vec ne_tree = ne_chunk(pos_tag(word_tokenize(sent_pun))) model = Doc2Vec(ne_tree) 当我运行Doc2Vec模型时

我试图在预处理的段落上训练Doc2Vec单词嵌入。我删除了标点符号,并进行了标记化、pos标记和分块

import nltk
from nltk import word_tokenize, pos_tag, ne_chunk
from gensim.models.doc2vec import Doc2Vec

ne_tree = ne_chunk(pos_tag(word_tokenize(sent_pun)))

model = Doc2Vec(ne_tree)

当我运行Doc2Vec模型时,出现错误“AttributeError:'Tree'对象没有属性'words'。应该采取什么措施来纠正这一点?谢谢。

Gensim
Doc2Vec
需要您提供的文本语料库成为一个可编辑的对象序列,每个对象都有一个
words
属性(字符串标记列表)和
tags
属性(标记名称列表,通常是字符串标记)

gensim中的示例类
TaggedDocument
是一种合适的对象。显然,
ne_chunk()
没有返回与
TaggedDocument
兼容的对象

您应该逐步阅读gensim文档/教程笔记本中的工作示例,以了解工作原理。例如,见: