Python 如何在nltk POS数据上应用TFIDF。。。。。?

Python 如何在nltk POS数据上应用TFIDF。。。。。?,python,machine-learning,nltk,data-science,tfidfvectorizer,Python,Machine Learning,Nltk,Data Science,Tfidfvectorizer,我将nltk POS特性化应用于panda数据框架中的评论栏。 我得到了这个新特性,但当我尝试在该特性上应用TFIDF矢量化时,它会显示错误,如 错误:应用TFIDF矢量器时 AttributeError:“list”对象没有较低的属性 我为nltk POS使用了以下代码 pure_df['pre_pro_plot_synopsis_POS'] = pos_tag_sents(pure_df['pre_pro_plot_synopsis'].apply(word_tokenize).tolist

我将nltk POS特性化应用于panda数据框架中的评论栏。 我得到了这个新特性,但当我尝试在该特性上应用TFIDF矢量化时,它会显示错误,如

错误:应用TFIDF矢量器时

AttributeError:“list”对象没有较低的属性

我为nltk POS使用了以下代码

pure_df['pre_pro_plot_synopsis_POS'] = pos_tag_sents(pure_df['pre_pro_plot_synopsis'].apply(word_tokenize).tolist())
有人能帮我把POS数据传给tfidf矢量器吗


Thank's prevance

这里,您创建的
pos\u tag\u sents
方法需要一个字符串作为参数,但这里您将列表作为参数传递给它。因此,不是这一行:
pos\u-tag\sents(纯df['pre\u-pro\u-plot\u-symposis')。apply(word\u-tokenize)。tolist())

再次尝试使用apply方法并将
pos\u tag\u sents
传递给它,如下所示:

pure\u-df['pre\u-pro\u-plot\u-sympsis\u-POS']=pure\u-df['pre\u-pro\u-plot\u-sympsis'].apply(单词标记化).apply(位置标记sents).tolist()


希望能有所帮助。

谢谢,我会尽力回复您:)