Python文档聚类

Python文档聚类,python,cluster-analysis,document,Python,Cluster Analysis,Document,我是Python新手,正在检查一个基于关键字对文档进行集群的示例程序。在中找到该程序,并将该程序转换为python 运行转换成python的程序时,会出现错误。通过添加库的import语句,几乎没有其他错误得到修复 或者,如果你建议我一些样本程序,其中饲料在多个文件和集群它也很好 下面给出了获取错误的部分代码: from sklearn.feature_extraction.text import TfidfVectorizer from IPython import get_ipython i

我是Python新手,正在检查一个基于关键字对文档进行集群的示例程序。在中找到该程序,并将该程序转换为python

运行转换成python的程序时,会出现错误。通过添加库的import语句,几乎没有其他错误得到修复

或者,如果你建议我一些样本程序,其中饲料在多个文件和集群它也很好

下面给出了获取错误的部分代码:

from sklearn.feature_extraction.text import TfidfVectorizer
from IPython import get_ipython
ipython = get_ipython()
print(synopses[20])
x=TfidfVectorizer()

tfidf_vectorizer = TfidfVectorizer(max_df=0.8, max_features=200000,
                                 min_df=0.2, stop_words='english',
                                 use_idf=True, tokenizer=tokenize_and_stem, ngram_range=(1,3))
get_ipython().magic('time tfidf_matrix = tfidf_vectorizer.fit_transform(synopses)')
print(tfidf_matrix.shape)
谢谢,
Sijo

有什么错误?你的问题到底是什么?下面给出了错误消息回溯(最近一次调用上次):文件“cluster_analysis.py”,第223行,在get_ipython().magic('time-tfidf_matrix=tfidf_vectorizer.fit_transform(synopses)'AttributeError:'NoneType'对象没有属性'magic',你显然不知道该程序在做什么。。。连这样的小事都修不好。。。通过复制和粘贴您不理解的代码来停止编程。你的工作是编程,而不是使用谷歌。。。