Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/295.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 将tf idf值作为列添加到矩阵中_Python_Pandas_Scikit Learn_Tf Idf - Fatal编程技术网

Python 将tf idf值作为列添加到矩阵中

Python 将tf idf值作为列添加到矩阵中,python,pandas,scikit-learn,tf-idf,Python,Pandas,Scikit Learn,Tf Idf,我试图将tfidf分数添加为功能。这是正确的方法吗 项目1的形状(400k)与项目2的形状相同。 tfidf_sp的形状为(800k,100k) 这将为您提供一个矩阵,其中列作为tfidf词汇表,每行包含对应于每个项的tfidf值 希望这有帮助 编辑: 尝试将获取的术语文档矩阵转换为数组,如下所示: import pandas as pd pd.DataFrame(tfidf_sp, columns = tfidf.get_feature_names()) 这将解决Pandas错误。您不应该

我试图将tfidf分数添加为功能。这是正确的方法吗

项目1的形状(400k)与项目2的形状相同。 tfidf_sp的形状为(800k,100k)

这将为您提供一个矩阵,其中列作为tfidf词汇表,每行包含对应于每个项的tfidf值

希望这有帮助

编辑:

尝试将获取的术语文档矩阵转换为数组,如下所示:

import pandas as pd

pd.DataFrame(tfidf_sp, columns = tfidf.get_feature_names())

这将解决Pandas错误。

您不应该使用
tfidf\u sp
作为您的功能吗?另外,您是否已经完成列车测试拆分?如果我对项目1使用新的\u list.append(tfidf\u sp[0:400k]),对项目2使用相同的方法。我的内核一直在消亡。为什么不干脆
df['updated_item']=tfidf.fit_transform(item)
?对于tqdm中的i(list(df['item1']):new_list=[]new_list.append(tfidf.idf_)df['updated_item']=list(new_list)我也希望看到进度并单独更新它们。你能告诉我我犯了什么错误吗?这会导致数据帧构造函数调用不正确的错误
import pandas as pd

pd.DataFrame(tfidf_sp, columns = tfidf.get_feature_names())
tfidf_sp = tfidf.fit_transform(item).toarray()