Matrix Carrot2文档相似性以及tf idf矩阵中的有序文档索引如何?

Matrix Carrot2文档相似性以及tf idf矩阵中的有序文档索引如何?,matrix,indexing,document,documents,carrot2,Matrix,Indexing,Document,Documents,Carrot2,我试图用carrot确定两个文档之间的相似性。是否有可能直接从框架中获得这种相似性 此外,我一直在研究tf idf矩阵,并意识到行对应于文档的词干化所有单词和列。但是,如何识别哪个文档对应于哪个列 例如,假设一个文档列表,列顺序将是列表中文档的顺序 例: 列表文档={doc1,doc2,doc3} 及 列0=doc1 Coluns 1=doc2 这是吗?Carrot2没有使用文档相似性的传统概念,因此您在那里找不到它。您确实可以使用术语文档矩阵来计算各种文档相似性 假设术语文档矩阵的列与输入列

我试图用carrot确定两个文档之间的相似性。是否有可能直接从框架中获得这种相似性

此外,我一直在研究tf idf矩阵,并意识到行对应于文档的词干化所有单词和列。但是,如何识别哪个文档对应于哪个列

例如,假设一个文档列表,列顺序将是列表中文档的顺序

例:

列表文档={doc1,doc2,doc3}

列0=doc1 Coluns 1=doc2


这是吗?

Carrot2没有使用文档相似性的传统概念,因此您在那里找不到它。您确实可以使用术语文档矩阵来计算各种文档相似性

假设术语文档矩阵的列与输入列表中的文档顺序相同,这是正确的。您可以检查以排除任何其他疑问