Matrix 如何得到一组文档的距离矩阵

Matrix 如何得到一组文档的距离矩阵,matrix,text,cluster-analysis,distance,Matrix,Text,Cluster Analysis,Distance,我正在尝试使用层次聚类对一组文档执行聚类。但是,我不确定如何获得一组文档的距离矩阵。有人能帮我吗?谢谢 决定要使用哪些功能 提取特征 确定要使用的相似性函数 计算成对相似性 将相似性转换为距离

我正在尝试使用层次聚类对一组文档执行聚类。但是,我不确定如何获得一组文档的距离矩阵。有人能帮我吗?谢谢

  • 决定要使用哪些功能
  • 提取特征
  • 确定要使用的相似性函数
  • 计算成对相似性
  • 将相似性转换为距离