Machine learning 文档聚类

Machine learning 文档聚类,machine-learning,nlp,artificial-intelligence,cluster-analysis,Machine Learning,Nlp,Artificial Intelligence,Cluster Analysis,是否有任何人工智能算法可用于改进文档聚类结果?聚类算法可以是分层的或任何其他的 谢谢你包括弗吉尼亚理工大学尼古拉斯·安德鲁斯和爱德华·福克斯2007年发表的一篇名为“”的论文的链接。我不确定你会将什么具体归类为“人工智能算法”,但扫描论文的内容表明,他们关注向量空间模型、对kmeans的扩展、生成算法、谱聚类、降维、基于相位的模型和比较分析。这是一个数学上非常密集的处理方法,但他们很小心地引用了他们所讨论的算法。聚类确实是人工智能领域的一种问题。如果你想降低一个层次,你可以说这是在机器学习领域。

是否有任何人工智能算法可用于改进文档聚类结果?聚类算法可以是分层的或任何其他的


谢谢你

包括弗吉尼亚理工大学尼古拉斯·安德鲁斯和爱德华·福克斯2007年发表的一篇名为“”的论文的链接。我不确定你会将什么具体归类为“人工智能算法”,但扫描论文的内容表明,他们关注向量空间模型、对kmeans的扩展、生成算法、谱聚类、降维、基于相位的模型和比较分析。这是一个数学上非常密集的处理方法,但他们很小心地引用了他们所讨论的算法。

聚类确实是人工智能领域的一种问题。如果你想降低一个层次,你可以说这是在机器学习领域。从这个意义上说,AI并没有改善文档聚类,而是解决了它!一些基本的备选方案,但每次使用的数据类型可能会通过不同的算法得到更好的处理。有很多基于k-means的方法来解决这个问题。在这种情况下,需要小心播种。球形k-均值(搜索迪伦的论文)是一种简单而标准的方法。其他扩展是

子空间聚类也是一个很好的尝试,如果您想比“文档聚类”更进一步,通常可以查看“高维稀疏数据空间中的聚类”