Text 相似度

Text 相似度,text,similarity,text-mining,Text,Similarity,Text Mining,我必须比较两份文件,找出相似度 我所需要做的就是比较两份文件并给出一个结果。数字应描述相似程度(类似文件的数字较大) 我想要一个有效的方法来执行这个过程。(衡量相似性的标准不仅仅是相似词语的基础,还必须考虑上下文。) 有人能为这个过程提出一个有效的算法吗。该算法只检查两个文档的相似性 在这里,您必须学习称为(奇异值分解)的技术 如果您想实现文档聚类技术,可以尝试使用Matlab并安装MatlabTMG工具。如果您只想快速、非数学的描述和实现(Java),这里有一个链接到 提示:对于自由文本,请使

我必须比较两份文件,找出相似度

我所需要做的就是比较两份文件并给出一个结果。数字应描述相似程度(类似文件的数字较大)

我想要一个有效的方法来执行这个过程。(衡量相似性的标准不仅仅是相似词语的基础,还必须考虑上下文。)

有人能为这个过程提出一个有效的算法吗。该算法只检查两个文档的相似性

在这里,您必须学习称为(奇异值分解)的技术


如果您想实现文档聚类技术,可以尝试使用Matlab并安装MatlabTMG工具。

如果您只想快速、非数学的描述和实现(Java),这里有一个链接到


提示:对于自由文本,请使用4或5的木瓦长度(这是签名生成算法的一个参数)

此主题有许多参考资料。请尝试搜索…我读了一篇关于两两相似性的论文。但我正在寻找有效的实现方法。你能推荐一个吗。请问为什么这个问题得到3张反对票?