Similarity 如何实施";相关文章;

Similarity 如何实施";相关文章;,similarity,Similarity,如何编写代码来查找与用户当前阅读的文章相关(类似)的文章 例如,假设我有文章: Python programming tips Python programming for newbies Programming in Python, ActionScript and Flash Programming in the Jungle Tarzan saves newbie Judy from using Fortran programming language (我现在就想到了这些标题。) 我如

如何编写代码来查找与用户当前阅读的文章相关(类似)的文章

例如,假设我有文章:

Python programming tips
Python programming for newbies
Programming in Python, ActionScript and Flash
Programming in the Jungle
Tarzan saves newbie Judy from using Fortran programming language
(我现在就想到了这些标题。)

我如何查询数据库并发现它们都是相关的

如果有任何建议,我将不胜感激


谢谢,Boda Cydo。

你在使用哪个数据库?“全文搜索”可能会帮助你,MySQL只是内置了它。用谷歌搜索一下。

我建议你看看

余弦相似度是一种简单的方法,用于测量两个文档之间的相似度(但不仅限于此),它不能将使用tf idf加权的单词向量作为输入。
基本上,如果一个单词在当前文档中频繁出现(术语频率-tf),那么tf-idf权重会更高,但在其他文档中很少出现(逆文档频率-idf)。

包含一些提示;更具体地说,这听起来像个问题

解决这个问题有几种方法。一种是标记,依靠读者和贡献者标记这些文章,您可以将关键字与ex的标记相匹配


另一种方法是结合搜索和分析,即谷歌方法。您可以显示搜索查询的结果,用户单击这些结果,那些单击其中一些的用户也单击相关的结果,您可以在它们之间建立关系。

如果您的案例确实是一个内容驱动的网站,那么请编辑为每一篇文章添加标签可能是最好的方法。t这是在网络上进行的方式(例如Wordpress)


另外,语言处理也有一些方法可以做到这一点,但由于您使用Python,我将把这一点留给Python专家来做…

一个建议是在您的所有文章中添加标记。相关文章是具有类似标签的文章