Algorithm 什么';从给定文本生成关键字的最佳方法是什么?

Algorithm 什么';从给定文本生成关键字的最佳方法是什么?,algorithm,nlp,seo,Algorithm,Nlp,Seo,我想为我的CMS生成关键字 有人知道生成关键字的好PHP脚本(或其他东西)吗 我有一个类似这样的HTML站点:要实现自动化,从文章中获取单词,将它们与黑名单进行匹配,并且不包括4个字符以下的单词 此外,允许用户手动编辑。因此,只有在没有关键字的情况下才能自动执行 这可以通过触发器或应用程序层来完成 问候,, /这是一个计算机很难解决的问题。让其他人手动操作或者干脆不操作会容易得多 如果你真的需要一台计算机来做这件事,我会去优秀的Python库,它有很多用于这类事情的工具(=自然语言处理),使用它

我想为我的CMS生成关键字

有人知道生成关键字的好PHP脚本(或其他东西)吗


我有一个类似这样的HTML站点:

要实现自动化,从文章中获取单词,将它们与黑名单进行匹配,并且不包括4个字符以下的单词

此外,允许用户手动编辑。因此,只有在没有关键字的情况下才能自动执行

这可以通过触发器或应用程序层来完成

问候,,
/这是一个计算机很难解决的问题。让其他人手动操作或者干脆不操作会容易得多

如果你真的需要一台计算机来做这件事,我会去优秀的Python库,它有很多用于这类事情的工具(=自然语言处理),使用它非常有趣

例如,您可以计算单词的频率分布,然后搜索出现频率最高的较大(比如说5个字符)单词的最常见超词,并将其作为关键字的提示


同样,由人来完成要容易得多。

如果我理解这个问题,你有文本,你想确定与文本最相关的关键字

三种方法:

1) 让用户输入关键字

2) 例如,文本的统计分析可以确定文本中比语言中更常见的单词。任何关于信息检索的好文章都会有一些算法

3) 如果您有一组已经分类的文档(可能以前是由人类分类的),那么您可以使用机器学习算法(可能是贝叶斯分类器)来训练系统对新文档进行分类。如果您让用户覆盖/更正建议的关键字,系统可以随时间学习


就我个人而言,我会做#3,因为它更具适应性。

从哪种数据“生成”数据?你能举个例子吗?人们在这方面很在行(;你应该让人们输入关键词,没有哪个脚本比一个人写的内容更匹配,再输入几个词有那么难吗?(+1@Harmen)但这是一个很难解决的问题…不要将其标记为php或seo,你将不会得到任何好的答案,而是将其标记为算法或最佳-practice@Philipp尽管如此,自动生成关键字通常是一个坏主意,因为脚本无法区分重要关键字和不重要关键字。您确定在脚本中需要关键字吗第一位?它通常足以让内容自己说话,给它适当的
标签等。