Artificial intelligence 如何自动摘录用户生成的内容?

Artificial intelligence 如何自动摘录用户生成的内容?,artificial-intelligence,nlp,user-generated-content,Artificial Intelligence,Nlp,User Generated Content,我运行一个允许用户写博客文章的网站,我真的很想总结写下的内容,并用它来填充-标签,例如 我可以使用什么方法自动总结/描述用户生成内容的内容? 有没有解决这个问题的方法(最好是免费的) (我见过其他网站只抄袭前100个左右的单词,但我觉得这是一个次优的解决方案。)我可能会尝试使用mechanical Turk或任何其他众包选项 这接近人工智能,因此不会有一个“简单”的解决方案,但有一些产品针对这个问题 例如,签出。另一个要签出的项目,一个SourceForge项目,不是一个简单的任务。。。您应该查

我运行一个允许用户写博客文章的网站,我真的很想总结写下的内容,并用它来填充
-标签,例如

我可以使用什么方法自动总结/描述用户生成内容的内容?
有没有解决这个问题的方法(最好是免费的)


(我见过其他网站只抄袭前100个左右的单词,但我觉得这是一个次优的解决方案。)

我可能会尝试使用mechanical Turk或任何其他众包选项

这接近人工智能,因此不会有一个“简单”的解决方案,但有一些产品针对这个问题


例如,签出。

另一个要签出的项目,一个SourceForge项目,

不是一个简单的任务。。。您应该查找有关“”的文章或书籍

一些先发因素可能是:

书籍:

文章:


让它变得可预测。

从用户的角度来看,仅仅使用第一段一点也不坏。 在某些情况下,使用任何自动化都注定会失败。所以我建议展示一下
第一段(可能在某个时候截断)作为摘要,并提供通过可选字段覆盖该段的功能。

将摘要任务视为从文档中“选择最重要的句子”的挑战

H.p.Luhn(1958)在中描述的方法描述了一种实际性能相当好的简单方法。试着试一试


如果您的网站使用Python编码,那么使用(自然语言工具包)编写此算法是一项有趣的任务。

Yahoo为此提供了一个免费API:
名词短语通常是句子的重要组成部分。选择名词短语密集的句子可以产生一个好的摘要。你可以用词性标记器得到名词短语


对于一个好的总结,最好是一个有意义的句子。阅读一个断章取义的句子有点刺耳。

苹果的包含可能有用的示例代码。

或者,当作者发表文章时,作者可以突出显示描述中可以使用的关键字,然后可以自动放入元描述标签。

不幸的是,它是在PHP(+1)中“如何识别一个文本的主旨”论文还提供了软件:密歇根大学的一些人也发现它有软件可用,虽然现在链接已经被删除了。其他链接已经死了,所以“如何识别文本的主旨”现在可以在这里找到:不知何故,使用专利代码似乎不是最好的法律选择。我一直在考虑这个选择。。但我想让系统尽可能地为用户简化。所以这个选择是不可能的。(这对于付费贡献和其他东西来说是很好的,但对我的观众来说不是)这项服务从给定的字符串中提取关键字。很好,但没有回答问题。