Javascript 以编程方式确定对话主题

Javascript 以编程方式确定对话主题,javascript,node.js,irc,chatbot,Javascript,Node.js,Irc,Chatbot,这可能是一个极难回答的问题,但这是我的问题 我想知道确定谈话主题的最佳方法是什么。对话通过IRC进行。我以前写过聊天机器人,它们对这个话题的解释很好,但没有我想要的那么准确 在过去,我必须列出一些常用词,如“the”和“a”,然后从主题数组中过滤它们。我不知道这是不是正确的方法 我想知道是否有某种频率算法可以让我计算出什么词是当前对话的主题 任何关于如何实现这一目标的建议都将不胜感激。谢谢。有一种叫做。 它只能准确地应用于人类书写的文本,而且必须有一定的长度 通过这种算法运行文本的结果将是一组关

这可能是一个极难回答的问题,但这是我的问题

我想知道确定谈话主题的最佳方法是什么。对话通过IRC进行。我以前写过聊天机器人,它们对这个话题的解释很好,但没有我想要的那么准确

在过去,我必须列出一些常用词,如“the”和“a”,然后从主题数组中过滤它们。我不知道这是不是正确的方法

我想知道是否有某种频率算法可以让我计算出什么词是当前对话的主题

任何关于如何实现这一目标的建议都将不胜感激。谢谢。

有一种叫做。 它只能准确地应用于人类书写的文本,而且必须有一定的长度


通过这种算法运行文本的结果将是一组关键字(占原始文本的5%-7%),这些关键字紧密地描述了文本的主题。

自然语言处理可能非常困难,但您仍然可以通过基础知识获得一些结果。丹尼尔·加布里埃尔使用齐普夫定律的建议是一个好建议

像Manning和Schütze这样的概述书可能会有所帮助——它解释了许多常见的技术,并将为您提供更专业的资源


(他们的网站也很棒,网站上有一个免费的PDF。)

如果聊天主题恰好是“the”这个词,你会觉得有点恶心,不是吗?@cHao。这就是为什么我在寻找一个能够返回实际主题的解决方案。也许事实证明,60%的时间里,这个话题是第八个最常用的词。所以你应该用它,而不是第一个最常用的。我不知道。这就是为什么我要问^^^这可能会导致我的大脑从我的脑袋里掉出来。但这似乎正是我要找的东西。我相信你知道IRC消息是什么样子的。短小的,通常不是很连贯的。也许我可以把最后10条左右的信息组合起来,然后把它们像这样写出来……是的,组合起来更好地分析整个对话的主题。我敢肯定,如果讨论了多个主题,这将是不准确的。我肯定会的。但任何程度的准确都比没有好。在过去,正是我的机器人模糊的准确性让它变得滑稽可笑。谢谢你。你把我带到了正确的轨道上,用组合信息制作样本,并用Zipf定律来解释它。谢谢你的回答,很棒!我已经在我的机器人中实现了类似于齐普夫定律的东西,但我相信这将在未来帮助人们。非常感谢。