Parsing 如何检测消息是否显示“谢谢”?

Parsing 如何检测消息是否显示“谢谢”?,parsing,nlp,Parsing,Nlp,我有各种各样的信息,我想知道这些信息的实质是否是说“谢谢”。这忽略了说“谢谢”的信息,并包括一个问题 由于您使用了“本质”一词,这是一个极难彻底回答的问题 让我们在这里退一步:在一个叫做情绪分析的相关问题上已经做了很多工作。在某些方面,这是这个问题的一个有趣的子集,因为它的定义要好得多 反对者:定义得更好!?为什么,情绪分析的定义非常明确。这是一张从文本到某种复习分数的地图。这是一种软弱无力的 反对者的批评的问题在于,这里给出的情感概念实际上没有很好的定义。星级的含义是什么?这和语言有什么关系?

我有各种各样的信息,我想知道这些信息的实质是否是说“谢谢”。这忽略了说“谢谢”的信息,并包括一个问题

由于您使用了“本质”一词,这是一个极难彻底回答的问题

让我们在这里退一步:在一个叫做情绪分析的相关问题上已经做了很多工作。在某些方面,这是这个问题的一个有趣的子集,因为它的定义要好得多

反对者:定义得更好!?为什么,情绪分析的定义非常明确。这是一张从文本到某种复习分数的地图。这是一种软弱无力的

反对者的批评的问题在于,这里给出的情感概念实际上没有很好的定义。星级的含义是什么?这和语言有什么关系?目前还不十分清楚,现有的方法在某些方面都难以做到这一点

事实上,表达感谢比表达感情要清楚得多。我们可以把感谢看作是一种特殊的情感,事实上,一种非常具体的情感,我怀疑,人类的注释者可以可靠地加以标记。如果人类能够可靠地标记一个现象,那就是计算和语料库语言学家认为某事是真实的足够标准。 这里有两种方法。一个会更快;其中一个更能说明问题

首先,想想你能想出的所有与感恩有关的字串,然后搜索它们。换句话说,这是@OMGtechy的尖刻评论的扩展版本。很明显,我很感谢你,也很感谢,我真的很感激,你的好意,太好了,我很感激。您可能很快就能获得相当好的数据覆盖率

第二种方法有点困难,但它的优点是挑战你的直觉。获取消息列表,并标记它们是否感谢。在每条信息中,标出表示对方感激的部分。您可以从这部分中获取结果,并使用它们来支持第一部分


我怀着感激之情怀疑,这种模式是相当有规律的。在表达感激之情时,我们通常会进入一个特定的语言使用语域,根据我第一部分的直觉,我们使用的词汇非常有限。没有花哨的NLP需要的只是详尽的模式匹配。如果是这样的话,这里有一些有趣的语言学在起作用

搜索子字符串谢谢??你所需要的只是一个小型研究团队和几年的紧张研究。你可以使用一个手动标记的数据集对其进行训练:-这是一个非常重要的问题,你不能简单地调用内置函数来解决。如果您所需要的只是字符串“谢谢”的存在,那么按照@OMGtechy的建议进行搜索。如果您不需要包含“谢谢”的表达式上的带标签的训练数据,那么您可以训练分类器,然后对新实例进行分类