Machine learning 问:机器学习模型能解决基于规则的问题吗?

Machine learning 问:机器学习模型能解决基于规则的问题吗?,machine-learning,nltk,word2vec,Machine Learning,Nltk,Word2vec,机器学习可以用来验证语句或捕获文本文档中的错误吗 例如,如果你教一个分类器“你应该每天吃两次苹果”,但在你正在测试的文档中,语句是“你应该每天吃三次苹果”,那么该语句可以被标记吗 显然,您可以构建一些基于规则的软件来捕捉这些,但我的问题集中在训练一个ML模型来捕捉这些,因为规则会发生变化 我查看了word2vec和NLTK,并对它们进行了一些测试,但无法连接点来教授分类器 如果可能的话,我们将如何去做或提供一些方向 谢谢,道格(时间太长,无法发表评论。) 是的,它可以。然而,它异常复杂。例如,沃

机器学习可以用来验证语句或捕获文本文档中的错误吗

例如,如果你教一个分类器“你应该每天吃两次苹果”,但在你正在测试的文档中,语句是“你应该每天吃三次苹果”,那么该语句可以被标记吗

显然,您可以构建一些基于规则的软件来捕捉这些,但我的问题集中在训练一个ML模型来捕捉这些,因为规则会发生变化

我查看了word2vec和NLTK,并对它们进行了一些测试,但无法连接点来教授分类器

如果可能的话,我们将如何去做或提供一些方向

谢谢,道格(时间太长,无法发表评论。)

是的,它可以。然而,它异常复杂。例如,沃森就进行了这种推理和分析。IBM称之为认知计算。正如您所写的,基于规则(或逻辑推理)的系统可以解决此类任务。因此,您应该问自己的问题是如何从文本中提取所需的事实。=>NLP,词性,命名实体,。。。然而,这项任务极其艰巨,因为每天“不超过100次”与这句话并不矛盾。因此,推理需要丰富的背景知识

如前所述,这是一个非常广泛的话题。你必须画出解决方案的草图,然后选择一小块,这被称为博士论文;)。 这张漂亮的图片说明了这一点

因此,找到了博士论文的正确关键词。这本书可能会让你有几个晚上的阅读时间


如果你想尝试使用NLTK,我会为你想要分析的句子生成解析树。之后,您可以尝试对齐这些,并检查重叠和偏差。然而,我不知道如何得出结论。一个稍微简单的版本是逐字匹配。关于Levenstein距离计算的一些内容。

重新写下我的问题,因为我在发帖15分钟后收到了两张反对票。希望它现在对其他人更有用。Word2Vec听起来不是一个好方法,它擅长于找到相似的单词并建立单词之间的关系。这里您需要一个分类器,其中您将提供带有标签1的“…吃苹果两次…”和带有标签0的“吃苹果X…”(其中X是随机数)。然后你可以教一个分类器这个句子是好的。如果你想让它通用。。。如果你能做到,你将是一个非常富有的人。是的,你能做到。然而,它却异常复杂。例如,沃森就进行了这种推理和分析。IBM称之为认知计算。正如您所写的,基于规则(或逻辑推理)的系统可以解决此类任务。因此,您应该问自己的问题是如何从文本中提取所需的事实。=>NLP,词性,命名实体,。。。然而,这项任务极其艰巨,因为每天“不超过100次”与这句话并不矛盾。因此,推理需要丰富的背景知识。感谢你们的回应,并提供了一些关于可能性的见解。我同意@CAFEBABE的观点,认为这是可能的,但这是极具挑战性的。CAFE BABE,您是否有推荐的方法或任何特别要查看的东西(可能调查NLTK中的命名实体),您会推荐吗?谢谢@CAFEBABE。这为我的研究提供了坚实的方向。