Machine learning 还是基于规则_Machine Learning_Nlp

Machine learning 还是基于规则

machine-learning nlp

Machine learning 还是基于规则,machine-learning,nlp,Machine Learning,Nlp,我的sklearn文本分类器的准确度已经达到85。制定基于规则的系统的优点和缺点是什么？做双倍的工作能省钱吗？也许你能为我提供双方的来源和证据，这样我就可以根据自己的情况做出决定。同样，我想知道什么时候基于规则的方法是有利的，什么时候基于ML的方法是有利的？谢谢这里有一个想法：您可以设置一个混合模型，而不是采用这种或那种方式。看看你的机器学习分类器所犯的典型错误，看看你是否能想出一套捕获这些错误的规则。然后在您的输入上运行这些规则，如果它们适用，则在那里完成；如果没有，则将输入传递给分类器

我的sklearn文本分类器的准确度已经达到85。制定基于规则的系统的优点和缺点是什么？做双倍的工作能省钱吗？也许你能为我提供双方的来源和证据，这样我就可以根据自己的情况做出决定。同样，我想知道什么时候基于规则的方法是有利的，什么时候基于ML的方法是有利的？谢谢

这里有一个想法：

您可以设置一个混合模型，而不是采用这种或那种方式。看看你的机器学习分类器所犯的典型错误，看看你是否能想出一套捕获这些错误的规则。然后在您的输入上运行这些规则，如果它们适用，则在那里完成；如果没有，则将输入传递给分类器

在过去，我是用概率词性标签来做这件事的。调整概率模型很困难，但添加一些预处理或后处理规则以捕获一些一致性错误很容易

Yoel Krupnik首席技术官兼联合创始人| smrt-会计AI写道：

我认为这取决于具体的问题。有些问题可以用基于规则的逻辑完全解决，有些问题需要机器学习经常在前后结合使用基于规则的逻辑。基于规则的方法的优点是，它不需要标记的训练数据，可以快速提供作为基准的良好结果，并帮助您更好地理解ML算法所需的未来标记/文本操作的问题

请阅读标签的描述。@molbdnilo什么，我是不是搞错了标签？哦，对不起。谢谢你写下你的评论。很高兴像你这样有经验的人花时间帮助像我这样的创业者。让我们看看我是否明白你的意思，然后在你的输入上运行这些规则，如果它们适用，在那里完成；如果没有，则将输入传递给分类器。你的意思是首先在输入上运行规则，然后只有在……什么？@yishairasowsky规则不适用的情况下才继续机器学习。对于我的POS-Tagger，我匹配了一些通常是错误的单词组合pre或tag-sequencepost。如果你使用模式来触发规则，那么如果没有规则触发，你可以使用你的分类器。我认为解释为什么一个答案被否决是一种很好的做法，而不仅仅是在不知道人们认为它有什么错的情况下这样做。我同意只有在你举例说明为什么的情况下才进行否决。但我看不出有人对你的答案投了反对票…@yishairasowsky它有一张赞成票和一张反对票。。。