Machine learning 还是基于规则

Machine learning 还是基于规则,machine-learning,nlp,Machine Learning,Nlp,我的sklearn文本分类器的准确度已经达到85。制定基于规则的系统的优点和缺点是什么?做双倍的工作能省钱吗?也许你能为我提供双方的来源和证据,这样我就可以根据自己的情况做出决定。同样,我想知道什么时候基于规则的方法是有利的,什么时候基于ML的方法是有利的?谢谢 这里有一个想法: 您可以设置一个混合模型,而不是采用这种或那种方式。看看你的机器学习分类器所犯的典型错误,看看你是否能想出一套捕获这些错误的规则。然后在您的输入上运行这些规则,如果它们适用,则在那里完成;如果没有,则将输入传递给分类器

我的sklearn文本分类器的准确度已经达到85。制定基于规则的系统的优点和缺点是什么?做双倍的工作能省钱吗?也许你能为我提供双方的来源和证据,这样我就可以根据自己的情况做出决定。同样,我想知道什么时候基于规则的方法是有利的,什么时候基于ML的方法是有利的?谢谢

这里有一个想法:

您可以设置一个混合模型,而不是采用这种或那种方式。看看你的机器学习分类器所犯的典型错误,看看你是否能想出一套捕获这些错误的规则。然后在您的输入上运行这些规则,如果它们适用,则在那里完成;如果没有,则将输入传递给分类器

在过去,我是用概率词性标签来做这件事的。调整概率模型很困难,但添加一些预处理或后处理规则以捕获一些一致性错误很容易

Yoel Krupnik首席技术官兼联合创始人| smrt-会计AI写道:

我认为这取决于具体的问题。有些问题可以用基于规则的逻辑完全解决,有些问题需要机器学习经常在前后结合使用基于规则的逻辑。 基于规则的方法的优点是,它不需要标记的训练数据,可以快速提供作为基准的良好结果,并帮助您更好地理解ML算法所需的未来标记/文本操作的问题


请阅读标签的描述。@molbdnilo什么,我是不是搞错了标签?哦,对不起。谢谢你写下你的评论。很高兴像你这样有经验的人花时间帮助像我这样的创业者。让我们看看我是否明白你的意思,然后在你的输入上运行这些规则,如果它们适用,在那里完成;如果没有,则将输入传递给分类器。你的意思是首先在输入上运行规则,然后只有在……什么?@yishairasowsky规则不适用的情况下才继续机器学习。对于我的POS-Tagger,我匹配了一些通常是错误的单词组合pre或tag-sequencepost。如果你使用模式来触发规则,那么如果没有规则触发,你可以使用你的分类器。我认为解释为什么一个答案被否决是一种很好的做法,而不仅仅是在不知道人们认为它有什么错的情况下这样做。我同意只有在你举例说明为什么的情况下才进行否决。但我看不出有人对你的答案投了反对票…@yishairasowsky它有一张赞成票和一张反对票。。。