Artificial intelligence 为什么朴素贝叶斯需要平衡的训练数据?

Artificial intelligence 为什么朴素贝叶斯需要平衡的训练数据?,artificial-intelligence,text-processing,sentiment-analysis,naivebayes,Artificial Intelligence,Text Processing,Sentiment Analysis,Naivebayes,我使用朴素贝叶斯算法创建了一个单词情感应用程序 该分类训练数据中有两类标准,即正训练数据和负训练数据。我对已分组的每个训练数据都使用一个独特的词。因此,我有每个数据标准的所有唯一单词。然后,计算每个唯一单词出现的概率值 问题是当我使用不均匀的训练数据时。例如:我使用60%的负面训练数据和40%的正面训练数据。那么测试数据的结果将更有可能是负面的结果,反之亦然 除此之外,我还必须使用平衡数据,我应该如何解决这个问题?还有我应该添加的其他方法吗?朴素贝叶斯需要平衡的训练数据,因为每个参数的可能性都受

我使用朴素贝叶斯算法创建了一个单词情感应用程序

该分类训练数据中有两类标准,即正训练数据和负训练数据。我对已分组的每个训练数据都使用一个独特的词。因此,我有每个数据标准的所有唯一单词。然后,计算每个唯一单词出现的概率值

问题是当我使用不均匀的训练数据时。例如:我使用60%的负面训练数据和40%的正面训练数据。那么测试数据的结果将更有可能是负面的结果,反之亦然


除此之外,我还必须使用平衡数据,我应该如何解决这个问题?还有我应该添加的其他方法吗?

朴素贝叶斯需要平衡的训练数据,因为每个参数的可能性都受到先验值(优先级值)的影响

此先验值取自每个数据的类。 也许我解释这类事情时你已经明白了