Artificial intelligence 为什么朴素贝叶斯需要平衡的训练数据？_Artificial Intelligence_Text Processing_Sentiment Analysis_Naivebayes

Artificial intelligence 为什么朴素贝叶斯需要平衡的训练数据？

artificial-intelligence

Artificial intelligence 为什么朴素贝叶斯需要平衡的训练数据？,artificial-intelligence,text-processing,sentiment-analysis,naivebayes,Artificial Intelligence,Text Processing,Sentiment Analysis,Naivebayes,我使用朴素贝叶斯算法创建了一个单词情感应用程序该分类训练数据中有两类标准，即正训练数据和负训练数据。我对已分组的每个训练数据都使用一个独特的词。因此，我有每个数据标准的所有唯一单词。然后，计算每个唯一单词出现的概率值问题是当我使用不均匀的训练数据时。例如：我使用60%的负面训练数据和40%的正面训练数据。那么测试数据的结果将更有可能是负面的结果，反之亦然除此之外，我还必须使用平衡数据，我应该如何解决这个问题？还有我应该添加的其他方法吗？朴素贝叶斯需要平衡的训练数据，因为每个参数的可能性都受

我使用朴素贝叶斯算法创建了一个单词情感应用程序

该分类训练数据中有两类标准，即正训练数据和负训练数据。我对已分组的每个训练数据都使用一个独特的词。因此，我有每个数据标准的所有唯一单词。然后，计算每个唯一单词出现的概率值

问题是当我使用不均匀的训练数据时。例如：我使用60%的负面训练数据和40%的正面训练数据。那么测试数据的结果将更有可能是负面的结果，反之亦然

除此之外，我还必须使用平衡数据，我应该如何解决这个问题？还有我应该添加的其他方法吗？

朴素贝叶斯需要平衡的训练数据，因为每个参数的可能性都受到先验值（优先级值）的影响

此先验值取自每个数据的类。也许我解释这类事情时你已经明白了