R-朴素贝叶斯在二值化后给出不同的结果

R-朴素贝叶斯在二值化后给出不同的结果,r,machine-learning,naivebayes,R,Machine Learning,Naivebayes,我的数据是垃圾邮件。我有4601行包含字符串的频率,最后一列类型有两个可能的值:spam或nonspam 我制作了类型列的二进制版本: 给我 p2 p1 nonspam spam 0 1655 57 1 3 2886 为什么不同?我怎样才能修好它?我是一个初学者,但在网上没有找到任何答案 谢谢 您是否碰巧使用了type列来预测m1中的g?如果在公式中使用,则包含所有数据列。Uuups是我的错,有点遗漏,但它现在可以工作了。谢谢 library(e1071)

我的数据是垃圾邮件。我有4601行包含字符串的频率,最后一列类型有两个可能的值:spam或nonspam

我制作了类型列的二进制版本:

给我

   p2
p1  nonspam spam
  0    1655   57
  1       3 2886
为什么不同?我怎样才能修好它?我是一个初学者,但在网上没有找到任何答案


谢谢

您是否碰巧使用了
type
列来预测
m1
中的
g
?如果在公式中使用
,则包含所有数据列。Uuups是我的错,有点遗漏,但它现在可以工作了。谢谢
library(e1071) 
m1 <- naiveBayes(g ~ ., data = spam)
p1 <- predict(m1, spam)

m2 <- naiveBayes(type ~ ., data = spam)
p2 <- predict(m2, spam)
table(p1,p2)
   p2
p1  nonspam spam
  0    1655   57
  1       3 2886