R-朴素贝叶斯在二值化后给出不同的结果
我的数据是垃圾邮件。我有4601行包含字符串的频率,最后一列类型有两个可能的值:spam或nonspam 我制作了类型列的二进制版本: 给我R-朴素贝叶斯在二值化后给出不同的结果,r,machine-learning,naivebayes,R,Machine Learning,Naivebayes,我的数据是垃圾邮件。我有4601行包含字符串的频率,最后一列类型有两个可能的值:spam或nonspam 我制作了类型列的二进制版本: 给我 p2 p1 nonspam spam 0 1655 57 1 3 2886 为什么不同?我怎样才能修好它?我是一个初学者,但在网上没有找到任何答案 谢谢 您是否碰巧使用了type列来预测m1中的g?如果在公式中使用,则包含所有数据列。Uuups是我的错,有点遗漏,但它现在可以工作了。谢谢 library(e1071)
p2
p1 nonspam spam
0 1655 57
1 3 2886
为什么不同?我怎样才能修好它?我是一个初学者,但在网上没有找到任何答案
谢谢 您是否碰巧使用了
type
列来预测m1
中的g
?如果在公式中使用
,则包含所有数据列。Uuups是我的错,有点遗漏,但它现在可以工作了。谢谢
library(e1071)
m1 <- naiveBayes(g ~ ., data = spam)
p1 <- predict(m1, spam)
m2 <- naiveBayes(type ~ ., data = spam)
p2 <- predict(m2, spam)
table(p1,p2)
p2
p1 nonspam spam
0 1655 57
1 3 2886