R 为什么每个模型算法(最大熵、森林、支持向量机等)的结果在表中产生完全相同的输出?

R 为什么每个模型算法(最大熵、森林、支持向量机等)的结果在表中产生完全相同的输出?,r,machine-learning,R,Machine Learning,在下面的R代码中,我介绍了基于一系列算法(如最大熵、SVM等)的训练数据来创建模型 我对算法结果表有一个问题,因为每个结果都显示完全相同的输出 请您帮助我具体理解为什么每个算法的结果表产生完全相同的输出的原因 这是为每个表生成的相同结果: 1 2 3 1 125 18 0 2 31 70 2 3 25 17 12 1 = Negative, 2 = Neutral, 3 = Positive, 为什么上面每个算法的表产生相同的结果 在上面的代码中,

在下面的R代码中,我介绍了基于一系列算法(如最大熵、SVM等)的训练数据来创建模型

我对算法结果表有一个问题,因为每个结果都显示完全相同的输出

请您帮助我具体理解为什么每个算法的结果表产生完全相同的输出的原因

这是为每个表生成的相同结果:

     1   2   3
 1 125  18   0
 2  31  70   2
 3  25  17  12

1 = Negative,
2 = Neutral,
3 = Positive,
为什么上面每个算法的表产生相同的结果

在上面的代码中,我确定了词典的性能 根据我的手工分类

您可以通过比较数据集ML的两列来实现这一点,因为它们似乎并不相关。使用混淆矩阵,例如:

library(caret)
text= read.csv("matrixdata.csv", header = FALSE)    
confusionMatrix(text$V1, text$V2)
您可以使用ML自动执行手动分类。从这个意义上说,您的数据集应该有一个额外的列,我们称之为“句子”,包含要分类的文本和句子

mat= create_matrix(text$sentence)
container = create_container(mat, as.numeric(as.factor(text[,1])),
                             trainSize=1:1200, testSize=1201:1500,virgin=FALSE)
如果希望ML模型从中学习,也可以将词典分类作为标签传递给容器


这是一个您可以查看以进行分类的示例。

您的分类任务的问题陈述是什么?您共享的数据似乎只是由三个唯一值组成的单元格,看起来像是标签和缺少的特征向量。@提供的数据集中的Reveille是我的手动分类金标准,与从数字转换为正数的词典相比,每个句子都是否定的或中性的,因此请与我的手动分类情感类别进行比较。我正在根据算法建立模型。最好知道为什么这些表为每个算法生成完全相同的答案。我对这个过程有点陌生,所以如果能提供更多帮助我理解的细节,我将不胜感激。因此,您共享的csv文件实际上不是数据集,而是实际与预测的标签,对吗?要将其设置为数据集,还应包括特征向量。我首先提出的一个假设是,这是一个简单的问题,因此所有模型都具有完美的性能。但是,根据你现在所说的,情况已经不是这样了。我建议您尝试单独培训和评估两个模型,也就是说,不使用容器实现。@Reveille数据集:第一列是我手动分类的句子。第二列是一本词典,我根据每个句子的情绪对其评分进行了标准化,但为了与手动分类进行比较,我编写了一个公式,将评分分为否定、中性或肯定。在上面的代码中,我确定了词典在手动分类中的表现。根据我的理解,这些算法不应该在表格中产生完全相同的结果,它们应该是不同的。@Reveille我接受了你关于单独培训和评估的建议,但它产生了完全相同的输出。希望以上所说的有意义。还有其他建议吗?我对这个领域还不熟悉,谢谢你花时间提出这些建议,非常感谢。我将继续实施这一计划。
mat= create_matrix(text$sentence)
container = create_container(mat, as.numeric(as.factor(text[,1])),
                             trainSize=1:1200, testSize=1201:1500,virgin=FALSE)