Machine learning 如何解释Weka中的逻辑回归结果
大家好,我是这个领域的新手,我想知道是否有人能帮助我理解逻辑回归的结果。 我需要了解自变量是否可以用来做一个好的分类。Machine learning 如何解释Weka中的逻辑回归结果,machine-learning,classification,weka,logistic-regression,Machine Learning,Classification,Weka,Logistic Regression,大家好,我是这个领域的新手,我想知道是否有人能帮助我理解逻辑回归的结果。 我需要了解自变量是否可以用来做一个好的分类。 ==运行信息=== 方案:weka.classifiers.functions.Logistic-r1.0E-8-M-1-num小数点后4位 关系:火车 实例:14185 属性:5 属性1 属性2 属性3 属性4 相依变量 测试模式:根据培训数据进行评估 ==分类器模型(完整训练集)=== 岭参数为1.0E-8的Logistic回归 系数。。。 等级 变量0 =======
==运行信息===
方案:weka.classifiers.functions.Logistic-r1.0E-8-M-1-num小数点后4位
关系:火车
实例:14185
属性:5
属性1
属性2
属性3
属性4
相依变量
测试模式:根据培训数据进行评估
==分类器模型(完整训练集)===
岭参数为1.0E-8的Logistic回归
系数。。。
等级
变量0
====================
属性1 0.0022
属性2 0.0022
ATTR_3 0.0034
属性4-0.0021
截距0.9156
优势比。。。
等级
变量0
====================
属性1 1.0022
属性2 1.0022
属性3 1.0034
ATTR_4 0.9979
构建模型所需时间:0.13秒
==对训练集的评估===
根据训练数据测试模型所用时间:0.07秒
==摘要===
正确分类的实例51240 72.2453%
分类错误的实例19685 27.7547%
卡帕统计-0.0001
平均绝对误差0.3992
均方根误差0.4467
相对绝对误差99.5581%
相对平方根误差99.7727%
实例总数70925
==按类别划分的详细精度===
TP比率FP比率精确召回F测量MCC ROC区域PRC区域等级
1,000 1,000 0,723 1,000 0,839 -0,005 0,545 0,759 0
0,000 0,000 0,000 0,000 0,000 -0,005 0,545 0,305 1
加权平均值0722 0723 0522 0722 0606-0005 0545 0633
==混淆矩阵===
我头上的一句话:
优势比和系数值彼此成比例,可以相互计算
对于属性1,exp(0.0022)=1.002
为了进行更多的计算和拟合/预测,系数“更好”。然而,系数是必须插入exp(x)
函数中的值,并且有点难以“在您的头脑中可视化”
对于人类的理解,优势比有时更方便——更容易解释/可视化,但你不能直接用它们进行某些计算
Weka不知道您更感兴趣的是什么,所以为了方便起见,它为您提供了两种服务
顺便说一下,weka做了正则化逻辑回归
(Logistic回归,岭参数为1.0E-8
),因此系数可能与其他软件包可能给出的系数略有不同 这不是一个真正的编程问题。要了解更多关于Weka中逻辑回归的知识,您可以尝试观看,如果您是数据挖掘新手,我推荐完整的课程。输出中的混淆矩阵表明,该分类器对数据的处理效果不佳,因为它预测几乎每个实例都属于类a
,而其中19680个实例应该是b
。