Machine learning 沃帕尔·瓦比总是得到同样的结果_Machine Learning_Vowpalwabbit_Multilabel Classification

Machine learning 沃帕尔·瓦比总是得到同样的结果

machine-learning

Machine learning 沃帕尔·瓦比总是得到同样的结果,machine-learning,vowpalwabbit,multilabel-classification,Machine Learning,Vowpalwabbit,Multilabel Classification,我用大众汽车来预测多个等级。最奇怪的是，无论我使用哪个参数，结果总是一样的如果真是这样，也许是因为我的数据详情：大约90k行数据。一行数据： 1 2334225|SUBDEPT "D1SUB1" "D2SUB1" |DEPT "DEPT1" "DEPT2" |SCANCODE "11223442" "65434533543" |WDAY Friday |AMTBOUGHT 2 这是一个多类问题，因此命令行是： vw --ect 38 ../Processed/train.vw.txt

我用大众汽车来预测多个等级。最奇怪的是，无论我使用哪个参数，结果总是一样的

如果真是这样，也许是因为我的数据

详情：

大约90k行数据。一行数据：

1 2334225|SUBDEPT "D1SUB1" "D2SUB1" |DEPT "DEPT1" "DEPT2" |SCANCODE "11223442" "65434533543" |WDAY Friday |AMTBOUGHT 2

这是一个多类问题，因此命令行是：

vw --ect 38 ../Processed/train.vw.txt --loss_function logistic --link=logistic

更改内容的单个参数是从--ect到--oaa。我已尝试添加以下内容，但没有更改最终验证值：

-c-k——通过20次（直到8次）
--l1或--l2
--电源
--忽略D或——忽略D（或s或su…）

结果总是如此

average loss = 0.911153 h

这里有什么我遗漏的吗？

你能分享你的数据吗？很难说不是这样。然而，作为一般规则，不应在减少的基础上强制执行损失（和/或链接）功能<代码>--ect 38是一个多类（而非二进制分类）问题。因此，假设数据在

[1,38]

范围内有38个不同的标签，只需让

--ect

算法（与其他典型减少一样）选择首选损失函数（或不使用默认值）。如果我不链接任何东西，它会让我损失.34（使用标志--loss_函数）。如果我不使用标志，它只给我预测，我需要概率。尽管如此，删除链接然后更改参数也不会改变损失。你是否随机洗牌了90k行训练数据？@arielf：“不应该在减少的基础上强制执行损失（和/或链接）功能”这通常是不正确的。默认损失为“平方”，这不适用于使用oaa获取概率。@AdrianoalMeda：如果您想要概率，请使用最新的VW版本和

VW--oaa=38--loss\u function=logistic--probabilities

（使用

--概率

，您不需要

--链接

，大众将报告0/1损失和多类物流损失）。使用

--ect

您无法预测概率。