Machine learning 沃帕尔·瓦比总是得到同样的结果

Machine learning 沃帕尔·瓦比总是得到同样的结果,machine-learning,vowpalwabbit,multilabel-classification,Machine Learning,Vowpalwabbit,Multilabel Classification,我用大众汽车来预测多个等级。最奇怪的是,无论我使用哪个参数,结果总是一样的 如果真是这样,也许是因为我的数据 详情: 大约90k行数据。一行数据: 1 2334225|SUBDEPT "D1SUB1" "D2SUB1" |DEPT "DEPT1" "DEPT2" |SCANCODE "11223442" "65434533543" |WDAY Friday |AMTBOUGHT 2 这是一个多类问题,因此命令行是: vw --ect 38 ../Processed/train.vw.txt

我用大众汽车来预测多个等级。最奇怪的是,无论我使用哪个参数,结果总是一样的

如果真是这样,也许是因为我的数据

详情:

大约90k行数据。一行数据:

1 2334225|SUBDEPT "D1SUB1" "D2SUB1" |DEPT "DEPT1" "DEPT2" |SCANCODE "11223442" "65434533543" |WDAY Friday |AMTBOUGHT 2 
这是一个多类问题,因此命令行是:

vw --ect 38 ../Processed/train.vw.txt --loss_function logistic --link=logistic
更改内容的单个参数是从--ect到--oaa。我已尝试添加以下内容,但没有更改最终验证值:

  • -c-k——通过20次(直到8次)
  • --l1或--l2
  • --电源
  • --忽略D或——忽略D(或s或su…)
结果总是如此

average loss = 0.911153 h

这里有什么我遗漏的吗?

你能分享你的数据吗?很难说不是这样。然而,作为一般规则,不应在减少的基础上强制执行损失(和/或链接)功能<代码>--ect 38是一个多类(而非二进制分类)问题。因此,假设数据在
[1,38]
范围内有38个不同的标签,只需让
--ect
算法(与其他典型减少一样)选择首选损失函数(或不使用默认值)。如果我不链接任何东西,它会让我损失.34(使用标志--loss_函数)。如果我不使用标志,它只给我预测,我需要概率。尽管如此,删除链接然后更改参数也不会改变损失。你是否随机洗牌了90k行训练数据?@arielf:“不应该在减少的基础上强制执行损失(和/或链接)功能”这通常是不正确的。默认损失为“平方”,这不适用于使用oaa获取概率。@AdrianoalMeda:如果您想要概率,请使用最新的VW版本和
VW--oaa=38--loss\u function=logistic--probabilities
(使用
--概率
,您不需要
--链接
,大众将报告0/1损失和多类物流损失)。使用
--ect
您无法预测概率。