Machine learning Vowpal Wabbit中逻辑回归所需的参数是什么?

Machine learning Vowpal Wabbit中逻辑回归所需的参数是什么?,machine-learning,bigdata,logistic-regression,vowpalwabbit,Machine Learning,Bigdata,Logistic Regression,Vowpalwabbit,我使用以下参数 vw -d train_output -f data.model --loss_function logistic 这是让Vowpal Wabbit明白我想应用逻辑回归的正确方法吗?是的,看起来不错 注意:如果您正在使用逻辑回归进行二元分类问题,则训练样本的标签应为[-1,1],而不是[0,1]。此外,您可能还需要添加--binary 1 'ham |f please read this mailing list issue ... -1 'spam |f dear frien

我使用以下参数

vw -d train_output -f data.model --loss_function logistic
这是让Vowpal Wabbit明白我想应用逻辑回归的正确方法吗?

是的,看起来不错

注意:如果您正在使用逻辑回归进行二元分类问题,则训练样本的标签应为[-1,1],而不是[0,1]。此外,您可能还需要添加
--binary

1 'ham |f please read this mailing list issue ...
-1 'spam |f dear friend, buy our mortgage plan ...
然后物流损耗和铰链损耗将正常工作。否则VW将抛出警告(当您忘记参数、使用了不存在的损失函数参数或您的标签不是[-1,1])

有关回归问题,请参见分位数损失或平方损失

见:


--binary
对学习模型没有影响。无论是否使用
--binary
,结果模型都是完全相同的。因此,它不会提高性能。它只有两个效果:第一,报告0/1损失而不是逻辑损失(0/1损失最多可以是1,而逻辑损失是无限的)。其次,
-p
(预测)的输出根据符号映射到-1和1。您是对的。我用你的更正更新了答案。我误解了以下评论:“如果您想进行分类,我建议使用-1/+1标签并使用--binary来获得0/1损失,而不是默认的平方损失。[…]此外,'-loss_function logistic'(而不是默认的平方损失)可能会为二进制分类提供更好的结果。”建议将其用于二进制分类,这不同于使用它来提高性能。通过sigmoid运行的日志丢失输出将给出相同的预测。抱歉误解,请回复。