Machine learning Vowpal Wabbit中逻辑回归所需的参数是什么？_Machine Learning_Bigdata_Logistic Regression_Vowpalwabbit

Machine learning Vowpal Wabbit中逻辑回归所需的参数是什么？

machine-learning

Machine learning Vowpal Wabbit中逻辑回归所需的参数是什么？,machine-learning,bigdata,logistic-regression,vowpalwabbit,Machine Learning,Bigdata,Logistic Regression,Vowpalwabbit,我使用以下参数 vw -d train_output -f data.model --loss_function logistic 这是让Vowpal Wabbit明白我想应用逻辑回归的正确方法吗？是的，看起来不错注意：如果您正在使用逻辑回归进行二元分类问题，则训练样本的标签应为[-1,1]，而不是[0,1]。此外，您可能还需要添加--binary 1 'ham |f please read this mailing list issue ... -1 'spam |f dear frien

我使用以下参数

vw -d train_output -f data.model --loss_function logistic

这是让Vowpal Wabbit明白我想应用逻辑回归的正确方法吗？

是的，看起来不错

注意：如果您正在使用逻辑回归进行二元分类问题，则训练样本的标签应为[-1,1]，而不是[0,1]。此外，您可能还需要添加

--binary

1 'ham |f please read this mailing list issue ...
-1 'spam |f dear friend, buy our mortgage plan ...

然后物流损耗和铰链损耗将正常工作。否则VW将抛出警告（当您忘记参数、使用了不存在的损失函数参数或您的标签不是[-1,1]）

有关回归问题，请参见分位数损失或平方损失

见：

--binary

对学习模型没有影响。无论是否使用

--binary

，结果模型都是完全相同的。因此，它不会提高性能。它只有两个效果：第一，报告0/1损失而不是逻辑损失（0/1损失最多可以是1，而逻辑损失是无限的）。其次，

-p

（预测）的输出根据符号映射到-1和1。您是对的。我用你的更正更新了答案。我误解了以下评论：“如果您想进行分类，我建议使用-1/+1标签并使用--binary来获得0/1损失，而不是默认的平方损失。[…]此外，'-loss_function logistic'（而不是默认的平方损失）可能会为二进制分类提供更好的结果。”建议将其用于二进制分类，这不同于使用它来提高性能。通过sigmoid运行的日志丢失输出将给出相同的预测。抱歉误解，请回复。