Python 逻辑回归是创建评分模型的更好方法吗?
我有一个用户详细信息的数据集,我想在其中为每个用户生成一个分数 所需的输出范围看起来像是低、中、高。我正在进行逻辑回归 这是处理这类问题的正确方法吗Python 逻辑回归是创建评分模型的更好方法吗?,python,dataset,regression,linear-regression,logistic-regression,Python,Dataset,Regression,Linear Regression,Logistic Regression,我有一个用户详细信息的数据集,我想在其中为每个用户生成一个分数 所需的输出范围看起来像是低、中、高。我正在进行逻辑回归 这是处理这类问题的正确方法吗 有什么建议吗?回答你的问题:这是一个不错的模式,在大多数情况下是建议的 更重要的问题是,在我看来,您应该在这里询问的是您拥有什么类型的用户数据,以及它在选择的模型中表现如何: - data has a large number of features: you probably want to run a PCA, XGBOOST or ano
有什么建议吗?回答你的问题:这是一个不错的模式,在大多数情况下是建议的 更重要的问题是,在我看来,您应该在这里询问的是您拥有什么类型的用户数据,以及它在选择的模型中表现如何:
- data has a large number of features: you probably want to run a PCA, XGBOOST or another feature importance evaluation to separate useful features from noise features
- you have a large amount of text data, i.e. logs: you might want to attach a naive Bayes, tf/idf or another model that performs well with text-based data
- does your data tend to overfit when using model X? Maybe you want to do data engineering or try a different model
我给您的建议是,首先构建LR模型,看看它在您的训练/测试/预测数据集上表现如何,评估性能是否符合您的需要,然后再思考/讨论不同的模型/方法 当然,我将使用LR模型,在分析输出后,将返回给您。谢谢