Python 如何处理数据集中的匿名变量以获得更好的预测

Python 如何处理数据集中的匿名变量以获得更好的预测,python,machine-learning,data-science,Python,Machine Learning,Data Science,我有一个数据集,其中我有4个匿名变量,如下所示,而且目标变量是匿名的: 有人能告诉我如何处理机器学习中的匿名特征吗?从这个匿名变量进行特征工程的最佳方法是什么?我如何从这个特征改进我的预测 1-缩放数字特征,并对分类特征进行一次热编码(您也可以使用分类变量的出现次数对其进行编码=将每个值替换为其计数) 2-研究你的目标和其他变量之间的相关性 3-使用不同的曲线图更好地了解数据 4-建模时使用变量选择方法

我有一个数据集,其中我有4个匿名变量,如下所示,而且目标变量是匿名的:


有人能告诉我如何处理机器学习中的匿名特征吗?从这个匿名变量进行特征工程的最佳方法是什么?我如何从这个特征改进我的预测

1-缩放数字特征,并对分类特征进行一次热编码(您也可以使用分类变量的出现次数对其进行编码=将每个值替换为其计数)

2-研究你的目标和其他变量之间的相关性

3-使用不同的曲线图更好地了解数据

4-建模时使用变量选择方法