Python 如何处理数据集中的匿名变量以获得更好的预测_Python_Machine Learning_Data Science

Python 如何处理数据集中的匿名变量以获得更好的预测

python machine-learning

Python 如何处理数据集中的匿名变量以获得更好的预测,python,machine-learning,data-science,Python,Machine Learning,Data Science,我有一个数据集，其中我有4个匿名变量，如下所示，而且目标变量是匿名的：有人能告诉我如何处理机器学习中的匿名特征吗？从这个匿名变量进行特征工程的最佳方法是什么？我如何从这个特征改进我的预测 1-缩放数字特征，并对分类特征进行一次热编码（您也可以使用分类变量的出现次数对其进行编码=将每个值替换为其计数） 2-研究你的目标和其他变量之间的相关性 3-使用不同的曲线图更好地了解数据 4-建模时使用变量选择方法

我有一个数据集，其中我有4个匿名变量，如下所示，而且目标变量是匿名的：

有人能告诉我如何处理机器学习中的匿名特征吗？从这个匿名变量进行特征工程的最佳方法是什么？我如何从这个特征改进我的预测

1-缩放数字特征，并对分类特征进行一次热编码（您也可以使用分类变量的出现次数对其进行编码=将每个值替换为其计数）

2-研究你的目标和其他变量之间的相关性

3-使用不同的曲线图更好地了解数据

4-建模时使用变量选择方法