Scikit learn 一个热编码2分类变量
对于具有两个类别的变量,它们是否需要一个热编码?在我的数据集中,有一个二进制变量为1或0。我需要在模型的管道中转换该变量,还是保持原样Scikit learn 一个热编码2分类变量,scikit-learn,one-hot-encoding,Scikit Learn,One Hot Encoding,对于具有两个类别的变量,它们是否需要一个热编码?在我的数据集中,有一个二进制变量为1或0。我需要在模型的管道中转换该变量,还是保持原样 variable = np.array([0,0,0,1,0,1,0]).reshape(-1,1) ohc = OneHotEncoder() ohc.fit(variable) 如果您的变量已经是二进制的(只有两个类:0和1),您可以说这个变量已经是一个热编码的,所以您不需要再次使用Sklearn函数onehotcoder 此外,一般来说,如果二进制变量是
variable = np.array([0,0,0,1,0,1,0]).reshape(-1,1)
ohc = OneHotEncoder()
ohc.fit(variable)
如果您的变量已经是二进制的(只有两个类:0和1),您可以说这个变量已经是一个热编码的,所以您不需要再次使用Sklearn函数
onehotcoder
此外,一般来说,如果二进制变量是分类变量,则必须使用LabelEncoder
将其转换为数字变量。无论如何,在你的例子中,你的变量已经是数字了