Python scikit学习LabelBinarizer-一个热编码与虚拟编码

Python scikit学习LabelBinarizer-一个热编码与虚拟编码,python,scikit-learn,dummy-variable,one-hot-encoding,Python,Scikit Learn,Dummy Variable,One Hot Encoding,scikit learn LabelBinarizer中有一个漂亮的函数,其工作原理如下: from sklearn.preprocessing import LabelBinarizer lb = LabelBinarizer(sparse_output = True) lb.fit_transform(['green', 'yellow', 'blue']) 输出: [[0 1 0] [0 0 1] [1 0 0]] 但我想知道,我是否可以从它或任何 替代功能: [[0 0]

scikit learn LabelBinarizer中有一个漂亮的函数,其工作原理如下:

from sklearn.preprocessing import LabelBinarizer
lb = LabelBinarizer(sparse_output = True)
lb.fit_transform(['green', 'yellow', 'blue'])
输出:

[[0 1 0]
 [0 0 1]
 [1 0 0]]
但我想知道,我是否可以从它或任何 替代功能:

   [[0 0]
     [0 1]
     [1 0]]

我尝试了option
sparse\u output=True
,但它不是我想要的

不可以。您可以使用
pandas.get\u dummies(drop\u first=True)
或自己从LabelBinarizer的输出中删除列。但是,在反变换过程中,您可能会遇到问题。最好是定制tranformerNo。您可以使用
pandas.get\u dummies(drop\u first=True)
或自己从LabelBinarizer的输出中删除列。但是,在反变换过程中,您可能会遇到问题。最好做一个定制的转换器