Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/python/338.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Python 使用OneHot编码器将一列拆分为四列_Python_Dataframe_One Hot Encoding - Fatal编程技术网

Python 使用OneHot编码器将一列拆分为四列

Python 使用OneHot编码器将一列拆分为四列,python,dataframe,one-hot-encoding,Python,Dataframe,One Hot Encoding,在Python中,假设有一列数据帧,名为size,如下所示: E G F D F E... 字母D到G代表不同的尺寸,从小到大。我能做的是用数字表示它们,如下所示: 2 4 3 1 3 2... 然而,由于这不是连续的数据,这可能会导致我将进行的其他分析出现问题。所以,我的另一个想法是将其拆分为4列,其中大小的实例为1,否则为0。应该是这样的: D E F G 0 1 0 0 0 0 0 1 0 0 1 0 1 0 0 0 0 0 1 0 0 1 0 0 我听说Python中

在Python中,假设有一列数据帧,名为size,如下所示:

E 
G 
F  
D 
F
E...
字母D到G代表不同的尺寸,从小到大。我能做的是用数字表示它们,如下所示:

2
4
3
1
3
2...
然而,由于这不是连续的数据,这可能会导致我将进行的其他分析出现问题。所以,我的另一个想法是将其拆分为4列,其中大小的实例为1,否则为0。应该是这样的:

D E F G

0 1 0 0
0 0 0 1
0 0 1 0
1 0 0 0
0 0 1 0 
0 1 0 0

我听说Python中有一种叫做OneHotEncoder的东西,它对此类场景非常有用。我将如何有效地使用此功能来解决此问题,或者,我可以用什么其他方法来解决此问题?

您正在寻找功能。示例:
pd.get_dummies(pd.Series(['a','b','b','c'])
。这就成功了。谢谢@DavidGasquez!