Machine learning 如何在分类中选择正确的类编码方法

Machine learning 如何在分类中选择正确的类编码方法,machine-learning,scikit-learn,neural-network,classification,Machine Learning,Scikit Learn,Neural Network,Classification,我想使用活动数据集使用scikit learn执行分类,其中类标签可能是以下情况之一: [‘Walk’, ‘Stand’, ‘Run’, ‘Jump’, ‘null’] 我不确定哪种标签编码方法在这里是最好的:或者。我认为LabelEncoder就足够了,因为它将使用从1到n的单个整数值来表示每种情况,但我想知道我的决定是否合理 谢谢LabelEncoder将适用于您的用例,使用0到4的整数作为类ID: In [15]: from sklearn.preprocessing import La

我想使用活动数据集使用scikit learn执行分类,其中类标签可能是以下情况之一:

[‘Walk’, ‘Stand’, ‘Run’, ‘Jump’, ‘null’]
我不确定哪种标签编码方法在这里是最好的:或者。我认为
LabelEncoder
就足够了,因为它将使用从
1
n
的单个整数值来表示每种情况,但我想知道我的决定是否合理


谢谢

LabelEncoder
将适用于您的用例,使用0到4的整数作为类ID:

In [15]: from sklearn.preprocessing import LabelEncoder

In [16]: le = LabelEncoder()


In [17]: le.fit(['Walk', 'Stand', 'Run', 'Jump', 'null'])
Out[17]: LabelEncoder()


In [18]: le.classes_
Out[18]: 
array(['Jump', 'Run', 'Stand', 'Walk', 'null'],
      dtype='<U5')

In [19]: le.transform(['null', 'Run', 'Jump'])
Out[19]: array([4, 1, 0])

In [20]: le.inverse_transform([4, 1, 0])
Out[20]: 
array(['null', 'Run', 'Jump'],
      dtype='<U5')
[15]中的
:来自sklearn.preprocessing导入标签编码器
在[16]中:le=LabelEncoder()
在[17]中:lefit(['Walk','Stand','Run','Jump','null'])
Out[17]:LabelEncoder()
在[18]中:le_
出[18]:
数组(['Jump','Run','Stand','Walk','null'],

dtype='您可以直接将字符串目标发送到MLPClassizer,它会像@ely使用的那样,在内部自动使用LabelEncoder将其转换为数字。但是您不需要显式地执行任何操作。