Machine learning 如何在分类中选择正确的类编码方法_Machine Learning_Scikit Learn_Neural Network_Classification

Machine learning 如何在分类中选择正确的类编码方法

machine-learning scikit-learn neural-network

Machine learning 如何在分类中选择正确的类编码方法,machine-learning,scikit-learn,neural-network,classification,Machine Learning,Scikit Learn,Neural Network,Classification,我想使用活动数据集使用scikit learn执行分类，其中类标签可能是以下情况之一： [‘Walk’, ‘Stand’, ‘Run’, ‘Jump’, ‘null’] 我不确定哪种标签编码方法在这里是最好的：或者。我认为LabelEncoder就足够了，因为它将使用从1到n的单个整数值来表示每种情况，但我想知道我的决定是否合理谢谢LabelEncoder将适用于您的用例，使用0到4的整数作为类ID： In [15]: from sklearn.preprocessing import La

我想使用活动数据集使用scikit learn执行分类，其中类标签可能是以下情况之一：

[‘Walk’, ‘Stand’, ‘Run’, ‘Jump’, ‘null’]

我不确定哪种标签编码方法在这里是最好的：或者。我认为

LabelEncoder

就足够了，因为它将使用从

到

的单个整数值来表示每种情况，但我想知道我的决定是否合理

谢谢

LabelEncoder

将适用于您的用例，使用0到4的整数作为类ID：

In [15]: from sklearn.preprocessing import LabelEncoder

In [16]: le = LabelEncoder()


In [17]: le.fit(['Walk', 'Stand', 'Run', 'Jump', 'null'])
Out[17]: LabelEncoder()


In [18]: le.classes_
Out[18]: 
array(['Jump', 'Run', 'Stand', 'Walk', 'null'],
      dtype='<U5')

In [19]: le.transform(['null', 'Run', 'Jump'])
Out[19]: array([4, 1, 0])

In [20]: le.inverse_transform([4, 1, 0])
Out[20]: 
array(['null', 'Run', 'Jump'],
      dtype='<U5')

[15]中的

：来自sklearn.preprocessing导入标签编码器
在[16]中：le=LabelEncoder（）
在[17]中：lefit（['Walk'，'Stand'，'Run'，'Jump'，'null']）
Out[17]：LabelEncoder（）
在[18]中：le_
出[18]：
数组（['Jump'，'Run'，'Stand'，'Walk'，'null']，
dtype='您可以直接将字符串目标发送到MLPClassizer，它会像@ely使用的那样，在内部自动使用LabelEncoder将其转换为数字。但是您不需要显式地执行任何操作。