Machine learning 如何在分类中选择正确的类编码方法
我想使用活动数据集使用scikit learn执行分类,其中类标签可能是以下情况之一:Machine learning 如何在分类中选择正确的类编码方法,machine-learning,scikit-learn,neural-network,classification,Machine Learning,Scikit Learn,Neural Network,Classification,我想使用活动数据集使用scikit learn执行分类,其中类标签可能是以下情况之一: [‘Walk’, ‘Stand’, ‘Run’, ‘Jump’, ‘null’] 我不确定哪种标签编码方法在这里是最好的:或者。我认为LabelEncoder就足够了,因为它将使用从1到n的单个整数值来表示每种情况,但我想知道我的决定是否合理 谢谢LabelEncoder将适用于您的用例,使用0到4的整数作为类ID: In [15]: from sklearn.preprocessing import La
[‘Walk’, ‘Stand’, ‘Run’, ‘Jump’, ‘null’]
我不确定哪种标签编码方法在这里是最好的:或者。我认为LabelEncoder
就足够了,因为它将使用从1
到n
的单个整数值来表示每种情况,但我想知道我的决定是否合理
谢谢
LabelEncoder
将适用于您的用例,使用0到4的整数作为类ID:
In [15]: from sklearn.preprocessing import LabelEncoder
In [16]: le = LabelEncoder()
In [17]: le.fit(['Walk', 'Stand', 'Run', 'Jump', 'null'])
Out[17]: LabelEncoder()
In [18]: le.classes_
Out[18]:
array(['Jump', 'Run', 'Stand', 'Walk', 'null'],
dtype='<U5')
In [19]: le.transform(['null', 'Run', 'Jump'])
Out[19]: array([4, 1, 0])
In [20]: le.inverse_transform([4, 1, 0])
Out[20]:
array(['null', 'Run', 'Jump'],
dtype='<U5')
[15]中的:来自sklearn.preprocessing导入标签编码器
在[16]中:le=LabelEncoder()
在[17]中:lefit(['Walk','Stand','Run','Jump','null'])
Out[17]:LabelEncoder()
在[18]中:le_
出[18]:
数组(['Jump','Run','Stand','Walk','null'],
dtype='您可以直接将字符串目标发送到MLPClassizer,它会像@ely使用的那样,在内部自动使用LabelEncoder将其转换为数字。但是您不需要显式地执行任何操作。