Machine learning 处理非十进制变量的最佳实践。[ACM KDD 2009杯]

Machine learning 处理非十进制变量的最佳实践。[ACM KDD 2009杯],machine-learning,artificial-intelligence,neural-network,data-mining,classification,Machine Learning,Artificial Intelligence,Neural Network,Data Mining,Classification,为了实践,我决定使用神经网络来解决由所述的分类问题(2类)。我发现的问题是,数据集包含很多“空”变量,我不知道如何处理它们。此外,出现了第二个问题。如何处理字符串等其他非小数。您的最佳实践是什么?大多数方法都需要数字特征,因此必须将分类特征转换为计数。例如,如果实例的属性中存在某个字符串,则其计数为1,否则为0。如果它发生不止一次,它的计数会相应增加。从这个角度来看,任何不存在的功能(或您所说的“空”)的计数都为0。请注意,属性名称必须是唯一的。大多数方法都需要数字特征,因此必须将分类特征转换为

为了实践,我决定使用神经网络来解决由所述的分类问题(2类)。我发现的问题是,数据集包含很多“空”变量,我不知道如何处理它们。此外,出现了第二个问题。如何处理字符串等其他非小数。您的最佳实践是什么?

大多数方法都需要数字特征,因此必须将分类特征转换为计数。例如,如果实例的属性中存在某个字符串,则其计数为1,否则为0。如果它发生不止一次,它的计数会相应增加。从这个角度来看,任何不存在的功能(或您所说的“空”)的计数都为0。请注意,属性名称必须是唯一的。

大多数方法都需要数字特征,因此必须将分类特征转换为计数。例如,如果实例的属性中存在某个字符串,则其计数为1,否则为0。如果它发生不止一次,它的计数会相应增加。从这个角度来看,任何不存在的功能(或您所说的“空”)的计数都为0。请注意,属性名称必须是唯一的。

是的,这可能对分类特征有用,但数字特征和“空”值特征如何?这取决于特征对应的内容,但在许多情况下是“空”的值仅表示0。是的,这可能对分类特征有用,但对于数字特征和具有“空”值的特征如何?这取决于特征对应的内容,但在许多情况下,“空”值仅表示0。