Machine learning 整数和类型分类

Machine learning 整数和类型分类,machine-learning,classification,Machine Learning,Classification,假设我们有以下数据集 Label | Features | ----------------------------------- Age | Size | Weight | shoeSize | 20 | 180 | 80 | 42 | 40 | 173 | 56 | 38 | 正如我所知,机器学习中的特征应该被规范化,而上面提到的特征可以被规范化,非常好。但是,如果我想扩展功能列表,例如

假设我们有以下数据集

Label  |        Features          |  
-----------------------------------
Age    | Size | Weight | shoeSize |
20     | 180  | 80     | 42       |
40     | 173  | 56     | 38       |
正如我所知,机器学习中的特征应该被规范化,而上面提到的特征可以被规范化,非常好。但是,如果我想扩展功能列表,例如以下功能,该怎么办

| Gender | Ethnicity |
| 0      | 1         |
| 1      | 2         |
| 0      | 3         |
| 0      | 2         |
其中,性别值0和1表示女性和男性。种族价值1、2和3分别适用于亚裔、西班牙裔和欧洲人。由于这些值引用类型,我确信它们是否可以被规范化


如果它们不能被规范化,我如何处理混合值(如大小)和类型(如焓)

请注意,规范化并不总是定义所要求的,它取决于要使用的模型;例如,基于树的模型不需要它。在任何情况下,这都是一个方法论问题,而不是编程问题,它更适合于;例如,基于树的模型不需要它。在任何情况下,这都是一个方法问题,而不是一个编程问题,它更适合于。