Dataframe macgien学习中的数据类型

Dataframe macgien学习中的数据类型,dataframe,machine-learning,random-forest,data-conversion,sqldatatypes,Dataframe,Machine Learning,Random Forest,Data Conversion,Sqldatatypes,我有不同数据类型的表。我的一些专栏是: 名称、时间、日期、文件数量、工时、作业类型 杰克,10:24:542015-02-15,82,20,项目经理 ……等等 我想通过使用随机森林模型来训练这些特征,以预测公司的工作类型。 我的问题是,我应该将列转换为特定的数据类型以获得良好的准确性,那么时间和数据呢?我有大约48970行,这是我第一次使用机器学习。是的,需要转换数据。通常,所有列都应具有数字格式: 您可以从时间-天、小时、周等提取特征 作业类型是一种分类特征,常用的转换方法有标签编码和单选编

我有不同数据类型的表。我的一些专栏是:

名称、时间、日期、文件数量、工时、作业类型

杰克,10:24:542015-02-15,82,20,项目经理 ……等等

我想通过使用随机森林模型来训练这些特征,以预测公司的工作类型。
我的问题是,我应该将列转换为特定的数据类型以获得良好的准确性,那么时间和数据呢?我有大约48970行,这是我第一次使用机器学习。

是的,需要转换数据。通常,所有列都应具有数字格式:

  • 您可以从时间-天、小时、周等提取特征
  • 作业类型是一种分类特征,常用的转换方法有标签编码和单选编码
  • 其他分类列也可以这样做,比如name
  • 如果使用线性模型,则应规范化数值特征