Dataframe macgien学习中的数据类型
我有不同数据类型的表。我的一些专栏是: 名称、时间、日期、文件数量、工时、作业类型 杰克,10:24:542015-02-15,82,20,项目经理 ……等等 我想通过使用随机森林模型来训练这些特征,以预测公司的工作类型。Dataframe macgien学习中的数据类型,dataframe,machine-learning,random-forest,data-conversion,sqldatatypes,Dataframe,Machine Learning,Random Forest,Data Conversion,Sqldatatypes,我有不同数据类型的表。我的一些专栏是: 名称、时间、日期、文件数量、工时、作业类型 杰克,10:24:542015-02-15,82,20,项目经理 ……等等 我想通过使用随机森林模型来训练这些特征,以预测公司的工作类型。 我的问题是,我应该将列转换为特定的数据类型以获得良好的准确性,那么时间和数据呢?我有大约48970行,这是我第一次使用机器学习。是的,需要转换数据。通常,所有列都应具有数字格式: 您可以从时间-天、小时、周等提取特征 作业类型是一种分类特征,常用的转换方法有标签编码和单选编
我的问题是,我应该将列转换为特定的数据类型以获得良好的准确性,那么时间和数据呢?我有大约48970行,这是我第一次使用机器学习。是的,需要转换数据。通常,所有列都应具有数字格式:
- 您可以从时间-天、小时、周等提取特征李>
- 作业类型是一种分类特征,常用的转换方法有标签编码和单选编码李>
- 其他分类列也可以这样做,比如name李>
- 如果使用线性模型,则应规范化数值特征李>