Machine learning 我应该如何处理数据集中的日期列?

Machine learning 我应该如何处理数据集中的日期列?,machine-learning,data-science,Machine Learning,Data Science,事实上,我正在研究澳大利亚的天气数据来预测明天是否会下雨? 我是机器学习新手,我不知道如何处理数据集中的日期列,因为我知道机器只接受数值 那么请告诉我这个约会我该怎么办我该怎么处理 您可以提取日期的年、月和日数作为分类变量。它可以是重要的月份、年份,也可以是一个月的开始或结束 如果您告诉我您使用的是哪种语言,我可以帮助您编写代码:)嘿,Navin Bondade, 当您使用onehotencoding时,假设列包含太多值,那么数据集中会自动堆积太多列。因此,您必须在该特定功能中选择10或15个最

事实上,我正在研究澳大利亚的天气数据来预测明天是否会下雨? 我是机器学习新手,我不知道如何处理数据集中的日期列,因为我知道机器只接受数值


那么请告诉我这个约会我该怎么办我该怎么处理

您可以提取日期的年、月和日数作为分类变量。它可以是重要的月份、年份,也可以是一个月的开始或结束

如果您告诉我您使用的是哪种语言,我可以帮助您编写代码:)

嘿,Navin Bondade, 当您使用onehotencoding时,假设列包含太多值,那么数据集中会自动堆积太多列。因此,您必须在该特定功能中选择10或15个最频繁的值,并尝试对它们进行编码,而忽略其余值。我没有亲自使用过,但我确实看到一支球队用这种技术赢得了KDD橙色杯。
快乐学习

我在使用Python。你的意思是我创建了3个独立的日、月和年列。是的,没错。你可以这样做:导入熊猫作为pd df['year']=pd.DatetimeIndex(df['Date'])。year df['month']=pd.DatetimeIndex(df['Date'])。month df['day']=pd.DatetimeIndex(df['Date'])。dayPlz还告诉我如何处理windgustdr列到windspeed3pm,我是否应该使用标签编码和一个热编码器,但这也会创建很多列,而且已经有太多的列了