为什么dask_ml.preprocessing.OrdinalEncoder.transform会产生非顺序编码的结果?
我对以下结果感到困惑: 原始OrdinalCoder.transform返回numpy.ndarray(带数值): dask ml对应项不仅通过返回pandas.DataFrame来中断接口,还简单地返回初始输入数据帧:为什么dask_ml.preprocessing.OrdinalEncoder.transform会产生非顺序编码的结果?,dask,dask-ml,Dask,Dask Ml,我对以下结果感到困惑: 原始OrdinalCoder.transform返回numpy.ndarray(带数值): dask ml对应项不仅通过返回pandas.DataFrame来中断接口,还简单地返回初始输入数据帧: >>> DaskOrdinalEncoder().fit_transform(df_dd).compute().equals(df) True 我所期望的是一个(Pandas或Dask)数据帧或一个(Numpy或Dask)数组,其中包含的数值与sklearn
>>> DaskOrdinalEncoder().fit_transform(df_dd).compute().equals(df)
True
我所期望的是一个(Pandas或Dask)数据帧或一个(Numpy或Dask)数组,其中包含的数值与sklearn OrdinalEncoder产生的数值类似
df_dd = df_dd.categorize(columns=["cat1", "cat2"])
在应用OrdinalCoder之前,需要将列标识为类别
>>> DaskOrdinalEncoder().fit_transform(df_dd).compute().equals(df)
True
df_dd = df_dd.categorize(columns=["cat1", "cat2"])