Scikit learn RobustScaler partial_fit()类似于MinMaxScaler或StandardScaler

Scikit learn RobustScaler partial_fit()类似于MinMaxScaler或StandardScaler,scikit-learn,Scikit Learn,我一直在使用RobustScaler来缩放数据,最近我们添加了额外的数据,这些数据推动了fit_变换的内存限制。我希望对子集数据进行部分拟合,但看起来RobustScaler并没有提供该功能。大多数其他定标器(MinMax、Standard、Abs)似乎都有部分匹配 由于数据中存在异常值,因此需要使用RobustScaler。我尝试使用MinMax和标准定标器,但是异常值对数据的影响太大了 我希望找到一种替代方法,来代替对大数据集进行拟合变换,类似于在其他定标器中进行部分拟合。如果使用sciki

我一直在使用RobustScaler来缩放数据,最近我们添加了额外的数据,这些数据推动了fit_变换的内存限制。我希望对子集数据进行部分拟合,但看起来RobustScaler并没有提供该功能。大多数其他定标器(MinMax、Standard、Abs)似乎都有部分匹配

由于数据中存在异常值,因此需要使用RobustScaler。我尝试使用MinMax和标准定标器,但是异常值对数据的影响太大了


我希望找到一种替代方法,来代替对大数据集进行拟合变换,类似于在其他定标器中进行部分拟合。

如果使用scikit学习对您来说不是一个困难的要求,您也许可以查看另一个生物分子动力学库,名为

它声称拥有类似于scikit learn的RobustScaler,并且可以选择使用部分拟合,这是根据他们的文档

链接:



PS:我还没有测试过它。

如果使用scikit learn对您来说不是一个困难的要求,您也许可以查看另一个名为的生物分子动力学库

它声称拥有类似于scikit learn的RobustScaler,并且可以选择使用部分拟合,这是根据他们的文档

链接:



PS:我还没有测试过。

谢谢。代码库已经将scikit learn用于其他目的,所以我没有探索其他库。我去看看。谢谢你!非常感谢。代码库已经将scikit learn用于其他目的,所以我没有探索其他库。我去看看。谢谢你!你找到解决方案了吗?由于RobustScalar的性质,不可能进行部分拟合。因此,我们将数据垂直分割(按要素列?),并使用多个RobustScalar进行缩放。我们保存由哪个RobustScalar实例缩放的列,并保存该信息。它实际上运行得很好。你找到解决方案了吗?由于RobustScalar的性质,不可能进行部分拟合。因此,我们将数据垂直分割(按要素列?),并使用多个RobustScalar进行缩放。我们保存由哪个RobustScalar实例缩放的列,并保存该信息。它实际上运行得很好。