Python SGD累加器浮子溢流

Python SGD累加器浮子溢流,python,scikit-learn,regression,Python,Scikit Learn,Regression,我正在尝试将SGDregressor sklearn用于20000行的数据集。10列是功能 它似乎没有大到足以引起 ValueError: floating-point under-/overflow occurred. 为什么会这样?解决此问题的可能方法是什么?您是否规范化了数据?我只删除了所有字符串参数并转换为0和1格式。其他事情能帮上什么忙?数据框看起来很小。为什么会出现记忆问题?我读过关于通过计算标准分数实现标准化的文章。是的,我会尝试用这种方式减少数据这不是内存问题,这是规模问题。当

我正在尝试将SGDregressor sklearn用于20000行的数据集。10列是功能

它似乎没有大到足以引起

ValueError: floating-point under-/overflow occurred.

为什么会这样?解决此问题的可能方法是什么?

您是否规范化了数据?我只删除了所有字符串参数并转换为0和1格式。其他事情能帮上什么忙?数据框看起来很小。为什么会出现记忆问题?我读过关于通过计算标准分数实现标准化的文章。是的,我会尝试用这种方式减少数据这不是内存问题,这是规模问题。当您需要在内存中存储非常小/很大的数字时,就会发生under/overflow,如果您不规范数据(输入和输出),则可能会发生under/overflow。例如,如果您拟合线性模型以从10^-5刻度的数字预测数字10^10,则需要大小为10^15的权重。