Python 熊猫中布尔索引的内存爆炸
我正在熊猫12.0中处理一个非常大的浮动数据系列。我想做的是在这个系列中将极端异常值设置为NaN,它表示一个标准化的特征向量(平均值为0,标准差为1) 我可以毫不费力地制作特征向量的布尔掩码来查找极端异常值:Python 熊猫中布尔索引的内存爆炸,python,pandas,machine-learning,sparse-matrix,pytables,Python,Pandas,Machine Learning,Sparse Matrix,Pytables,我正在熊猫12.0中处理一个非常大的浮动数据系列。我想做的是在这个系列中将极端异常值设置为NaN,它表示一个标准化的特征向量(平均值为0,标准差为1) 我可以毫不费力地制作特征向量的布尔掩码来查找极端异常值: mask = feature_series > 10 | feature_series < 10 它也不限于此操作。我还通过以下方式获得了内存爆炸: mask.any() 是什么让这一切发生的?我觉得这可能是个bug,但我对熊猫还是比较陌生,不能确定。也许你需要一些括号 m
mask = feature_series > 10 | feature_series < 10
它也不限于此操作。我还通过以下方式获得了内存爆炸:
mask.any()
是什么让这一切发生的?我觉得这可能是个bug,但我对熊猫还是比较陌生,不能确定。也许你需要一些括号
mask = (feature_series > 10) | (feature_series < 10)
mask=(特性系列>10)|(特性系列<10)
和缺少括号再次成为罪魁祸首。非常感谢。
mask = (feature_series > 10) | (feature_series < 10)