Python 三维Numpy阵列分析的标准差vs Z分数vs IQR

Python 三维Numpy阵列分析的标准差vs Z分数vs IQR,python,arrays,optimization,bigdata,outliers,Python,Arrays,Optimization,Bigdata,Outliers,我试图分析3D numpy数组中的一大组数据,但不确定如何分析这些数据中的异常值。我不想完全抛出数据来破坏数组的大小,因为这可能需要抛出整个数据片 也就是说,关于检查异常值的不同方法的参考并没有显示任何特定的最佳方法来重新计算异常值并替换它。一组随机分布的数据主要以中位数为中心,并根据不同的方法(st.dev.,z-score,IQR,其他方法)重新计算每个异常值,其优点和缺点是什么 此外,Python中最优化的方法是处理几十万个非常大的3D数组。我认为第一个问题显然超出了堆栈溢出的范围,应该发

我试图分析3D numpy数组中的一大组数据,但不确定如何分析这些数据中的异常值。我不想完全抛出数据来破坏数组的大小,因为这可能需要抛出整个数据片

也就是说,关于检查异常值的不同方法的参考并没有显示任何特定的最佳方法来重新计算异常值并替换它。一组随机分布的数据主要以中位数为中心,并根据不同的方法(st.dev.,z-score,IQR,其他方法)重新计算每个异常值,其优点和缺点是什么


此外,Python中最优化的方法是处理几十万个非常大的3D数组。

我认为第一个问题显然超出了堆栈溢出的范围,应该发布。为什么需要重新计算异常值?只需将异常元素替换为NaN即可<代码>a[a>阈值]=np.nan。最大的缺点是这将迫使您的数组成为浮动数组。否则考虑使用布尔掩码并在任何计算之前应用该掩码。