Statistics 为八度音阶forge统计软件包函数的Anderson-Darling测试创建CDF

Statistics 为八度音阶forge统计软件包函数的Anderson-Darling测试创建CDF,statistics,octave,Statistics,Octave,我使用的是Octave,我想使用Octave forge统计软件包中的anderson_darling_测试来测试两个数据向量是否来自相同的统计分布。此外,参考分布不太可能是“正态”。此参考分布将是已知分布,并取自上述函数的帮助“如果您从已知分布中选择,请将您的值转换为分布的CDF值并使用“统一”。" 因此,我的问题是:如何将数据值转换为参考分布的CDF值 问题的一些背景信息:我有一个原始数据值向量,从中提取循环分量(这将是参考分布);然后,我希望将此循环分量与原始数据本身进行比较,以查看原始数

我使用的是Octave,我想使用Octave forge统计软件包中的anderson_darling_测试来测试两个数据向量是否来自相同的统计分布。此外,参考分布不太可能是“正态”。此参考分布将是已知分布,并取自上述函数的帮助“如果您从已知分布中选择,请将您的值转换为分布的CDF值并使用“统一”。"

因此,我的问题是:如何将数据值转换为参考分布的CDF值


问题的一些背景信息:我有一个原始数据值向量,从中提取循环分量(这将是参考分布);然后,我希望将此循环分量与原始数据本身进行比较,以查看原始数据是否本质上是循环的。如果可以拒绝关于两者相同的无效假设,则我将知道原始数据中的大部分移动不是由于循环影响,而是由于趋势或噪声造成的。

如果您的数据具有特定的分布,例如
beta(3,3)
then

p = betacdf(x, 3, 3)
将根据CDF的定义保持一致。如果要将其转换为法线,可以调用反向CDF函数

x=norminv(p,0,1)

关于统一<代码> P<代码>。一旦转换,使用您最喜欢的测试。我不确定我理解您的数据,但是您可以考虑使用At,这是一个非参数分布均匀性测试。

< P>您的方法在多个方面被误导。
  • 在Octave forge中实现的Anderson-Darling测试是一个单样本测试:它需要一个数据向量和一个引用分布。分布应该是已知的,而不是来自数据。虽然您正确引用了有关使用CDF和“统一”的帮助文件“选项对于非内置的发行版,您将忽略同一帮助文件的下一句话:
如果分布参数是根据数据本身估计的,则不要使用“均匀”,因为这会使A^2统计值明显偏向较小的值

所以,不要这样做

  • 即使您发现或编写了一个实现两个样本的Anderson-Darling或Kolmogorov-Smirnov测试的函数,您仍然会遇到一些问题:

  • 您的样本(数据和根据数据估计的循环部分)不是独立的,这些测试假设独立

  • 根据你的描述,我假设有某种时间预测器。因此,即使分布重合,也不意味着它们在相同的时间点重合,因为比较分布会随着时间的推移而崩溃

  • 周期趋势+误差的分布预计不会与周期趋势单独的分布相同。假设趋势为sin(t)。那么它永远不会超过1。现在添加一个标准偏差为0.1的正态分布随机误差项(很小,因此趋势占主导地位)。显然,您可以得到远高于1的值

我们没有足够的信息来找出正确的方法,这也不是一个真正的编程问题。查找时间序列理论-分离循环分量是其中的一个主要主题。但许多合理的分析可能基于残差:(观测值-根据循环分量预测)。你仍然需要注意自相关性和其他复杂性,但至少这是朝着正确的方向迈出的一步