Python 估计两个未配对数据集之间的相似性

Python 估计两个未配对数据集之间的相似性,python,scipy,statistics,Python,Scipy,Statistics,我试图比较数据(黑色)和模型(颜色)。[图一] 还有另一个例子[图2]。图1和图2的数据集和模型不同。 在这两种情况下,似乎模型和数据之间存在重叠,然而,图2的重叠/匹配更好。我想量化两种情况下数据和模型的相关性,以便区分两种数据的“拟合优度”。我想知道应该使用哪种(统计)方法来定量估计相关性。您可以先使用numpy.mean计算每个数据集的重心,然后比较它们之间的接近程度。 下一步是检查每个中心是否位于另一个数据集的不确定性椭圆()内 最后,我建议使用假设测试,如学生测试或f测试。对于此类

我试图比较数据(黑色)和模型(颜色)。[图一]

还有另一个例子[图2]。图1和图2的数据集和模型不同。


在这两种情况下,似乎模型和数据之间存在重叠,然而,图2的重叠/匹配更好。我想量化两种情况下数据和模型的相关性,以便区分两种数据的“拟合优度”。我想知道应该使用哪种(统计)方法来定量估计相关性。

您可以先使用
numpy.mean计算每个数据集的重心,然后比较它们之间的接近程度。
下一步是检查每个中心是否位于另一个数据集的不确定性椭圆()内


最后,我建议使用假设测试,如学生测试或f测试。对于此类测试,
scipy
中有一些方法,只需查看文档

就可以开始使用
numpy.mean计算每个数据集的重心,并比较它们之间的接近程度。
下一步是检查每个中心是否位于另一个数据集的不确定性椭圆()内


最后,我建议使用假设测试,如学生测试或f测试。对于这类测试,
scipy
中有一些方法,请查看文档

您的语言是什么?R还是Python?@Pascal我在用Python。那么为什么要用“R”标记呢?删除。不过,这些情节是什么意思。对于每个黑点,都有一个特定的对应色点?@AmiTavory否,数据和模型之间没有一对一的关系。对于每个图形,数据表示不同条件下的x和y值。我试图对各种可能性进行建模,并用彩色点表示我的结果。现在我想看看模型点[color]是否足以表示数据[black]。您的语言是什么?R还是Python?@Pascal我在用Python。那么为什么要用“R”标记呢?删除。不过,这些情节是什么意思。对于每个黑点,都有一个特定的对应色点?@AmiTavory否,数据和模型之间没有一对一的关系。对于每个图形,数据表示不同条件下的x和y值。我试图对各种可能性进行建模,并用彩色点表示我的结果。现在我想看看模型点[颜色]是否足以表示数据[黑色]。