Python 我使用什么样的scipy统计检验来比较样本均值?

Python 我使用什么样的scipy统计检验来比较样本均值?,python,numpy,statistics,scipy,Python,Numpy,Statistics,Scipy,假设样本量不相等,在以下情况下,我使用什么测试来比较样本均值(如果以下任何一项不正确,请更正): 正态分布=真和方差齐性=真 scipy.stats.ttest_ind(sample_1, sample_2) scipy.stats.ttest_ind(sample_1, sample_2, equal_var = False) scipy.stats.mannwhitneyu(sample_1, sample_2) ??? 正态分布=真和方差齐性=假 scipy.stats.ttest

假设样本量不相等,在以下情况下,我使用什么测试来比较样本均值(如果以下任何一项不正确,请更正):

正态分布=真方差齐性=真

scipy.stats.ttest_ind(sample_1, sample_2)
scipy.stats.ttest_ind(sample_1, sample_2, equal_var = False)
scipy.stats.mannwhitneyu(sample_1, sample_2)
???
正态分布=真方差齐性=假

scipy.stats.ttest_ind(sample_1, sample_2)
scipy.stats.ttest_ind(sample_1, sample_2, equal_var = False)
scipy.stats.mannwhitneyu(sample_1, sample_2)
???
正态分布=假方差齐性=真

scipy.stats.ttest_ind(sample_1, sample_2)
scipy.stats.ttest_ind(sample_1, sample_2, equal_var = False)
scipy.stats.mannwhitneyu(sample_1, sample_2)
???
正态分布=假方差齐性=假

scipy.stats.ttest_ind(sample_1, sample_2)
scipy.stats.ttest_ind(sample_1, sample_2, equal_var = False)
scipy.stats.mannwhitneyu(sample_1, sample_2)
???
快速回答: 正态分布=真方差齐性=假样本量>30-50

scipy.stats.ttest_ind(sample1, sample2, equal_var=False)
回答得好: 如果你检查中心极限定理,它说(来自维基百科):“在概率论中,中心极限定理(CLT)指出,给定某些条件,足够大数量的独立随机变量迭代的算术平均值,每个迭代都有一个定义良好的(有限的)预期值和有限方差将近似为正态分布,而与基础分布无关。”

因此,尽管您没有正态分布总体,但如果您的样本足够大(大于30或50个样本),那么样本的平均值将是正态分布的。因此,您可以使用:

scipy.stats.ttest_ind(sample1, sample2, equal_var=False)

这是对两个独立样本具有相同平均(预期)值的无效假设的双边检验。使用equal_var=False选项,它将执行Welch t检验,该检验不假设人口方差相等。

这似乎更像是一个统计问题。您是否尝试过交叉验证:?谢谢,我已在此处发布了问题: