Python 如何在多个coliumn上执行测试
我的数据框在下面Python 如何在多个coliumn上执行测试,python,statistics,Python,Statistics,我的数据框在下面 patid age gender tg0 tg1 tg2 tg3 tg4 wgt0 wgt1 wgt2 wgt3 wgt4 0 1 45 Male 180 148 106 113 100 198 196 193 188 192 1 2 56 Male 139 94 119 75 92 237 233 232 228 225 2 3 50 Male 152 185 86 149 118 233 231 229 228
patid age gender tg0 tg1 tg2 tg3 tg4 wgt0 wgt1 wgt2 wgt3 wgt4
0 1 45 Male 180 148 106 113 100 198 196 193 188 192
1 2 56 Male 139 94 119 75 92 237 233 232 228 225
2 3 50 Male 152 185 86 149 118 233 231 229 228 226
3 4 46 Female 112 145 136 149 82 179 181 177 174 172
4 5 64 Male 156 104 157 79 97 219 217 215 213 214
如果我对tg0 tg1 tg2 tg3 tg4
和wgt0 wgt1 wgt2 wgt2 wgt3 wgt4
进行平均,这样我将得到两列a和b并进行测试,这是正确的方法吗
同时也复制了案例研究
一位内科医生正在为有家族病史的患者评估一种新的饮食
心脏病。为了测试这种饮食的有效性,将16名患者置于
节食6个月。他们的体重和甘油三酯水平在出生前测量
研究结束后,医生想知道
测量值已更改
无效假设:使用新饮食6个月后,个体的甘油三酯水平和体重没有差异
Alt假说:使用新饮食6个月后,个体的甘油三酯水平和体重存在显著差异
对于2个变量,我们可以执行以下代码
from scipy import stats
#Data of group 1
a = np.array([42.1, 80.0, 30.0, 45.8, 57.7, 80.0, 82.4, 66.2, 66.9, 79.0])
#Data of group 2
b = np.array([80.7, 85.1, 88.6, 81.7, 69.8, 79.5, 107.2, 69.3, 80.9, 63.0])
t2, p2 = stats.ttest_ind(a,b)
我不知道为什么每个病人有四个甘油三酯和体重的测量 假设测量间隔一个月(节食时和开始节食时tg0、wgt0),那么你可以做两件事中的一件:
a
,最后一个值作为b
。对砝码也要这样做如果(tg0 tg1 tg2 tg3 tg4)是饮食前的测量值,而(wgt0 wgt1 wgt2 wgt3 wgt4)是饮食后的测量值,并且它们测量的是相同的东西(例如体重),那么您可以按照您的建议进行测量。看起来您希望找出每种测量类型在6个月前后的差异。基于此,您似乎希望执行两个单独的测试:
tg0
和wgt0
分别是初始甘油三酯和体重测量值,tg4
和wgt4
是最终测量值
对于每个测试,您将比较最终测量值与初始测量值,因此您希望按照以下方式构建测试:
t_tg, p_tg = stats.ttest_ind(tg4,tg0)
t_wgt, p_wgt = stats.ttest_ind(wgt4,wgt0)
然后使用
p_tg
和p_wgt
对甘油三酯和体重进行唯一的测定。如果我理解正确,你的问题是你想用一次测试对体重和甘油三酯进行t检验?你能不能不把测试分成两个测试,用两个t检验来测试体重和三甘醇的差异?如果重量的t检验和甘油三酯的t检验均显示显著性,则不能拒绝零值?我假设tg为甘油三酯,wgt为重量。为什么每个患者有四个测量值?