Machine learning 对相同数据、不同测试进行生存分析-一个拒绝,但另一个不接受';T

Machine learning 对相同数据、不同测试进行生存分析-一个拒绝,但另一个不接受';T,machine-learning,statistics,data-science,Machine Learning,Statistics,Data Science,以下是我正在调查的数据集的链接: 我想在生存分析中测试维持组和非维持组之间的差异的统计学意义。这是Kaplan-Meier图,显示了两组发生事件的概率分布。人们可以清楚地观察到,平均而言,维持组的受试者比未维持组的受试者存活时间更长。 统计测试日志排名验证了这一发现: # Apply log-rank test from lifelines.statistics import logrank_test results = logrank_test(t[maintained],t[~ma

以下是我正在调查的数据集的链接:

我想在生存分析中测试维持组和非维持组之间的差异的统计学意义。这是Kaplan-Meier图,显示了两组发生事件的概率分布。人们可以清楚地观察到,平均而言,维持组的受试者比未维持组的受试者存活时间更长。

统计测试日志排名验证了这一发现:

# Apply log-rank test 

from lifelines.statistics import logrank_test

results = logrank_test(t[maintained],t[~maintained],s[maintained],t[~maintained], alpha=0.99)
results.print_summary()

结果表明,两组生存时间差异有统计学意义。所以,我假设当测试日志危险时,我应该期望看到统计上的差异。换句话说,维护组(x=1)的日志危险应低于未维护组(x=0)。为了验证这一点,我拟合了一个cox回归模型:

from lifelines import CoxPHFitter

df = data.copy()
df.x.replace(['Maintained', 'Nonmaintained'], [1,0], inplace=True)

cf = CoxPHFitter()
cf.fit(df.ix[:,1:], 'time', event_col='status')
cf.print_summary()

奇怪的是,在这项测试中,x(维持)的参数估计值没有统计学意义,这意味着维持和未维持的对数危险没有区别

1) 在这样的事件中,统计测试结果存在差异,统计学家应该如何解释与不同影响相关的生存率


2) 由于样本量小于30,cox回归可能不可靠吗?

这个问题不适用于SO,因为SO是一个讨论编程问题的论坛。请删除此问题并在data science SE上或可能在data science SE上提问。我认为您在调用对数秩测试时出错:
results=logrank\u test(t[mainted],t[~mainted],s[mainted],t[~mainted],alpha=0.99)
-您正在调用
t[~mainted]
两次。