Machine learning 对相同数据、不同测试进行生存分析-一个拒绝，但另一个不接受'；T_Machine Learning_Statistics_Data Science

Machine learning 对相同数据、不同测试进行生存分析-一个拒绝，但另一个不接受'；T

machine-learning statistics

Machine learning 对相同数据、不同测试进行生存分析-一个拒绝，但另一个不接受'；T,machine-learning,statistics,data-science,Machine Learning,Statistics,Data Science,以下是我正在调查的数据集的链接：我想在生存分析中测试维持组和非维持组之间的差异的统计学意义。这是Kaplan-Meier图，显示了两组发生事件的概率分布。人们可以清楚地观察到，平均而言，维持组的受试者比未维持组的受试者存活时间更长。统计测试日志排名验证了这一发现： # Apply log-rank test from lifelines.statistics import logrank_test results = logrank_test(t[maintained],t[~ma

以下是我正在调查的数据集的链接：

我想在生存分析中测试维持组和非维持组之间的差异的统计学意义。这是Kaplan-Meier图，显示了两组发生事件的概率分布。人们可以清楚地观察到，平均而言，维持组的受试者比未维持组的受试者存活时间更长。

统计测试日志排名验证了这一发现：

# Apply log-rank test 

from lifelines.statistics import logrank_test

results = logrank_test(t[maintained],t[~maintained],s[maintained],t[~maintained], alpha=0.99)
results.print_summary()

结果表明，两组生存时间差异有统计学意义。所以，我假设当测试日志危险时，我应该期望看到统计上的差异。换句话说，维护组（x=1）的日志危险应低于未维护组（x=0）。为了验证这一点，我拟合了一个cox回归模型：

from lifelines import CoxPHFitter

df = data.copy()
df.x.replace(['Maintained', 'Nonmaintained'], [1,0], inplace=True)

cf = CoxPHFitter()
cf.fit(df.ix[:,1:], 'time', event_col='status')
cf.print_summary()

奇怪的是，在这项测试中，x（维持）的参数估计值没有统计学意义，这意味着维持和未维持的对数危险没有区别

1）在这样的事件中，统计测试结果存在差异，统计学家应该如何解释与不同影响相关的生存率

2）由于样本量小于30，cox回归可能不可靠吗？

这个问题不适用于SO，因为SO是一个讨论编程问题的论坛。请删除此问题并在data science SE上或可能在data science SE上提问。我认为您在调用对数秩测试时出错：

results=logrank\u test（t[mainted]，t[~mainted]，s[mainted]，t[~mainted]，alpha=0.99）

-您正在调用

t[~mainted]

两次。