用survfit()拟合生存曲线
我有一个生存数据,用survfit()拟合生存曲线,r,survival-analysis,survival,survminer,R,Survival Analysis,Survival,Survminer,我有一个生存数据,df,如下所示: df <- structure(list(time_to_event = c(369L, 4597L, 2154L, 4426L, 823L, 4248L, 1045L, 4186L, 1305L, 1960L, 3905L, 5L, 3840L, 3802L, 3730L, 280L, 3678L, 81L, 59L, 3360L, 3318L, 3142L, 2912L, 2909L, 2873L, 2847L, 2843L, 2819L, 4
df
,如下所示:
df <- structure(list(time_to_event = c(369L, 4597L, 2154L, 4426L, 823L,
4248L, 1045L, 4186L, 1305L, 1960L, 3905L, 5L, 3840L, 3802L, 3730L,
280L, 3678L, 81L, 59L, 3360L, 3318L, 3142L, 2912L, 2909L, 2873L,
2847L, 2843L, 2819L, 44L, 2677L, 2647L, 2569L, 2507L, 27L, 2372L,
1771L, 1708L, 1131L, 1618L, 1597L, 1303L, 1254L, 1242L, 386L,
1150L, 1113L, 1078L, 1036L, 1008L, 972L, 118L, 927L, 495L, 781L,
772L, 735L, 496L, 469L, 428L, 413L, 270L, 959L), event = c(1L,
0L, 1L, 0L, 1L, 0L, 1L, 0L, 1L, 1L, 0L, 1L, 0L, 0L, 0L, 1L, 0L,
1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L,
1L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L,
0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L)), row.names = c(NA,
-62L), class = "data.frame")
我认为这可能是因为原始数据集中缺少值,但没有遗漏
survival
中的lung
数据集工作正常:
survfit(Surv(time, status) ~ 1, data = lung)
# Call: survfit(formula = Surv(time, status) ~ 1, data = lung)
#
# n events median 0.95LCL 0.95UCL
# 228 165 310 285 363
62人中只有15人(24%)经历过这一事件。因此,事件发生的中间时间没有定义也就不足为奇了。在肺部数据中,这一数字为72%,死亡的中位时间为310天。这意味着50%的样本在第310天死亡。@Edward那么,是否仍然值得查看这些数据进行生存分析?你知道这里的中位数是怎么计算的吗?我尝试了
中位数(lung$time)#[1]255.5
和中位数(lung$time[which(lung$status==2)])#[1]226
——它们给出了不同的值——不,这是卡普兰·迈耶的估计,而不是粗略的估计。你需要包括所有的样本,即使是那些被审查的。找一本关于生存分析的教科书或资料来源。数据是否仍然值得分析是另一个网站的问题,并非如此。62个网站中只有15个(24%)经历过这一事件。因此,事件发生的中间时间没有定义也就不足为奇了。在肺部数据中,这一数字为72%,死亡的中位时间为310天。这意味着50%的样本在第310天死亡。@Edward那么,是否仍然值得查看这些数据进行生存分析?你知道这里的中位数是怎么计算的吗?我尝试了中位数(lung$time)#[1]255.5
和中位数(lung$time[which(lung$status==2)])#[1]226
——它们给出了不同的值——不,这是卡普兰·迈耶的估计,而不是粗略的估计。你需要包括所有的样本,即使是那些被审查的。找一本关于生存分析的教科书或资料来源。数据是否仍然值得分析是另一个网站的问题,不是这样。
survfit(Surv(time, status) ~ 1, data = lung)
# Call: survfit(formula = Surv(time, status) ~ 1, data = lung)
#
# n events median 0.95LCL 0.95UCL
# 228 165 310 285 363