Warning: file_get_contents(/data/phpspider/zhask/data//catemap/4/r/79.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
用survfit()拟合生存曲线_R_Survival Analysis_Survival_Survminer - Fatal编程技术网

用survfit()拟合生存曲线

用survfit()拟合生存曲线,r,survival-analysis,survival,survminer,R,Survival Analysis,Survival,Survminer,我有一个生存数据,df,如下所示: df <- structure(list(time_to_event = c(369L, 4597L, 2154L, 4426L, 823L, 4248L, 1045L, 4186L, 1305L, 1960L, 3905L, 5L, 3840L, 3802L, 3730L, 280L, 3678L, 81L, 59L, 3360L, 3318L, 3142L, 2912L, 2909L, 2873L, 2847L, 2843L, 2819L, 4

我有一个生存数据,
df
,如下所示:

df <- structure(list(time_to_event = c(369L, 4597L, 2154L, 4426L, 823L, 
4248L, 1045L, 4186L, 1305L, 1960L, 3905L, 5L, 3840L, 3802L, 3730L, 
280L, 3678L, 81L, 59L, 3360L, 3318L, 3142L, 2912L, 2909L, 2873L, 
2847L, 2843L, 2819L, 44L, 2677L, 2647L, 2569L, 2507L, 27L, 2372L, 
1771L, 1708L, 1131L, 1618L, 1597L, 1303L, 1254L, 1242L, 386L, 
1150L, 1113L, 1078L, 1036L, 1008L, 972L, 118L, 927L, 495L, 781L, 
772L, 735L, 496L, 469L, 428L, 413L, 270L, 959L), event = c(1L, 
0L, 1L, 0L, 1L, 0L, 1L, 0L, 1L, 1L, 0L, 1L, 0L, 0L, 0L, 1L, 0L, 
1L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 
1L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 
0L, 0L, 0L, 1L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L, 0L)), row.names = c(NA, 
-62L), class = "data.frame")
我认为这可能是因为原始数据集中缺少值,但没有遗漏

survival
中的
lung
数据集工作正常:

survfit(Surv(time, status) ~ 1, data = lung)
# Call: survfit(formula = Surv(time, status) ~ 1, data = lung)
# 
# n  events  median 0.95LCL 0.95UCL 
# 228     165     310     285     363 

62人中只有15人(24%)经历过这一事件。因此,事件发生的中间时间没有定义也就不足为奇了。在肺部数据中,这一数字为72%,死亡的中位时间为310天。这意味着50%的样本在第310天死亡。@Edward那么,是否仍然值得查看这些数据进行生存分析?你知道这里的中位数是怎么计算的吗?我尝试了
中位数(lung$time)#[1]255.5
中位数(lung$time[which(lung$status==2)])#[1]226
——它们给出了不同的值——不,这是卡普兰·迈耶的估计,而不是粗略的估计。你需要包括所有的样本,即使是那些被审查的。找一本关于生存分析的教科书或资料来源。数据是否仍然值得分析是另一个网站的问题,并非如此。62个网站中只有15个(24%)经历过这一事件。因此,事件发生的中间时间没有定义也就不足为奇了。在肺部数据中,这一数字为72%,死亡的中位时间为310天。这意味着50%的样本在第310天死亡。@Edward那么,是否仍然值得查看这些数据进行生存分析?你知道这里的中位数是怎么计算的吗?我尝试了
中位数(lung$time)#[1]255.5
中位数(lung$time[which(lung$status==2)])#[1]226
——它们给出了不同的值——不,这是卡普兰·迈耶的估计,而不是粗略的估计。你需要包括所有的样本,即使是那些被审查的。找一本关于生存分析的教科书或资料来源。数据是否仍然值得分析是另一个网站的问题,不是这样。
survfit(Surv(time, status) ~ 1, data = lung)
# Call: survfit(formula = Surv(time, status) ~ 1, data = lung)
# 
# n  events  median 0.95LCL 0.95UCL 
# 228     165     310     285     363