在Surv中(开始时间、结束时间、新死亡):停止时间必须为>;开始时间,NA已创建

在Surv中(开始时间、结束时间、新死亡):停止时间必须为>;开始时间,NA已创建,r,number-formatting,survival,R,Number Formatting,Survival,我使用“生存”软件包来拟合具有时间间隔的cox模型(间隔为30天)。我正在从xlsx工作表中读取数据。我不断得到错误,说我的停止时间必须大于我的开始时间。开始值都小于停止值 我检查了一下,以确保这些都是以数字的形式读入的。我还将它们改为整数,这并没有解决问题。我使用此代码查看是否有任何观察符合此标准: a <- a1[which(a1$end_time > a1$start_time),] a1$start\u时间),] 大约有一半的数据集符合这个标准,但当我查看数据时,所有的开

我使用“生存”软件包来拟合具有时间间隔的cox模型(间隔为30天)。我正在从xlsx工作表中读取数据。我不断得到错误,说我的停止时间必须大于我的开始时间。开始值都小于停止值

我检查了一下,以确保这些都是以数字的形式读入的。我还将它们改为整数,这并没有解决问题。我使用此代码查看是否有任何观察符合此标准:

a <- a1[which(a1$end_time > a1$start_time),]
a1$start\u时间),]
大约有一半的数据集符合这个标准,但当我查看数据时,所有的开始时间似乎都小于结束时间

有人知道为什么会发生这种情况,以及我如何解决它吗?我是一个新手,所以也许有一些明显的事情我不知道

model1<- survfit(Surv(start_time, end_time, censor) ~ exp, data=a1, weights = weight)

model1您是否可以共享
dput(a1)
的输出?如果您只打算使用符合条件的数据,那么您的survfit应该调用
data=a
而不是
data=a1
@rawr我不打算只使用符合条件的数据,我想看看哪些数据符合条件。这看起来不像是任何人做的,所以我想有一些像我这样的新手不明白的格式。我发布了一小段数据集抱歉,我认为我之前不清楚,我无法编辑我的评论:@rawr我希望专栏的开始时间<结束时间(每隔30天)。所有值看起来都是正确的,但其中大约一半满足条件“开始时间>结束时间”。我不明白为什么会出现这种情况(所有开始时间数字似乎都小于结束时间数字)。有没有像我这样的新手不明白的潜在格式?我发布了数据集的剪贴。a1和a看起来都一样。我认为这里的问题是您没有指定参数
type
。您应该指定
type=“interval”
,我认为这里的默认设置是假设
type=“counting”
,我认为您不需要这样做。查看
Surv
的文档了解更多信息。