Warning: file_get_contents(/data/phpspider/zhask/data//catemap/2/sharepoint/4.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Pyspark AFT生存模型中的生存概率_Pyspark_Survival Analysis - Fatal编程技术网

Pyspark AFT生存模型中的生存概率

Pyspark AFT生存模型中的生存概率,pyspark,survival-analysis,Pyspark,Survival Analysis,我想知道如何使用AFTSurvivalRegression方法计算pyspark中的生存概率。我在网上看到过这个例子: 从pyspark.ml.regression导入生存回归后 从pyspark.ml.linalg导入向量 training=spark.createDataFrame([ (1.218,1.0,向量密度(1.560,-0.605)), (2.949,0.0,向量密度(0.346,2.158)), (3.627,0.0,向量密度(1.380,0.231)), (0.273,1.0

我想知道如何使用
AFTSurvivalRegression
方法计算pyspark中的生存概率。我在网上看到过这个例子:

从pyspark.ml.regression导入生存回归后
从pyspark.ml.linalg导入向量
training=spark.createDataFrame([
(1.218,1.0,向量密度(1.560,-0.605)),
(2.949,0.0,向量密度(0.346,2.158)),
(3.627,0.0,向量密度(1.380,0.231)),
(0.273,1.0,向量密度(0.520,1.151)),
(4.199,0.0,向量密度(0.795,-0.226)),[“标签”、“审查”、“特征”])
量化概率=[0.3,0.6]
aft=生存后回归(量化概率=量化概率,
quantilesCol=“分位数”)
型号=后安装(培训)
#打印AFT生存回归的系数、截距和比例参数
打印(“系数:+str(模型系数))
打印(“截距:+str(截距模型))
打印(“比例:+str(模型比例))
model.transform(training).show(truncate=False)

但有了这个,我只能预测存活时间。我也可以得到分位数概率,但我不知道它们是如何工作的。我的问题是如何得到一个人在特定时间存活的概率?

我不是一个蟒蛇主义者,但我在几年前为一个提问者回答了这个问题:我想象你有能力生成一个均匀空间分位数的向量,然后得到每个分位数的预测时间。如果是这样,那么您应该能够遵循以下R代码作为大纲: