Sas 使用Proc Logistic/Proc GAM

Sas 使用Proc Logistic/Proc GAM,sas,logistic-regression,gam,Sas,Logistic Regression,Gam,在我的数据集中,由不同范围表示的变量(如女性年龄带)被指定为15-20、20-25、25-30等等。但问题是,在数据不可用的地方,特定观察值被标记为“不可用”,这使得sas将此字段作为字符读取。所以我相信这将使得在逻辑回归中调用这个变量变得困难。此外,还有一些特定的分类字段,它们有3个不同的指示符0 1和2。但即使这些字段也有“不可用”标签。从技术上讲,我不能用零替换它们,因为零可能是一个有效值 有人能帮忙解决吗?这个问题比“不可用”更严重,因为“15-20”也会被解读为字符。但你不想用中间值来

在我的数据集中,由不同范围表示的变量(如
女性年龄带
)被指定为15-20、20-25、25-30等等。但问题是,在数据不可用的地方,特定观察值被标记为“不可用”,这使得sas将此字段作为字符读取。所以我相信这将使得在逻辑回归中调用这个变量变得困难。此外,还有一些特定的分类字段,它们有3个不同的指示符
0 1和2
。但即使这些字段也有“
不可用
”标签。从技术上讲,我不能用零替换它们,因为零可能是一个有效值


有人能帮忙解决吗?

这个问题比“不可用”更严重,因为“15-20”也会被解读为字符。但你不想用中间值来代替它们,因为这会让事情变得很奇怪。你没有XXX 17.5岁的人

我要做的是使用数据步骤将数据重新编码为均匀分布在每个年龄段内,并将“不可用”重新编码为


(对不起,我刚买了一台新电脑,正在等待新的SAS安装,所以现在无法显示代码)

您可以将其作为字符读入并手动重新编码,或者用空格替换数据中所有不可用的内容(查找/替换全部)