R 从回归模型计算风险分数时,如何考虑分类变量?

R 从回归模型计算风险分数时,如何考虑分类变量?,r,regression,R,Regression,我有一个数据集,其中有许多变量,我想用它们来生成一个疾病风险评分 我已经创建了一个我正在尝试做的基本版本 数据集如下所示: ID DISEASE_STATUS AGE SEX LOCATION 1 1 20 1 FRANCE 2 0 22 1 GERMANY 3 0 24 0 ITALY 4 1 20 1 GERMANY

我有一个数据集,其中有许多变量,我想用它们来生成一个疾病风险评分

我已经创建了一个我正在尝试做的基本版本

数据集如下所示:

ID  DISEASE_STATUS  AGE  SEX  LOCATION
1   1               20   1    FRANCE
2   0               22   1    GERMANY
3   0               24   0    ITALY
4   1               20   1    GERMANY
5   1               20   0    ITALY
所以我运行的模型是:

glm(disease_status ~ age + sex + location, data=data, family=binomial(link='logit'))
该模型产生的β值如下:

bage = −0.193
bsex = −0.0497
blocation= 1.344
为了生成风险分数,我想将每个个体的值乘以β值,例如:

risk score = (-0.193 * 20 (age)) + (-0.0497 * 1 (sex)) + (1.344 * ??? (location))
但是,我将使用什么值将位置的beta分数乘以


谢谢大家!

你能在帖子中提供带有
dput
的data.frame吗?你能在帖子中提供带有
dput
的data.frame吗?