SAS:不同于PROC FREQ&;过程物流

SAS:不同于PROC FREQ&;过程物流,sas,logistic-regression,Sas,Logistic Regression,我正在做一个项目,遇到了一个预期的问题。在对我的数据运行PROC LOGISTIC后,我注意到一些优势比和回归系数似乎与它们应该是的相反。在使用PROC FREQ运行优势比进行一些调查之后,我相信PROC LOGISTIC的优势比存在某种形式的错误 下面的例子是响应变量“MonthStay”和其中一个变量“KennelCough”MonthStay=Y,感兴趣的事件是KennelCough=N 我不知道如何纠正这个可疑的错误。我的代码中是否缺少获得正确计算的内容?还是我完全误解了发生了什么?谢谢

我正在做一个项目,遇到了一个预期的问题。在对我的数据运行PROC LOGISTIC后,我注意到一些优势比和回归系数似乎与它们应该是的相反。在使用PROC FREQ运行优势比进行一些调查之后,我相信PROC LOGISTIC的优势比存在某种形式的错误

下面的例子是响应变量“MonthStay”和其中一个变量“KennelCough”MonthStay=Y,感兴趣的事件是KennelCough=N

我不知道如何纠正这个可疑的错误。我的代码中是否缺少获得正确计算的内容?还是我完全误解了发生了什么?谢谢

以下是PROC FREQ代码和结果:

proc freq data = capstone.adopts_dog order = freq;
tables KennelCough*MonthStay / relrisk;
run;

以下是过程逻辑代码和结果:

proc logistic data = capstone.adopts_dog plots(only)=(roc(id=prob) effect); 

class Breed(ref='Chihuahua') Gender(ref='Female') 
Color(ref='Black') Source(ref='Stray') EvalCat(ref='TR') SNAtIn(ref='No')
FoodAggro(ref='Y') AnimalAggro(ref='Y') KennelCough(ref='Y') Dental(ref='Y') 
Fearful(ref='Y') Handling(ref='Y') UnderAge(ref='Y') InJuris(ref='Alameda County')
InRegion(ref='East Bay SPCA - Dublin') OutRegion(ref='East Bay SPCA - Dublin')
/ param=ref;

model MonthStay(event='Y') = Age Gender Breed Weight Color Source EvalCat SNatIn
NumBehvCond NumMedCond FoodAggro AnimalAggro KennelCough Dental Fearful 
Handling UnderAge Injuris InRegion OutRegion 

/ lackfit aggregate scale = none selection = backward rsquare;
output out = probdogs4 PREDPROBS=I reschi = pearson h = leverage;
run;

班级级别信息

优势比估计值


在Proc Freq中,您正在计算未调整的优势比,而在Proc后勤中,所有优势比都已针对逻辑回归模型中包含的协变量进行了调整

在Proc Freq中,您正在计算未调整的优势比,而在Proc后勤中,经过更多的思考和研究,我相信这个问题实际上可能是辛普森悖论!非常有趣的事情!经过更多的思考和研究,我相信这个问题实际上可能是辛普森悖论!非常有趣的事情!