在医学科学研究中,经常会遇到因变量为二进制(二分法)数据(binary,dichotomous data),如疾病的发生或不发生、治愈或未愈、生存或死亡、取0和1的值等。同时,可能有多个自变量对因变量(或结果变量)产生影响,就可用二元Logistic回归进行分析,这一方法在医学流行病学研究中具有极广泛的应用。
〖例题〗某医生收集到一些血液病患者的资料,共包含11个变量,各变量的具体含义依次为:sex(性别逻辑回归算法,1-男,0-女)、age(年龄)、diag(诊断,1-CML,0-非CML)、pilot(预处理,1-TBI、0-非TBI)、gvhd(1-GNHD III~VI,0- GNHD 0~II)、igm(1-IgM阳性,0-IgM阴性)、trans(移植类型,1-P型,0-B型)、yufang(是否采取预防,1-预防,0-未预防)、xz(血症,1-有血症,0-无血症)、JB(疾病,1-患病,0-未患病)、sw(死亡与否,1-死亡,0-存活),试分析是否采取预防措施和巨细胞病毒病的关系。(说明:CML代表慢性粒细胞白血病;TBI代表照射;GVHD代表移植物抗宿主病;JB代表巨细胞病毒病)。
一、建立数据文件
注:在二元Logistic回归中,因变量必须为二进制变量(0,1),阳性结果(如患病、死亡、复发、转移等)为1,阴性结果为0。
详见《SPSS常用统计分析教程(SPSS 22.0中英文版)(第4版)》例题数据文件:hemopath.sav
二、二元Logistic回归
三、结果解释
1、模型系数综合检验(Omnibus Tests of Model Coefficients)表,模型卡方值为9.678,P=0.002
2、模型摘要(Model Summary)表,Cox & Snell R方以及Nagelkerke R方检验是回归方程的拟合优度检验,类似于线性回归的R方统计量,其数值大小反映方程对被解释变量变异解释的程度。这两个统计量常用于不同模型之间的比较,R方越大表明模型拟合效果越好。本例的Nagelkerke R方为0.129,Cox & Snell R方为0.173。
3、分类表(Classification Table)列出了观测值(Observed)与预测值(Predicted)的交叉表,参加建模的数据中逻辑回归算法,结局为“未患病”的判断正确率为77.4%(特异度),结局为“患病”的判断正确率为59.0%(灵敏度),对建模数据总的回判正确率为67.1%,这说明模型的预测效果不错(如果预概率大于50%,预测为良好,反之预测为不好)。
4、yufang(是否采取预防)的Wald值为8.758(P=0.0.03<0.01),按α=0.05水准,认为yufang(是否采取预防)与因变量jb(巨细胞病毒病)间的联系有统计学意义B=-1.595,表明的yufang是一个保护因素。估计优势比OR(EXP(B))及其95%CI为0.203(0.071,0.584)其95%CI小于1,可认为yufang是一个保护因素,采取预防措施的研究对象患巨细胞病毒病的优势是未采取预防措施的研究对象的0.203倍。
【作者介绍】李志辉,长期从事各类统计软件应用研究,主编或参编SPSS、MINITAB、STATISTICA多个统计软件教材共8本。代表作:电子工业出版社《SPSS常用统计分析教程(SPSS 22.0中英文版)(第4版)》(2015年)。
关注微信订阅号“一起学统计工具”(原名:一起学SPSS)后,回复关键词SPSS,可获取一起学统计工具学习资源包下载地址。
限时特惠:本站每日持续更新海量设计资源,一年会员只需29.9元,全站资源免费下载
站长微信:ziyuanshu688