桂林电子科技大学
数学与计算科学学院实验报告
第二篇:2_2列联表资料的统计分析与SAS软件实现
?678?中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7
MedicalStatistics 医学统计学
2×2列联表资料的统计分析与SAS软件实现
胡良平,王琪
军事医学科学院生物医学统计学咨询中心,北京100850
关键词:统计学;医学;数据分析,统计;定性资料;SAS软件
HuLP,WangQ.JChinIntegrMed.2009;7(7):6782682.
ReceivedMay31,2009;acceptedJune10,2009J,Indexed/abstractedinandfulltext:ZhongXiYiJieHeXueBao.Freefulltext(HTMLcom.ForwardlinkingDOI:10.3736/OpenAccess
StatisticalanalysisusingSASsoftwarepackagefordataof2×2contingencytable
Liang2pingHU,QiWANG
ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China
Keywords:statistics;medicine;dataanalysis,statistical;qualitativedata;SASsoftware
定性资料常以列联表形式呈现出来,通常分为2×2表、2×C表和R×2表、R×C表和高维列联表。本文结合科研中的部分实例,介绍4种2×2列联表资料并用SAS实现其资料的统计分析。1 横断面研究设计的2×2表资料
分析资料所需要的SAS程序:
datay;doA=1to2;doB=1to2;inputF@@;output;
end;end;cards;3425131381;
procfreq;weightF;
tablesA3B/CHISQ;run;
横断面研究设计的2×2表资料是指在某个时间断面(时点或很短时间内)进行调查或实验研究时,对一组受试对象同时按两个定性变量来划分,每个定性变量都只有两个水平,通常一个为原因变量,另一个为结果变量,其目的是了解某个时间点的现状[1]。 例1 多发伤的诊断对临床医师来说是最棘手的问题之一,容易发生漏诊。将医师按资历分为两组,比较两组医师的骨折漏诊情况,资料见表1[2]。
表1 接诊医师的资历与骨折漏诊情况
医师资历
3年以下3年以上
运行结果:
A×B表的统计量
统计量
卡方
似然比卡方连续校正卡方
Mantel2Haenszel卡方Phi系数列联系数
CramerV统计量
自由度
1111
值概率
3.86670.04933.80050.05123.36330.06673.86120.04940.07450.07430.0745
例数
漏诊情况:
漏诊
343165
未漏诊
251381632
合计
285412697
合计
Correspondence:Prof.Liang2pingHU;Tel:010266931130;E2mail:lphu812@sina.com
中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7?679?
procfreq;weightF;
tablesA3B/CHISQCMH;run;
Fisher精确检验
datay;
340.98140.03410.01560.0630
doA=1to2;doB=1to2;inputF@@;output;
end;end;cards;39101;
单元格(1,1)频数(F)
左侧Pr<=F右侧Pr>=F表概率(P)双侧Pr<=P
2
由于χ=3.8667,P=0.0493,似乎表明两组不同资历医师的骨折漏诊情况不同,即3年以下医师资历的接诊医师的漏诊率(11.9%)大于3年以上医师资历的接诊医师(7.5%)。
2
但这样下结论是不够科学严谨的!因为χ检
2
验所依赖的理论依据是χ分布, :
似然比卡方连续校正卡方
Mantel2Haenszel卡方Phi系数列联系数
CramerV统计量
自由度
1111
值
10.144911.29437.64029.7038-0.66410.5553-0.6641
概率
0.00140.00080.00570.0018
。,也没有小于5的理论频数,但计算所得到的检验统计量值刚超过最低临界
2
值3.841,此时,应以校正χ检验结果或Fisher精
2
确检验结果为准,即校正χ=3.3633,P=0.0667;或采用Fisher精确检验结果P=0.063。
25%的单元格的期望计数比5小,卡方可能不是有效检验。
对本例而言,正确的专业结论是:虽然3年以下医师资历的接诊医师的漏诊率(11.9%)大于3年以上医师资历的接诊医师(7.5%),但二者之间的差异没有统计学意义,可认为其漏诊率基本相同。2 队列研究设计的2×2表资料
Fisher精确检验
单元格(1,1)频数(F)
左侧Pr<=F右侧Pr>=F表概率(P)双侧Pr<=P
30.00220.99990.00210.0028
队列研究设计的2×2表资料是依据专业知识,通过对不同暴露水平的对象进行追踪观察,确定其疾病发生情况,从而分析暴露因素与疾病发生之间的因果关系。它是由因溯果的分析性研究设计,是论证疾病的可疑原因是否的确为致病原因的一种重要研究方法。
例2 为探讨保守治疗掌侧Barton骨折的指征和预后,保守治疗23例掌侧Barton骨折患者,按复位满意与否分为两组,追踪观察7个月,观察术后并发症即创伤性关节炎的发生情况,资料见表2[3]。
表2 创伤性关节炎与复位结果的比较
组别复位满意
复位不满意合计
例数
创伤性关节炎无创伤性关节炎
31013
9110
因n<40且小于5的理论频数的个数超过总格子数的1/5,所以应选用Fisher精确检验,P=0.0028。说明复位满意与否和是否患创伤性关节炎有关。复位满意者创伤性关节炎发生比例低。A×B表的汇总统计量如下。
Cochran2Mantel2Haenszel统计量(基于表得分)统计量
123
对立假设非零相关
行均值得分差值自由度
111
值
9.70389.70389.7038
概率
0.00180.00180.0018
普通相对风险的估计值(行1/行2)
合计
121123
研究类型案例对照(优比)
Cohort(第1列风险)Cohort
(2)
Logit
方法
Mantel2HaenszelMantel2HaenszelLogit
Mantel2HaenszelLogit
值
0.03330.03330.27500.27508.25008.2500
95%置信限0.00290.00290.10140.10141.23751.2375
0.38080.38080.74580.745854.998254.9982
分析资料所需要的SAS程序:
?680?中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7
本例关心的结果是“复位是否满意的患者创伤性关节炎发生频率之间的差异有无统计学意义”,其
对应的相对危险度(relativerisk,RR)应看第1列风险所对应的结果。RR=0.2750,即复位满意组创伤性关节炎发生频率是复位不满意组创伤性关节炎发生频率的0.2750倍,总体RR的95%置信区间为[0.1014,0.7458]。
若在SAS程序中将两行数据交换,则对应的RR=3.6364,其95%置信区间为[1.3409,9.8614],
运行结果:
A×B表的统计量
统计量
似然比卡方
连续校正卡方
Mantel2Haenszel卡方Phi系数列联系数
CramerV统计量
自由度
111
值
10.75169.934910.6294-0.16660.1643-0.1666
概率
0.00100.00160.0011
即复位不满意组创伤性关节炎发生频率是复位满意组创伤性关节炎发生频率的3.6364倍,总体RR的95%置信区间为[1.3409,9.4]3 ×(1,1))
<=>=F表概率(P)双侧Pr<=P
41
7.791×10-40.99974.318×10-40.0016
疾病的发生有无影响及其影响程度时,针对某因素从部分病人发病之后开始调查,将病人设为病例组,并选择与病例组具有可比性的未患此病的非病人或患其他病的人作为对照组,分别调查这两组人暴露于可疑致病因素的情况。如果将病例与对照进行个体配对,那么就是配对病例对照研究资料;如果未进行配对,那就是成组病例对照研究。在成组病例对照研究中,两组样本含量可以不相等。
例3 为探讨原发性闭角型青光眼的危险因素,192例原发性闭角型青光眼患者进入病例组,以年龄、性别作为匹配条件,选择有其他眼部疾患的
2
192例患者作为对照组,通过χ检验比较原发性闭角型青光眼病例组与对照组在生活行为习惯等方面的差异,资料见表3[4]。
表3 是否患原发性闭角型青光眼与
看电视距离远近之间的关系
看电视距离(m)
>3
<3
123
χ2=10.6572,P=0.0011,说明两行的频数
分布不同,也就是说看电视距离远近与是否患原发性闭角型青光眼可能有关(因为是回顾性调查研究,因果关系并非十分肯定)。采用Fisher精确检验得到的结果,P=0.0016,结论同上。A×B表的汇总统计量如下。
Cochran2Mantel2Haenszel统计量(基于表得分)统计量
对立假设非零相关
行均值得分差值一般关联
自由度
111
值
10.629410.629410.6294
概率
0.00110.00110.0011
普通相对风险的估计值(行1/行2)
研究类型案例对照(优比)
Cohort(第1列风险)Cohort
(第2列风险)
Logit
Mantel2HaenszelLogit
Mantel2HaenszelLogit
方法
Mantel2Haenszel
值95%置信限
0.47320.30070.74460.47320.30070.74460.66780.51210.87080.66780.51210.87081.41121.16221.71351.41121.16221.7135
病例
41151192
例数对照
70122192
合计
111273384
合计
分析资料所需要的SAS程序:
datay;
doA=1to2;doB=1to2;inputF@@;output;
end;end;cards;4170151122procfreq;weightF;
tablesA3B/CHISQCMH;run;
关于优势比(oddsrate,OR)是否等于1的假
2
设检验结果为χ=10.6294,P=0.0011,说明总体OR≠1。因为本例属于病例对照研究设计,看上表“普通相对风险的估计值(行1/行2)”前两行的结果,OR=0.4732,其95%置信区间为[0.3007,0.7446]。 专业结论:因OR=0.4732,其95%置信区间为[0.3007,0.7446],且对于“H0:总体OR=1”的假设检验结果为P<0.05,说明看电视距离>3m对患原发性闭角型青光眼具有一定的保护作用;换句话说,看电视距离<3m相对于看电视距离>3m
中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7?681?
的OR=1/0.4732=2.1133,即看电视距离<3m易导致原发性闭角型青光眼的可能性比看电视距离>3m大2.1133倍。
4 配对研究设计的2×2表资料
运行结果:
McNemar检验
统计量(S)
自由度
Pr>S
15.36361<0.0001
配对研究设计的2×2表资料是指按照配对原则分别接受两种不同的处理方法,每种处理方法的结果都可分为阳性和阴性两种,数出两种处理方法同时判定为阳性和阴性的频数以及它们结果不一致的频数,将结果列成配对设计的2×2表形式。 例4 为探讨脑钠肽(brainnatriureticpeptide,BNP)为金标准,将174血瘀证组BNP水平,BNP<100ng/L为非血瘀证组,BNP>100ng/L为血瘀证组,结果见表4[5]。
表4 脓毒症BNP与血瘀证金标准诊断结果
BNP法
简单Kappa系数
Kappa
0.47540.06470.34860.6022
渐近标准误差
95%置信下限95%H0检验:Kappa=0
H0下的渐近标准误差
Z
0.07216.5959<0.0001<0.0001
单侧Pr>Z双侧Pr>|Z|
金标准:
人数
血瘀证非血瘀证
86995
354479
合计
12153174
血瘀证非血瘀证合计
这是用McNemarχ2检验计算的结果,χ2=
15.3636(此处使用的是未校正的计算公式),P<0.0001,说明两种方法在检验脓毒症血瘀证方面的差别有统计学意义。Kappa=0.4754(反映两种方法检测结果一致程度大小的统计量),其渐近标准误EKappa=0.0647,总体Kappa的95%置信区间为[0.3486,0.6022]。“H0:总体Kappa=0”的假设
因为19xx年北京血瘀证国际会议制订的血瘀证诊断参考标准是金标准,故该资料为特设金标准
的配对设计四格表资料。若原文的目的是为了比较两种检测方法不一致部分的频数之间的差别是否具有统计学意义,应选用配对设计定性资料的χ2检验,即McNemarχ2检验;若原文的目的是为了检验两种方法的诊断结果是否一致,则应采用一致性检验,即Kappa检验。 分析资料所需要的SAS程序:
datay;doA=1to2;doB=1to2;inputF@@;output;
end;end;cards;8635944;
procfreq;weightF;tablesA3B;testKappa;run;
检验结果为Z=6.5959,P<0.0001,说明两种方
法之间的检验一致率与期望一致率之间的差别有统计学意义,即两种方法的检验结果具有较高的一致性。
专业结论之一:经差异性检验可知,两种检测方法之间不一致部分的差别有统计学意义,说明BNP法检测结果假阳性率很高。 专业结论之二:经一致性检验可知,BNP法与金标准在检测脓毒症血瘀证方面具有较高的一致性。至于能否用BNP检测法取代金标准,需要提出专业要求,即BNP法检测结果与金标准的正确率应达到多大数值,本例中的正确率为74.71%[(86+44)/174×100%],相对来说,还是比较低的,可能不具有多大的实际意义。
REFERENCES
1 HuLP.Designofscientificresearchesandstatistical
analysisindentistry.Beijing:People’sMilitaryMedicalPress.2007:1522163.Chinese.
变量A、B分别代表BNP法检测的结果和根据金标准检测的结果,1代表阳性,2代表阴性。
胡良平.口腔医学科研设计与统计分析.北京:人民军
医出版社.2007:1522163.
?682?中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7
2 LiQ,WangCQ,LiuG,LiK,DengJ,LuoKJ.
Analysisforcausesofmisseddiagnosisoffractureduringtreatmentofmultipletrauma.ZhongguoGuShang.2008;21(2):89290.Chinese.
JiangSY.Acase2controlstudyoffactorsassociatedwithprimaryangle2closureglaucoma.ZhonghuaYanKeZaZhi.2008;44(6):5032506.ChinesewithabstractinEnglish.
李青,王春庆,刘钢,李昆,邓进,罗开俭.多发伤救
治中骨折漏诊原因分析.中国骨伤.2008;21(2):892
90.
3 TangWJ,WangMY,GongXY,AnGS.Clinical
investigationofconservativetreatmentforvolarBartonfracture.ZhongguoGuShang.2008;21(5):3832385.ChinesewithabstractinEnglish.
庄勋,朱蓉嵘,管怀进,黄春华,施文平,姜声扬.原
发性闭角型青光眼相关因素的病例对照研究.中华眼科杂志.2008;44(6):5032506.
5 ChenY,ZhuL,QianYM.Diagnosticvalueofassayof
brainnatriureticpeptideinpatientswithsepsisofblood2stasissyndrome.JChinMed.2008;6(3):2662269.English.
汤文杰,王满宜,贡小英,安贵生.保守治疗掌侧
Barton骨折的临床探讨.中国骨伤.2008;5):385.
4 ZhuangX,Zhu,WP,
,...2008;6(3):2662
2009全国中西医结合周围血管疾病学术交流会报到通知
“2009全国中西医结合周围血管疾病学术交流会”拟定于20xx年10月在郑州召开,同时召开中国中西
医结合学会周围血管疾病专业委员会第七次换届会议。会议由中国中西医结合学会主办,周围血管疾病专业委员会承办,河南中医学院第一附属医院协办。会议主题为中西医结合周围血管疾病的新进展。现将会议有关事项通知如下。 1 会议安排 (1)会议日程:20xx年10月30日报到,20xx年10月31日~11月1日开会;(2)报到地点:河南明珠大酒店(河南省郑州市金水区人民路6号,河南中医学院第一附属医院对面);(3)会务费:每位参会者800元(含资料费、餐饮费等),住宿费回单位报销;(4)每位参会者授予国家级继续教育学分6分。 2 注意事项 (1)由于住宿紧张,务必在10月15日前寄回会议回执表(以邮戳为准),以便安排。(2)由飞机场到会址乘车路线:乘机场大巴到民航大酒店下车,换乘52路公交车,在工人新村下车,马路对面向北100m即到。需要接机者,请务必提前与会务组联系。(3)由火车站到会址乘车路线:由火车站乘坐1路电车(每位车费1元),到工人新村下车,向北100m即到,会议不在车站设接待处。(4)有会议发言者,请提前做好发言准备。(5)第七届周围血管疾病专业委员会的委员候选人请务必参会,否则视为自动放弃委员资格。
3 联系方式 联系人:崔公让(手机:133xxxxxxxx;E2mail:zhzhcgr@126.com),崔炎(手机:037166598866;办公室电话:0371266212427),马海涛(手机:139xxxxxxxx;E2mail:mahaitao6968@126.com);联系地址:郑州市人民路19号河南中医学院第一附属医院;邮政编码:450000。
中国中西医结合学会