SAS软件实验二单描述统计分析

时间:2024.4.20

桂林电子科技大学

 数学与计算科学学院实验报告


第二篇:2_2列联表资料的统计分析与SAS软件实现


22列联表资料的统计分析与SAS软件实现

?678?中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7

MedicalStatistics 医学统计学

2×2列联表资料的统计分析与SAS软件实现

胡良平,王琪

军事医学科学院生物医学统计学咨询中心,北京100850

关键词:统计学;医学;数据分析,统计;定性资料;SAS软件

HuLP,WangQ.JChinIntegrMed.2009;7(7):6782682.

ReceivedMay31,2009;acceptedJune10,2009J,Indexed/abstractedinandfulltext:ZhongXiYiJieHeXueBao.Freefulltext(HTMLcom.ForwardlinkingDOI:10.3736/OpenAccess

StatisticalanalysisusingSASsoftwarepackagefordataof2×2contingencytable

Liang2pingHU,QiWANG

ConsultingCenterofBiomedicalStatistics,AcademyofMilitaryMedicalSciences,Beijing100850,China

Keywords:statistics;medicine;dataanalysis,statistical;qualitativedata;SASsoftware

  定性资料常以列联表形式呈现出来,通常分为2×2表、2×C表和R×2表、R×C表和高维列联表。本文结合科研中的部分实例,介绍4种2×2列联表资料并用SAS实现其资料的统计分析。1 横断面研究设计的2×2表资料

  分析资料所需要的SAS程序:

datay;doA=1to2;doB=1to2;inputF@@;output;

end;end;cards;3425131381;

procfreq;weightF;

tablesA3B/CHISQ;run;

  横断面研究设计的2×2表资料是指在某个时间断面(时点或很短时间内)进行调查或实验研究时,对一组受试对象同时按两个定性变量来划分,每个定性变量都只有两个水平,通常一个为原因变量,另一个为结果变量,其目的是了解某个时间点的现状[1]。  例1 多发伤的诊断对临床医师来说是最棘手的问题之一,容易发生漏诊。将医师按资历分为两组,比较两组医师的骨折漏诊情况,资料见表1[2]。

表1 接诊医师的资历与骨折漏诊情况

医师资历

3年以下3年以上

  运行结果:

A×B表的统计量

统计量

卡方

似然比卡方连续校正卡方

Mantel2Haenszel卡方Phi系数列联系数

CramerV统计量

自由度

1111

值概率

3.86670.04933.80050.05123.36330.06673.86120.04940.07450.07430.0745

例数

漏诊情况:

漏诊

343165

未漏诊

251381632

合计

285412697

合计

Correspondence:Prof.Liang2pingHU;Tel:010266931130;E2mail:lphu812@sina.com

22列联表资料的统计分析与SAS软件实现

中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7?679?

procfreq;weightF;

tablesA3B/CHISQCMH;run;

Fisher精确检验

datay;

340.98140.03410.01560.0630

doA=1to2;doB=1to2;inputF@@;output;

end;end;cards;39101;

单元格(1,1)频数(F)

左侧Pr<=F右侧Pr>=F表概率(P)双侧Pr<=P

2

  由于χ=3.8667,P=0.0493,似乎表明两组不同资历医师的骨折漏诊情况不同,即3年以下医师资历的接诊医师的漏诊率(11.9%)大于3年以上医师资历的接诊医师(7.5%)。

2

  但这样下结论是不够科学严谨的!因为χ检

2

验所依赖的理论依据是χ分布,  :

似然比卡方连续校正卡方

Mantel2Haenszel卡方Phi系数列联系数

CramerV统计量

自由度

1111

10.144911.29437.64029.7038-0.66410.5553-0.6641

概率

0.00140.00080.00570.0018

。,也没有小于5的理论频数,但计算所得到的检验统计量值刚超过最低临界

2

值3.841,此时,应以校正χ检验结果或Fisher精

2

确检验结果为准,即校正χ=3.3633,P=0.0667;或采用Fisher精确检验结果P=0.063。

 25%的单元格的期望计数比5小,卡方可能不是有效检验。

对本例而言,正确的专业结论是:虽然3年以下医师资历的接诊医师的漏诊率(11.9%)大于3年以上医师资历的接诊医师(7.5%),但二者之间的差异没有统计学意义,可认为其漏诊率基本相同。2 队列研究设计的2×2表资料

Fisher精确检验

单元格(1,1)频数(F)

左侧Pr<=F右侧Pr>=F表概率(P)双侧Pr<=P

30.00220.99990.00210.0028

  队列研究设计的2×2表资料是依据专业知识,通过对不同暴露水平的对象进行追踪观察,确定其疾病发生情况,从而分析暴露因素与疾病发生之间的因果关系。它是由因溯果的分析性研究设计,是论证疾病的可疑原因是否的确为致病原因的一种重要研究方法。

  例2 为探讨保守治疗掌侧Barton骨折的指征和预后,保守治疗23例掌侧Barton骨折患者,按复位满意与否分为两组,追踪观察7个月,观察术后并发症即创伤性关节炎的发生情况,资料见表2[3]。

表2 创伤性关节炎与复位结果的比较

组别复位满意

复位不满意合计

例数

创伤性关节炎无创伤性关节炎

31013

9110

  因n<40且小于5的理论频数的个数超过总格子数的1/5,所以应选用Fisher精确检验,P=0.0028。说明复位满意与否和是否患创伤性关节炎有关。复位满意者创伤性关节炎发生比例低。A×B表的汇总统计量如下。

Cochran2Mantel2Haenszel统计量(基于表得分)统计量

123

对立假设非零相关

行均值得分差值自由度

111

9.70389.70389.7038

概率

0.00180.00180.0018

普通相对风险的估计值(行1/行2)

合计

121123

研究类型案例对照(优比)

Cohort(第1列风险)Cohort

(2)

Logit

方法

Mantel2HaenszelMantel2HaenszelLogit

Mantel2HaenszelLogit

0.03330.03330.27500.27508.25008.2500

95%置信限0.00290.00290.10140.10141.23751.2375

0.38080.38080.74580.745854.998254.9982

  分析资料所需要的SAS程序:

22列联表资料的统计分析与SAS软件实现

?680?中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7

  本例关心的结果是“复位是否满意的患者创伤性关节炎发生频率之间的差异有无统计学意义”,其

对应的相对危险度(relativerisk,RR)应看第1列风险所对应的结果。RR=0.2750,即复位满意组创伤性关节炎发生频率是复位不满意组创伤性关节炎发生频率的0.2750倍,总体RR的95%置信区间为[0.1014,0.7458]。

  若在SAS程序中将两行数据交换,则对应的RR=3.6364,其95%置信区间为[1.3409,9.8614],

  运行结果:

A×B表的统计量

统计量

似然比卡方

连续校正卡方

Mantel2Haenszel卡方Phi系数列联系数

CramerV统计量

自由度

111

10.75169.934910.6294-0.16660.1643-0.1666

概率

0.00100.00160.0011

即复位不满意组创伤性关节炎发生频率是复位满意组创伤性关节炎发生频率的3.6364倍,总体RR的95%置信区间为[1.3409,9.4]3 ×(1,1))

<=>=F表概率(P)双侧Pr<=P

41

7.791×10-40.99974.318×10-40.0016

  疾病的发生有无影响及其影响程度时,针对某因素从部分病人发病之后开始调查,将病人设为病例组,并选择与病例组具有可比性的未患此病的非病人或患其他病的人作为对照组,分别调查这两组人暴露于可疑致病因素的情况。如果将病例与对照进行个体配对,那么就是配对病例对照研究资料;如果未进行配对,那就是成组病例对照研究。在成组病例对照研究中,两组样本含量可以不相等。

  例3 为探讨原发性闭角型青光眼的危险因素,192例原发性闭角型青光眼患者进入病例组,以年龄、性别作为匹配条件,选择有其他眼部疾患的

2

192例患者作为对照组,通过χ检验比较原发性闭角型青光眼病例组与对照组在生活行为习惯等方面的差异,资料见表3[4]。

表3 是否患原发性闭角型青光眼与

看电视距离远近之间的关系

看电视距离(m)

>3

<3

123

χ2=10.6572,P=0.0011,说明两行的频数  

分布不同,也就是说看电视距离远近与是否患原发性闭角型青光眼可能有关(因为是回顾性调查研究,因果关系并非十分肯定)。采用Fisher精确检验得到的结果,P=0.0016,结论同上。A×B表的汇总统计量如下。

Cochran2Mantel2Haenszel统计量(基于表得分)统计量

对立假设非零相关

行均值得分差值一般关联

自由度

111

10.629410.629410.6294

概率

0.00110.00110.0011

普通相对风险的估计值(行1/行2)

研究类型案例对照(优比)

Cohort(第1列风险)Cohort

(第2列风险)

Logit

Mantel2HaenszelLogit

Mantel2HaenszelLogit

方法

Mantel2Haenszel

值95%置信限

0.47320.30070.74460.47320.30070.74460.66780.51210.87080.66780.51210.87081.41121.16221.71351.41121.16221.7135

病例

41151192

例数对照

70122192

合计

111273384

合计

  分析资料所需要的SAS程序:

datay;

doA=1to2;doB=1to2;inputF@@;output;

end;end;cards;4170151122procfreq;weightF;

tablesA3B/CHISQCMH;run;

  关于优势比(oddsrate,OR)是否等于1的假

2

设检验结果为χ=10.6294,P=0.0011,说明总体OR≠1。因为本例属于病例对照研究设计,看上表“普通相对风险的估计值(行1/行2)”前两行的结果,OR=0.4732,其95%置信区间为[0.3007,0.7446]。  专业结论:因OR=0.4732,其95%置信区间为[0.3007,0.7446],且对于“H0:总体OR=1”的假设检验结果为P<0.05,说明看电视距离>3m对患原发性闭角型青光眼具有一定的保护作用;换句话说,看电视距离<3m相对于看电视距离>3m

22列联表资料的统计分析与SAS软件实现

中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7?681?

的OR=1/0.4732=2.1133,即看电视距离<3m易导致原发性闭角型青光眼的可能性比看电视距离>3m大2.1133倍。

4 配对研究设计的2×2表资料

  运行结果:

McNemar检验

统计量(S)

自由度

Pr>S

15.36361<0.0001

  配对研究设计的2×2表资料是指按照配对原则分别接受两种不同的处理方法,每种处理方法的结果都可分为阳性和阴性两种,数出两种处理方法同时判定为阳性和阴性的频数以及它们结果不一致的频数,将结果列成配对设计的2×2表形式。  例4 为探讨脑钠肽(brainnatriureticpeptide,BNP)为金标准,将174血瘀证组BNP水平,BNP<100ng/L为非血瘀证组,BNP>100ng/L为血瘀证组,结果见表4[5]。

表4 脓毒症BNP与血瘀证金标准诊断结果

BNP法

简单Kappa系数

Kappa

0.47540.06470.34860.6022

渐近标准误差

95%置信下限95%H0检验:Kappa=0

H0下的渐近标准误差

Z

0.07216.5959<0.0001<0.0001

单侧Pr>Z双侧Pr>|Z|

金标准:

人数

血瘀证非血瘀证

86995

354479

合计

12153174

血瘀证非血瘀证合计

  这是用McNemarχ2检验计算的结果,χ2=

15.3636(此处使用的是未校正的计算公式),P<0.0001,说明两种方法在检验脓毒症血瘀证方面的差别有统计学意义。Kappa=0.4754(反映两种方法检测结果一致程度大小的统计量),其渐近标准误EKappa=0.0647,总体Kappa的95%置信区间为[0.3486,0.6022]。“H0:总体Kappa=0”的假设

  因为19xx年北京血瘀证国际会议制订的血瘀证诊断参考标准是金标准,故该资料为特设金标准

的配对设计四格表资料。若原文的目的是为了比较两种检测方法不一致部分的频数之间的差别是否具有统计学意义,应选用配对设计定性资料的χ2检验,即McNemarχ2检验;若原文的目的是为了检验两种方法的诊断结果是否一致,则应采用一致性检验,即Kappa检验。  分析资料所需要的SAS程序:

datay;doA=1to2;doB=1to2;inputF@@;output;

end;end;cards;8635944;

procfreq;weightF;tablesA3B;testKappa;run;

检验结果为Z=6.5959,P<0.0001,说明两种方

法之间的检验一致率与期望一致率之间的差别有统计学意义,即两种方法的检验结果具有较高的一致性。

  专业结论之一:经差异性检验可知,两种检测方法之间不一致部分的差别有统计学意义,说明BNP法检测结果假阳性率很高。  专业结论之二:经一致性检验可知,BNP法与金标准在检测脓毒症血瘀证方面具有较高的一致性。至于能否用BNP检测法取代金标准,需要提出专业要求,即BNP法检测结果与金标准的正确率应达到多大数值,本例中的正确率为74.71%[(86+44)/174×100%],相对来说,还是比较低的,可能不具有多大的实际意义。

REFERENCES

1 HuLP.Designofscientificresearchesandstatistical

analysisindentistry.Beijing:People’sMilitaryMedicalPress.2007:1522163.Chinese.

  变量A、B分别代表BNP法检测的结果和根据金标准检测的结果,1代表阳性,2代表阴性。

  胡良平.口腔医学科研设计与统计分析.北京:人民军

医出版社.2007:1522163.

22列联表资料的统计分析与SAS软件实现

?682?中西医结合学报20xx年7月第7卷第7期 JournalofChineseIntegrativeMedicine,July2009,Vol.7,No.7

2 LiQ,WangCQ,LiuG,LiK,DengJ,LuoKJ.

Analysisforcausesofmisseddiagnosisoffractureduringtreatmentofmultipletrauma.ZhongguoGuShang.2008;21(2):89290.Chinese.

JiangSY.Acase2controlstudyoffactorsassociatedwithprimaryangle2closureglaucoma.ZhonghuaYanKeZaZhi.2008;44(6):5032506.ChinesewithabstractinEnglish.

  李青,王春庆,刘钢,李昆,邓进,罗开俭.多发伤救

治中骨折漏诊原因分析.中国骨伤.2008;21(2):892

90.

3 TangWJ,WangMY,GongXY,AnGS.Clinical

investigationofconservativetreatmentforvolarBartonfracture.ZhongguoGuShang.2008;21(5):3832385.ChinesewithabstractinEnglish.

  庄勋,朱蓉嵘,管怀进,黄春华,施文平,姜声扬.原

发性闭角型青光眼相关因素的病例对照研究.中华眼科杂志.2008;44(6):5032506.

5 ChenY,ZhuL,QianYM.Diagnosticvalueofassayof

brainnatriureticpeptideinpatientswithsepsisofblood2stasissyndrome.JChinMed.2008;6(3):2662269.English.

  汤文杰,王满宜,贡小英,安贵生.保守治疗掌侧

Barton骨折的临床探讨.中国骨伤.2008;5):385.

4 ZhuangX,Zhu,WP,

,...2008;6(3):2662

2009全国中西医结合周围血管疾病学术交流会报到通知

  “2009全国中西医结合周围血管疾病学术交流会”拟定于20xx年10月在郑州召开,同时召开中国中西

医结合学会周围血管疾病专业委员会第七次换届会议。会议由中国中西医结合学会主办,周围血管疾病专业委员会承办,河南中医学院第一附属医院协办。会议主题为中西医结合周围血管疾病的新进展。现将会议有关事项通知如下。  1 会议安排 (1)会议日程:20xx年10月30日报到,20xx年10月31日~11月1日开会;(2)报到地点:河南明珠大酒店(河南省郑州市金水区人民路6号,河南中医学院第一附属医院对面);(3)会务费:每位参会者800元(含资料费、餐饮费等),住宿费回单位报销;(4)每位参会者授予国家级继续教育学分6分。  2 注意事项 (1)由于住宿紧张,务必在10月15日前寄回会议回执表(以邮戳为准),以便安排。(2)由飞机场到会址乘车路线:乘机场大巴到民航大酒店下车,换乘52路公交车,在工人新村下车,马路对面向北100m即到。需要接机者,请务必提前与会务组联系。(3)由火车站到会址乘车路线:由火车站乘坐1路电车(每位车费1元),到工人新村下车,向北100m即到,会议不在车站设接待处。(4)有会议发言者,请提前做好发言准备。(5)第七届周围血管疾病专业委员会的委员候选人请务必参会,否则视为自动放弃委员资格。

  3 联系方式 联系人:崔公让(手机:133xxxxxxxx;E2mail:zhzhcgr@126.com),崔炎(手机:037166598866;办公室电话:0371266212427),马海涛(手机:139xxxxxxxx;E2mail:mahaitao6968@126.com);联系地址:郑州市人民路19号河南中医学院第一附属医院;邮政编码:450000。

中国中西医结合学会

更多相关推荐:
软件需求分析实验报告

计算机科学与技术学院实验报告电子版课程软件工程

实验1 《软件项目的需求分析》实验报告

软件工程实验报告实验1软件项目的需求分析学号班号姓名课程主讲教师张建国实验指导教师张建国提交日期20xx年11月11日软件需求规格说明书1引言11编写目的编写本文档的目的是根据系统分析工程师和客户沟通的结果对用...

需求分析实验报告

武汉理工大学学生实验报告书实验课程名称软件需求工程开课学院指导老师姓名学生姓名学生专业班级学年第学期实验课程名称软件需求工程实验课程名称软件需求工程

软件工程实验报告模板——需求分析

软件工程实验报告超市运营管理系统需求分析指导教师班级学生姓名学号完成日期运城学院计算机科学与技术系目录1系统需求概述111系统概述112系统功能需求12用例建模121确定系统范围和系统边界222参与者列表223...

软件需求分析实验

实验1软件功能描述与确认验证性实验一实验目的与要求针对常用软件如Word描述软件功能确认描述的正确性至少10个功能要求1两人或三人一组2严格按照实验报告格式编写3实验报告内容详实公正态度认真二实验环境1个人计算...

需求分析实验报告

软件工程实践报告计科121班杨光敏08123234一软件需求分析1实验目的学习图形工具软件VISIO掌握结构化需求分析方法熟练绘制数据流图学习快速原型工具的使用2基本要求1针对银行ATM系统进行需求分析工作了解...

需求分析实验报告

实验课程名称软件工程需求分析实验课程名称软件需求工程

需求分析与解决方案实验报告实验报告8

广东科学技术职业学院广州学院实验报告专业计算机应用班级成绩评定学号姓名合作者号教师签名实验8题目可视化建模基础三第8周星期第节

需求分析与解决方案实验报告实验报告6

广东科学技术职业学院广州学院实验报告专业计算机应用班级成绩评定学号姓名合作者号教师签名实验6题目可视化建模基础第6周星期第节

软件工程实验-需求分析

实验系统需求分析一目的与任务目的确定项目的可实施性在此基础上完成系统的逻辑功能模型的建立任务可采用不同的软件开发技术完成对项目的需求分析过程给出系统的逻辑功能模型数据字典以及规格说明书二内容要求与安排方式1实验...

需求分析与解决方案实验报告实验报告13

广东科学技术职业学院广州学院实验报告专业计算机应用班级成绩评定学号姓名合作者号教师签名实验13题目用户界面设计第13周星期第节

软件工程需求分析报告

1引言错误未定义书签11开发背景错误未定义书签软件开发背景计算机技术以及计算机网络技术为核心的信息科技的发展颠覆了原有世界的很多事物纸牌游戏也随着信息革命的大潮进入了20时代以前必须大家坐在一起才能够完成的事情...

软件需求分析实验报告(21篇)