统计分析方法总结

时间:2024.5.19

统计分析方法总结

1.连续性资料

1.1 两组独立样本比较

1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。

1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态

分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。

1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,

如Wilcoxon检验。

1.2 两组配对样本的比较

1.2.1 两组差值服从正态分布,采用配对t检验。

1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。

1.3 多组完全随机样本比较

1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如

果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-

Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。

1.4 多组随机区组样本比较

1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检

验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。

****需要注意的问题:

(1) 一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检

验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。

(2) 当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其

他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**

(3) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但

不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。

2.分类资料

2.1 四格表资料

2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。

2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的

检验或Fisher’s确切概率法检验。

2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。

2.2 2×C表或R×2表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5

的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。

2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的

Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。

2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采

用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.3 R×C表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5

的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。

2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的

Pearson 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。

2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则

可采用普通的Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用

行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。

2.4 配对分类资料的统计分析

2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对

+c<40,则用校正的配对 检验。

检验。(2)一致性检 检验。(2)b2.4.1 C×C资料,(1)配对比较:用McNemar配对

验,用Kappa检验

在SPSS软件相关分析中,pearson(皮尔逊), kendall(肯德尔)和spearman(斯伯曼/斯皮尔曼)三种相关分析方法有什么异同

两个连续变量间呈线性相关时,使用Pearson积差相关系数,不满足积差相关分析的适用条件时,使用Spearman秩相关系数来描述.

Spearman相关系数又称秩相关系数,是利用两变量的秩次大小作线性相关分析,对原始变量的分布不作要求,属于非参数统计方法,适用范围要广些。对于服从Pearson相关系数的数据亦可计算Spearman相关系数,但统计效能要低一些。Pearson相关系数的计算公式可以完全套用Spearman相关系数计算公式,但公式中的x和y用相应的秩次代替即可。

Kendall's tau-b等级相关系数:用于反映分类变量相关性的指标,适用于两个分类变量均为有序分类的情况。对相关的有序变量进行非参数相关检验;取值范围在-1-1之间,此检验适合于正方形表格;

计算积距pearson相关系数,连续性变量才可采用;计算Spearman秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据; 计算Kendall秩相关系数,适合于定序变量或不满足正态分布假设的等间隔数据。

计算相关系数:当资料不服从双变量正态分布或总体分布未知,或原始数据用等级表示时,宜用 spearman或kendall相关

Pearson 相关复选项 积差相关计算连续变量或是等间距测度的变量间的相关分析

Kendall 复选项 等级相关 计算分类变量间的秩相关,适用于合并等级资料

Spearman 复选项 等级相关计算斯皮尔曼相关,适用于连续等级资料 注:

1若非等间距测度的连续变量 因为分布不明-可用等级相关/也可用Pearson 相关,对于完全等级离散变量必用等级相关

2当资料不服从双变量正态分布或总体分布型未知或原始数据是用等级表示时,宜用 Spearman 或 Kendall相关。

3 若不恰当用了Kendall 等级相关分析则可能得出相关系数偏小的结论。则若不

恰当使用,可能得相关系数偏小或偏大结论而考察不到不同变量间存在的密切关系。对一般情况默认数据服从正态分布的,故用Pearson分析方法。

在SPSS里进入Correlate-》Bivariate,在变量下面Correlation Coefficients复选框组里有3个选项:

Pearson

Kendall's tau-b

Spearman:Spearman

spearman(斯伯曼/斯皮尔曼)相关系数

斯皮尔曼等级相关是根据等级资料研究两个变量间相关关系的方法。它是依据两列成对等级的各对等级数之差来进行计算的,所以又称为“等级差数法” 斯皮尔曼等级相关对数据条件的要求没有积差相关系数严格,只要两个变量的观测值是成对的等级评定资料,或者是由连续变量观测资料转化得到的等级资料,不论两个变量的总体分布形态、样本容量的大小如何,都可以用斯皮尔曼等级相关来进行研究

Kendall's相关系数

肯德尔(Kendall)W系数又称和谐系数,是表示多列等级变量相关程度的一种方法。适用这种方法的数据资料一般是采用等级评定的方法收集的,即让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物。等级评定法每个评价者对N件事物排出一个等级顺序,最小的等级序数为1 ,最大的为N,若并列等级时,则平分共同应该占据的等级,如,平时所说的两个并列第一名,他们应该占据1,2名,所以它们的等级应是1.5,又如一个第一名,两个并列第二名,三个并列第三名,则它们对应的等级应该是1,2.5,2.5,5,5,5,这里2.5是2,3的平均,5是4,5,6的平均。

肯德尔(Kendall)U系数又称一致性系数,是表示多列等级变量相关程度的一种方法。该方法同样适用于让K个评委(被试)评定N件事物,或1个评委(被试)先后K次评定N件事物所得的数据资料,只不过评定时采用对偶评定的方

法,即每一次评定都要将N个事物两两比较,评定结果如下表所示,表格中空白位(阴影部分可以不管)填入的数据为:若i比j好记1,若i比j差记0,两者相同则记0.5。一共将得到K张这样的表格,将这K张表格重叠起来,对应位置的数据累加起来作为最后进行计算的数据,这些数据记为γij。

正态分布的相关检验

对来自正态总体的两个样本进行均值比较常使用T检验的方法。T检验要求两个被比较的样本来自正态总体。两个样本方差相等与不等时用的计算T值的公式不同。

进行方差齐次性检验使用F检验。对应的零假设是:两组样本方差相等。P值小于0.05说明在该水平上否定原假设,方差不齐;否则两组方差无显著性差异。

U检验时用服从正态分布的检验量去检验总体均值差异情况的方法。在这种情况下总体方差通常是已知的。

虽然T检验法与U检验法所解决的问题大体相同,但在小样本(样本数n)=30作为大样本)且均方差未知的情况下就不能用U检验法了。

均值检验时不同的数据使用不同的统计量

使用MEANS过程求若干组的描述统计量,目的在于比较。因此必须分组求均值。这是与Descriptives过程不同之处。

检验单个变量的均值是否与给定的常数之间存在差异,用One-Sample T Test 单样本T检验过程。

检验两个不相关的样本是否来自来具有相同均值的总体,用

Independent-Samples T test 独立样本t检验过程。

如果分组样本不独立,用Paired Sample T test 配对t检验。

如果分组不止两个,应使用One-Way ANOVO一元方差分析(用于检验几个独立的组,是否来自均值相等的总体)过程进行单变量方差分析。

如果试图比较的变量明显不服从正态分布,则应该考虑使用一种非参数检验过程Nonparametric test.

如果用户相比较的变量是分类变量,应该使用Crosstabs功能。

当样本值不能为负值时用右侧单边检验。


第二篇:统计分析方法总结


统计分析方法总结

分享

首次分享者:郭郭 已被分享8次 评论(0)复制链接分享转载举报

1.连续性资料

1.1 两组独立样本比较

1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。

1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态

分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。

1.1.3 资料方差不齐,(1)采用Satterthwate的t’检验;(2)采用非参数检验,

如Wilcoxon检验。

1.2 两组配对样本的比较

1.2.1 两组差值服从正态分布,采用配对t检验。

1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。

1.3 多组完全随机样本比较

1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如

果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-

Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。

1.4 多组随机区组样本比较

1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如

果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检

验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。

****需要注意的问题:

(1) 一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检

验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。

(2) 当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其

他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意

两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**

(3) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但

不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。

2.分类资料

2.1 四格表资料

2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson

检验或Fisher’s确切概率法检验。

2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。

2.2 2×C表或R×2表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5

的格子数目<总格子数目的25%,则用普通的Pearson

确切概率法检验。

2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的

Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。

2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采

用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.3 R×C表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5

的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。

2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的

Pearson 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。

2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则

可采用普通的Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用

行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s检验。 2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的

差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。

2.4 配对分类资料的统计分析

2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对

c<40,则用校正的配对

用Kappa检验。

检验。(2)b+检验。 检验。(2)一致性检验,2.4.1 C×C资料,(1)配对比较:用McNemar配对

更多相关推荐:
中国建筑业协会_20xx年建筑业发展统计分析

(建筑时报20xx年x月x日)20xx年建筑业发展统计分析住房和城乡建设部计划财务与外事司中国建筑业协会一、20xx年建筑业基本情况20xx年,在国家积极财政政策的推动下,建设领域投资规模不断扩大,建筑业呈现良…

朔黄铁路机车监控统计分析系统的功能及应用-张朝辉

朔黄铁路机车监控统计分析系统的功能及应用张朝辉朔黄铁路机辆分公司河北省肃宁县062350摘要:利用机车监控记录装置的原始数据、做为统计数据采集发展的方向,实现资源共享。为此,“机车监控统计分析系统”的开发及使用…

关于做好“质检科技资源管理与统计分析系统”数据录入上报工作的通知

关于开展“质检科技资源管理与统计分析系统”数据录入上报工作的通知各县市区质量技术监督局,市局各直属技术机构:为贯彻落实支树平局长在福建信息化工作会议上的讲话精神,进一步加强质检科技信息化管理,国家质检总局科技司…

小学20xx教育技术装备统计分析报告

20xx年教育技术装备统计分析报告一、学校基本概况我校位于新疆乌鲁木齐市火车西站西园街186号,有学生1172名,23个班级,教职工60人。二、装备配备情况1、实验教学人员基本情况我校有3名实验教学人员,其中1…

党内统计分析报告

####煤矿委员会20##年度党内统计分析报告根据##煤公司组织部要求,##煤矿党委于20##年x月对矿党组织和党员的基本情况进行了统计汇总。20##年我矿党建工作在发展党员工作力度、结构布局和积极分子培养等方…

20xx年1-8月永定县金腾大酒店生产安全事故统计分析 文档

20xx年1-8月永定县金腾大酒店生产安全事故统计分析一、8月份事故情况截至8月x日,全店共发生各类生产安全事故5起,主要是:(一)、三楼消防管道跑水事件,无人员伤亡;(二)、停电事件,因县城区域停电,店内发电…

[A] 20xx年临床路径统计分析与改进措施

20xx年临床路径实施情况统计分析和改进措施自20xx年x月起我院重新开展了临床路径实践工作,通过1年的实践,取得了一些成绩和经验,现总结汇报如下:一、工作开展情况及成效1.建立临床路径管理小组,健全工作制度。…

统计分析方法总结

统计分析方法总结分享首次分享者:郭郭已被分享8次评论(0)复制链接分享转载举报1.连续性资料1.1两组独立样本比较1.1.1资料符合正态分布,且两组方差齐性,直接采用t检验。1.1.2资料不符合正态分布,(1)…

统计分析方法总结

单变量统计分析方法总结一、计量资料1.两组独立样本比较1.1资料符合正态分布,且两组方差齐性,及独立性,可直接采用t检验。1.2资料不符合正态分布(1)数据转换(如对数转换等)→使之服从正态分布→转换后的数据采…

统计分析方法总结

1连续性资料1.1两组独立样本比较1.1.1资料符合正态分布,且两组方差齐性,直接采用t检验。1.1.2资料不符合正态分布:(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(…

统计分析方法总结

统计分析方法总结1.连续性资料1.1两组独立样本比较1.1.1资料符合正态分布,且两组方差齐性,直接采用t检验。1.1.2资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的…

饭店月度经营数据统计分析报告

饭店月度经营数据统计分析报告●月度评述总体来看,5月份全国饭店市场经营情况略逊于4月份,五星级酒店、四星级酒店及三星级酒店共同呈现小幅度下滑趋势。饭店三项主要经营指标均有不同程度下降,客房收入比出现滑落,餐饮收…

统计分析(78篇)