数据分析统计方法的选择

时间:2024.5.2

数据分析的统计方法选择小结

完全随机分组设计的资料

一、

两组或多组计量资料的比较

1.两组资料:

1)大样本资料或服从正态分布的小样本资料

(1)若方差齐性,则作成组t检验

(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验

2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验

2.多组资料:

1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。

2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。

二、

分类资料的统计分析

1.单样本资料与总体比较

1)二分类资料:

(1)小样本时:用二项分布进行确切概率法检验;

(2)大样本时:用U检验。

2)多分类资料:用Pearson ?2检验(又称拟合优度检验)。

2.

四格表资料

1)n>40并且所以理论数大于5,则用Pearson ?2

2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正 ?2或用Fisher’s 确切概率法检验

3)n???????40或存在理论数<1,则用Fisher’s 检验

3. 2×C表资料的统计分析

1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH ?2或成组的Wilcoxon秩和检验

2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势?2检验

3)行变量和列变量均为无序分类变量

(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson ?2

(2)n???????40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验

4. R×C表资料的统计分析

1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH ?2或Kruskal Wallis的秩和检验

2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH ?2

3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析

4)列变量和行变量均为无序多分类变量,

(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson ?2

(2)n???????40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验

三、

Poisson分布资料

1.单样本资料与总体比较:

1)观察值较小时:用确切概率法进行检验。

2)观察值较大时:用正态近似的U检验。

2.两个样本比较:用正态近似的U检验。

配对设计或随机区组设计

四、

两组或多组计量资料的比较

1.两组资料:

1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验

2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验

2.多组资料:

1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。

2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。

五、

分类资料的统计分析

1.四格表资料

1)b+c>40,则用McNemar配对 ?2检验或配对边际?2检验

2)b+c???????40,则用二项分布确切概率法检验

2.C×C表资料:

1)配对比较:用McNemar配对 ?2检验或配对边际?2检验

2)一致性问题(Agreement):用Kap检验

变量之间的关联性分析

六、

两个变量之间的关联性分析

1.两个变量均为连续型变量

1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析

2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析

2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析

3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析

七、

回归分析

1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。

2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。

1)非配对的情况:用非条件Logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

2)配对的情况:用条件Logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

八、

生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)

1.用Kaplan-Meier方法估计生存曲线

2.大样本时,可以寿命表方法估计

3.单因素可以用Log-rank比较两条或多条生存曲线

4.多个因素时,可以作多重的Cox回归

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用


第二篇:[DOC] 附录 数据分析的统计方法选择小结


数据分析的统计方法选择小结

完全随机分组设计的资料

一、 两组或多组计量资料的比较

1.两组资料:

1)大样本资料或服从正态分布的小样本资料

(1)若方差齐性,则作成组t检验

(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验

2)小样本偏态分布资料,则用成组的Wilcoxon秩和检验

2.多组资料:

1)若大样本资料或服从正态分布,并且方差齐性,则作完全随机的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。

2)如果小样本的偏态分布资料或方差不齐,则作Kruskal Wallis的统计检验。如果Kruskal Wallis的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用成组的Wilcoxon秩和检验,但用Bonferroni方法校正P值等)进行两两比较。

二、 分类资料的统计分析

1.单样本资料与总体比较

1)二分类资料:

(1)小样本时:用二项分布进行确切概率法检验;

(2)大样本时:用U检验。

2)多分类资料:用Pearson ?2检验(又称拟合优度检验)。

2. 四格表资料

1)n>40并且所以理论数大于5,则用Pearson ?2

2)n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正 ?2或用Fisher’s 确切概率法检验

3)n?40或存在理论数<1,则用Fisher’s 检验

3. 2×C表资料的统计分析

1)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH ?2或成组的Wilcoxon秩和检验

2)列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势?2检验

3)行变量和列变量均为无序分类变量

(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson ?2

(2)n?40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验

4. R×C表资料的统计分析

21)列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH ?或Kruskal

Wallis的秩和检验

2)列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH ?2

3)列变量和行变量均为有序多分类变量,可以作Spearman相关分析

4)列变量和行变量均为无序多分类变量,

(1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson ?

(2)n?40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验

三、 Poisson分布资料

1.单样本资料与总体比较:

1)观察值较小时:用确切概率法进行检验。

2)观察值较大时:用正态近似的U检验。

2.两个样本比较:用正态近似的U检验。 2

配对设计或随机区组设计

四、 两组或多组计量资料的比较

1.两组资料:

1)大样本资料或配对差值服从正态分布的小样本资料,作配对t检验

2)小样本并且差值呈偏态分布资料,则用Wilcoxon的符号配对秩检验

2.多组资料:

1)若大样本资料或残差服从正态分布,并且方差齐性,则作随机区组的方差分析。如果方差分析的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:LSD检验,Bonferroni检验等)进行两两比较。

2)如果小样本时,差值呈偏态分布资料或方差不齐,则作Fredman的统计检验。如果Fredman的统计检验为有统计学意义,则进一步作统计分析:选择合适的方法(如:用Wilcoxon的符号配对秩检验,但用Bonferroni方法校正P值等)进行两两比较。

五、 分类资料的统计分析

1.四格表资料

1)b+c>40,则用McNemar配对 ?检验或配对边际?检验

2)b+c?40,则用二项分布确切概率法检验

2.C×C表资料:

1)配对比较:用McNemar配对 ?2检验或配对边际?2检验

2)一致性问题(Agreement):用Kap检验 22

变量之间的关联性分析

六、 两个变量之间的关联性分析

1.两个变量均为连续型变量

1)小样本并且两个变量服从双正态分布,则用Pearson相关系数做统计分析

2)大样本或两个变量不服从双正态分布,则用Spearman相关系数进行统计分析

2.两个变量均为有序分类变量,可以用Spearman相关系数进行统计分析

3.一个变量为有序分类变量,另一个变量为连续型变量,可以用Spearman相关系数进行统计分析

七、 回归分析

1.直线回归:如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,则直线回归(单个自变量的线性回归,称为简单回归),否则应作适当的变换,使其满足上述条件。

2.多重线性回归:应变量(Y)为连续型变量(即计量资料),自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。如果回归分析中的残差服从正态分布(大样本时无需正态性),残差与自变量无趋势变化,可以作多重线性回归。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

3.二分类的Logistic回归:应变量为二分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。

1)非配对的情况:用非条件Logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

2)配对的情况:用条件Logistic回归

(1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

(2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

4.有序多分类有序的Logistic回归:应变量为有序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

5.无序多分类有序的Logistic回归:应变量为无序多分类变量,自变量(X1,X2,…,Xp)可以为连续型变量、有序分类变量或二分类变量。

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

八、 生存分析资:要求资料记录结局和结局发生的时间(如;死亡和死亡发生的时间)

1.用Kaplan-Meier方法估计生存曲线

2.大样本时,可以寿命表方法估计

3.单因素可以用Log-rank比较两条或多条生存曲线

4.多个因素时,可以作多重的Cox回归

1)观察性研究:可以用逐步线性回归寻找(拟)主要的影响因素

2)实验性研究:在保持主要研究因素变量(干预变量)外,可以适当地引入一些其它可能的混杂因素变量,以校正这些混杂因素对结果的混杂作用

更多相关推荐:
如何撰写统计分析报告

如何撰写统计分析统计分析是以统计资料为依据以统计方法为手段定量分析与定性分析相结合去认识事物的一种分析研究活动是统计工作的最后阶段也是展示统计工作成绩提升统计地位的重要窗口统计分析的一项重要作用就是为党政决策企...

统计分析报告

【目录】一.引言二.研究目的三.数据分析I.对能源生产及构成的分析I.1.基于excel对能源生产及构成的简单分析I.2.基于spss对能源生产及构成的有关分析I.2.a.相关分析I.2.b.回归分析II.对能…

数据统计分析评价报告

数据统计分析评价报告编号DZXXJL122统计分析部门督导室编制审批日期20xx年12月20日

统计数据分析报告(范本)

统计数据分析报告范本摘要题青少年社会调查正文中国拥有世界上最为庞大的青少年人口群体统计表明20xx年中国1435岁人口有465亿占总人口的3625对于任何社会来说青少年都是民族的未来与希望中国社会正处于改革开放...

物流数据统计分析报告

20xx年物流配送统计分析报告一20xx年度物流数据120xx年物流总量汇总20xx年运输总量为79016吨由于20xx年物流数据统计不全无法对比2萘系羧酸占比表1萘系羧酸占比表萘系全年占比均值66羧酸全年占比...

统计分析报告

关于Wentworth医疗中心的数据统计分析报告管理实验班周义为管理报告1利用描述统计学方法汇总这两部分研究的数据关于抑郁症的得分你的初步观察的结果是什么2对于两个数据集使用方差分析方法在每种情况下陈述需要进行...

20xx-20xx年中国派克笔芯行业统计数据分析预测报告

20xx20xx年中国派克笔芯行业统计数据分析预测报告报告链接yjbgqghyqt20xx0331308917html正文目录第一章派克笔芯行业发展概述1第一节派克笔芯行业定义1一派克笔芯定义1二派克笔芯应用3...

数据整理与分析实验报告

浙江万里学院实验报告课程名称20xx20xx学年第一学期统计实验实验名称数据整理与数据分析专业班级姓名学号实验日期专业班级姓名学号实验日期专业班级姓名学号实验日期4姓名实验日期6

sas统计分析报告

统计软件报告聚类分析和方差分析在统计学成绩分析中的应用班级精算0801班姓名张倪学号20xx111500报告时间20xx年11月指导老师郝际贵成绩1目录一背景及数据来源1二描述性统计分析2三聚类分析4四方差分析...

分析报告、统计分析和数据挖掘的区别

分析报告统计分析和数据挖掘的区别分析报告给你后见之明hindsight统计分析给你先机foresight数据挖掘给你洞察力insight举个例子说你看到孙悟空跟二郎神打仗然后写了个分析报告说孙悟空在柔韧性上优势...

统计学调查分析报告

问卷调查统计分析报告一制订调查方案调查日期20xx年6月2日调查主题图书馆利用状况调查对象广工大龙洞校区管理学院学生调查目的通过对这些不同年级的学生到图书馆的频率以及对图书馆的意见来分析本校区图书馆的利用情况我...

统计学调查分析报告

一调查研究方案的设计与组织实施一调查目的1描述和反映本校经济管理学院10级会计系经济系和人力资源系学生对于毕业去向的意向分析并研究各意向的分布情况2在系别性别家庭因素个人因素等方面对毕业意向的分布进行研究探究这...

数据统计分析报告(38篇)