医学统计学名词解释概念总结

时间:2024.3.31

医学统计学——纯概念复习提纲,给点建议吧,感觉全了。

名解

医学统计学: 是用统计学原理和方法研究生物医学问题的一门学科。他包括了研究设计、数据收集、整理、分析以及分析结果的正确解释和表达

统计描述:用统计指标、统计图表对资料的数量特征及分布规律进行客观的描述和表达。

统计推断:在一定的置信度和概率保证下,用样本信息推断总体特征:

①参数估计:用样本的指标去推断总体相应的指标

②假设检验:由样本的差异推断总体之间是否可能存在的差异

同质:一个总体中有许多个体,他们之所以共同成为人们研究的对象,必定存在共性,我们说一些个体处于同一总体,就是指他们大同小异,具有同质性。

总体(population)是根据研究目的确定的同质的观察单位的全体,更确切的说,是同质的所有观察单位某种观察值(变量值)的集合。总体可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。

样本:从总体中随机抽取部分观察单位,其测量结果的集合称为样本(sample)。样本应具有代表性。所谓有代表性的样本,是指用随机抽样方法获得的样本。

随机抽样:随机抽样(random sampling)是指按照随机化的原则(总体中每一个观察单位都有同等的机会被选入到样本中),从总体中抽取部分观察单位的过程。随机抽样是样本具有代表性的保证。

变异:在自然状态下,个体间测量结果的差异称为变异(variation)。变异是生物医学研究领域普遍存在的现象。严格的说,在自然状态下,任何两个患者或研究群体间都存在差异,其表现为各种生理测量值的参差不齐。

(1)计量资料:对每个观察单位用定量的方法测定某项指标量的大小,所得的资料称为计量资料(measurement data)。计量资料亦称定量资料、测量资料。.其变量值是定量的,表现为数值大小,一般有度量衡单位。

(2)计数资料:将观察单位按某种属性或类别分组,所得的观察单位数称为计数资料(count data)。计数资料亦称定性资料或分类资料。其观察值是定性的,表现为互不相容的类别或属性。

(3)等级资料:将观察单位按测量结果的某种属性的不同程度分组,所得各组的观察单位数,称为等级资料(ordinal data)。

概率:概率(probability)又称几率,是度量某一随机事件A发生可能性大小的一个数值,记为P(A),P(A)越大,说明A事件发生的可能性越大。0﹤P(A)﹤1。

频率:在相同的条件下,独立重复做n 次试验,事件A 出现了m 次,则比值m/n 称为随机事件A 在n 次试验中出现的频率(freqency)。当试验重复很多次时P(A)= m/n。

随机误差(random error)又称偶然误差,是指排除了系统误差后尚存的误差。它受多种因素的影响,使观察值不按方向性和系统性而随机的变化。误差变量一般服从正态分布。随机误差可以通过统计处理来估计。

抽样误差(sampling error )是指样本统计量与总体参数的差别。在总体确定的情况下,总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

系统误差:系统误差(systematic error)是指由于仪器未校正、测量者感官的某种偏差、医生掌握疗效标准偏高或偏低等原因,使观察值不是分散在真值的两侧,而是有方向性、系统性或周期性地偏离真值。系统误差可以通过实验设计和完善技术措施来消除或使之减少。

随机变量:随机变量(random variable)是指取指不能事先确定的观察结果。随机变量的具体内容虽然是各式各样的,但共同的特点是不能用一个常数来表示,而且,理论上讲,每个变量的取值服从特定的概率分布。

参数:参数(paramater)是指总体的统计指标,如总体均数、总体率等。总体参数是固定的常数。多数情况下,总体参数是不易知道的,但可通过随机抽样抽取有代表性的样本,用算得的样本统计量估计未知的总体参数。

统计量:统计量(statistic)是指样本的统计指标,如样本均数、样本率等。样本统计量可用来估计总体参数。总体参数是固定的常数,统计量是在总体参数附近波动的随机变量。

频数表(frequency table)用来表示一批数据各观察值或在不同取值区间的出现的频繁程度(频数)。

算术均数(arithmetic mean)描述一组数据在数量上的平均水平。总体均数用μ表示,样本均数用X 表示。

几何均数(geometric mean)用以描述对数正态分布或数据呈倍数变化资料的水平。记为G。

中位数(median)Md将一组观察值由小到大排列,n 为奇数时取位次居中的变量值;为偶数时,取位次居中的两个变量的平均值。反映一批观察值在位次上的平均水平。

极差(range)亦称全距,即最大值与最小值之差,用于资料的粗略分析,其计算简便但稳定性较差。

百分位数(percentile)是将n 个观察值从小到大依次排列,再把它们的位次依次转化为百分位。百分位数的另一个重要用途是确定医学参考值范围。

四分位数间距(inter-quartile range)是由第3 四分位数和第1 四分位数相减计算而得,常与中位数一起使用,描述偏态分布资料的分布特征,较极差稳定。

方差(variance):方差表示一组数据的平均离散情况,由离均差的平方和除以样本个数得到。

标准差(standard deviation)是方差的正平方根,使用的量纲与原量纲相同,适用于近似正态分布的资料,大样本、小样本均可,最为常用。

变异系数(coefficient of variation)用于观察指标单位不同或均数相差较大时两组资料变异程度的比较。用CV 表示。计算:标准差/均数*100%

统计推断:通过样本指标来说明总体特征,这种从样本获取有关总体信息的过程称为统计推断(statistical inference)。

抽样误差:由个体变异产生的,抽样造成的样本统计量与总体参数的差异,称为抽样误差(sampling error)。

标准误及X s 通常将样本统计量的标准差称为标准误(standard error of mean,SEM ),它反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异,说明均数抽样误差的大小。

可信区间:按预先给定的概率确定的包含未知总体参数的可能范围。该范围称为总体参数的可信区间(confidence interval,CI)。

参数估计:指用样本指标值(统计量)估计总体指标值(参数)。

假设检验中P 的含义:指从H0 规定的总体随机抽得等于及大于(或等于及小于)现有样本获得的检验统计量值的概率。

I 型错误(type I error ),指拒绝了实际上成立的H0,这类“弃真”的错误称为I 型错误,其概率大小用α表示。

II 型错误(type II error),指接受了实际上不成立的H0,这类“存伪”的误称为II 型错误,其概率大小用β表示。

检验效能:1-β称为检验效能(power of test),它是指当两总体确有差别,按规定的检验水准a 所能发现该差异的能力。

(rate)又称频率指标,说明一定时期内某现象发生的频率或强度。

计算公式为:发生某现象的观察单位数/可能发生某现象的观察单位总数*100%,表示方式有:百分率(%)、千分率(‰)等。

构成比(proportion)又称构成指标,说明某一事物内部各组成部分所占的比重或分布。

计算公式为:某一组成部分的观察单位数/同一事物各组成部分的观察单位总数*100%,表示方式有:百分数等。

(ratio)又称相对比,是A、B 两个有关指标之比,说明A 是B 的若干倍或百分之几。

计算公式为:A/B ,表示方式有:倍数或分数等。

非参数统计:针对某些资料的总体分布难以用某种函数式来表达,或者资料的总体分布的函数式是未知的,只知道总体分布是连续型的或离散型的,用于解决这类问题的一种不依赖总体分布的具体形式的统计分析方法。

参数统计:通常要求样本来自总体分布型是已知的(如正态分布),在这种假设的基础上,对总体参数(如总体均数)进行估计和检验,称为参数统计(parametric statistics)

秩次:变量值按照从小到大顺序所编的秩序号称为秩次(rank)。

秩和:各组秩次的合计称为秩和(rank sum),是非参数检验的基本统计量。

直线回归(linear regression)建立一个描述应变量依自变量变化而变化的直线方程,并要求各点与该直线纵向距离的平方和为最小。直线回归是回归分析中最基本、最简单的一种,故又称简单回归(simple regression)。

回归系数(regression coefficient )即直线的斜率(slope),在直线回归方程中用b 表示,b 的统计意义为X每增(减)一个单位时,Y平均改变b 个单位。

相关系数r用以描述两个随机变量之间线性相关关系的密切程度与相关方向的统计指标。

相关概念

医学科研数据统计分析大致分以下4个步骤。

1.1 数据整理

1.2 统计描述

1.3 统计推断

1.4 结果表达

频数表的制作

  • 求全距R
  • 找到资料中的最大值A和最小值B
  • 计算全距R,
  • 划分组段
  • 确定组数
  • 确定组距
  • 确定各组段的上下限
  • 下限(lower limit) 上限(upper limit)
  • 第一组段,其下限可取小于最小观察值得数
  • 半开半闭区间 [ -- ,-- )
  • 画表

频数分布表和频数分布图的用途

  • 揭示频数分布的特征
  • 集中趋势
  • 集中趋势是指一组数据向某一个位置聚集或集中的倾向。
  • 离散趋势
  • 离散趋势反映的是一组数据的分散性和变异度,即各个数据离开集中位置的程度。
  • 便于观察数据的分布类型
  • 正态分布
  • 集中趋势的指标:均数
  • 离散趋势的指标:标准差
  • 偏态分布
  • 集中趋势的指标:中位数
  • 离散趋势的指标:四分位间距

标准差的意义和用途

1.     说明资料的离散趋势(或变异程度),标准差的值越大,说明变异程度越大,均数的代表性越差.

标准差与原始数据的单位一致,在科技论文报告中,均数与标准差经常被同时用来描述资料的集中趋势与离散趋势。

1.     用于计算变异系数

2.     用于计算标准误

3.     结合均值与正态分布的规律,估计参考值的范围。

变异系数(coefficient of variation)

适用范围

1观察指标单位不同,如身高、体重——不同单位资料

2均数相差悬殊

变异系数的特点及相应的用途

  • 没有单位

n 反映标准差占均数的百分比或标准差是均数的几倍

n 可用来比较度量衡单位不同的资料的变异度

  • 不受平均水平的影响

n 反映的是以均数为基数的相对变异的大小

n 比较均数相差悬殊的资料的变异度

变异指标小结

1.极差较粗,适合于任何分布

2.标准差与均数的单位相同,最常用,适合于近似正态分布

3.变异系数主要用于单位不同或均数相差悬殊资料

4.平均指标和变异指标分别反映资料的不同特征,常配套使用如——正态分布:均数、标准差; 偏态分布:中位数、四分位间距

相对数使用应注意的问题

1.根据需要正确选择相对数,常见错误是以构成比代率。

2.分母应当够大。分母小于20时可靠性较差。如果分母太小,宜用绝对数表示。

3.计算观察单位数不等的几个率的平均率时,不能将几个率直接相加求平均率。

4.要注意其内部构成是否相同。若内部构成不同的资料,应先进行率的标准化后再比。

5.根据样本数据计算的强度相对数,要考虑抽样误差的影响。

中心极限定理 central limit theorem

①即使从非正态总体中抽取样本,所得均数分布仍近似呈正态。

②随着样本量的增大, 样本均数的变异范围也逐渐变窄。

标准误

标准误越大,样本均数的分布越分散,样本均数与总体均数的差别越大,抽样误差越大,由样本均数估计总体均数的可靠性越小。反之亦然。

标准误反映了样本均数间的离散程度,也反映了样本均数与总体均数的差异。

标准误与标准差成正比,当总体中各观测值变异很小时,样本均数与总体均数的差异小,抽样误差小。

标准误 与样本含量的平方根成反比,样本含量越大,抽样误差越小

t分布

同一概率下,自由度越大,|t|越小;

同一自由度下,|t|越大,概率P值越小;

同一自由度下,双侧概率为单侧概率的2倍时,所对应的t界值相等;

当自由度趋向于∞时的t界值即为相应概率下的Z值。

统计推断的任务就是用样本信息推论总体特征。

1、点(值)估计——( 近似值)——用相应的样本统计量直接作为其总体参数的估计值。

2、 区间估计——(近似范围)——按预先给定的概率(1-α)所确定的包含未知总体参数的一个范围

假设检验有三个基本步骤:

① 建立假设和确定检验水准,通常选α=0.05

② 计算检验统计量

③ 确定P 值和做出统计推断结论

所有的假设检验都按照这三个步骤进行,各种检验方法的差别在于第②步计算的检验统计量不同。

H0H1的涵义及注意事项

1.检验假设是针对总体,而非样本;

2.H0H1是互相对立,不是可有可无,而是缺一不可;

3. H0无效假设,通常是某两个或多个总体参数相相同,或总体参数之差为0,或某资料服从某一分布等等;

4.假设检验主要是围绕H0进行的,当H0被拒绝时,则接受H1

5. 备选假设应该按照实际世界所代表的方向来确定,即它通常是被认为可能比零假设更符合数据所代表的现实。 H1的内容反映出单侧还是双侧

减少I型错误的主要方法:假设检验时设定a 值。

减少II型错误的主要方法:提高检验效能。

方差分析应用条件:

总体——正态且方差相等

样本——独立、随机

方差分析的结果拒绝H0,接受H1,不能说明各组总体均数间两两都有差别。如果要分析哪些两组间有差别,可进行多个均数间的多重比较

卡方检验目的:

推断两个总体率或构成比之间有无差别

多个总体率或构成比之间有无差别

多个样本率的多重比较

两个分类变量之间有无关联性

频数分布拟合优度的检验。

应用:计数资料

检验统计量 c2值反映了实际频数与理论频数的吻合程度。自由度取决于可以自由取值的格子数目,而不是样本含量n。四格表资料只有两行两列,v=1,即在周边合计数固定的情况下,4个基本数据当中只有一个可以自由取值。

参数统计(parametric statistics)

总体分布型已知,对总体参数进行估计或检验

正态分布、二项分布、泊松分布等的检验

不可用参数检验的情形:

不符合正态分布要求或方差齐性要求

变量变换后方差仍不齐或非正态分布

总体分布未知

需找到不依赖于总体分布的方法

应用非参数检验的情况:

1.不满足正态和方差齐性条件的小样本资料

2.总体分布类型不明的小样本资料

3.一端或二端是不确定数值(如<0.002、 >65等)的资料(必选)

4.单向(双向)有序列联表资料

5.各种资料的初步分析

双变量计量资料:每个个体有两个变量值

总体:无限或有限对变量值

样本:从总体随机抽取的n对变量值

(X1,Y1), (X2,Y2), …, (Xn,Yn

目的:研究X和Y的数量关系

方法:相关与回归——简单、基本:直线相关、直线回归

相关系数又称Pearson积矩相关系数,说明具有直线关系的两变量间相关的密切程度与相关方向

相关系数没有测量单位,其值为-1≤r≤1

r>0表示正相关,r<0表示负相关,r=1 或r= -1为完全相关,r=0为零相关即无直线关系

线性相关分析的注意事项

1.线性相关表示两个变量之间的关系是双向的,分析变量之间的关系,须首先绘制散点图,散点图呈直线趋势时,再做分析

2.r只表示两个服从正态分布的随机变量之间线性关系的密切程度和相关方向,r=0只能说XY之间无线性关系,并不能说XY之间无任何关系

3.计算出的相关系数是样本的相关系数,是总体相关系数的估计值,因此判断总体相关时,需要做假设检验。只有拒绝了无效假设时,才能认为存在相关,及判断相互关系的密切程度

4.相关关系并不一定是因果关系。相关分析的任务就是对相关关系给以定量的计算和描述

统计表制作过程中存在的常见问题有: 标题不确切、标目表述不清、纵标目和横标目随意颠倒位置、数字不合理表示、表格过于简单或繁琐、表内容与文字内容重复、注释内容过多等。

线图绘制常见错误

线图绘制中常见的错误是横坐标轴上各刻度的间隔表示的数量不等

统计推断时的常见错误

未对统计资料进行统计学处理,仅凭统计指标的绝对值大小就下结论是很不严谨的,也极易得出错误结论。

分析定量资料时存在的问题

忽视t 检验和方差分析的前提条件、误用t 检验代替方差分析、误用参数检验代替非参数检验、各种方差分析方法的混用

正确做法是先判断资料所对应的设计类型;其次,是考察资料所具备的前提条件。

定量资料分析时的步骤,关键是两点:

其一,检查定量资料是否满足参数检验的前提条件;

其二,正确辨析定量资料所对应的实验设计类型。

更多相关推荐:
医学统计学总结手持版

统计学(Statistics):应variable):变量的观察般用希腊字母表示。用统计学的原理与方法,或检测结果,也叫变量的统计量(statistic):根据研究数据的搜集、整理与观测值。样本个体值计算出来的…

医学统计学总结

1、同一资料的标准差是否一定小于均数?答:均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。2、极差、四分位间距、标准差、变异系数的适用范围有何异同…

医学统计学 总结 经典

Chapter基本概念显著性检验(testofsignificance):计算P值医学统计工作的内容:1、实验设计:最关键最重要2、收集资料:最基础原始资料:实验数据现场调查资料医疗卫生工作记录报表报告卡质量控…

医学统计学总结

一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验2)小样本偏态分布资料,则用成组…

医学统计学_总结_重点_笔记_复习资料

俄第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样…

医学统计学总结

医学统计学总结一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验2)小样本偏态分布…

20xx住院医师培训医学统计学总结

一、统计描述算术平均数反映集中趋势:几何平均数中位数方差及标准差反应离散趋势:几何标准差四分位数间距或百分位数二、统计资料正态分布方差分析齐性tF计量资料不齐t’或秩和检验非正态分布秩和检验计数资料(率构成比)…

医学统计学各种资料比较 选择方法小结

医学统计学各种资料比较选择方法小结一两组或多组计量资料的比较1两组资料1大样本资料或服从正态分布的小样本资料1若方差齐性则作成组t检验2若方差不齐则作t检验或用成组的Wilcoxon秩和检验2小样本偏态分布资料...

医学统计学_总结_重点_笔记_复习资料

第一章2选1总体总体population是根据研究目的确定的同质观察单位研究对象的全体实际上是某一变量值的集合可分为有限总体和无限总体总体中的所有单位都能够标识者为有限总体反之为无限总体样本从总体中随机抽取部分...

统计学小结

第一章统计总论一统计一词的含义二统计的研究对象特点三统计的职能四总体和总体单位五标志与标志表现六统计指标及其分类七变量的涵义及其分类一统计一词的含义统计有三种含义即统计工作统计资料和统计学二统计学的研究对象和特...

统计学总结

计量资料统计描述集中趋势离散趋势频数分布假设检验t检验单样本均数样本符合正态分布配对样本均数差值d符合正态分布两独立样本均数正态分布方差齐性方差分析满足正态性和方差齐性随机区组资料22交叉设计资料22析因设计资...

贾俊平 统计学 总结

第一章导论概念统计学收集处理分析解释数据井从数据中得出结论的科学统计的分类描述统计研究的是数据收集处理汇总图表描述文字概括与分析等统计方法推断统计是研究如何利用样木数据进行推断总体特征数据1分类数据对事物进行分...

医学统计学总结(34篇)