生物统计学名词解释

时间:2024.4.5

1.

2.

3.

4. 样本: 样本 从总体中抽出的若干个体所构成的集合称为样本。 总体: 总体 指具有相同性质的个体所组成的集合称为总体。 连续变量:表示在不变量范围内可抽出某一范围的所有值。 非连续变量:也称为离散型变量,表示在变量数列中,仅能取得固定数

值,并且通常是整数。

5. 准确性:指在调查或实验中某一试验指标或形状的观测值与真值接近

的程度。

6. 精确性:指调查或实验中同一试验指标或形状的重复观测值彼此接近

程度大小。

7. 资料:指在一定条件下,在生物学实验和调查中,能够获得大量原始

数据,对某种具体事务或现象观察的结果。

8. 数量性状资料:指一般是由计数和测量或度量得到的。

9. 质量性状资料:是指对某种现象只能观察而不能测量的资料,也称属

性资料。

10. 计数资料;指由计数得到的数据。

11. 计量资料:有测量或度量得到的数据。

12. 普查:指对研究对象的每一个个体都进行测量或度量的一种全面调查。

13. 抽样调查:是一种非全面调查,它是根据一定的原则对研究对象抽取

一部分个体进行测量或度量,把得到抽样调查的数据资料作为样本进行统计处理,然后利用样本特征数对总体进行推断。

14. 全距(极差) :是指样本数据资料中最大观测值与最小观测值的差值。

组中值:是指两个组限下线和上限的中间值。

15. 算数平均数:是指总体或样本资料中哥哥给观测值的总和除以观测值

的个数所得的商。

16. 中位数:是指将试验或调查资料中所有观测值以大小顺序排列,居中

位置的观测值。

17. 众数:资料中出现次数最多的那个观测值或次数最多一组的中点值。

18. 几何平均数:指资料中有几个观测值,其乘积开几次方所得的数值。

19. 方差:指用样本容量 n 来除离均差平方和,得到平均的平方和。

20. 标准差:指方差的平方根和。

21. 变异系数:指将样本标准差除以样本平均数得出的百分比。

22. 概率:指某事件 A 在 n 次重复试验中,发生了几次,当试验次数 n

不断增大时,事件 A 发生的频率 W(A) 概率 就越来越接近某一确定值 P,于是则定 P 为事件 A 发生的概率.

23. 和事件:指事件 A 和事件 B 至少有一件发生而构成的新事件称为事

件 A 和事件 B 的事件。

24. 积事件:指事件 A 和事件 B 同时发生而构成的新事件,称为事件 A

和事件 B 的积事件。

25. 互斥事件:指事件 A 和事件 B 不能同时发生,称为事件 A 和事件 B

互斥。

26. 对立事件:指事件 A 和事件 B 必有一个事件发生,但两者不能同时

发生。

27. 独立事件:指事件 A 的发生与事件 B 的发生毫无关系。

28. 完全事件系:指如果多个事件 A1、A2、、、 、、、An 两两相斥,且每次

试验结果必然发生其一,则称事件 A1、 完全事件系 A2、、、 、、、An 为一个完全事件系。

29. 概率加法定理: 指互斥事件 A 和 B 的和事件的概率等于事件 A 和

事件 B 的概率之和, P(A+B)=P(A)+P(B)。

30. 概率乘法定理:指事件 A 和事件 B 为独立事件,则事件 A 与 B 同

时发生的概率等于事件 A 和事件 B 各自概率乘法定理的乘积,即:P(A*B)=P(A)*P(B)。

31. 伯努利大数定律:设 M 是 n 次独立试验中事件 A 出现的次数,而

不是事件 A 在每次试验中出现的概率,则对于任意小的正数 ε ,有如下关系:limp{m/n-p< ε }=1

32. 辛钦大数定律:是用来说明为什么可以用算术平均数来推断总体平均

数 m 的。

33. 统计推断:指从样本的统计数对总体参数做出的推断,包括参数估计和

假设检验。

34. 假设检验:指根据总体理论分布和小概率原理,对未知或不完全知道

的总体提出两种彼此对立的假设,然后有样本的实际结果,经过一定的计算,做出在一定概率意义上应该接受的那种假设的推断。

35. 参数估计:指由样本结果对总体参数在一定概率水平下所作出的估计。

点估计是用样本统计量直接给出总体相应参数的估计值,由于抽样误差存在,X拔不同的样本将会得到不同的点估计值,点估计缺乏明确的精度概念,而区间估计在一定程度上可以弥补这个不足

36. 小概率原理:指如果假设一些条件,并在假设的条件下能够准确地算

出事件 A 出现的概率 a 为很小,则在假设条件下的 n 次独立重复试验中时按预定的概率发生,而在有一次试验中则几乎不可能独立。

37. 显著水平:指在无效假设和备择假设后,要确定一个否定 H0 的概率

标准,这个概率称为显著水平。

38. 方差同质性:就是指各个总体的方差是相同的。

39. α 错误 :H0 是真实的,假设检验却否定了它,就烦了一个否定真实

假设的错误,称为 α 错误。

40. β 错误:指如果H0 不是真实的,假设检验时却接受了 H0,否定了 HA

这样就犯了接受不真实假设的错误,称为 β 错误。

41. 适合性检验:指比较观测值与理论值是否符合的假设检验交适合性检

验。

42. 独立性检验:指研究两个或两个以上因子彼此之间是相互独立的还是

相互影响的一类统计方法。

43. 相关分析:是研究现象之间是否存在某种依存关系, 并对具体有依存

关系的现象探讨其相关方向以及相关程度,是研究随机变量间的相关关系的一种统计方法。

44. 回归分析:是确定两种或两种以上变数间相互依赖的定量关系的一种

统计分析方法。

45. 回归系数:y^=a+bx,自变量 x 改变一个单位,依变量 y 平均增加或

减少的单位数,即回归直线的斜率 b。

46. 回归截距:y^=a+bx,a 是当 x=0 时的 Y^值,即直线在 y 轴上的截

距,称为回归截距。

47. 离回归平方和:它反映除去 x 与 y 相关程度和性质的统计数。

48. 回归平方和:它反映在 y 的总体变异种由于 x 与 y 的直线关系而

产生 y 变异减小的部分。

49. 相关系数:是指通过计算表示 x 和 y 相关程度和性质的统计数。

50. 决定系数:是变量 x 引起 y 变异的回归平方和与 y 变异总平方和

的比率。

51. 转换:指估计总体相关系数 p 的置信区间时,需要将 r 转换成 z。

52. 试验设计:广义的指整个研究课题的设计,包括实验方案的拟订,试

验方案的拟订,试验单位的选择,分组的排列,实验过程中试验指标的现象记载,试验资料的整理,分析等内容。

53. 试验结果重演:是指在相同的条件下,在进行实验或实践,应能重复

获得与原试验结果相近的结果。

54. 处理因素:一般指对受试对象给予的某种外部干预。

55. 主效应:多因素中试验中引起实验结果发生变化的主要。

56. 互作:因素之间的交互作用。

57. 受试对象:是处理因素的客体,实际上就是根据研究目的而确立的观

测总体。

58. 处理效应:是处理因素作用于受试对象的反应,是研究最终体现

59. 误差:在试验中受偶然影响或者说非处理因素影响使观测值偏离试验

处理真值的差异。

60. 随机误差:由于试验中许多无法控制的偶然因素所造成的试验结果与

真实结果之间产生的误差。

61. 系统误差:由于试验处理以外的其他条件明显不一致所产生的带有倾

向性或定向性的偏差

62. 重复:在试验中,同一处理设置的试验单位数。

63. 随机:是指一个重复的某一处理或处理组合被安排在哪一个试验单位,

不要有主观成见。

64. 均积:是 x 与 y 的平均的离均差的乘积和,简称均积。

65. 协方差:与均积相应的总体参数。

66. 协方差分析:把回归分析与方差分析结合。

67. 试验控制:要提高试验的精确度和灵敏度,必须严格控制试验条件的

均匀性,使各处里处于尽可能一致的条件下。

68. 统计控制:是试验控制的一种辅助手段,是用统计方法来矫正因自变量

的不同而对依变量所产生的影响。

69. 估计量:估计总体参数的统计量

70. 无偏估计量:如果一个统计量的理论平均数(即数学期望)等于总体

参数,这个统计量就叫无偏估计量

71. 矩估计:用样本矩作为总体矩的估计值

72. 矩估计法(数字特征法、矩法)用样本矩作为相应总体矩的估计量,

也可以用样本数字特征作为相应的总体数字特征的估计量。用矩法获得的估计值,叫据估计值。据发的思想实质是用样本去替换总体矩的原则,称之为替换原则

73. 有效估计量:设a1,a2是A的两个无偏估计量,若var(a1)<var(a2),

则a1为有效估计量

74. 抽样误差:由抽样引起的样本值与总体值之间的差异成为抽样误差,

直接原因:总体中各个体之间存在差异,或重复试验中一些服从某种分布的偶然误差的存在

75. 标注误差(标准误):描述样本平均数波动情况的统计量,就是X拔的

方差或标准差,计均数抽样误差为西格玛X拔,=西格玛/根号n,西格玛X拔就是标准误(差)

76. 估计样本平均数方差:SX拔平方,=S平方/n

77. 估计标准误:SX拔,=S/根号n

78. 置信区间:达到某一置信度(如95%)时,预报量可能出现的范围(如

E(y)±1.96西格玛,这里西格玛是标准差)

置信区间的意义是:反复抽样多次,每次的样本容量相等,每次的样本值确定一个区间[a1,a2],这个区间包含a的概率是100(1-阿尔法)%,不包含a的概率是100阿尔法%

79. 置信水平(置信度,置信系数,可靠度)是指总体参数值落在样本统

计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。

80. 拟合优度检验:对总体分布类型的检验,包括检验观测数与理论书之

间的一致性,通过检验观测数与理论书之间的一致性来判断事件之间的独立性

81. 皮尔逊定理:若n充分大,则不论总体服从什么分布,卡平方总是近

似服从自由度为m-a-1的卡平方分布

82. 方差分析:能同时判断多组数据平均数之间的差异显著性,能把随机

变异从混杂状态中分离开来,从而为判断因素对实验结果有无确实的影响提供依据

83. 方差分析的前提条件:等方差,正态性、独立性

84. 固定因素:若因素的a个水平是经过特意选择的,则该因素为固定因

素。发差分析所得到的结论只适合于选定的几个水平,并不能将其结论扩展到未加考虑的水平上

85. 固定效应模型:处理固定因素所用的模型称为固定效应模型或固定模

86. 随机因素:若因素的a个水平,是从该因素水平总体中随机抽出的样

本,则该因素称为随机因素,从随机因素a个水平所得到的结论,可以推广到这个因素的所有水平上

87. 处理随机因素所用的模型称为随机效应模型

88. 多重比较:对各对均值之间的差异的显著性检验

89. LSD法在统计推断时犯第一类错误的概率大,而Duncan法犯第一类错

误的概率小。

90. 多个方差齐性检验(bartlett检验,巴特氏卡平方检验):当a个随

机样本是从独立正态总体中抽取时,可以计算出统计量K平方,当n=min(nj)充分大时,K平方的抽样分布非常接近于a-1自由度的卡方分布。由此可对多个总体进行卡平方检验。

91. 两因素之间交互作用产生新效应的现象为交互作用

92. 由因素水平的改变而造成的因素效应的改变称为该因素的主效应

93. 交叉分组设计:假设A药物有a水平,B药物有b水平,共有ab个剂

量组合,每一组重复n次。共有abn名病人参加实验,这样的实验设计称为交叉分组设计

94. 相关:设有两个随机变量 X和Y,对于任一随机变量的每一个可能的

值,另一个随机变量都有一个确定的分布与之相对应,则称这两个随机变量之间存在相关关系

95. 如果变量之间的关系可以用函数关系来表达,就称它们之间的关系为

确定性关系

96. 回归关系、相关关系:统计学上把变量之间的非确定性关系称为相关

关系,也成为回归关系

97. 如果对于一个普通变量x的每一个可能的值xj都有随机变量Y的一个

分布与之对应,则称随见变量Y的一个分布与之对应,则称随机变量Y对x存在回归关系

98. 具有回归关系的两变量之间对于任一xi都不会有一个确切的yi与之

对应,但为了描述两变量之间的数量关系,可选当x=xi时Y的平均数谬角标Y乘X=xi与之相对应,则称谬角标Y乘X是Y的条件平均数

99. Y1,y2…yn这n个数据的离差平方和,记作SYY,称为总离差平方和,

反映了n个yi折的离散程度

100. 回归平方和(y折-y拔)平方求和,几座SSR。是n个yi折的离

差平方和,反映了n个yi折的离散程度

101. 剩余平方和(残差平方和)(yi-yi拔)平方求和,记作SSe,是除

了x对Y的线性影响之外的其他剩余因素造成的平方和,这些因素中包括x对Y的非线性影响及试验误差,观察误差等随机因素

102. 相关分析是对两个或两个以上随见变量之间相互关联程度进行分

析的统计学方法

103. 存在于两个随机变量之间的相关关系称为简单相关或单相关,存在

于三个或三个以上变量之间的相关关系为多重相关或复相关

在一元回归中,回归的显著程度,可以用相关系数来表示,同样,在多元回归问题中,回归的显著程度可以用复相关系数表示

104. 统计学上把衡量变量之间关系密切程度的统计量称为相关系数 105. 消除了其他变量的影响后两个变量之间的相关关系称为偏相关(纯

相关)。为了反映两变量间的真正关系,就要保证在其他变量都保持不变的情况下,计算它们的相关系数,这时的相关系数称为偏相关系数或纯相关系数

106. 样本平均数作为总体平均数估计值的优良:无偏(均值等于总体平

均数)、有效(方差小雨其他估计值)、一致性(总体平均数为极限值) 107. 概率论中有关论证随机变量的和的分布服从正态分布的一类定理

称为中心极限定理

108. 若X为一随机变量,则F(x)=P(X<=x)为X的分布函数

数理统计上称统计量的分布为抽样分布

第一个统计假设是μ =10,这个假设称为原假设(零假设,零值假设),用符号H0表示; 第二个统计假设μ ≠10 称为备择假设(替代假设),用符号H1或HA表示。

概率很小的事件在一次试验中实际上是不可能发生的。

按小概率原理否定H0,不免要犯错误,我们知道,当H0为真时,小概率事件A也有可能发生,因此当我们拒绝H0时,我们可能会犯以真为假的错误,称之为Ⅰ型错误。

原假设不真实,而我们却按小概率原理接受了它,这种以假为真的错误称为Ⅱ型错误。

假设检验的步骤

提出假设H0,即,假定试验结果与真值(正常值,或要求值)没有差异,现有差异是由抽样误差所引起的。

确定检验方法,在H0为真的前提下,构造一个合适的统计量U、T、X2 、或 F。

显著性水平a的确定,然后由a确定所选检验统计量的临界值。从而划定接受域和拒绝域。 做出推断 根据样本值计算所选统计量的具体值。然后做出推断:

统计推断的主要内容分为两大类:总体参数估计和统计假设检验。

通过样本确定分布函数中参数值的过程称为参数估计。

随机变量的数字特征同它的概率分布中的参数之间通常有一定的关系,因而对数字特征的估计也被称为参数估计。

由抽样引起的样本值与总体值之间的差异称为抽样误差。

下面是几种常用的衡量估计量好坏的准则。无偏性 有效性 一致性

标准误差,标准误

描述样本平均数波动情况的统计量就是样本平均数 这个随机变量的方差或标准差,

配对实验是指这样的实验,来自两个总体的样本值是成对出现的,它的特点是n1=n2,一个样本中的某个数据必然对应于另一个样本中的相应数据。由于同一配对内两个供试材料的实验条件很接近,而且这一配对内的系统误差又可以通过这一对数据的差数来消除,从而使处理效果更加明显,因而可以减小实验误差,提高实验精度。

对总体分布类型的检验通常称为分布函数的拟合优度检验(goodness of fit test) 。 该检验包括两种类型:

一是检验观测数与理论数之间的一致性;

二通过检验观测数与理论数之间的一致性来判断事件之间的独立性。

皮尔逊卡平方检验的第二个主要应用方面是通过检验观测数与理论数之间的一致性来判断事件之间的独立性。列联表的独立性检验就属于这种情况。

列联表是样本观测数据按两个或两个以上标准分类所得的一种频数表。

方差分析的前提条件

等方差:a组数据可看作来自a个总体的a个样本,要求每个总体要有相同的方差s2; 正态性:要求a个总体均服从正态分布

独立性:要求a个总体之间相互独立。

处理固定因素所用的模型称为固定效应模型(fixed effect model)或简单地称为固定模型(fixed model)。

两因素之间相互作用而产生新效应的现象称为交互作用

由因素水平的改变而造成的因素效应的改变称为该因素的主效应

如果变量之间的关系不可以用函数关系来表达,则称它们之间的关系为非确定性关系。 统计学上把变量之间的非确定性关系称为相关关系,有时也称为回归关系。

若X也是一个随机变量,在Y对X存在回归关系的同时,X对Y也存在回归关系,这时称X和Y间存在相关(correlation)关系。

相关分析是对两个或两个以上随机变量之间相互关联程度进行分析的统计学方法。

存在于两个随机变量之间的相关关系称为简单相关,或单相关;存在于三个或三个以上变量之间的相关关系为多重相关,或复相关。

统计学上把衡量变量之间关系密切程度的统计量称为相关系数。

一个变量与两个或两个以上变量之间的相关关系称为复相关,而它们之间相关联密切程度的数量指标就称为复相关系数

消除了其它变量的影响后两个变量之间的相关关系称为偏相关(或纯相关),相应的相关系数称为偏相关系数(partial correlation coefficient)(或纯相关系数)

更多相关推荐:
生物统计学总结

生物统计学学习心得这学期要结束了,在老师的指导下,经过一学期对生物统计学的学习,我对生物统计学有了进一步的理解。下面是我学习这门课程的一些收获和体会,还有对生物统计学简单的总结。1.收获生物统计学是在生物的基础…

生物统计学总结心得

《生物统计学》学习心得记得开学的前几周,老师说过一句话:每天都是向既定目标迈进的一步。是啊,我们每天都会经历不同的事情,每天都要学习新的知识。而我们每周二晚上都要学习生物统计学,我觉得这不仅是周二那天的收获,更…

高级生物统计学学习心得

高级生物统计学课程学习总结摘要经过一学期对生物统计学的学习我对生物统计学有了进一步的理解本文主要讲述了本学期学习生物统计之后我对生物统计学的收获和体会关键词生物统计学收获体会学习了黄老师讲授的高级生物统计学这门...

生物统计学学习心得

生物统计学学习心得一、《生物统计学》这一门课。你学到什么?谈谈你学习这一门课的心得体会。(一)、《生物统计学》这门课,首先,我不仅学到了很多生物统计方面的基础知识、基本概念和相关的应用,还学习了如何设计试验。在…

生物统计学总结答案

四简答题1方差分析的基本步骤2显著性检验的基本步骤1首先对试验样本所在的总体作假设作无效假设这个假设需要我们来验证因此称叫做备择假设构成了一个对立事件2确定显著性水平即小概率事件的临界概率一般设定为005和00...

生物统计学 总结

生物统计学总结绪论统计工作的四大步骤设计搜集整理分析统计资料的三大类型计量资料对每个观察值单位用定量方法测得每项指标量的大小所得的资料计数资料将观察单位按照某种属性类别分组所得的观察单位数等级资料将观察单位按某...

史上最全生物统计学考试总结

第一章生物统计学:是数理统计在生物学研究中的应用,它是应用数理统计的原理和方法来分析和解释生物界各种现象和试验调查资料的一门学科,属于应用统计学的一个分支。内容:试验设计:试验设计的基本原则、试验设计方案的制定…

生物统计学第一章

生物统计学教案授课教师陈彦云宁夏大学生命科学学院教学内容与组织安排第一章绪论讲述本章教学目标概述本课时主要内容摘要生物统计学是数理统计学的原理和方法在生命科学领域的具体应用它是运用统计的原理和方法对生物有机体开...

生物统计学复习

生物统计学复习一样本参数的计算1标准偏差s平均数2变异系数cvs二事件独立性与相容性区别1设A与B相互独立PAB05PA02PB2设随机事件AB互不相容PAB05PA02PB3连续型数据和离散型数据区别定义等三...

生物统计学1

生物学各专业研究生必修课程生物统计学一授课对象20xx级研究生二时间20xx20xx学年第一学期三目的意义学习生物学研究中的试验设计和统计分析的方法四教材李春喜王文林等编著20xx生物统计学第二版科学出版社五主...

社会统计学总结

一算数平均数某一总体值总体单位平均所得的标志值的水平是反映集中趋势最常用最基本的平均指标二中位数把总体单位某一数量标志的各个数值按大小顺序排列位于正中处的变量值三平均差各变量值对其算术平均数或中位数离差绝对值的...

统计学考试总结

第一套试卷及参考答案一选择题40分1根据某医院对急性白血病患者构成调查所获得的资料应绘制BA条图B百分条图或圆图C线图D直方图2均数和标准差可全面描述D资料的特征A所有分布形式负偏态分布正偏态分布正态分布和近似...

生物统计学总结(27篇)