试验统计方法复习总结
第一章
试验因素:简称因素或因子(factor):被变动并设有待比较的一组处理的因子或试验研究的对象(研究对象的效应)。
水平(level):试验因素内不同的级别或状态。
简单效应(simple effect): 在同一因素内两种水平间试验指标的差异。
主效(main effect):一个因素内各简单效应的平均数。
交互作用效应(interaction effect),简称互作: 因素内简单效应间差异的平均。
例、有一N和P对水稻A品种的小区试验产量结果如下:
互作的实质:反映了一个因素的不同水平在另一个因素的不同水平上 反应不一致的现象.
2.什么是实验方案,如何制定一个正确的实验方案?试举例说明?
试验方案:根据试验目的和要求所拟定的用来进行比较的一组试验处理的总称。
1.目的明确。
2. 选择适当的因素及其水平。
3. 设置对照水平或处理,简称对照(check,符号CK)。
4. 应用唯一差异原则。
3.什么是实验误差?实验误差与实验的准确度,精确度以及实验处理间的可靠性有什么关系?
试验误差的概念:试验结果与处理真值之间的差异
试验误差的分类:
1.系统误差(systematic error) : 由于固定原因造成的试验结果与处理真值之间的差异.
系统误差影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;
2.随机误差(random error):由于随机因素或偶然因素造成的
试验结果与处理真值之间的差异.
随机误差影响了数据的精确性,精确性是指观测值间的符合程度。
4实验误差有哪些来源?如何控制?
来源:(1)试验材料固有的差异
(2)试验时农事操作和管理技术 的不一致所引起的差异
(3)进行试验时外界条件的差异
控制:(1)选择同质一致的试验材料
(2) 改进操作和管理技术,使之标准化
(3) 控制引起差异的外界主要因素
选择条件均匀一致的试验环境;
试验中采用适当的试验设计和科学的管理技术;
应用相应的科学统计分析方法。
第二章
2、田间试验设计的基本原则是什么?有何作用?
试验设计的三个基本原则
1.重复 2.随机 3.局部控制
第三章
1总体,样本,参数,统计数的概念和关系?
总体( population ):具有共同性质的个体所组成的集团.
样本( sample ):从总体中抽取若干个个体的集合称为样本(sample)。
参数:由总体中全部个体观察值计算得总体特征值.
统计数( statistic ):测定样本中的各个体而得的样本特征数,如平均数等,称为统计数
关系:试验研究的目的是为了获得总体的信息或特征;
试验研究的方法则是抽样研究;
利用样本的结果(统计数)推断或估计总体特征 (参数).
2算数平均数的意义和特性?
算术平均数 一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为算术平均数
算术平均数的重要特性:(1)离均差之和为零(2)离均差平方的总和最小
3变异数的意义、种类和计算?
变异数的意义:一表示资料数据间的变异程度或离散程度或离均程度;二可以衡量平均值的代表性.
变异数的种类: 一、极差 二、方差 三、标准差 四、变异系数
计算:样本标准差的公式为:
总体标准差用表示:
变异系数( coefficient of variation ) ----样本的标准差对均数的百分数:
变异系数是一个不带任何单位的平均一个单位纯数离均程度,其作用:消除了平均值大小及所带单位不同的影响,其可用以比较二个事物的变异度大小。
第四章
1统计概率、正态离差含义?
统计学上用n较大时稳定的频率近似代表概率。通过大量实验而估计的概率称为实验概率或统计概率,以p表示。
正态离差:
2正太分布曲线特征的第五点?
正态曲线与横轴之间的总面积等于1,因此在曲线下横轴的任何定值,例如从y=y1到y=y2之间的面积,等于介于这两个定值间面积占总面积的成数,或者说等于y落于这个区间内的概率。正态曲线的任何两个y定值ya与yb之间的面积或概率乃完全以曲线的 和 而确定的
3小概率原理及其在统计假设测验中的应用?
小概率原理----若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。
小概率事件实际不可能性原理在统计假设测验中的应用:如果事先假设了一些条件,在这些假设的条件下若计算出某一事件为一小概率事件,然而它在一次正常的试验中竟然发生了;反过来说明假设的条件不正确,从而否定该假设(接受另一个相反的假设)
4、样本平均数抽样分布及其参数?样本平均数差数抽样分布及其参数?
从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布( sampling distribution )是统计推断的理论基础。
如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到 个样本(所有可能的样本个数)。 抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。
(1) 该抽样分布的平均数 与母总体的平均数相等:
(2) 该抽样分布的方差与母总体方差间存在如下关系:
如果从一个总体随机地抽取一个样本容量为n1的样本,同时随机独立地从另一个总体抽取一个样本容量为n2的样本,那么可以得到分别属于两个总体的样本,这两个独立随机抽取的样本平均数间差数( )的抽样分布参数与两个母总体间存在如下关系:
(1) 该抽样分布的平均数与母总体的平均数之差相等:
(2) 该抽样分布的方差与母总体方差间的关系为:
第五章
1区间估计,置信区间,置信限,置信度的概念?
区间估计:在一定的概率保证之下,由样本的统计数估计出总体参数可能位于的区间.
置信区间( confidence interval ):在一定的概率保证之下,由样本的统计数估计出的总体参数可能位于的区间.区间的上、下限称为置信限( confidence limit )
一般以L1和L2分别表示置信下限和上限。
置信系数或置信度:保证总体参数位于置信区间的概率以P=(1- )表示。
2什么是统计假设?统计假设有哪几种?各有何含义?假设测验时直接测验的统计假设是那一种为什么?
统计假设(statistical hypothesis) :对样本所属的总体(特征值或参数)提出假设(包括无效假设和备择假设两个,在后面有说明)。
§ 无效假设(null hypothesis):记作H0,假设样本所属总体效应或参数(平均数)与某一指定值相等或假设两个总体参数相等,即相对而言都不具有自己的独特效应.
§ 备择假设( alternative hypothesis ):记作 HA,假设样本所属总体效应或参数(平均数)与某一指定值不相等或假设两个总体参数不相等,或相对而言它们都有自己的独特效应.所以也可以称为有效假设.
因为只有无效假设相当于总体已知,这样才能从已知的总体中进行抽样分布,才能进一步计算样本在无效假设中出现的概率。
3区间估计和假设测验的关系?
区间估计与统计假设测验的关系为:
1 如果无效假设位于置信区间内,就接受无效假设,称为
差异不显著;
2 如果无效假设位于置信区间外,就否定无效假设,接受
备择假设,称为差异显著;
4什么是显著水平?为什么要有一个显著水平?根据什么确定显著水平?它和统计推断有何关系?
用来测验假设的小概率标准5%或1%等,称为显著水平
由于显著水平不同可能直接影响到推断结果.本例题如果
用0.01水平就要接受无效假设,所以必须事先确定显著水平.
选用显著水平的原则:统计上达显著,实际上有应用价值.
选用显著水平的原则:试验误差小的,选高水平0.01;
试验误差大的,选低水平0.05.
5什么叫统计推断?它包括哪些内容?什么是统计假设测验,它的原理和方法?
统计推断:利用概率论和抽样分布的原理,由样本结果(统计数)推断或估计其总体特征(参数).
它有两条路:一是统计假设测验,二是参数的区间估计.本教材主要是统计假设测验.
统计假设测验的含义:首先对样本所属的总体提出统计假设(无效假设 ,备择假设 )然后计算样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小则否定该假设,从而接受另一个相反的备择假设
具体有以下三大步:
(一)提出统计假设:对所研究的总体首先提出统计假设
(二)计算概率: 在假定无效假设为正确的前提下,研究抽样分布,从而计算出样本在无效假设的总体中出现的概率
(三) 推断: 根据“小概率事件实际上不可能发生”原理接受或否定无效假设
第六章
1方差分析的基本方法基本步骤?
方差分析的步骤:
1.平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.
2.F测验:利用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的.
3.多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.
2、F测验的两个前提条件?
F测验需具备条件:
(1)变数y遵循正态分布N( , ),
(2) s12 和 s22 彼此独立 。
3、多重比较方法尺度大小和应用?
多重比较方法尺度的大比较:
1.P=2时:
2.P>2时:
(1)试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法(LSD法);
(2)新复极差法(SSR法)适用于试验精确度一般的所有均值间的相互 比较.
(3)q法测验适用于试验精确度较高的所有均值间的相互比较.
4、方差分析的含义是什么?如何进行自由度和平方和的分解?如何进行F测验和多重比较?
所谓方差分析(analysis of variance) :是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。是关于k(k≥3)个样本平均数的假设测验方法.
平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.
F测验:利用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的. F测验(方差差异的显著性测验或方差的同质性测验)的方法
1.提出统计假设
2.规定显著水平
3.计算概率
4.推断:如果 就否定无效假设,接受备择假设
如果 接受无效假设
多重比较的基本思路
利用误差方差计算出最小显著差异标准,若任两个均值之差的绝对值
标准, 则它们的总体均值 就差异显著; 反之就差异不显著.
多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.
5、方差分析有哪些基本假定?
(1) 处理效应与环境效应等应该具有“可加性”(additivity) 以组合内只有单个观察值的两向分组资料的线性可加模型为例予以说明
(2)试验误差 应该是随机的、彼此独立的,具有平均数为零而且作正态分布,即“正态性”(normality) .
(3)所有试验处理必须具有共同的误差方差,即误差同质性(homogeneity)
第七章
1适合性测验独立性测验的含义?
适合性测验的概念:测验实际次数与理论次数是否相适合的卡平方测验
独立性测验的概念:测验两个因素的列联次数是否相互独立的卡平方测验. 独立性测验的实质:测验实际次数与理论次数是否相适合的卡平方测验
第九章
1什么叫回归分析?直线回归方程和回归截距回归系数的统计意义是什么?如何计算?如何对直线回归进行假设测验和区间估计?
回归分析:计算回归方程为基础的统计分析方法。
(一)直线回归方程式
(9·1)
n a回归截距(regression intercept):a是x=0时Y的值,即回归直线在y 轴上的截距。
n b 回归系数(regression coefficient):b是x 每增加一个单位数时,Y平均地将要增加(b>0时)或减少(b<0时)的单位数。
建立回归方程或求a和b的原理是:
最小二乘法或最小平方法原理,即使各个实际值y与回归直线对应值之差平方之和最小.
其几何图形上的含义:各个实际观测点与回归直线上点之距离和为最小,即误差为最小.
(1).提出统计假设,H0: =0 , Ha: ≠O
(2).规定显著水平为0.05或0.01
(3).计算概率:计算b来自 =0的总体的概率
2什么叫相关分析?相关系数决定系数各有什么具体意义?如何计算?如何对相关系数做假设测验?
相关分析:计算相关系数为基础的统计分析方法。计算表示Y 和X 相关密切程度的统计数,并测验其显著性。
相关系数是两个变数标准化离差的乘积之和的平均数。
n 相关系数的功能定义:表示变量间相关性质与程度的统计数
n 相关系数的计算定义:由自变量引起的回归平方和占依变量总平方和比率的平方根(见公式9.34下)
n 相关系数的推导定义:是两个变数标准化离差的乘积之和的平均数。
n 一般回答问题时常指功能定义!
决定系数(determination coefficient)定义为由x不同而引起的y 的平方和 占y总平方和SSy= 的比率
所以决定系数即相关系数r 的平方值。
n (一) 的假设测验
n 测验一个样本相关系数 r 所来自的总体相关系数是否为0,所作的假设为H0: 对HA: ≠0。
n 在的总体中抽样,r的分布随样本容量n的不同而不同。
n r的抽样误差:
n 当 时:
n 或 (9·37)
n 此 t 值遵循 的t分布,由之可测验 H0: 。
n 对于同一资料,线性回归的显著性等价于线性相关的显著性。
n 将(9·37)移项,即可得到自由度和显著水平一定时的临界 r 值:
第二篇:试验统计方法复习总结加解析
1 变量:数据所具有的变异特征或性。 2 观察值:变量所测得的具体观测数据,或每一个体的某一性状,特征的测定数据。
3 总体:具有共同性质的个体所组成的集体。 4 个体:总体中的一个成员。
5 样本:从总体中抽出的部分个体的总和。即总体的一部分 样本容量:样本中所包含的个体数目。
6 参数:由总体的全部观察值而算得的总体特征值。 7.统计数:由样本观察值而算得的样本特征数。
8. 算数平均数:指资料中各观察值总和除以观测值个数所得的商。
9. 中位数:将资料内所有观测值从小到大依次排列,位于中间的那个观测值。
10.众数:资料中出现次数最多的那个观测值或次数最多一组的组中值。
11.无偏估计量:当一个统计量的数学期望等于所估计的总体参数时 则称此统计量为该总体参数的无偏估计量
12.极差:指样本观察值中最大值与最小值之差,也称变异幅度或全距。
13.变异系数:标准差与平均数的百分率称为变异系数,记为C.V。
14.试验:通常我们把根据某一研究目的,在一定条件下对自然规律现象所进行的观察或试验统称为试验。
15.小概率原理:在统计学上,把小概率事件在一次试验中看成是实际不可能发生的事件称为小概率事件实际不可能性原理
16.试验指标:为衡量试验结果的好坏或处理效应的高低,在试验中具体测定额性状或观测的项目。
17.试验因素:试验中所研究的影响试验指标的因素。 18.试验水平:试验因素所处的某种特定状态或数目等级。
19.试验处理:每一试验因素不同或多因素间的水平组合构成了实验处理。
20.L8(27):L代表正交表的符号 L右下角的数字“8”代表8行,包含8个处理(水平组合);“2”表示因素水平数, “7“表示有7列,用这张正交表最多可以安排7个2水平因素。
22.单一差异原则;除需要比较的因素外,其他因素都必须保持的相同的水平上
23.β-错误:无效假设是错误的,备择假设是正确的,可是测验结果却接受了无效假设,这种错误称为第二类错误,即参数见本来有差异,可是测验结果却认为参数见无差异。
24α-错误:无效假设是正确的情况下,可是由于假设测验结果否定了无效假设,这种错误称为第一类错误,即不同总体的参数见本来没有差异,可测试结果却认为有错误。
25.方差分析:将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总便有意中相对重要程度的一种统计分析方法。
26.多重比较:在方差分析的基础上,对各处理平均数进一步分析比较,以选拔出最优的处理方法。
27.肥底:为使被研究对象处于同一可比状态而设置的肥料底肥。
28.完全方案设计:。
29.不完全方案设计;在全部水平组合中挑选部分水平组合获得的方案称为不完全方案设计。(根据完全试验方案进行的试验是全面试验。根据不完全方案进行的试验称为部分试验)
30.边际效应:是指小区周围的边行和行端种植的作物,某生长状况与小区中间者不同的现象。
31.因素简单效应:一个因素的水平相同,另一因素不同水平间的产量差异。
32.因素交互作用:指不同因素相互作用产生的新效应。指不同因素综合效应与各因素单独效应的差值。
33因素主效应:指同一因素各简单效应的平均值。
1 试验方法设计的基本原则有哪些?其主要作用是什么?
(1)重复 作用 估计试验误差 降低实验误差 从高提高实验精确度
(2)随机排列 作用 是一个区组中每一个处理都有同等机会设置在任何一个实验小区上 避免任何主观成见
(3)局部控制 作用 在田间分范围 分地段控制土壤差异等非处理因素 使之对各试验处理小区的影响达到最大程度的一致
2 统计方法的基本作用
一是有效地、科学地组织统计工作,推进统计工作的现代化进程;
二是规范国家机关、社会团体、各种经济组织以及公民在统计活动中的行为,保障统计资料的准确性、及时性和全面性
3 平均值的意义
(1) 平均值最为近似真值或最佳值 是数据的代表值 表示资料中观察值的中心位置
(2) 平均值反映了总体的典型水平 说明了总体集中性特征 可作为代表值与另一组资料做比较 借以明确两者之间的差异
4 标准差的特性
标准差的大小受资料中每个观测值的影响
在计算标准差是在各观测值上减去一个常数 其数值不变
当每个观测值乘以或除以一个常数2时 则所得的标准差是原来的2倍
5 标准差的作用
测定研究对象变异程度的大小 可作为度量离差的标准单位 还可以作为检验不同样本是否有本质差异的标准单位
6 随机试验的三个特征
(1) 实验可以在相同的情况下多次重复
(2) 每次实验结果可能不止一个 并且事先知道会有哪些可能的结果
(3) 每次实验总是恰好出现这些结果中的一个 但在这一次随机实验之前 却不能肯定这次实验会出现哪个结果
7 中心极限定理的意义。 _
不论X变量是连续型的还是离散型的 也不论X服从哪种分布 一般只要N>30就可认为X的分布是正态的 若X的分布不是偏态 在N>20时的分布就近似于正态分布
8 随机区组设计的优缺点
优点:(1) 设计简单,容易掌握;
(2) 富于伸缩性,单因素、多因素以及综合性的试验都可应用;
(3) 能提供无偏的误差统计,并有效地减少单向的肥力差异,降低误差;
(4) 对试验地的地形要求不严,必要时,不同区组亦可分散设置在不同地段上。
缺点:这种设计不允许处理数太多,一般不超过20个。因为处理多,区组必然增大,局部控制的效率降低,而且只能控制一个方向的土壤差异。
9 试验方案设计的基本原则。
1) 拟定试验方案,应回顾以往研究进展和文献探索
2) 根据试验目的确定供试因素及其水平
3) 方案中应包含对照
4) 唯一差异原则
5) 正确处理试验因素与条件关系
6) 多因素试验提供了比单因素试验过多的效应估计.
10 单因素随机区组设计资料方差分析的基本步骤及下列计算公式。 P110
13.平均数的基本性质(重要特性)
(1)样本各观测值与其平均数的差数的总和等于0. (2)离均差平方的总和最小。
书例题 8.6 最优多元线性回归方程的统计选择
误差
方差分析的三个基本假定 总体
回归分析任务 变异系数 标准差作用 正交设计基本特点 建立回归方程目的
试验统计方法复习总结
? 统计学:研究事物的数量特征及其数量规律的一门方法论学科
**
1.何为实验因素,实验水平,实验处理?何谓简单效应、主要效应和交互作用效应?举例说明。
试验因素:简称因素或因子(factor):被变动并设有待比较的一组处理的因子或试验研究的对象(研究对象的效应)。
水平(level):试验因素内不同的级别或状态。
试验处理(treatment):单因素试验中的每一个水平即为一个处理;多因素试验中是不同因素的水平结合在一起形成的处理组合,也简称为处理。
简单效应(simple effect): 在同一因素内两种水平间试验指标的差异。
主效(main effect):一个因素内各简单效应的平均数。
交互作用效应(interaction effect),简称互作: 因素内简单效应间差异的平均。
互作的实质:反映了一个因素的不同水平在另一个因素的不同水平上 反应不一致的现象.
2.什么是实验方案,如何制定一个正确的实验方案?试举例说明?
试验方案:根据试验目的和要求所拟定的用来进行比较的一组试验处理的总称。
1.目的明确。
2. 选择适当的因素及其水平。
3. 设置对照水平或处理,简称对照(check,符号CK)。
4. 应用唯一差异原则。
3.什么是实验误差?实验误差与实验的准确度,精确度以及实验处理间的可靠性有什么关系?
试验误差的概念:试验结果与处理真值之间的差异
试验误差的分类:
1.系统误差(systematic error) : 由于固定原因造成的试验结果与处理真值之间的差异.
系统误差影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;
2.随机误差(random error):由于随机因素或偶然因素造成的
试验结果与处理真值之间的差异.
随机误差影响了数据的精确性,精确性是指观测值间的符合程度。
4实验误差有哪些来源?如何控制?
来源:(1)试验材料固有的差异
(2)试验时农事操作和管理技术 的不一致所引起的差异
(3)进行试验时外界条件的差异
控制:(1)选择同质一致的试验材料
(2) 改进操作和管理技术,使之标准化
(3) 控制引起差异的外界主要因素
选择条件均匀一致的试验环境;
试验中采用适当的试验设计和科学的管理技术;
应用相应的科学统计分析方法。
**1、试验设计( experiment design)
广义----是指整个试验研究课题的设计,包括确定试验处理的方案,小区技术,以及相应的资料搜集、整理和统计分析的方法等;
狭义----专指小区技术,特别是抽样方法.重复区组和试验小区的排列方法。主要通过抽样方法,重复区组和处理小区的不同排列方法,达到控制或减少试验误差的目的.
处理小区----一个处理所占有的一小块试验空间或试验地.
重复区组( block ) ----一个试验的全部处理小区相邻排列在一起即构成一个区组.
2、田间试验设计的基本原则是什么?有何作用?
试验设计的三个基本原则
1.重复 2.随机 3.局部控制
重复的作用: 估计试验误差 ;降低试验误差 。
随机的主要作用:无偏估计试验误差;研究随机事件----获得随机变量-----概率的性质------进行统计分析(统计推断)!
局部控制就是分范围分地段或分空间地控制非处理因素,使之对各试验处理的影响在较小空间内达到最大程度的一致,从而有效地降低试验误差。
这是降低误差的重要手段之一
**
1总体,样本,参数,统计数的概念和关系?
总体( population ):具有共同性质的个体所组成的集团.
有限总体----由有限个个体构成的总体.
无限总体----总体所包含的个体数目有无穷多个 .
样本( sample ):从总体中抽取若干个个体的集合称为样本(sample)。
参数:由总体中全部个体观察值计算得总体特征值.
统计数( statistic ):测定样本中的各个体而得的样本特征数,如平均数等,称为统计数
关系:试验研究的目的是为了获得总体的信息或特征;
试验研究的方法则是抽样研究;
利用样本的结果(统计数)推断或估计总体特征 (参数).
2算数平均数的意义和特性?
算术平均数 一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为算术平均数
算术平均数的重要特性:(1)离均差之和为零(2)离均差平方的总和最小
3变异数的意义、种类和计算?
变异数的意义:一表示资料数据间的变异程度或离散程度或离均程度;二可以衡量平均值的代表性.
变异数的种类: 一、极差 二、方差 三、标准差 四、变异系数
计算:样本标准差的公式为:
总体标准差用表示:
变异系数( coefficient of variation ) ----样本的标准差对均数的百分数:
变异系数是一个不带任何单位的平均一个单位纯数离均程度,其作用:消除了平均值大小及所带单位不同的影响,其可用以比较二个事物的变异度大小。
**1统计概率、正态离差含义?
统计学上用n较大时稳定的频率近似代表概率。通过大量实验而估计的概率称为实验概率或统计概率,以p表示。
正态离差:
3小概率原理及其在统计假设测验中的应用?
小概率原理----若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。
小概率事件实际不可能性原理在统计假设测验中的应用:如果事先假设了一些条件,在这些假设的条件下若计算出某一事件为一小概率事件,然而它在一次正常的试验中竟然发生了;反过来说明假设的条件不正确,从而否定该假设(接受另一个相反的假设)
**1区间估计,置信区间,置信限,置信度的概念?
区间估计:在一定的概率保证之下,由样本的统计数估计出总体参数可能位于的区间.
置信区间( confidence interval ):在一定的概率保证之下,由样本的统计数估计出的总体参数可能位于的区间.区间的上、下限称为置信限( confidence limit )
一般以L1和L2分别表示置信下限和上限。
置信系数或置信度:保证总体参数位于置信区间的概率以P=(1- )表示。
2什么是统计假设?统计假设有哪几种?各有何含义?假设测验时直接测验的统计假设是那一种为什么?
统计假设(statistical hypothesis) :对样本所属的总体(特征值或参数)提出假设(包括无效假设和备择假设两个,在后面有说明)。
§ 无效假设(null hypothesis):记作H0,假设样本所属总体效应或参数(平均数)与某一指定值相等或假设两个总体参数相等,即相对而言都不具有自己的独特效应.
§ 备择假设( alternative hypothesis ):记作 HA,假设样本所属总体效应或参数(平均数)与某一指定值不相等或假设两个总体参数不相等,或相对而言它们都有自己的独特效应.所以也可以称为有效假设.
因为只有无效假设相当于总体已知,这样才能从已知的总体中进行抽样分布,才能进一步计算样本在无效假设中出现的概率。
3区间估计和假设测验的关系?
区间估计与统计假设测验的关系为:
1 如果无效假设位于置信区间内,就接受无效假设,称为
差异不显著;
2 如果无效假设位于置信区间外,就否定无效假设,接受
备择假设,称为差异显著;
4什么是显著水平?为什么要有一个显著水平?根据什么确定显著水平?它和统计推断有何关系?
用来测验假设的小概率标准5%或1%等,称为显著水平
由于显著水平不同可能直接影响到推断结果.本例题如果
用0.01水平就要接受无效假设,所以必须事先确定显著水平.
选用显著水平的原则:统计上达显著,实际上有应用价值.
选用显著水平的原则:试验误差小的,选高水平0.01;
试验误差大的,选低水平0.05.
5什么叫统计推断?它包括哪些内容?什么是统计假设测验,它的原理和方法?
统计推断:利用概率论和抽样分布的原理,由样本结果(统计数)推断或估计其总体特征(参数).
它有两条路:一是统计假设测验,二是参数的区间估计.本教材主要是统计假设测验.
统计假设测验的含义:首先对样本所属的总体提出统计假设(无效假设 ,备择假设 )然后计算样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小则否定该假设,从而接受另一个相反的备择假设
具体有以下三大步:
(一)提出统计假设:对所研究的总体首先提出统计假设
(二)计算概率: 在假定无效假设为正确的前提下,研究抽样分布,从而计算出样本在无效假设的总体中出现的概率
(三) 推断: 根据“小概率事件实际上不可能发生”原理接受或否定无效假设
**1方差分析的基本方法基本步骤?
方差分析的步骤:
1.平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.
2.F测验:利用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的.
3.多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.
2、F测验的两个前提条件?
F测验需具备条件:
(1)变数y遵循正态分布N( , ),
(2) s12 和 s22 彼此独立 。
3、多重比较方法尺度大小和应用?
多重比较方法尺度的大比较:
1.P=2时:
2.P>2时:
(1)试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法(LSD法);
(2)新复极差法(SSR法)适用于试验精确度一般的所有均值间的相互 比较.
(3)q法测验适用于试验精确度较高的所有均值间的相互比较.
4、方差分析的含义是什么?如何进行自由度和平方和的分解?如何进行F测验和多重比较?
所谓方差分析(analysis of variance) :是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。是关于k(k≥3)个样本平均数的假设测验方法.
平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.
F测验:利用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的. F测验(方差差异的显著性测验或方差的同质性测验)的方法
1.提出统计假设
2.规定显著水平
3.计算概率
4.推断:如果 就否定无效假设,接受备择假设
如果 接受无效假设
多重比较的基本思路
利用误差方差计算出最小显著差异标准,若任两个均值之差的绝对值
标准, 则它们的总体均值 就差异显著; 反之就差异不显著
多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.
5、方差分析有哪些基本假定?
(1) 处理效应与环境效应等应该具有“可加性”(additivity) 以组合内只有单个观察值的两向分组资料的线性可加模型为例予以说明
(2)试验误差 应该是随机的、彼此独立的,具有平均数为零而且作正态分布,即“正态性”(normality) .
(3)所有试验处理必须具有共同的误差方差,即误差同质性(homogeneity)
**1适合性测验独立性测验的含义?
适合性测验的概念:测验实际次数与理论次数是否相适合的卡平方测验
独立性测验的概念:测验两个因素的列联次数是否相互独立的卡平方测验. 独立性测验的实质:测验实际次数与理论次数是否相适合的卡平方测验
**1什么叫回归分析?直线回归方程和回归截距回归系数的统计意义是什么?如何计算?如何对直线回归进行假设测验和区间估计?
回归分析:计算回归方程为基础的统计分析方法。
(一)直线回归方程式
(9·1)
n a回归截距(regression intercept):a是x=0时Y的值,即回归直线在y 轴上的截距。
n b 回归系数(regression coefficient):b是x 每增加一个单位数时,Y平均地将要增加(b>0时)或减少(b<0时)的单位数。
建立回归方程或求a和b的原理是:
最小二乘法或最小平方法原理,即使各个实际值y与回归直线对应值之差平方之和最小.
其几何图形上的含义:各个实际观测点与回归直线上点之距离和为最小,即误差为最小.
(1).提出统计假设,H0: =0 , Ha: ≠O
(2).规定显著水平为0.05或0.01
(3).计算概率:计算b来自 =0的总体的概率
2什么叫相关分析?相关系数决定系数各有什么具体意义?如何计算?如何对相关系数做假设测验?
相关分析:计算相关系数为基础的统计分析方法。计算表示Y 和X 相关密切程度的统计数,并测验其显著性。
相关系数是两个变数标准化离差的乘积之和的平均数。
n 相关系数的功能定义:表示变量间相关性质与程度的统计数
n 相关系数的计算定义:由自变量引起的回归平方和占依变量总平方和比率的平方根(见公式9.34下)
n 相关系数的推导定义:是两个变数标准化离差的乘积之和的平均数。
一、判断题:判断结果填入括弧,以√表示正确,以×表示错误。(每小题2分,共14分)
1 多数的系统误差是特定原因引起的,所以较难控制。( × )
2 否定正确无效假设的错误为统计假设测验的第一类错误。( √ )
3 A群体标准差为5,B群体的标准差为12, B群体的变异一定大于A群体。( × )
4 “唯一差异”是指仅允许处理不同,其它非处理因素都应保持不变。( √ )
5 某班30位学生中有男生16位、女生14位,可推断该班男女生比例符合1∶1(已知)。 ( √ )
6 在简单线性回归中,若回归系数,则所拟合的回归方程可以用于由自变数可靠地预测依变数。( × )
7 由固定模型中所得的结论仅在于推断关于特定的处理,而随机模型中试验结论则将用于
推断处理的总体。( √ )
二、填空题:根据题意,在下列各题的横线处,填上正确的文字、符号或数值。(每个空1分,共16分)
1 对不满足方差分析基本假定的资料可以作适当尺度的转换后再分析,常用方法有
平方根转换 、 对数转换 、 反正旋转换 、 平均数转换 等。
2 拉丁方设计在 两个方向 设置区组,所以精确度高,但要求 重复数 等于 处理数 ,所以应用受到限制。
3 完全随机设计由于没有采用局部控制,所以为保证较低的试验误差,应尽可能使试验的环境因素相当均匀。
4 在对单个方差的假设测验中:对于,其否定区间为或;对于,其否定区间为;而对于,其否定区间为。
5 方差分析的基本假定是 处理效应与环境效应的可加性 、 误差的正态性 、 误差的同质性 。
6 一批玉米种子的发芽率为80%,若每穴播两粒种子,则每穴至少出一棵苗的概率为 0.96 。
7 当多个处理与共用对照进行显著性比较时,常用 最小显著差数法(LSD) 方法进行多重比较。
三、选择题:将正确选择项的代码填入题目中的括弧中。(每小题2分,共10分)
1 田间试验的顺序排列设计包括 ( C )。
A、间比法 B、对比法 C、间比法、对比法 D、阶梯排列
2 测定某总体的平均数是否显著大于某一定值时,用( C )。
A、两尾测验 B、左尾测验 C、右尾测验 D、无法确定
3分别从总体方差为4和12的总体中抽取容量为4的样本,样本平均数分别为3和2,在95%置信度下总体平均数差数的置信区间为( D )。
A、[-9.32,11.32] B、[-4.16,6.16] C、[-1.58,3.58] D、都不是
4 正态分布不具有下列哪种特征( D )。
A、左右对称 B、单峰分布 C、中间高、两头低 D、概率处处相等
5 对一个单因素6个水平、3次重复的完全随机设计进行方差分析,若按最小显著差数法进行多重比较,比较所用的标准误及计算最小显著差数时查表的自由度分别为( C )。
A、, 3 B、, 3 C、, 12 D、, 12
四、简答题:(每小题5分,共15分)
1 分析田间试验误差的来源,如何控制?
答:田间试验的误差来源有:(1)试验材料固有的差异,
(2)试验时农事操作和管理技术的不一致所引起的差异,
(3)进行试验时外界条件的差异
控制田间试验误差的途径:(1)选择同质一致的试验材料,
(2)改进操作和管理技术,使之标准化,
(3)控制引起差异的外界主要因素。
2 试述统计假设测验的步骤。
答:(1) 对样本所属的总体提出假设,包括无效假设和备择假设。
(2) 规定测验的显著水平a值。
(3) 在为正确的假定下,计算概率值p-值。
(4)统计推论,将p-值与显著水平a比较,作出接受或否定H0假设的结论。
3 田间试验设计的基本原则是什么,其作用是什么?
答:田间试验设计的基本原则是重复、随机、局部控制。
其作用是(1)降低试验误差;
(2)获得无偏的、最小的试验误差估计;
(3)准确地估计试验处理效应;
(4)对各处理间的比较能作出可靠的结论。
1、对频率百分数资料进行方差分析前,应该对资料数据作反正弦转换。 ( × )
2、多重比较前,应该先作F测验。 ( × )
3、u测验中,测验统计假设 ,对 时,显著水平为5%,则测验的值为
1.96。 ( × )
4、多个方差的同质性测验的假设为,对 (对于所有的)。 ( × )
5、对直线回归作假设测验中, 。 ( × )
6、在进行回归系数假设测验后,若接受,则表明X、Y两变数无相关关系。( × )
7、如果无效假设错误,通过测验却被接受,是a错误;若假设正确,测验后却被否定,
为b错误。 ( × )
8、有一直线相关资料计算相关系数r为0.7,则表明变数x和y的总变异中可以线性关系说明的部分占70%。 ( × )
9、生物统计方法常用的平均数有三种:算术平均数、加权平均数和等级差法平均数。( × )
10、某玉米株高的平均数和标准差为(厘米),果穗长的平均数和标准差为
(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( × )
1、 田间试验设计的基本原则是什么,其作用是什么?
答:田间试验设计的基本原则是重复、随机、局部控制。
其作用是(1)降低试验误差;
(2)获得无偏的、最小的试验误差估计;
(3)准确地估计试验处理效应;
(4)对各处理间的比较能作出可靠的结论。
2、何谓随机区组试验设计?
答:根据“局部控制”的原则,将试验地按肥力程度划分为等于重复次数的区组,一区组亦即一重复,区组内各处理都独立地随机排列。
3、用样本直线回归方程,由X预测Y时,为什么不能任意外推?
答:因为在试验范围之外,X、Y 两个变数间是否存在回归关系和什么样的回归关系,并不知道,
因而用样本直线回归方程,由X预测Y时,不能任意外推。
4、什么是试验误差?试验误差与试验的准确度、精确度有什么关系?
答:试验误差指观察值与其理论值或真值的差异。
系统误差使数据偏离了其理论真值,影响了数据的准确性;偶然误差使数据相互分散,影响了数据的精确性。
三、填空题: 根据题意,在下列各题的横线处,填上正确的文字、符号或数值。
(本大题分8小题, 每个空1分, 共20分)
1、变异数包括 极差 、 方差 、 标准差 、 变异系数 。
2、小麦品种A每穗小穗数的平均数和标准差值为18和3(厘米),品种B为30和4.5(厘 米),根据 _ CVA_ 大于_ CVB _,品种_ A _ 的该性状变异大于品种_ B _。
3、用紫花、长花粉与红花、圆花粉香豌豆杂交,调查四种类型豌豆株的数目,在测验它们 是否按 9:3:3:1 的比例分离时,应用 _适合性测验__ 方法测(检)验,如测验否定无效假设,说明__其四种类型不符合 9:3:3:1 的分离比例。
4、二项总体也可以称为0,1总体,是因为 二项总体中两事件为对立事件,将发生事件记为“1”,另一事件记为“0” 。
5、在研究玉米种植密度和产量的关系中,其中种植密度 是自变数, 产量 是依变数。
6、标准正态分布是参数___m=0__,_s2_=1__的一个特定正态曲线。
7、方差分析的基本假定是 处理效应与环境效应的可加性 、 误差的正态性 、 误差的同质性 。
8、误差可以分为 随机 误差和 系统 误差两种类型。
1、下列事件的关系中,属于独立事件的是 。
A.一粒种子播种后发芽与不发芽
B. 从一束玫瑰花中取出一支,颜色为红色、白色和黄色的事件
C. 饲喂幼虫时幼虫的成活与死亡
D. 播种两粒种子,第一粒出苗和第二粒出苗
2、算术平均数的两个特性是 。
A. ∑x2最小, =0 B. 最小, x=0
C. 最小, =0 D. 最小, =0
3、已知,则x在区间的概率为 。
A、0.025 B、0.975 C、0.95 D、0.05
4、关于无偏估计值,下列说法正确的是 。
A.是m的无偏估计值 B.S2 不是s2的无偏估计值;
C.以n为分母得到的样本方差 S02是s2的无偏估计值
D.S是s的无偏估计值
5、研究农药残留问题,凭生产经验认为喷洒杀虫剂后的蔬菜中杀虫剂含量μ1高于未喷洒的蔬菜中的含量μ0,那么在做假设测验时,无效假设应该是 。
A. H0:μ1=μ0 B. H0:μ1 ≤μ0
C. H0:μ1≥μ0 D. H0:μ1≠μ0
6、为比较去雄和不去雄两种处理对玉米产量的影响,选面积相同的玉米小区10个,各分成两半,一半去雄,一半不去雄。所得数据应做 。
A.u 测验 B.t测验 C.测验 D.F测验
7、次数资料的独立性测验和适合性测验都是 。
A.两尾测验 B.左尾测验 C.右尾测验 D.以上都不对
8、方差分析时,进行数据转换的目的是 。
A.误差方差同质 B. 处理效应与环境效应线性可加
C.误差方差具有正态性 D. A、B、C都对
9、用标记字母法表示的多重比较结果中,如果两个平均数的后面,既标有相同大写拉丁字母,又标有不同大写拉丁字母,则它们之间差异
A. 极显著 B. 不显著 C. 显著 D. 未达极显著
10、单个方差的假设测验,采用的测验方法有
A.u 测验 B.t测验 C.测验 D.F测验
11、以下的第 个分布是与自由度无关的。
A. 正态分布 B.t分布 C.χ2分布 D. F 分布
12、当试验中设有共同对照,多个处理与共同对照进行显著性比较时,常用 。
A.LSD法 B.SSR法 C. q法 D. LSR法
13、要得到剩余误差(离回归误差)最小的回归方程,选用的是 。
A. 矫正法 B. 离均差和为最小的原理
C. 最小二乘法 D. 计算合并均方值的方法
14、决定系数的取值范围为 。
A. [0,1] B. [-1,0] C.[-1,1] D.[-∞,+∞]
15、随机区组试验其方差分析时误差项自由度为DFe,若有一小区数据缺失,则误差项自由度为 。
A. DFe-1 B. Dfe+1 C. Dfe D. Dfe-2
三、填空题(每空1分,共15分)
1.有一样本其观察值分别9、6、10、8、12、11、8、8、9, 则其算术平均数为_____________,中位数为__________,众数为_______,极差为_______。
2. 已知金鱼的体色鱼与体长没有关系,在一个金鱼群体中,已知体色为金色的概率为0.35,体长超过10cm的概率为0.20。从该群体中任意选出一条鱼,它既是金色,体长又超过10cm的概率是 ,它是非金色,体长小于10cm的概率是 。
3. 两个独立的正态总体N1(μ1=4, s12=9)和N2(μ2=3, s22=4),分别以样本容量n1=3,n2=4进行抽样,其样本平均数差数的分布应遵从 分布,且具有μx1-x2= ,= 。
4. 随机抽取百农3217小麦品种100株测定株高,得样本平均数 =80cm,样本标准差S=10cm,用99%的可靠度估计该品种的平均株高为 至____ ________。
5.如果无效假设H0正确,通过假设测验却被否定,会犯 错误,如果无效假设H0错误,通过假设测验却被接受,会犯 错误。
6. 在对比法或间比法试验结果分析中,判断某处理确实优于对照,要求相对生产力一般至少应超过对照___________以上。
7.直线回归分析中用自变量x的变化去预测依变量y的变化时,一般要求相关系数∣r∣≥ ,且达显著水平。
1.统计数:由样本全部个体所得观测值算得的样本特征数。
2.随机误差:由于无法控制的偶然因素的影响,造成的试验结果与真实结果之间产生的误差。
3.二项总体:由非此即彼事件组成的总体,常以B(n,p)来表示。
4.小概率事件原理:统计学上认为小概率事件在一次随机试验中实际是不可能发生。
5.试验因素:试验中变动的有待比较的一组试验处理。
二、选择题 (本大题分15小题,每小题1分,共15分)
1、D 2、C 3、B 4、A 5、B 6、B 7、C 8、D 9、D 10、C
11、A 12、A 13、C 14、A 15、A
三、填空题:(每空1分,15分)
1、9 9 8 6 2、0.07 0.52 3、正态 1 4 4、77.42 82.58
5、第一类或α错误 第二类或β错误 6、10% 7、0.7
1、卡平方测验的连续性矫正的前提条件是 自由度等于1 。
2、在多重比较中,当样本数大于等于3时,t测验,SSR测验、q测验的显著尺度 q 最高, t 最低。
3、对比法、间比法试验,由于处理是作 顺序 排列,因而不能够无偏估计出试验的误差。
4、拉丁方设计及特点横行数=纵行数=处理
=重复次数。
可以从两个方向控制土壤肥力差异而引起的误差,提高试验正确性;缺乏灵活性、伸缩性。拉丁方设计的步骤:①选择标准拉丁方。②随机调整横行。③随机调整纵行。④随机排列处理。
6、适合性测验的基本步骤:①提出无效假设和对应的备择假设。②确定显著水平(∝表示)。③计算统计量。④做出统计推断。
7、如何整理大样本数量资料?①求全距(极差)。②决定组数和组距。③确定组限和组中值。④根据组限把各个观察值归组。(特殊、推测、一般、样本。)
填空:
1、对田间试验的要求主要有四点即:实验目的要明确、实验条件要具有代表性、试验结果具有可靠性、实验结果具有重演性、。
2、拉丁方与随机区组设计的最大不同点在于,前者能从两个方向控制土壤肥力差异。
3、在正态分布下,平均数左右一倍标准差范围内变量出现的概率为68.28%。
4、统计推断包括统计假设测验和参数估计。
5、比较实验数据与理论假设是否符合的卡平方测验称为适合性测验。
6、卡平方的定义式:X2=∑(O-E)2 E
7、一个相关模型资料,其样本容量n一般不应小于5.
8、否定正确的H0假设要犯α错误,接受错误H0假设要犯β错误。
9、独立性测验是用于研究两个或多个变数之间相关性的测验方法。
10、决定系数的取值区间为[0,1].
11、二项成数方差分析时当百分数小于30%或者大于70%,数据转换用反正弦转换。
12、多重比较结果的表示方法,常用有梯形表法和标记字母法。
13、相关系数的取值区间为[-1,+1].
14、X2值的取值区间为[0,+∞].
15、一系列变量中最大值与最小值之差称为极差,用R表示。
名词解释:
1、样本:从总体中抽取出来加以研究的部分个体。
2、总体:具有相同性质的个体所组成的群体称为总体。
3、参数:利用总体的所有个体观察值,计算所得用以代表总体特征的数值。
4、统计数:利用样本的各个观察值、计算所得的数值。
5、单尾测验:利用一尾概率进行的测验。
6、双尾测验:利用两尾概率进行的测验。
7、无效假设:在统计假设测验中,必需进行的假设。
8、备择假设:在统计假设中,与无效假设相对应的假设。
9、接受区:在统计假设测验中,接受无效假设的区域。
10、否定区:在统计假设测验中,否定无效假设的区域。
11、显著水平:在统计假设测验中,用于否定无效假设的概率标准。
12、回归分析:以计算回归方程为基础的统计分析方法。
13、相关分析:以计算相关性为基础的统计分析方法。
14、置信区间:在一定概率保证下,由样本结果估计总体参数,可能取值的区间。
15、置信度:以叫置信系数,保证总体参数分布在置信区间的概率。
16、重复:试验的每一个处理,所种植的小区数目。
17、小区:在田间实验中每一个处理所占的小块地段。
简答题:
1、田间试验误差来源及控制途径:答:试验误差来源:①实验材料的不一致性。②田间操作管理水平的差异。③外界条件的影响。试验误差控制途径:①选择同质一致的材料。②不断改善田间操作管理水平。③优化外界条件。
2、平均数假设测验的基本步骤:①提出无效假设和对应的备择假设。②确定显著水平。③计算统计量。④作出统计推断。
3、简述方差分析步骤:①分解总变异的平方和和自由度。②根据平方和和自由度求出各项变异的均方。③进行方差的干测验,以及平均数差异显著性检验,做出统计推断。
5、田间试验设计的基本原则和作用:原则:①重复。②随机排列。③局部控制。作用:降低试验误差,提高试验正确性。
1、对频率百分数资料进行方差分析前,应该对资料数据作反正弦转换。 ( × )
2、多重比较前,应该先作F测验。 ( × )
3、u测验中,测验统计假设 ,对 时,显著水平为5%,则测验的值为
1.96。 ( × )
4、多个方差的同质性测验的假设为,对 (对于所有的)。 ( × )
5、对直线回归作假设测验中, 。 ( × )
6、在进行回归系数假设测验后,若接受,则表明X、Y两变数无相关关系。( × )
7、如果无效假设错误,通过测验却被接受,是a错误;若假设正确,测验后却被否定,
为b错误。 ( × )
8、有一直线相关资料计算相关系数r为0.7,则表明变数x和y的总变异中可以线性关系说明的部分占70%。 ( × )
9、生物统计方法常用的平均数有三种:算术平均数、加权平均数和等级差法平均数。( × )
10、某玉米株高的平均数和标准差为(厘米),果穗长的平均数和标准差为
(厘米),可认为该玉米的株高性状比果穗性状变异大。 ( × )
二、简答题:(根据题意,给出简单、适当的论述)
(本大题分4小题, 每小题5分, 共20分)
1、 田间试验设计的基本原则是什么,其作用是什么?
答:田间试验设计的基本原则是重复、随机、局部控制。
其作用是(1)降低试验误差;
(2)获得无偏的、最小的试验误差估计;
(3)准确地估计试验处理效应;
(4)对各处理间的比较能作出可靠的结论。
2、何谓随机区组试验设计?
答:根据“局部控制”的原则,将试验地按肥力程度划分为等于重复次数的区组,一区组亦即一重复,区组内各处理都独立地随机排列。
3、用样本直线回归方程,由X预测Y时,为什么不能任意外推?
答:因为在试验范围之外,X、Y 两个变数间是否存在回归关系和什么样的回归关系,并不知道,
因而用样本直线回归方程,由X预测Y时,不能任意外推。
4、什么是试验误差?试验误差与试验的准确度、精确度有什么关系?
答:试验误差指观察值与其理论值或真值的差异。
系统误差使数据偏离了其理论真值,影响了数据的准确性;偶然误差使数据相互分散,影响了数据的精确性。
1、变异数包括 极差 、 方差 、 标准差 、 变异系数 。
2、小麦品种A每穗小穗数的平均数和标准差值为18和3(厘米),品种B为30和4.5(厘 米),根据 _ CVA_ 大于_ CVB _,品种_ A _ 的该性状变异大于品种_ B _。
3、用紫花、长花粉与红花、圆花粉香豌豆杂交,调查四种类型豌豆株的数目,在测验它们 是否按 9:3:3:1 的比例分离时,应用 _适合性测验__ 方法测(检)验,如测验否定无效假设,说明__其四种类型不符合 9:3:3:1 的分离比例。
4、二项总体也可以称为0,1总体,是因为 二项总体中两事件为对立事件,将发生事件记为“1”,另一事件记为“0” 。
5、在研究玉米种植密度和产量的关系中,其中种植密度 是自变数, 产量 是依变数。
6、标准正态分布是参数___m=0__,_s2_=1__的一个特定正态曲线。
7、方差分析的基本假定是 处理效应与环境效应的可加性 、 误差的正态性 、 误差的同质性 。
8、误差可以分为 随机 误差和 系统 误差两种类型。