? 统计学:研究事物的数量特征及其数量规律的一门方法论学科
? 生物统计学:研究生物的数量特征及其数量规律的一门方法论学科(数理统计和概率论的原理在生物学研究中的应用)
科学研究的基本过程和方法
(一) 科学研究的基本过程(与第五章的统计假设测验有密切的联系)
(1)提出假设或假说; (2)进行试验或抽样调查; (3)分析数据肯定或否定或修改假说。
(二) 科学研究的基本方法
1.选题2.文献3.假说 4.试验的规划与设计 5.假说的检验
1.何为实验因素,实验水平,实验处理?何谓简单效应、主要效应和交互作用效应?举例说明。
试验因素:简称因素或因子(factor):被变动并设有待比较的一组处理的因子或试验研究的对象(研究对象的效应)。
水平(level):试验因素内不同的级别或状态。
试验处理(treatment):单因素试验中的每一个水平即为一个处理;多因素试验中是不同因素的水平结合在一起形成的处理组合,也简称为处理。
简单效应(simple effect): 在同一因素内两种水平间试验指标的差异。
主效(main effect):一个因素内各简单效应的平均数。
交互作用效应(interaction effect),简称互作: 因素内简单效应间差异的平均。
互作的实质:反映了一个因素的不同水平在另一个因素的不同水平上 反应不一致的现象.
2.什么是实验方案,如何制定一个正确的实验方案?试举例说明?
试验方案:根据试验目的和要求所拟定的用来进行比较的一组试验处理的总称。
1.目的明确。 2. 选择适当的因素及其水平。 3. 设置对照水平或处理,简称对照(check,符号CK)。 4. 应用唯一差异原则。
试验误差的概念:试验结果与处理真值之间的差异
试验误差的分类:1.系统误差(systematic error) : 由于固定原因造成的试验结果与处理真值之间的差异. 系统误差影响了数据的准确性,准确性是指观测值与其理论真值间的符合程度;
2.随机误差(random error):由于随机因素或偶然因素造成的
试验结果与处理真值之间的差异.
随机误差影响了数据的精确性,精确性是指观测值间的符合程度。
4实验误差来源:(1)试验材料固有的差异(2)试验时农事操作和管理技术 的不一致所引起的差异(3)进行试验时外界条件的差异
控制:(1)选择同质一致的试验材料(2) 改进操作和管理技术,使之标准化(3) 控制引起差异的外界主要因素 选择条件均匀一致的试验环境; 试验中采用适当的试验设计和科学的管理技术;
应用相应的科学统计分析方法。
第二章
1、试验设计( experiment design)
广义----是指整个试验研究课题的设计,包括确定试验处理的方案,小区技术,以及相应的资料搜集、整理和统计分析的方法等;
狭义----专指小区技术,特别是抽样方法.重复区组和试验小区的排列方法。主要通过抽样方法,重复区组和处理小区的不同排列方法,达到控制或减少试验误差的目的.
处理小区----一个处理所占有的一小块试验空间或试验地.
重复区组( block ) ----一个试验的全部处理小区相邻排列在一起即构成一个区组.
2、田间试验设计的基本原则是什么?有何作用?
试验设计的三个基本原则
1.重复 2.随机 3.局部控制
重复的作用: 估计试验误差 ;降低试验误差 。
随机的主要作用:无偏估计试验误差;研究随机事件----获得随机变量-----概率的性质------进行统计分析(统计推断)!
局部控制就是分范围分地段或分空间地控制非处理因素,使之对各试验处理的影响在较小空间内达到最大程度的一致,从而有效地降低试验误差。这是降低误差的重要手段之一
第三章
总体( population ):具有共同性质的个体所组成的集团.
样本( sample ):从总体中抽取若干个个体的集合称为样本(sample)。
参数:由总体中全部个体观察值计算得总体特征值.
统计数( statistic ):测定样本中的各个体而得的样本特征数,如平均数等,称为统计数
关系:试验研究的目的是为了获得总体的信息或特征;试验研究的方法则是抽样研究;
利用样本的结果(统计数)推断或估计总体特征 (参数).
算术平均数 一个数量资料中各个观察值的总和除以观察值个数所得的商数,称为算术平均数
算术平均数的重要特性:(1)离均差之和为零(2)离均差平方的总和最小
变异数的意义:一表示资料数据间的变异程度或离散程度或离均程度;二可以衡量平均值的代表性.
变异数的种类: 一、极差 二、方差 三、标准差 四、变异系数
计算:样本标准差的公式为:
总体标准差用表示:
变异系数( coefficient of variation ) ----样本的标准差对均数的百分数:
变异系数是一个不带任何单位的平均一个单位纯数离均程度,其作用:消除了平均值大小及所带单位不同的影响,其可用以比较二个事物的变异度大小。
第四章
1统计学上用n较大时稳定的频率近似代表概率。通过大量实验而估计的概率称为实验概率或统计概率,以p表示。
3小概率原理及其在统计假设测验中的应用?
小概率原理----若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。
小概率事件实际不可能性原理在统计假设测验中的应用:如果事先假设了一些条件,在这些假设的条件下若计算出某一事件为一小概率事件,然而它在一次正常的试验中竟然发生了;反过来说明假设的条件不正确,从而否定该假设(接受另一个相反的假设)
4、样本平均数抽样分布及其参数?样本平均数差数抽样分布及其参数?
从已知的总体中以一定的样本容量进行随机抽样,由样本的统计数所对应的概率分布称为抽样分布。抽样分布( sampling distribution )是统计推断的理论基础。
如果从容量为N的有限总体抽样,若每次抽取容量为n的样本,那么一共可以得到 个样本(所有可能的样本个数)。 抽样所得到的每一个样本可以计算一个平均数,全部可能的样本都被抽取后可以得到许多平均数。如果将抽样所得到的所有可能的样本平均数集合起来便构成一个新的总体,平均数就成为这个新总体的变量。由平均数构成的新总体的分布,称为平均数的抽样分布。随机样本的任何一种统计数都可以是一个变量,这种变量的分布称为统计数的抽样分布。
(1) 该抽样分布的平均数 与母总体的平均数相等:
(2) 该抽样分布的方差与母总体方差间存在如下关系:
如果从一个总体随机地抽取一个样本容量为n1的样本,同时随机独立地从另一个总体抽取一个样本容量为n2的样本,那么可以得到分别属于两个总体的样本,这两个独立随机抽取的样本平均数间差数( )的抽样分布参数与两个母总体间存在如下关系:
(1) 该抽样分布的平均数与母总体的平均数之差相等:
(2) 该抽样分布的方差与母总体方差间的关系为:
第五章
1区间估计,置信区间,置信限,置信度的概念?
区间估计:在一定的概率保证之下,由样本的统计数估计出总体参数可能位于的区间.
置信区间( confidence interval ):在一定的概率保证之下,由样本的统计数估计出的总体参数可能位于的区间.区间的上、下限称为置信限( confidence limit )
一般以L1和L2分别表示置信下限和上限。
置信系数或置信度:保证总体参数位于置信区间的概率以P=(1- )表示。
统计假设(statistical hypothesis) :对样本所属的总体(特征值或参数)提出假设(包括无效假设和备择假设两个,在后面有说明)。
§ 无效假设(null hypothesis):记作H0,假设样本所属总体效应或参数(平均数)与某一指定值相等或假设两个总体参数相等,即相对而言都不具有自己的独特效应.
§ 备择假设( alternative hypothesis ):记作 HA,假设样本所属总体效应或参数(平均数)与某一指定值不相等或假设两个总体参数不相等,或相对而言它们都有自己的独特效应.所以也可以称为有效假设.
因为只有无效假设相当于总体已知,这样才能从已知的总体中进行抽样分布,才能进一步计算样本在无效假设中出现的概率。
区间估计与统计假设测验的关系为:
1 如果无效假设位于置信区间内,就接受无效假设,称为差异不显著;
2 如果无效假设位于置信区间外,就否定无效假设,接受备择假设,称为差异显著;
4什么是显著水平?为什么要有一个显著水平?根据什么确定显著水平?它和统计推断有何关系?
用来测验假设的小概率标准5%或1%等,称为显著水平
由于显著水平不同可能直接影响到推断结果.本例题如果
用0.01水平就要接受无效假设,所以必须事先确定显著水平.
选用显著水平的原则:统计上达显著,实际上有应用价值. 选用显著水平的原则:试验误差小的,选高水平0.01; 试验误差大的,选低水平0.05.
5什么叫统计推断?它包括哪些内容?什么是统计假设测验,它的原理和方法?
统计推断:利用概率论和抽样分布的原理,由样本结果(统计数)推断或估计其总体特征(参数).
它有两条路:一是统计假设测验,二是参数的区间估计.本教材主要是统计假设测验.
统计假设测验的含义:首先对样本所属的总体提出统计假设(无效假设 ,备择假设 )然后计算样本在无效假设的总体中出现的概率,若概率大则接受该假设;若概率小则否定该假设,从而接受另一个相反的备择假设
具体有以下三大步:
(一)提出统计假设:对所研究的总体首先提出统计假设
(二)计算概率: 在假定无效假设为正确的前提下,研究抽样分布,从而计算出样本在无效假设的总体中出现的概率
(三) 推断: 根据“小概率事件实际上不可能发生”原理接受或否定无效假设
第六章
方差分析的步骤:
1.平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.
2.F测验:利用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的.
3.多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.
2、F测验的两个前提条件?
F测验需具备条件:
(1)变数y遵循正态分布N( , ),
(2) s12 和 s22 彼此独立 。
3、多重比较方法尺度大小和应用?
多重比较方法尺度的大比较:
1.P=2时:
2.P>2时:
(1)试验事先确定比较的标准,凡与对照相比较,或与预定要比较的对象比较,一般可选用最小显著差数法(LSD法);
(2)新复极差法(SSR法)适用于试验精确度一般的所有均值间的相互 比较.
(3)q法测验适用于试验精确度较高的所有均值间的相互比较.
4、方差分析的含义是什么?如何进行自由度和平方和的分解?如何进行F测验和多重比较?
所谓方差分析(analysis of variance) :是将总变异剖分为各个变异来源的相应部分,从而发现各变异原因在总变异中相对重要程度的一种统计分析方法。是关于k(k≥3)个样本平均数的假设测验方法.
平方和及自由度的分解:把试验资料总变异的平方和及自由度分解为各个因素的平方和及自由度,并计算出它们的方差.
F测验:利用f分布测验各个因素的方差是否显著大于误差方差.以明确哪个因素的效应是显著的. F测验(方差差异的显著性测验或方差的同质性测验)的方法
1.提出统计假设
2.规定显著水平
3.计算概率
4.推断:如果 就否定无效假设,接受备择假设
如果 接受无效假设
多重比较的基本思路
利用误差方差计算出最小显著差异标准,若任两个均值之差的绝对值
标准, 则它们的总体均值 就差异显著; 反之就差异不显著.
多重比较:对方差显著的因素内水平间的平均数进行比较(差异显著性测验),以明确哪些平均数间差异显著,哪些平均数间差异不显著.
5、方差分析有哪些基本假定?
(1) 处理效应与环境效应等应该具有“可加性”(additivity) 以组合内只有单个观察值的两向分组资料的线性可加模型为例予以说明
(2)试验误差 应该是随机的、彼此独立的,具有平均数为零而且作正态分布,即“正态性”(normality) .
(3)所有试验处理必须具有共同的误差方差,即误差同质性(homogeneity)
第七章
1适合性测验独立性测验的含义?
适合性测验的概念:测验实际次数与理论次数是否相适合的卡平方测验
独立性测验的概念:测验两个因素的列联次数是否相互独立的卡平方测验. 独立性测验的实质:测验实际次数与理论次数是否相适合的卡平方测验
第二篇:统计方法总结
一、统计分析方法总结
1.连续性资料
1.1 两组独立样本比较
1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。
1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。
1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。
1.2 两组配对样本的比较
1.2.1 两组差值服从正态分布,采用配对t检验。
1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。
1.3 多组完全随机样本比较
1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。
1.4 多组随机区组样本比较
1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。
1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。
****需要注意的问题:
(1) 一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。
(2) 当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**
(3) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。
2.分类资料
2.1 四格表资料
2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。
2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的 检验或Fisher’s确切概率法检验。
2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。
2.2 2×C表或R×2表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的
格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。
2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。
2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.3 R×C表资料的统计分析
2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。
2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。
2.2.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。
2.2.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。
2.4 配对分类资料的统计分析
2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对 检验。(2)b+c<40,则用校正的配对 检验。
2.4.1 C×C资料,(1)配对比较:用McNemar配对 检验。(2)一致性检验,用Kappa检验。
二、医学科研程序
⑴科研选题——⑵研究设计——⑶实施方法——⑷统计分析——⑸总结归纳
其中科研选题和研究设计最关键。
科研设计分为⑴专业设计⑵统计设计
统计设计的内容:研究对象数量的确定、对照组的选定、随机化分组原则、控制误差及统计分析方法的选定等。一、科研选题:⑴、查阅文献;⑵、选题原则:创新性、先进性、科学性、可行性;⑶、研究条件和优势
二、实施方法:⑴、调查;⑵、实验⑶、临床观察。
三、统计分析:⑴、正确搜集资料;⑵、描述资料统计特征⑶、统计推断并得出结论统计资料的要求:准确、完整、及时
描述资料:统计表、统计图、统计指标
统计推断:参数估计、假设检验
医学科研设计基本内容(临床实验设计参考用)
(社区干预试验设计可参照)
临床科研是以病人为研究对象,因此,在进行临床科研设计时应注意:①人有社会属性,受精神因素、心理因素影响,要注意临床科研要符合医学伦理要求;②必须设立对照(设立对
照的注意问题附后);③随访的起点和止点应有明确的定义;④注意影响实验研究结果的因素,并适当控制(具体内容附后)。
1.国内外研究现状、水平、发展趋势(简要介绍与本课题有关研究的国内外现状、水平、发展趋势等,写明本课题提出的依据及本课题研究目的;简要介绍预试验内容及结果。)。
2.研究对象:
(1)具体诊断标准(用公认的或统一的,并阐明出处;如没有统一的标准也应写明是自定标准。)、制定入选(纳入)标准及排除标准;
(2)研究对象选择范围(包括对照组)及选样和分组方法(使用正确的随机方法选样和分组;在实验对象的分组和施加因素分配实验组、对照组上,都要随机化);
(3)样本含量。(说明确定样本含量的依据)
3.处理因素:(详细写)
处理因素设置要求:①抓住主要因素;②找出非处理因素(混杂因素);③处理因素标准化。
(1)设备(或试剂或药物)生产厂家(来源)及型号(剂量);
(2)治疗方法及操作程序(包括对照组);
(3)操作过程中的质量控制(包括方法、人员、设备三统一及实验质控手段等);
(4)技术关键。
4.研究结果:
确定研究效应的测量指标及测定方法,要考虑与待评价的结果有关联性、客观性、灵敏性、特异性及实用性等。
(1)疗效判断标准(用公认的或统一的,并阐明出处;如没有统一的标准也应写明是自定标准。);
(2)(近期、远期)观察指标(各组观察指标应一致)及观察方法;
(3)科研记录表格及汇总表格式样;
(4)统计方法及指标确定,预计结果;
(5)科研质量控制措施(包括科研全过程的各环节,如预试验工作、分组、施加处理因素、临床观察及随访、原始资料的记录及收集、资料整理等方面质量控制措施)。
5.创新设想(本研究的):
6.工作时间安排(包括调研、设计、研究、统计分析、总结鉴定等):
7.研究人员分工(包括姓名、性别、年龄、职称、工作单位及在本研究中的详细分工):
8.经费的筹措及使用计划:
9.存在(可能出现)的问题、困难及解决办法:
临床科研的对照问题
为保证临床科研实验组与对照组之间具有可比性,对照组中的观察对象除了实验因素不同以外,实验过程中的实验条件和辅助措施,都应与实验组相同。常用对照方式如下:
1、空白对照:对照组不施加任何处理因素。这种对照仅用在某些病情较轻或长期稳定无任何危险的疾病,如:慢性关节炎、HbsAg携带者、近视等。
2、安慰剂对照:对照组采用无药理作用且无害的“药“,如:淀粉、生理盐水等经加工后其外形、味道等与试验药相似,不被受试者识别。这种对照仅用在研究的疾病尚无有效治疗方法,或使用安慰剂后该病的病情、临床经过、预后等影响小或无影响时。
3、实验对照:对照组不施加处理因素,但施加某种与处理因素有关的实验因素。
4、标准对照:用现有标准方法或常规方法做对照,注意以一种低疗效的方法作对照来提高试验的疗效是毫无意义的,甚至是有害的。
5、历史对照:以过去的研究结果作对照,这是一种非随机和非同期的对照,容易产生偏倚(可
能因为疾病自然病程会随时间而变化,或医生的收治病人诊断标准和治疗方法或水平因时间而变化等,使两组失去可比性)。这种对照可用于狂犬病、骨折愈合等疗效对照。
6、自身对照:对照和实验在同一受试对象进行,这种对照简单易行,但应注意该方法的两个缺陷:一是实验总是把处理前作对照,这不符合随机分配原则;二是实验前后某些环境因素或自身因素发生了改变,可能影响实验结果。可考虑用交叉实验解决。
7、相互对照:多种待研究观察因素相互对照。
目前常用的设计方案有:随机对照实验、配对实验、交叉实验(适于病程较长的实验研究),可根据具体情况,选用适合的方法进行实验研究。
10、影响实验研究结果的因素及其控制
一、误差:
1、随机误差:通过增加样本含量,可减小随机误差,但不能消除。
2、非随机误差:
非系统误差:偶然失误造成的。
系统误差:误差值遵循一定的规律而存在或变化,增加样本量,不能纠正。
二、编倚:(可以看成是一种系统误差)
1、选择性偏倚:防止选择性偏倚的措施:①正确拟定观察对象的纳入和排除标准;②采用分层抽样方法;③正确设立对照;④遵守随机化原则。
2、测量偏倚(或称观察偏倚或信息偏倚):
产生原因:①沾染(对照组也接受了处理措施);②干扰;③依从与非依从;④失访(>20%);⑤检查与诊断结果不一致;⑥观察记录有误;⑦心理因素的干扰。
防止措施:①用盲法试验;②签定实验合同;③检查实验对象的依从情况;④注意医德问题;⑤定期检查研究记录;⑥对实验方法、诊断标准的一致性在实验前应做出估计。
3、混杂偏倚:
产生原因:多在总结分析阶段,评价被研究因素与疾病之间的关系时,如果存在外来因素与该病和研究因素均有联系,使研究因素效应与外来因素效应混
在一起,从而掩盖或夸大研究因素与疾病的真实联系。
防止措施:①设计时,用配对设计或采用分层抽样方法;②分析阶段,用分层分析技术或多变量回归分析技术。其目的是平衡混杂因素的作用。
医学科研设计基本内容(调查设计参考用)
1、国内外研究现状、水平、发展趋势(简要介绍与本课题有关研究的国内外现状、水平、发展趋势等,写明本课题提出的依据及研究目的。注意:研究目的应很明确,且围绕一个中心;简要介绍预试验内容及结果。)。
2、调查计划:
⑴、确定观察对象(所要研究的总体)和观察单位(总体中的个体统计对象)
⑵、选定调查指标(调查指标是调查目的的具体体现):指标选择要求:①精选、重点突出,不要贪多求全,分散精力。②计量指标比计数指标敏感。③客观指标优于主观指标。④选用灵敏度高,特异度高的检查方法作为诊断依据。
⑶、调查方法(普查、抽样调查等)
⑷、样本含量(说明确定样本含量的依据)
⑸、收集原始资料的调查方式(直接观察、直接采访(访问调查、自填调查)、间接采访(信访、电话))
⑹、设计调查表和问卷(调查表和问卷设计相关问题附后)
⑺、调查阶段的组织工作(包括组织领导、关系协调、调查员培训等)
⑻、设计阶段质量控制:①正确划分调查范围;②尽量选择客观、明确的指标;③对调查问题进行精选,避免问题过于繁杂;④对于可能引起混淆的调查项目给出明确的定义。
⑼、调查阶段质量控制:①通过预试验工作完善调查设计;②抓好调查员的选拔和培训,避免因调查员工作态度不好或业务水平不足而影响调查结果;③对被调查者可能存在的拒绝、躲避、隐瞒、等问题,采取相应措施,如:开展宣传、摸清被调查者在家的时间规律、对敏感问题做好解释和保密工作,对记忆不清者,可请知情人帮助回忆;④在问卷中设置相反问题,以了解应答的可靠性;⑤选择调查方式时应考虑年龄和文化水平因素;⑥对检测项目的调查应注明检测设备、
试剂等生产厂家、型号、批号;操作过程应注意操作方法(包括诊断标准)、人员、设备(应有明确的校正灵敏度及准确度的方法及时间)三统一;⑦注意调查的效度(真实性)与信度(可靠性)问题,常采用现场抽样复查来评价调查信度等。
3、整理计划:(去粗取精,去伪存真)
⑴、计算机录入与整理工作:应提出确保录入质量的措施:①在建立数据库时,编写逻辑查错程序;②同一资料用两个录入员输入并用计算机核对;③资料录入完成后,做频数表或散点图,发现异常值;④正确选择合适的指标和分析方法等。
⑵、资料分组:(按数值大小分组、按类型分组等)
⑶、分组组数确定:
4、统计分析计划:(包括:①说明指标的内涵和计算方法及预期进行统计描述和推断内容;②拟进行的探索性分析;③控制混杂因素的措施;④列出统计分析表,并通过统计分析表检查调查、整理计划有否遗漏。)
5、创新设想(本研究的):
6、工作时间安排(包括调研、设计、研究、统计分析、总结鉴定等):
7、研究人员分工(包括姓名、性别、年龄、职称、单位及在本研究中的详细分工):
8、经费的筹措及使用计划:
9、存在(可能出现)的问题、困难及解决办法:
10、调查表及问卷设计相关问题
一、一般结构:
1、前言:用于说明调查目的、重要性、回答问题的必要性以及对调查内容保密等,以取得调查对象的合作。
2、填写说明:为保证所有调查员和调查对象均能对调查项目和填写方法正确理解,统一认识而编写。
3、核(备)查项目:该部分与调查目的无关,作核查核对用。内容包括调查员姓名、调查日期、复核结果、未调查原因等。
4、调查(分析)项目:为直接用于调查指标所必须以及排除混杂因素所必须的项目,包括调查对象的①背景资料,如:姓名、住址、单位、电话等;②人口学项目,如:年龄、性别、民族、婚姻状况、文化程度、职业等;③研究项目(该部分是调查表的核心内容,依不同调查目的而定,分问题项目和检测项目)。
二、问题的形式:问题的基本形式有提问式和陈述式两种;根据问题答案的形式分开放式问题(无统一答案)和封闭式问题(有固定答案)。
封闭式问题设计注意:1、答案应包括所有可能的答案,还应有“其它”一栏;2、各选择答案不应相互包含,不应有重叠情况。
三、问题设计的一般原则:
1、尽量避免用专业术语(提问一般就低不就高);
2、避免混淆,对语义较模糊的词(如:经常、偶尔、普通、大概等)应给出本次调查的定义或标准。
3、避免双重问题,避免一个问题中实际提出两个问题。
4、提问避免诱导或强制性(否定形式的提问有诱导之嫌);对有社会期望偏倚的问题应注意。
5、问题应适合全部调查对象并符合逻辑。
6、敏感问题的处理:对国家政策、伦理道德、经济收入、生活行为、其它个人隐私等敏感问题,可以采用对象转移法或假定法提问;关于敏感问题调查的随机应答技术问题,须参考有关统计学专著。
7、调查项目的安排顺序(注意问题顺序的逻辑性)
①、一般问题在前,特殊问题在后;
②、易答问题在前,难答问题在后;
③、敏感问题一般在最后;如敏感问题较多,可分散在问卷中,以降低其敏感性; ④、一般将问题项目放在前,检测项目放在后。