论文撰写中常见的统计学问题及其处理

时间：2024.4.20

论文撰写中常见的统计学问题及其处理

赵右更

绝大多数的论文撰写，均需通过一定数量临床病例（或资料）的观察，研究事物间的相互关系，以探讨客观存在的新规律。如何确定新诊断、新治疗等措施是否优于原沿用的方法，就需进行两种方法比较，这就涉及统计处理；统计设计又是整个课题研究设计中一个重要的组成部分。显然，经正确统计处理的结果可信度高，论文的质量也高。

据不完全统计，在难以发表的、已凝聚着作者心血并花费较长时间与较大财力撰写的研究论文中，约半数以上是由于统计错误致其结果与原文主要结论相违背。如一文采用某新药引产，96例足月孕妇的产后出血与新生儿低Apgar评分率均为2.1%（各2例），明显低于应用原药引产的19例，其产后出血与新生儿低Apgar评分发生率均为15.8%（各3例，X2=7.164，p？.001）。故认为采用新药引产是一更安全的措施。原药引产组例数偏少暂且不谈，该资料比较应采用精确法分析，结果是与原始果恰恰相反（p>0.05）,这样上述的主要结论就欠可靠而难以发表,否则论文可起误导作用。类似问题文稿中还常有出现。现就文稿中常见的统计问题及其相应的处理方法简述如下。

一、常用的统计术语

统计学中常用的概念有总体和样本、随机与概率、计算与计数、等级资料及正态与偏态分布资料、标准差与标准误等。如某研究采用经会阴途径测定宫颈长度，以探讨不同宫颈长度与临产时间的关系。结果显示35例宫颈长度为25~34mm者与32例宫颈长为15~24mm者临产时间的均值±标准差（±）各为57.6±58.1与47.3±49.1小时。该计量资料，经t检验显示t=0.780，p>0.05，并未提示不同宫颈长度的临产时间差异有显著意义；从标准差大于均值，显示各变量值离散程度大，呈偏态分布，故不能采用±s这一算术均数法计算均数。经偏态转换成近似正态分布资料后结果是：35例与32例的临产时间各为34.5±4.1与26.7±4.1小时，（=7.778，p？。001），两组差异有极显著意义。可认为随着宫颈长度的缩短、临产时间也缩短。此外，当两组资料单位不同时，其S单位也不同；即使两组单位的变量值，若其均数差异较大，也都应以变异系数替代s来比较两组值的离散度的大小。

二、正常值范围及异常阀值的确定

如何确定选择研究对象，至少需多少例，正确统计处理和参考一定数量的病理数据，是确定正常范围及异常阀值的四个重要因素。

1.研究对象：应为“完全健康者”，可包括患有不影响待测指标疾病的患者。如“正常妊娠”的条件：孕前月经周期规则、单胎、妊娠过程顺利、无产科并发症及其它有关合并症，分娩孕周为37~41周，新生儿出生体重为2500~4000g和Apgar评分≥7分。

2.观察数量：观察数量应尽可能多于100例：需分组者，各组人数也是如此（标本来源困难时酌情减少）。有些指标如雌三醇（E3）、甲胎蛋白（AFP）、胎盘泌乳素（HPL）等随孕周进展而变化，应按孕周分组；邻近孕周均数相近者，可合并几周计算。若为偏态分布，应以百分位数计算，则例数应》120例。取各孕周对象时，应考虑到所取各孕周中的例数分布大致均衡。显然，文稿中往往以少量例数求得正常值是欠可靠的。

3.统计处理：应根据所得数据分布特征采用不同的统计处理方法。属正态或近似正态分布的数据，可采用±s法计算；这也适用于以一定方法能将非正态分布转换成正态或近似正态分布的资料。对无法转换的偏态资料，应采用百分位数计算法。具体计算（包括上下限初步制定）

4.对照数量：相应观察的病例数（包括分组）应不少于30例。这对制定某指标有临床意义的异常阀值尤其重要，这一点往往易被忽视。如在参考较多病例数据后，唾液游离E3的下限异常阀值应为第2.5百分为数，而非通常采用的5百分为数。否则，将会导致指标产前监护的假阳性率增加。

三、t检验与校正t检验（t′检验）

这是文稿中极易混淆的一类计量资料统计问题。

（一）t检验的注意事项

1.t检验的意义：t检验与所有统计分析相同，其结果提示现有差别不仅仅是抽样误差所致，且提示犯第一类错误的可能性大小，即t0.05 与 t0.01犯第一类错误的

可能性各为5%与1%。

2.统计意义与临床意义的关系：统计学有显著意义，而在临床上可能是无意义的，提示该研究应继续深入，以明确该差异是否真有显著意义；相反，统计无显著意义，而临床上却是有意义的，不能贸然轻易地下结论。应复查实验设计、方法、试剂及仪器性能、质控措施和实验数据等是否问题，或尚需再进一步增加样本量进行复测等。

3.t检验使用范围：t检验仅适用于正态或近似正态分布（包括偏态转换）和其方差是齐性资料的检验；t检验适用于可比性资料，即除了欲比较的因素外，其它所有可影响的因素应相似。

4.t检验的结果判断：判断结果不应绝对化，p<或>0.05,分别表示可拒绝或接受原定的假设,但两者都有5%的可能性犯第一类错误;而p值越小,只能是更有理由拒绝原定的假设.

5.单侧与双侧检验:应预先制定本研究的结果是需行双侧还是单侧检验.对有把握确知某治疗措施或某指标是不会劣于现有的,才作单侧检验;若不知何者为优,应行双侧检验.因为在同一t值的界限上,单侧检验的概率(p)仅为后者的一半,

也就是说单侧检验较双侧检验更易得出差别有统计意义的结论.不可随意制定。一般讲，绝对大多数研究以采用双侧检验为妥。

（二）tˊ检验与t检验的区别

当样本均数的方差非齐性时，应以tˊ替代t检验。例如：甲组32例血清某指标值为53.9±49.6（ūmol/L）；乙组6例的结果为26.6±7.2（ūmol/L），若不考虑两样本方差大小，t 检验t=1.331，p>0.05，提示两组血清该指标的平均含量差异无显著意义。但先作方参齐性检验，F=47.4，p？.01，示这两样本方差差异有极显著意义。据此应采用tˊ=2.952 >tˊ0.012.875,p<0.01。显然，与上

述结论恰恰相反。

四、卡方（X）、校正X与直接法（或精确法）检验

这三种检验方法为一类用途较广，但也易混淆的、适用于记数资料检验的方法。应注意，签于总数与理论值的不同，应采用相适合的检验方法。

例1 192例出生体重≥4000g的新生儿发生难产与窒息数分别为151例与22例；3475例出生体重≥3500~4000g的新生儿发生难产与窒息数分别为185与265例；2451例出生体重≥2500~3500g的新生儿发生难产与窒息数分别为122与169例。3组的构成比：难产与新生儿窒息率分别为：78.6%、5.3%、5.0%与11.4%、

7.6%、6.9%。据此贸然认为出生体重≥2500~3500g为最佳新生儿分娩体重的结论不可靠。经X2分析，后两组的难产与窒息率间和前两组窒息率差异均无显著意义（p均>0.05）.故可认为,单据本研究结果是难以得出上述临床上认可的结论的。这涉及到上述“统计无显著意义，而临床却是有意义”的问题，应进一步复查或增加样本测试。杜绝单纯根据百分率的大小贸然下结论。

例2 某药治疗感染衣原体（CT）的中、晚期孕妇各11例和36例，她们的新生儿感染CT数各为3例和23例。X2 检验得X2=4.570，p<0.05。据此误认为，某药治疗中孕期感染CT孕妇的新生儿感染CT数少于晚孕期才开始治疗的新生儿感染数。根据统计原则，其中一个数的理论值为4.9（<5）时,应采用校正X2计算,得X2=3.209,p>0.05。显然，正确结论恰与上述相异。

例3 以精确法代替X2检验。某新技术测试8例卵巢内胚窦瘤患者，5例呈阳性反应；测试25例卵巢颗粒细胞瘤患者中6例阳性。X2检验的X2=4.042，p<0.05。误认为该新技术测前组的阳性率高于后组。但签于总例数33例（<5），且其中一个数的理论值为2.7（<5）。故应改用精确法检验，结果首次计算p值，已达到0.102，>双侧检验的有显著性的意义的界限0.025。故p>0.05。结论也恰相反。

五、相关与回归分析

相关分析只是以相关系数（r）来表示两个变量间直线关系的密切程度和相关方面的统计指标。无论是正相关（r为正值）或负相关（r为负值），只是经相22

关系数的统计意义检验（如t检验）后，当p？.05时，即示差异有显著意义时，才能依据︳r ︳值的大小来说明两变量间相关的密切程度。因此，表示相关性，除写出r值外，应注明p值；切不可将相关的显著性误解为相关程度；也应注意：相关分析是不能单纯用于阐明两事物或现象间存在着本质的联系，即使两变量间存在高度相关关系（即有一定的统计联系），也不能证明它们间存在着因果关系。如欲证明两事物间的内在联系，必需凭借专业知识从理论上加以阐明。

“相关”是表示两个变量间相互关系的密切程度，而回归分析是提示两个变量间的从属关系。在回归分析中，应注意由X变量值推算Y，与Y变量值推算X的回归线是不一样的；直线回归方程的适用范围，一般近适合于自变量X原则数据的范围，故绘制回归线时，X值切不能超越实测值的范围而任意延长。

可见，这两种分析，说明的问题是不同的，但相互又有联系。在作回归分析时，一般先作相关分析，只有在相关分析有统计意义（即回归有统计意义）的前提下，求回归方程和回归线才有实际意义。决不能把毫无实际意义的两个事物或两种现象进行相关与回归分析。

六、数据的正确书写

1.文稿内各数据的书写必须前后一致；总数应等于各分组的数据之和。

2.对不同指标，有其不同数据精度的要求，这应结合专业知识加以判断。如新生儿出生体重是以公斤为单位，记录测定数据精确到小数点后的第二位数字即可。

3.测定数据的书写，不能超越其测量仪器测试的精确度范围。

4.同一指标的前后数据应保持同一精度。

5.经计算，出现比预定小数点后两位数多的字，应采取“≤4舍、≥6入”与“5‘奇’进‘偶’出”方法，以决定小数点后第三位数字是“舍”还是“入”，即5前为单数则入，双数则舍。

6.未经统计检验，文稿内不宜出现推断性的比较结果的结论。如“××结果的百分率高或××结果的百分率”、“本文结果较××报道的多或少或类似”等结论。这在综述类文章撰写过程中也需注意；欲予以比较，也应注意两者的可比性。

上述是统计学中较为基础的概念，但又是文稿中常见的、较易出现差错的内容。因此可以认为，统计学是医护人员必需掌握并能熟练应用的一门重要知识；藉此，可不断地从自身和他人的研究中获取更多、更新和更可靠的专业信息。

第二篇：医学论文中的常见统计学问题及其处理

222

新疆医科大学学报　JOURNALOFXINJIANGMEDICALUNIVERSITY　2002Jun.,25(2)

医学论文中的常见统计学问题及其处理

李　晶1　综述　　徐　秦2,杨爱萍1审校

(新疆医科大学1学报编辑部,2公共卫生学院卫生统计学教研室,新疆　乌鲁木齐　830000)

中图分类号:R195.1　　文献标识码:B　　文章编号:100925001(2002)0220222203　　随着现代医学的发展,医学统计学作为一种认识医学现

象数量特征的重要工具受到了广大医学工作者的重视,统计学分析已成为医学科研报告中不可缺少的一个重要组成部分。正确使用,能保证科研工作的顺利进行,使研究结果更具有说服力。反之,如果使用不当或误用,会直接影响研究结果的质量,甚至有时会导致错误的结论,文章的可靠性和科学性将大大降低。Clantz1报道生物医学文献约半数的文章所使用的统计方法不正确,凌瑞珠2调查了《中华医学检验杂志》,发现其原著中50%～70%存在统计误用,认为国内其它医学杂志的统计误用也多处于类似水平。新疆医学院和石河子医学院有关学者从19xx年以来对区内外10余种医学刊物的论文进行了认真考察,发现有许多统计误用情况3,4。本文就医学论文中常见的统计学问题作如下综述。

1　医学科研设计方面

1.1　缺乏完善的实验计划　有些研究工作者对欲研究的课题缺乏细致的思考,不拟订切实可行的实验计划,致使有些过失无法弥补。如遗漏了某些重要的影响因素或观测指标;实验记录零乱或残缺不齐;缺乏完善的实验计划和必要的预实验等。

1.2　所采用的实验设计类型过于简单　统计学的设计类型很多,研究者应根据具体情况选用不同的设计类型。但在实际工作中需要用多因素的实验研究却按单因素的设计思想来设计实验,使得科研课题的研究时间延长,并且用单因素实验研究取代多因素实验研究,当因素之间存在显著性的交互作用时,容易得出错误的结论。

1.3　设计类型辨别不清　如果仅凭专业知识去设立试验组和对照组,而对试验中究竟涉及几个试验因素,它们之间是怎样组合的以及所使用的设计类型是什么却不清楚,这样易犯错误。例如:(1)拆散了多因素的整体设计;(2)混淆了因素与水平之间的关系;(3)混淆了重复试验与重复测量之间的关系5,6。

1.4　抽样研究应分析抽样误差7,8　一般的研究工作都是抽样研究,从样本资料计算出来的比例或率都有抽样误差,在分析中都要考虑抽样误差,不要仅仅比较样本比例或样本率的大小就下结论,因此,作者在分析由抽样调查获得的样本统计指标时应运用统计方法估计抽样误差。许多医学刊物中所刊载的抽样研究的文章的作者未提供抽样误差,使编者及读者无法估计总体参数的可信限及可靠程度。有些作者对样本统计值之差未进行显著性检验,仅凭资料表面的差值比较来加以判断。

1.5　临床实验中的样本问题9　

1.5.1　样本对总体代表性差　临床实验研究中为了保证样本具有代表性,必须做到:(1)使受试的每个个体都符合事先根据研究目的及专业理论规定的总体条件,诸如疾病诊断标准、病情分组、药物种类、剂量及疗效判定标准等,即方法要标准化;(2)遵循随机抽样原则,使每个研究对象在抽样过程中不受主观或客观的影响,机会均等地列入实验组和对照组8。在撰写论文时,作者应在文中提供其样本具有代表性的必要依据,以便编审人员判断样本的代表性及结论的可靠性。

1.5.2　样本含量太小　样本含量太小所得资料不稳定,结论缺乏充分的根据。有些论文中样本含量≤3,当指标的变异度较大时,很难呈现出资料之间的内在规律性。为此,必须在

保证实验结果具有一定可靠性的条件下,确定最少的样本含量,样本含量应在实验前确定,而不能随意确定。1.6　对照10　

1.6.1　未设对照　临床实验必须设立对照,使处理的效应可与之比较。影响疾病的因素是复杂的,除治疗因素外,心理因素、气候、营养、休息等对疾病的发生与转归也有不同程度的影响;临床上还有许多疾病,如感冒、乙型肝炎、病毒性结膜炎等不经治疗也可治愈。要想验证疾病的转归是药物的作用还是其它因素作用的结果,必须通过设立对照加以鉴别。1.6.2　对照不合理或不符合均衡原则　临床实验中要使试验组与对照组病人的性别、年龄、病情尽可能一致,观察的指标、方法、仪器、人员相同,治疗中医师和病人还应避免对试验组和对照组产生心理上的偏性。一般来说,在同时同地按同一标准选取受试对象较易保证对照组与试验组的均衡性,而以过去病例作对照,或以别的地区、单位的资料作对照,则不易保证均衡性。比较常见的缺陷是:为了得到所希望的结果,人为地将病情较重的受试者分到对照组,而将病情较轻的受试者分到治疗组。这样就失去了比较的意义。

2　观察指标选择不当

论文反映出来的实验效应,通常是通过各项观察指标来

鉴定的,作者选择的观察指标是否恰当,将影响论文的学术价值和实用价值。实验研究的观察指标在设计过程中要经过严格的选择,指标的具体方法也有明确的实施方案,有些还要经过预实验。观察指标选择不当存在的主要问题有:(1)缺乏客观性:所选观察指标多为实验者或受试者的主观感觉,如疼痛缓解、症状改善、情绪好转等,没有明确的量化标准。(2)缺乏评判价值:所选指标在试验组和对照组之间虽有显著性差异,但不能排除非实验因素的干扰影响,或不是为同行所公认的有效指标,或自行降低评判标准,或计算方

法不当,故无法进行有效评价。

(3)未选主要指标:尽管实验结果在一些次要指标上显示有差异,但对主要指标未进行观

察或资料缺如,故其结果无实际意义。

(4)相关性不强:所选指标与研究目的之间缺乏必要的逻辑联系,或联系不密切,所得结果不能说明问题,或不能提供可靠依据,说服力不强,

可信度差。

(5)指标繁杂,观察角度多变:所选各指标之间交叉重叠,相互关系不明确、不确定,导致结果分析紊乱,结论

含糊、矛盾。(6)效应指标概念有误:如灵敏度、特异度、假阴

性率、假阳性率等效应指标,常因概念性错误,导致计算结果不正确11。

依据上述原则选定的指标,反映在论文中则要求作者不仅应列出指标的具体名称,还应介绍检测的特定要求和方法,包括指标本身的特殊制备方法、中间媒体的制备、受试对象的处理,施加因素作用于受试对象的手段、形式或指标的检测方法,测量仪器的品名、型号、产地、有关的参数和工作条件,药品、试剂的来源和纯度等;对有些需要加以严格选择和限制的指标,应如实给出控制的程度和条件;某些对数据的收集和处理有特定要求的,应做专门的陈述。

3　统计指标的误用[12,13]

3.1构成比误作率　比与率是临床医学研究中最常用的相对数指标,构成比是构成指标,表示事物或现象内部各构成部分的比重;率是频率指标,是指在某种现象或事件在一定条件下,其实际发生数与可能发生此现象或事件总数的比例。临床医学论文中很多作者常把构成比当成率进行比较,

新疆医科大学学报　JOURNALOFXINJIANGMEDICALUNIVERSITY　2002Jun.,25(2)

223

造成对疾病的发生做出错误估计。出现这种错误的原因,是

因为不能正确理解比与率的区别所致。一般来说,率的分子源于分母,但分子、分母具有不同的事件属性,构成比虽然分子也源于分母,但分子、分母具有相同的事件属性。

3.2　发病率与患病率　发病率与患病率相混淆的原因主要是没有把握住观察、统计的时间,发病率是指观察期内(年、季、月等)新发生某病的例数与同期平均人口数之比,强调在观察期内的新发病例数,而患病率则指观察时点的某病的现患病例数与该时点人口数之比,强调的是该观察时点上某病的现患(新、旧病例)情况。分析两者的关系,一般来说,发病率增加,其相应的患病率也增加,疾病持续的时间对发病率无影响,但对患病率却有影响。发病率是指平均每1000人口中新发生的病例数,其计算公式为:某病发病率=某年(期)内所发生的新病例数除以同年(期)平均人口数乘1000‰。3.3　死亡率与病死率　这是2个不同含义的指标,在进行人群研究时,它们的分子可能相同,但分母不同。死亡率的分母是同期人口数,是观察人群中某病的死亡频率,反映了观察人口因某病的死亡水平,是一个人口学指标,一般以10万分率表示;而病死率的分母是患某病的患者总数,是某病患者中因该病而死亡的频率,反映了某病的死亡危险性,一般以百分率表示。某病病死率高,并不能说明就有高的某病死亡率,对某一医院来说,只能计算病死率,而不能计算死亡率。部分作者常将某病住院病死率误为某病死亡率。

3.4　漏诊率与误诊率　在临床医学研究中,对漏诊率与误诊率的研究分析是不断地提高诊疗水平、改善医疗服务质量的一个有效方法。但在当前医学期刊中,两者的错用率却非常高。以甲病为例,误诊是将甲病诊断为非甲病或将非甲病诊断为甲病,而漏诊是仅将甲病没有诊断为甲病。

误诊率是在临床诊断中对某种疾病在一定的观察期间对一定数量的诊断例数发生错误诊断的频数,误诊率=误诊例数?全部诊断例数×100%

而漏诊率是表示在临床诊断中对某一种疾病在一定观察期内对一定数量的诊断例数发生遗漏诊断的频度,漏诊率

=漏诊例数?

(正确诊断数+遗漏诊断数)×100%4　统计方法方面14,15

4.1　所用统计方法未交代或交代不清　论文中应将所用的统计方法交代清楚,使用不正确的统计方法会得出错误的结论,如果作者对论文中所用统计方法不予交代或交代不清,读者对论文结果的正确与否就无法判断。有的作者只在论文中简单地提一句“经统计学处理,有统计学意义”,就写出结论;有的甚至不提“统计”二字,直接用P值说明问题(P>0.05或P<0.05等)。正确的做法是应写明具体的统计方法,如有特殊情况,还应说明是否采用了校正,这样才有说服力。严格地说,应写明精确的统计量值和P值,如t值、F值、?2

值等,不应笼统地以P>0.05或P<0.05代替。此外,应该交代所使用的计算工具与统计软件名称(如SAS、SPSS等)。

4.2　不经统计处理,仅凭数字大小下结论　有些作者根据观察资料大小未经统计处理做出结论,而作样本之间的比较时,必须做假设检验,以确定抽样误差的大小。4.3　统计方法选择、使用不正确

4.3.1　配对设计资料误用成组设计(完全随机设计)资料的t检验　两种检验方法的不同16:(1)适用的定型分组设计不同,成组设计适用于完全随机的资料,而配对差值的t检验适用于随机配对设计的资料,包括自身对照和配对对照等设计;(2)资料的分组设计不同,因此观察的内容也不同,对于成组设计的资料,需要观察两样本的均数和标准差,并采用完全随机t检验进行统计推断,以比较两样本均数有无差异。自身对照设计是在同一个体上进行实验,研究者需要观察每一个实验单位处理前后或两种处理方法两次结果差值

的均数和差值的标准差,采用配对差值的t检验,目的是推

断同一样本处理前后或两种处理方法有无差异;(3)配对差值的t检验适用于随机配对设计资料,随机配对设计最大限度地减少了个体差异(生物变异)对处理间变异的可能影响,因而减少了实验误差,提高了实验精确度,故对自身对照设计的资料应采用配对差值的t检验。

4.3.2　方差分析数据误用t检验　如果对于多个样本均数间的两两比较仍用t检验对每两个对比组作比较,会增加第一类错误的概率a16。因此当比较的样本均数大于或等于3个时,应先进行方差分析,在差异显著的基础上再选用适当的两两比较方法作各对均数间的比较(各均数间相互比较用

SNK法、

多个实验组与一个对照组均数的比较用Q检验、Dunnettt检验法等),这样可以获得最好的检验效能。文章中经常见到将方差分析资料用t检验进行重复比较。

4.3.3　?2检验的误用　医学论文中常见的?2检验的误用情况如下:(1)对总例数n过小以及有一细格为0的四格表资料不宜用四格表?2检验公式求?2值;(2)对同一事物内部两个组成部分的构成比比较不宜采用四格表?2检验公式;(3)配对设计的四格表资料不可用成组设计四格表?2检验公式求?2值;(4)趋势性?2检验不能误用行×列表?2检验17。

4.3.6　诊断效果的评价　应用诊断性试验时的注意事项:(1)评价诊断性试验的核心内容是必须将诊断试验与“金标准”同步进行盲法对比研究,只有通过比较方可确定有无推广价值。(2)所选择的病例一定要能代表目标人群,即病例组应包括临床类型的病例,对照组应包括极易混淆的病例。研究对象如来自不同级别的医院,代表性可能有所差异。(3)在研究过程中严格把好质量控制关,避免产生选择偏倚、错误分类偏倚、测量偏倚等。(4)理想的诊断试验应该是既真实又可靠,因此在评价诊断试验时既要评价试验的真实性(准确性),又要评价试验的可靠性。(5)详细叙述诊断试验的方法、操作步骤和注意事项,以便他人进行重复试验。(6)当评价2种不同的诊断试验时,前提条件是每个诊断试验都必须同金标准做过比较,然后再比较2个试验的灵敏度或特异度18。

5　统计表格

统计表的列表原则一是重点突出,简单明了,即一张表一般表达一个中心内容,不要包罗万象;二是主次分明,层次清楚,符合逻辑,明确被说明部分(主语)与说明部分(谓语)19。但在有些医学论文中,表格设计不当及其统计学处理不当是相当普遍的问题之一,影响了对研究结果的正确表达,严重者甚至直接导致错误的结论20～22。

5.1　表格与文字叙述重复　统计表与正文一般有相互呼应,相互补充的作用,但2者不可过于重复,若表的内容很简单,用文字可清楚地表达,则应删去表只用文字叙述,反之,若遇到用表格可取代繁琐冗长的文字叙述,便于进行相互比较时,则应使用统计表而删去文字或仅留少量概括性文字说明。

5.2　表式过于复杂,层次过多　对统计表的基本要求是表式简明易懂,层次清楚,符合专业逻辑,但有的表表式太繁杂,不易看懂。

5.3　主谓语位置排列不当　多见于将谓语指标放在左侧主语位置,造成同一竖列指标不同、单位不同(有的为例数、有的为均数±标准差或百分比),使表格杂乱无章。

5.4　表题不符合要求　统计表要有一个简明扼要概括表内容的标题,一般不超过20个字,医学论文中常见的表题方面的错误有:无表题;缺表号;表号不是用阿拉伯数字,而是用的汉字表一、表二等或罗马数字表?、表?等;表题末尾加上标点符号或加上“统计表”、“比较表”之类的不必要文字;表题与表的内容不贴切、文不对题。

5.6　统计表的数字和文字编写不规范　国家颁布的科技期

224

新疆医科大学学报　JOURNALOFXINJIANGMEDICALUNIVERSITY　2002Jun.,25(2)

刊编辑标准中对统计表的数字和文字编写有明确规定:(1)表内的数字一律用阿拉伯数字;(2)各列数据的小数点或各位数要对齐,数字间夹有“±”、“～”、“?”等符号者要以这些符号为准对齐;(3)同一指标的有效数字的位数要一致;(4)每格内上下或左右数字或符号相同时要重复写出,不能用“同上”、“同右”;(5)表内一般不宜有空格,作了调查或观察,其结果数据为零者要填写“0”,未取得数据者用“…”表示,未作调查或观察者用“—”表示;(6)小数点前后为4位以上数字的数据,每隔3位数字加1?4铅字空(不用“’”号分隔);(7)纯小数的数据小数点之前的“0”不能省略;(8)各组调查或观察样本数相同者可不列调查或观察样本数这一谓语纵标目,只在相应的主语横标目或谓语纵标目下用括号注明样本数;(9)表内数据如均为均值±标准差(或标准误),题右侧加括号注明(θ可在表

x±s、θx

±sxθ),表内各项指标的单位相同时亦可照此方式编排;(10)表内的文字应在有关栏内居中排,若文字较多需转行时,头行应缩一字起排;(11)表内文字亦需正确使用标点符号,但每项文字最末不用标点符号;(12)表体内容为数字的表,表内一般不设附注或说明栏;(13)表题、主谓语标目或某个数据需注释者可以从左至右,从上至下为序用3、33、#、##、△、△△等符号加在有关部分的右上角,并在表注内加以注释;(14)要在表注内注释显著性检验结果者必须明确指出比较的对象。

6　统计图

绘制统计图时,一定要根据资料的性质选用相应的统计图,要注意标题、坐标、各种统计图的适用情况及制作要点19

。(1)直条图,主要适用于几个相对数指标的比较,如几个地区、几个单位、几个人群或几种疾病的发病率、患病率、病死率或有效率的比较。(2)构成图,主要用于表示某事物内部各组成部分所占的比重,可以有圆图和百分条图两种形式。(3)直方图(频数分布图)用于表示某种计量数据按数量分组后的频数分布,如身高、体重或肺活量的频数分布。(4)点图,又称散点图、相关图,用于表示一个变量随另一个变量的变化而变化的趋势。(5)线图,也是用于表示一个变量随另一个变量的变化而变化的趋势。线图与点图的区别在于:如果对应于任意一个横坐标上的取值,纵坐标上可以有几个取值,就只能画点图;如果对应于任意一个横坐标上的取值,纵坐标上只可以有一个取值,就可以画点图。论文中常见的统计图问题有:选择不合适,组距不等,有的纵、横坐标比例不当,有的标题本应放在图下而放在图的上方或侧面等。

7　统计结论表达不规范23,24

统计学上与日常生活中对差异作是否有显著性推断是完全不同的2个概念,表面上看两个样本均数差异很大,而统计学上可能无显著性差异;表面上看两个样本均数差异不大,而统计学上可能做出差异有显著性意义的推断。在医学论文中经常见到“差异不显著”、“差异显著”、“差异非常显著”等,这种说法容易与日常生活的差异判断相混淆。现在统计学上的差异推断主张用差异有无统计学意义或差异有(非常)显著性意义来表达。P接近显著水准а时,下结论要慎重。另外,P越小,就越有理由认为被比较的均数或率之间有差异。至于两者差异有多大,要由它们之间实际相差有多大再结合专业知识来确定。规范化的假设检验结论应当是把所用方法的名称,计算所得的相应统计量数值及概率值一并给出,再据此下专业结论。

以上所列问题均是常见的统计学错误,在医学论文中经常出现,尤其是临床医学论文更为普遍。一篇高质量的学术论文,不仅要有创新性,而且必须保证其科学性,如果对统计问题不够重视,则论文的科学性就不能得到保证,也很难做出正确的结论。随着医学对数学依赖程度的日益增加,任何医生都不能将论文的统计处理全交给统计专家来做,建议临床医务工作者可以阅读一下加拿大医学会杂志中的“临床医

生基础统计”系列讲座25～27,或更专业的统计教科书,以便

结合自己专业的科研工作正确的运用统计方法。参考文献:

1　ClantzA(张志慈译).怎样发现、纠正和防止医学文献中的错

误[J.国外医学心血管病分册,1981,1:38.

2　凌瑞珠.临床科研中常见的统计误用问题[J.中国卫生统计,

1985,2(2):57.

3　徐秦.医学统计与设计指南[M.乌鲁木齐:新疆科技卫生出

版社,1996.132.160.

4　姜明,杨春荣,李立.医学科研选题、设计与论文写作[M.乌

鲁木齐:新疆科技卫生出版社,1999.37.82.128.

5　胡良平1医学统计应用错误的诊断与释疑[M]1北京:军事医

学科学出版社,1999161

6　胡良平,王功鹏.合理选用统计方法[J.中国医学影像学杂志,

1996,4(3):185.

7　詹绍康.在医学科技论文中要强调正确的统计分析[J.中国实

用外科杂志,1999,19(8):4942496.

8　李雅娟,章丽.浅谈医学研究中的统计设计与统计处理[J.中

国医科大学学报,1994,23(3):2982300.

9　赵清波,徐勇勇1如何确定抽样研究所需要的样本量[J]1中

华预防医学杂志,2001,35(3):2031

10　詹绍康1合理设立对照[J]1中国实用外科杂志,1999,19

(9):5631

11　沈志宏,缪宏建1医学论文的表格设计及其统计学处理[J]1

南通医学院学报,1997,17(4):5841

12　王凌.医学论文中常见统计学概念误用分析[J.数理医药学

杂志,2000,13(5):4342435.

13　吕元聪,梁秋萍.医学论文来稿中常见的统计学错误分析[J.

广西预防医学,1999,5(6):3722374.

14　CosteJ,FermanianJ,VenotA.Methodologicalandstatisti2

calproblemsintheconstructionofcompositemeasurementscales:asurveyofsixmedicalandepidemiologicaljournals[J.StatMed.1995,14(4):331245.

15　SchwartSJ,SturrM,GolbergG.Staisticalmethodsinreha2

bilitationliterture:Asurveyofrecentpublications[J.ArchPhysMedRehabil,1996,77:4972500.

16　陈捷.医学论文中常见数理统计应用错误剖析[J.中国卫生

统计,1997,14(4):53255.

17　王茹茗,刘勖.医学论文中错误应用?2检验的实例分析[J.

临床荟萃,1998,13(8):3802383.

18　方积乾,凌莉,张敏瑞.近期医学论文中常见统计错误及其纠

正[J.中山医科大学学报,1999,20(4):3142318.

19　倪宗瓒.卫生统计学[M.第4版.北京:人民卫生出版社,

2001.1432146.

20　李晖.中华病理学杂志论文统计学应用情况简析(?)[J.中

华病理学杂志,2001,30(1):73275.

21　卢庆霞.科技论文表格中常见错误辨析[J.中日友好医院学

报,1997,11(3):2612264.

22　刘勖1医学论文中统计表格的常见错误[J]1临床荟萃,

1994,9(20):9581

23　TrishaGreenhalgh,马林茂.如何阅读医学论文(五)供非统

计学家使用的统计学:“显著性的”关系和这种关系中的陷阱[J.英国医学杂志?中文版,2000,3(1):35239.

24　王净净.医学科研论文中的统计问题[J.中国医师杂志,

2001,3(1):628.

25　GuyattG,JaenschkeR,HeddleN,etal.Basicstatisticsfor

clincians1.Hypothesistesting[J.CanMedAssocJ,1995,152:27232.

26　GuyattG,JaenschkeR,HeddleN,etal.Basicstatisticsfor

clincians2.Interpretingstudyresultsconfidenceintervals[J.CanMedAssocJ,1995,152:169273.27　JaenschkeR,GuyattG,ShannonH,etal.Basicstatistics

forclincians3.Assessingtheeffectsoftreatment:measuresofassociation[J.CanMedAssocJ,1995,152:35127.

[收稿日期:2001212216

更多相关推荐：

统计学专业论文范文: 试论我国统计理论研究的立足点及相关问题文章整理编辑论文文库工作室工作QQ1548927986本文仅供参考学习如有疑问欢迎来询更多论文写作发表辅导摘要随着社会的进步和经济的发展我国统计理论研究也不断发展统计理论的...
统计学论文 - 本: 班级学好姓名装订线学院20xx20xx学年第一学期统计学考查试卷我看统计学统计无处不在我们的生活离不开统计它在我们的生活中扮演着重要角色我们的国家民族也离不开统计随着社会经济的发展特别是改革开放以来统计的应用领...
统计学课程论文.doc: 统计学课程论文题目统计与我的成长学院商学院专业班级证券1102学号20xx3114042学生姓名陈辉指导教师郭松云20xx418日期目录1什么是统计12统计的产生和发展243我接触过的统计4统计的应用65统计学...
医学论文写作指导之统计学问题全攻略: 医学论文写作指导之统计学问题全攻略在核心期刊越来越多的成为发刊主流的当前统计学分析便成为论文写作的一个不可避免的部分然而根据小编多年与作者沟通的经验对于大多数医生而言统计学分析是难点是障碍本期创新医学网为了让医...
统计学论文 (1): 田间试验调查总结格式要求和试验观测材料不同配方施肥对生菜产量的影响署名单位园艺技术101班邮编摘要本论文介绍了不同配方施肥对生菜产量的影响分析了不同配方对生菜产量的具体表现并做出了结果分析通过不同配方施肥对生菜...
统计学专业实习报告范文: 统计学专业实习报告学校山西大同大学院系数学与计算机科学学院统计系班级12级统计一班学号111111111111姓名xxx实习是统计学专业教学计划的重要组成部分是对学生进行实际统计工作能力初步训练的基本形式是培养...
统计学论文: 基于二元回归分析的火灾数据研究摘要根据国家20xx20xx年火灾的相关统计数据应用回归分析研究了火灾引起的经济损失与火灾中伤人数目及烧毁建筑面积之间的关系建立了二元线性回归模型对方程的精度进行了相关性检验关键词...

统计论文: 统计论文摘要真实准确是统计工作的生命线然而在我国统计信息失真特别是人为数字造假导致的失真至今尚未得到彻底根治而且在个别地方呈蔓延之势也引起了社会的广泛关注GDP增速遭质疑大学生被就业工资被增长房价被稳定等热词成...
应用统计学结课论文: 应用统计学结课论文姓名徐宝宝学号0605112328学院信息工程学院班级测控081班应用统计学结课论文摘要随着社会主义市场机制的建立与不断完善社会上对统计的重要性认识越来越深入统计的作用受到越来越广泛的重视对统...
统计学研究生毕业论文格式和自查内容: 统计学研究生毕业论文格式和自查内容一论文格式论文封面内封缩略词表目录中文摘要Abstract前言第一部分11研究目的111第四部分研究总结41主要研究内容和结论42本研究的特色43需进一步研究的内容参考文献致谢...
《统计软件应用》期末课程论文范文2: 我国旅游收入的实证分析一经济理论陈述在研读了大量统计和计量资料的基础上选择了三个大方面进行研究既包括旅游人数人均旅游花费和基本交通建设其中在旅游人数这个解释变量的划分上我们考虑到随着全球经济一体化的发展越来越多...
《统计软件应用》期末课程论文范文1: 中国经济增长影响因素实证分析摘要改革开放以来我国的社会主义经济取得了突飞猛进的发展经济增长速度更是举世瞩目本文采用经济增长模型和多元线性回归分析方法对19xx20xx年中国经济增长因素进行研究分析了物质资本劳动...

热门关注