统计总结
1.频数表的用途
揭示计量资料的分布特征;描述计量资料分布的集中趋势和离散趋势;便于发现某些特大或特小的可疑值。
2.描述集中趋势的特征值
算术均数:对称分布,特别是正态或近似正态分布的数值变量资料。
几何均数:资料呈倍数关系或对数正态分布(正偏峰分布)
中位数::资料分布呈明显偏态;资料分布情况不清楚;数据的最大值(最小值)无准确测量数据。
3.描述离散趋势的特征数
极差:反映个体变异的范围
百分位数:常用于确定医学参考值范围:分布中间的比较稳定,有较好代表性,靠近两端的,只在样本量足够大才较稳定。
方差:反映一组同质数据变异度
标准差:表示数据分布的离散程度,常用X?S表示计量资料数字特征的专用符号(X表示平均水平,S表示变异度)
变异系数:多用于观察指标单位不同(如身高与体重的变异程度)或均数相差较大(如儿童身高与成人身高变异程度)时的比较
4.应用相对数时应注意的问题
应用相对对比分析时,要考虑资料是否具有可比性;
计算相对数时,分母不宜过小;
对观察例数不等的几个率,不能直接相加求其平均值;
不能以构成比代替强度相对数
5统计表的结构:标题 表目 线条 数字
统计表设计基本原则:简单明了;主语和宾语要划分清楚。
6.统计图的注意事项:
条图:常用来比较各个相对独立的统计指标
单式条图:一个统计指标,一个分组因素
复式条图:一个统计指标,两个分组因素
圆图:事物内部的构成情况
百分条图:功能同圆图,可将多组数据排列在一起进行比较
线图:线段的升降表达一事物随另一事物数量变化的趋势,或某事物的数值随时间变化的过程
半对数线图:表达事物之间变化的相对速度
直方图: 表示连续变量的频数分布
散点图:用点的密集和散布趋势表示两指标间的相对关系
7.二项分布的适用条件
每次试验只会发生两种对立的可能结果之一;
每次试验产生的某种结果(如“阳性”)的概率固定不变;
重复试验是相互独立的
8.Poisson分布
性质:(1)数学期望(均数)=方差;(2)可加性。对于服从Poisson分布的m个相互独立的随机变量X1,X2,?X,它们之和也服从Poisson分布,且其均数为这m个随机变量的均数之和
与二项分布、正态分布的关系:
λ≥20时,Poisson分布资料可作为正态分布处理
对于n很大,π很小的二项分布b(n, π)近似λ=nπ的Poisson分布
9.正态分布的特征
1)正态曲线位于直角坐标系上方,以x=μ为中心,左右完全对称,两端以x轴为渐近线
2)在x=μ处,f(x)有最大值f(μ)=1/σ π;x越远离μ,f(x)值越小
3)两个参数:位置参数μ,形态参数σ。
若固定σ,μ值变小,曲线则沿x轴向左平移,μ值变大,曲线则沿x轴向右平移,形状均不变;
若固定μ,σ值变小,曲线则变陡峭,σ值变大,曲线则变平坦
4)正态分布曲线下的面积分布规律:
X轴与正态曲线所夹的面积恒等于1或100%;
区间μ±σ的面积为68.27%,区间μ±1.96σ的面积为95.00%,区间μ±2.58σ的面积为99.00%。
10.医学参考值范围
正常人:排除了影响所研究指标的疾病和有关因素的同质人群
双侧 单侧
P=0.95 【-1.96,1.96】 (-∞,1.64)
P=0.99 【-2.58,2.58】 (-∞,2.32)
意义:参考值范围是指绝大多数正常人的某指标值都在一定的范围内(90%、95%、99%)。如某指标参考值百分界采用95%,则在参考值范围之外的正常人尚有5%,对于双侧界值,在下侧和上侧界值之外各有2.5%,对于单侧界值,在下侧或上侧界值之外各有5%
11.x2分布是一种连续型分布,其形状依赖于自由度v的大小 P99(6-10)不同自由度的x2分布曲线图
F分布也是一种连续型分布,其密度曲线为单峰的偏态分布 P100(6-11)不同自由度F分布图
12.总体均数区间估计公式 P106
13.可信区间的涵义 P107
14.假设检验:H0—原假设/零假设/无效假设
H1—H0的对立假设/备择假设
两类错误:I型错误(假阳性)是指拒绝了实际上成立的H0所犯的“弃真”错误,其概率大小用α表示。II型错误(假阴性)则是“接受”了实际上不成立的H0所犯的“取伪”错误,其概率大小用β表示。当样本含量n确定时,α愈小,β愈大;反之α愈大,β愈小。 P124
P128 P值的含义 假设检验与可信区间的区别于联系
14.x2检验
2×2表:两独立样本率检验(例9-1) 两相关样本率检验(例9-3)
R×C 表x2检验的条件:理论频数不宜太小,否则有可能产生偏性,
理论频数太小界定:有1/5以上格子的理论频数小于5,或至少有一个格子的理论频数小
于1
理论频数处理方法:增大样本量;删去理论频数太小的格子所对应的行或列;合并理论频数太小的格子所相邻的行或列
15.t检验的应用条件
①当样本量较小时,理论上要求样本为来自正态分布总体的随机样本;②当两小样本均数比较时,要求两总体方差相等(方差齐性)。
16.方差分析的应用条件
①各组样本是相对独立的随机样本且来自正态总体;②各组总体方差相等(方差齐性)
17.线性回归应用的注意事项
①在进行线性回归分析前,应先绘制散点图,只有各观测点的分布存在直线趋势时,才事宜作直线回归分析
②作回归分析时,要注意两变量间关系是否存在实际意义
③两变量间存在直线关系时,不一定表明彼此之间就存在因果关系,有可能是依存关系,或仅仅是表面上的伴随关系
④建立回归方程后,须对回归系数β进行假设检验,只有经假设检验得出总体回归系数β不为0后,回归方程才有意义
⑤使用回归方程进行估计与预测时,一般只适用于原来的观测范围,即自变量的取值范围,不能随意将范围扩大
⑥在线性回归分析时,要注意远离群体的离群值对回归效果的影响
18.线性相关系数r(积差相关系数)没有单位,其取值在-1和1之间波动。其值为正表示正相关,若负表示负相关,若0表示零相关(不一定不相关,可能为曲线关系)
应用r时应注意的问题:r只表示两个服从正态分布的随机变量之间线性关系的密切程度和相关方向,r=0只能说X和Y之间无线性关系,并不能说X与Y之间无任何关系,也可能X与Y之间有密切的曲线关系;相关关系并不一定是因果关系。
19.非参数统计分析方法:对总体分布形式不作任何假定,相对参数统计分析方法而言的方法
配对设计资料的秩检验;编秩号注意①差数为0的数据忽略不计;②余下的n个差数按绝对值由小至大排秩号,但排好后秩号要保持原差数的正负号;③差数绝对值相等时,要以平均秩号表示。
Spearman秩相关P222
第二篇:医学统计总结
计量资料
一.统计描述
频数分布:
1.频数分布表
2.频数分布图 可以用来判断计量资料的分布类型,以便于进一步做统计分析和处理外,
还可以进行病因研究和疾病预防控制。
集中趋势的描述:
1.算术平均数 反映一组呈对称分布的变量值在数量上的平均水平。
2.几何平均数 反映一组经对数转换后呈对称分布的变量值在数量上的平均水平,常适
用于免疫学指标
3.中位数 将n个变量值从大到小排列,位置居于中间的那个数。适用于各种分布类型 ,
尤其是偏态分布和一端或两端无确切数值的资料。
4.百分位数PX 常用于确定单峰偏态分布资料的医学参考值范围(要求样本含量要足
够大);
离散趋势的描述:
1.极差 常用来说明传染病、食物中毒等的最短和最长潜伏期;一组变量值的最大值与
最小值之差。
2.四分位数间距 是由第3四分位数P75和第1四分位数P25相减而得,记为QR。
3.方差和标准差 方差就是离均差平方和除以N。
标准差就是方差的平方根。
4.变异系数 用于观察指标不同时和均数相差较大时,记为CV。用于两种或多种不同
性质变量变异程度的直观比较;在实验方法学研究中,用来表示方法的
精密度。
二.统计推断
单因素
单样本 (单组设计) 一个样本指标和一个已知的总体指标做比较
1. 样本含量较小n<60且样本来自正态分布的总体时——单样本t检验
2. 样本含量较大时——u检验
3. 样本来自的总体不服从正态分布——Wilcoxon符号秩检验
两相关样本(配对设计) 两同质受试对象配成对子分别接受两种不同处理;同一受试对
象分别接受两种不同处理;同一受试对象接受处理前后。
1.两样本差值服从正态分布——配对t检验
2两样本差值不服从正态分布——配对样本比较的Wilcoxon符号秩检验
当n≤50时,查T界值表。
当>50时。可用正态近似法作——u检验
两独立样本(成组设计) 适用于完全随机设计两样本的比较
1.两样本含量较小n1≤60或(和)n2≤60,两样本的总体均服从正态分布且总体方差
相等,——两独立样本t检验
2.两样本含量较小n1≤60或(和)n2≤60,两样本的总体均服从正态分布但总体方差
不相等,——两独立样本 t’检验或秩转换的非参数检验
3.两样本的总体有一不服从正态分布或总体方差不相等——两独立样本的Wilcoxon秩
和检验 当n1≤10和n2-n1≤10时,查T界值表。
当n1>10或n2-n1>10时,可用正态近似法作——u检验
多个独立样本(单因素多水平设计)
1.完全随机设计资料的方差分析
多个样本的总体均服从正态分布且总体方差相等——单向分类的方差分析
多个样本的总体有一服从正态分布或总体方差不相等——Kruskal-Wills H检
验或进行变量变换后采用单向分类的方差分析 Kruskal-Wills H检验 当样本个数g=3和每个样本例数≤5时,查H界值表。
当g=3且最小样本例数>5或g>3时,则H近似服从
χ2分布,查χ2界值表。
2.随机区组设计资料的方差分析
对于正态分布且方差齐的资料——双向分类的方差分析
对于分正态分布或(和)方差不齐的资料——Friedman M检验或进行变量变换
后采用双向分类的方差分析。
Friedman M 检验 当n≤15和g≤15时,查M界值表。
当n>15或g>15时,可用卡方近似法,查χ2界值表。
实际上,当g>4或者g=4且n>5或者g=3且n>9时,就可用
χ2近似法,查χ2界值表。
多个独立样本间的多重比较
多个样本均服从正态分布且方差齐
1.LSD-t检验 适用于一对或几对在专业上有特殊意义的样本均数间的比较。
2.Dunnett-t检验 适用于g-1个实验组与一个对照组均数差别的多重比较。
3.SNK-q检验 适用于多个样本均数两两之间的全面比较。
多个独立样本有一不服从正态分布或方差不齐的两两比较—— Nemenyi法检验
多个相关样本有一不服从正态分布或方差不齐的两两比较——q检验
多因素
随机区组设计
SS总=SS处理+SS区组+SS误差
1.观察指标呈正态分布——ANOVA
多个样本均数两两之间的全面比较——SNK-q检验
2.观察指标不呈正态分布——Friedman M检验
当n≤15和g≤15时,查M界值表。 当n>15或g>15时,可用卡方近似法,查χ2界值表。
实际上,当g>4或者g=4且n>5或者g=3且n>9时,就可用
χ2近似法,查χ2界值表。
多个相关样本两两比较的q检验
析因设计——方差分析
完全随机的析因设计 SS总=SSA+SSB+SSAB+SSE
随机区组的析因设计 SS总=SSA+SSB+SSAB+SSE+SS区组
正交设计 是非全面实验,g个处理组是各因素个水平的部分组合。适用于寻找疗效好的
药物配方,医疗仪器多个参数的优化组合,生物体的培养条件等。
当以筛选各因素各水平最佳组合条件为目的时——直接分析,算一算
当需对实验结果进行统计推断时——方差分析
重复测量设计——方差分析
计数资料
一.统计描述
1.绝对数 如某病的出院人数、治愈人数、死亡人数等,通常不具有可比性。
2.强度相对数 说明某现象发生的频率或强度又称为率。
率=某时期内发生某现象的观察单位数/同期可能发生某现象的观察单 位数×比例基数
3.结构相对数 表示事物内部某一部分的个体数与该事物各部分个体数的总和之比,用 来说明各构成部分在总体中所占的比重和分布,又称为构成比。 构成比=某一组成部分的观察单位数/同一事物各组成部分的观察单位数×100%
4.相对比 简称比,是两个有关指标之比,说明两指标的比例关系。
相对比=甲指标/乙指标×100%
二.统计推断
样本率与总体率的比较
当n较大、p和1-p均不太小,如np和n(1-p)均大于5时——u检验 两样本率的比较
当n1与n2均较大,且p1、1-p1与p2、1-p2均不太小,如n1p1、n1(1-p1) 与n2p2、n2(1-p2)均大于5时——u检验
当n≥40且所有的T≥5时——χ2检验的基本公式或专用公式,当P≈ɑ时,改用四格 表资料的Fisher确切概率法。
当n≥40但有1≤T≤5时——χ2检验的校正公式或Fisher确切概率法。
当n<40或T<1时——用四格表资料的Fisher确切概率法。
配对四格表资料的χ2检验
当b+c≥40时——一般公式
当b+c<40时——校正公式
多个样本率的比较 ——R×C表的χ2检验
多个样本率间的多重比较——χ2分割法
两个样本构成比比较—— R×C表的χ2检验
等级资料
等级资料两独立样本比较——两独立样本的Wilcoxon秩和检验
等级资料两相关样本比较——两相关样本的Wilcoxon符号秩检验
等级资料多个独立样本比较——多个独立样本的Kruskal-Wills H检验
第三篇:20xx宁源统计总结
宁强县能源统计工作总结
20xx年我县能源统计工作在县委、县政府的正确领导下,在省、市统计局的指导和大力支持下,认真贯彻落实国家和省局能源统计工作建设要求,紧扣节能降耗目标任务, 紧紧围绕县委、县政府的中心工作,以不断提高统计数据质量为核心,立足于服务经济建设,进一步发挥统计服务、统计咨询和统计监督的整体功能。密切关注和牢牢把握全县工业经济发展的新形势,较好地完成了年度工作任务。现将今年的工作简要总结如下:
一、认真搞好“企业一套表”能源统计工作
为保证“企业一套表”工作的顺利进行,我县召开了全县各相关单位及统计专业报表人员专题讨论会,就如何做好“企业一套表”工作进行了专题讨论,会上对“企业一套表”工作方案进行认真阅读,熟练掌握“企业一套表”工作的相关流程,对目前在工作中会碰到的困难进行了认真疏理;同时,对全县所有“三上”企业统计人员进行业务培训,培训内容采取以专业人员演示结合企业统计员上机操作的培训方式,分期对相关企业进行业务培训,通过培训,所有联网直报企业业务人员都能熟练掌握“企业一套表”上报程序,能够独立完成报表审核及上报工作,为“企业一套表”工作顺利进行打下了良好的基础。
二、进一步加强“五有”建设基础工作
1、加强能源统计台帐建设,使基础工作更加规范化。要求各企
业建立规模以上工业企业能源及水消费购进和消费量分月台帐,通过台帐可以清晰地看到数据的来源,使上报的资料做到有根有据。
2、抓好规模以上工业企业“有机构、有人员、有资格、有制度、有台帐、有微机”建设,规范企业统计行为,加大督查力度。
3、强化学习培训,提高人员的综合素质。认真组织企业学习国家、省、市有关节能工作的文件,《能源法》和源统计方法制度。
三、继续加强能源统计监测工作
1、严格按照《宁强县推动落实节能综合性工作方案部门分工》中部门工作职责和年度任务,抓好能源统计监测工作,提供准确客观的能源统计数据及分析建议,使目标任务落到实处。
2、抓好重点企业节能统计监测工作。重点抓好汉中锌业铜矿公司、长江资源循环利用有限公司、友信建材公司等耗能较大的规模企业的节能统计监测工作,将监测动态数据及时报告县政府领导,并通报给有关部门,全力做好服务工作。
3、配合做好社会节能降耗宣传工作。积极配合政府有关部门和单位,做好节能降耗工作的宣传,树立大局意识,增强责任,从我做起,从点滴做起,把节能降耗各项措施落到实处。
四、网报中存在的问题
虽然企业都按时完成了联网直报工作,但直报过程中出现的问题并不乐观,经过分析,主要存在以下几个问题:
1、企业在报表填报中粗心大意,企业是第一次联网直报,有些企业报表人员显得力不从心,出现一些不该出的错误,如能源中的工
业总产值及电力与工业B204-1表中的产值及电力不一样,能源表中的去年同期数填错及漏填指标等。使得统计局专业人员不得不多次督促企业对有问题的指标进行修正,造成企业多次修改数据、以致企业报表人员对统计工作有所抱怨,因此也增加了统计局专业人员不必要的工作量。
2、能源统计指标体系设计过于复杂、专业,基层统计人员难以胜任,在我们目前现有的能源统计报表中主要以工业p201和p207为主,这两张报表不但专业性强,而且审核关系错综复杂,在每次报表时间非常紧张的情况下,复杂的审核关系给基层统计人员造成了巨大压力。由于企业统计人员的文化素质普遍不高,加之频繁的更换人员,面对当前国家如此高的能源统计要求标准,省市级对数据的严格审查,统计人员疲于应付,势必影响数据的质量和上报时间,造成能源统计工作的被动局面。
五、对能源统计的几点看法
1、简化能源统计报表指标体系,降低审核要求。
在目前情况下,基层统计人员只能胜任一些简单的统计工作,像能源统计这样复杂、严格的专业统计很多基层统计人员根本无法适应。针对这种现状我们应该从两个方面着手解决,首先要简化能源统计的指标体系,降低审核要求,建立一套适应实际情况的能源统计指标体系。其次要改善基层统计人员的工作待遇,提高基层统计部门的用人门槛,吸引更多的高学历的人才来充实基层统计部门的力量。
2、淡化产值能耗审核关系,确保能耗数据的真实性。
产值增长过快,与现行的考核体制有关系,基层统计部门抗干扰的能力差,产值增长过快的问题恐怕无法在短期内解决。如果解决不了产值过快增长问题,那能源统计数据和产值数据之间必然就会出现矛盾,为了防止能源统计数据被动跟着产值数据同步提高,最好的办法就是淡化产值能耗的审核关系,把精力重点放在抓好能耗数据的统计和填报上,以提供真实、准确的能耗数据供政府决策。
六、下一步工作打算
一年来,我县能源统计工作取得了一定成绩,但与国家能源建设及省、市局工作要求,与全市规上工业企业节能减排目标任务控制还存在较大差距。对于今后的工作中,我们有以下打算:
1、继续加大“一套表”培训力度,提高统计业务水平。县统计局要分专业就各专业企业在填报过程中可能出现的问题以及本专业需要进行哪些操作继续进行有针对性的培训,切实提高基层报表人员业务水平,使企业统计人员更好地掌握数据处理程序。
2、对今年网报中出现错误较多的企业进行重点跟踪,督促企业在明年报表中不再出现看错单位及漏填指标的情况。
3、继续加强和完善基层企业单位的基础工作,建立健全原始记录、统计台帐,保证数据源头的真实可靠
4、加强统计法制建设,增强全社会依法统计意识。
下一步我们将切实加强领导,采取有效措施,进一步夯实统计基层基础建设,健全完善考核评价制度,扎实开展数据质量评估分析,从严控制数据质量,加大统计执法力度,以高度的政治责任感抓好能
源统计监测工作,确保本年节能降耗目标实现。
宁强县统计局
20xx.11.14