统计学平均数总结表

时间:2024.4.13

第二篇:地统计学总结


第一章

地统计学的原名为地质统计学。

关键人物:D.J.Krige和H.S.Sichel的新矿藏评价方法

法国著名统计学家G.Matheron创立地统计学

M.David《矿产储量地统计学评价》(1977)

A.G.Journel等《采矿地统计学》(1978)

I.Clark 《实用地统计学》(1979)

B.D.Ripley《空间统计学》

E.H.Issaks和R.M.Srivostava   《应用地统计学导论》(1989)

N.Cressie    《空间数据统计学》(1991)

含义:地统计学是以区域化变量理论为基础,以变异函数为主要工具,研究在空间分布上既有随机性又有结构性,或空间相关和依赖性的自然现象的科学。

理论基础——区域化变量理论:当一个变量呈现为空间分布时,就称之为区域化。区域化变量具有两个最显著,而且也是最重要的特征,即随机性和结构性。

主要工具——协方差函数和变异函数:区域化随机变量之间的差异,可以用空间协方差来表示。

主要内容——克立格插值法:克立格插值法,又称空间局部估计或空间局部插值法。克立格法是建立在变异函数理论及结构分析基础之上。实质是利用区域化变量的原始数据和变异函数的结构特点,对未采样点的区域化变量的取值进行线性无偏、最优估计。

适用范围:克里格方法的适用范围为区域化变量存在空间相关性,则可以利用克里格方法进行内插或外推;否则反之。

地统计学软件:GS+、ArcGIS、Surfer、STATPAC、Geo-EAS、GEOPACK、Geostatistical Toolbox、GSLIB、DPS等数据分析软件。

地统计学与经典统计学的区别:

第二章

地理数据:是用一定的测度标准来衡量地理要素而取得的地理信息。

几个基本概念:间隔尺度数据:以连续的量来表示地理要素。根据地理要素的不同性质,采用不同的度量单位。比例尺度数据:是以连续的量来表示地理要素。事先规定一个基点,再将其他的量换算为它的比例。有序数据(等级数据):不是用连续的量来表示地理要素,而是只表示其次序关系的数据。二元数据:即0和1数据,用于表示地理要素的性质。名义尺度数据:用于表示地理要素的类型,可以用文字或字符表示。

基本统计分析:1、抽样方案:

1)随机抽样:利用随机数表或随机函数来确定样本。假定地理要素在空间或时间上的变化是随机的,而忽略其内部各部分的差异。适用于:地理类型划分不明确,对区域的差异性了解不多。

2)机械抽样:按固定间隔确定样本。不考虑地理要素的分布特点,而把它假定为均匀分布。

3)分组抽样:先分组再抽样。考虑到已经掌握的每组地理要素在总体中的比例和地位。

2、频数分布

频数:变量按大小顺序排序,并按一定间距分组,变量在各组出现的次数,称为频数。

频率:各组频率=各组频数/频数总数

累积频数

3、统计特征数

参数估计:点估计、区间估计

首先,根据样本值,对总体分布的类型做出判断和假设,从而得到总体的分布类型,其中含有一个或几个未知参数。其次,对另外一些并不关心其分布类型的统计推断问题,只关心总体的某些数字特征,通常把这些数字特征称为参数。这时,抽样的目的就是为了了解这些未知的参数。

探索性空间数据分析(ESDA:1、检查数据分布。

2、寻找全局和局部离群值。全局离群值:对于数据集中所有点的值,具有很高或很低值的观测样点。局部离群值:在数据集中,对于其周围点的值,具有很高或很低值的观测样点。【寻找方法:1)用直方图查找全局离群值,2)用半变异/协方差函数云识别离群值,3)用Vonoroi地图寻找离群值】

3、全局趋势分析。         4、检测空间自相关及方向变异。

相关分析:判断散点图(能够分辨什么是完全正线性相关,完全负线性相关,正线性相关,负先行先关,不相关,非线性相关的图像)

计算简单相关系数:(有公式)相关系数r=0,不相关:|r|<0.3,极低度相关;0.3≤|r|<0.5;0.5≤|r|<0.8,中度相关;|r|≥0.8,高度相关;|r|=1,完全相关。

相关分析与的区别与联系:  

一元线性回归分析的步骤流程:1、一元线性回归方程的建立2、回归系数的估计3、对一元回归方程的评价1)一元线性回归模型拟合优度的评价2)一元线性回归方程的显著性检验(t检验,F检验)

第三章

区域化变量的概念:以空间点x的三个直角坐标x u,x v,x w为自变量的随机场,称为区域化变量,或区域化随机变量。Z( x u , x v , x w)=Z(x) (举例说明:如,某地区的高程,某日某时的海面温度,某地区某日的云量)

性质:随机性:区域化变量是一个随机函数,具有局部的、随机的、异常的性质。

结构性:变量在点x与x+h处具有某种程度的自相关,这种自相关依赖于两点间的距离及变量特征。

空间局限性:指区域化变量往往只存在与一定的空间范围内,该空间称为区域化的几何域。在几何域内,变量属性最明显;在几何域外,变量属性不明显。(例如:群落中某一林分的类型;矿石品位只存在于矿化空间中)

空间连续性:不同的区域化变量具有不同程度的空间连续性。(例如:土壤厚度,具有较强的连续性。土壤中某种元素的含量,连续性不强,有时甚至不连续)

各向异性:区域化变量在各个方向上的性质变化相同,称为各向同性。在各个方向上的性质变化不同,称为各向异性。(知道各项同性和各向异性的图分别是什么样子,各项同性是各项异性的特例)

可迁性:区域化变量在一定范围内具有明显的空间相关,但超过这一范围之后,相关关系就变得很弱,甚至消失。

含义:观测前Z(x)是一个随机场,观测后Z(x)是一个普通的空间三元函数值或空间点函数值。

协方差函数的计算:

变异函数的计算:

对半变异函数的理解:半变异函数随距离的增加而增大。即当空间上的两点距离很近时,它们是相似的,其半变异值比较小。当这两点之间的距离扩大时,它们的相似性增加,其半变异值加大。

半变异函数中各个参数的意思:C0:表示h很小时,两点间观测值的变化。a:反映了区域化变量的影响范围。C(0):反映某区域化变量在研究范围内的变异强度。

块金效应:对变异函数 γ(h),当h=0时, γ(h)≠0, γ(h)=C0(常数),这种现象称为块金效应。块金常数反映了区域化变量内部随机性的可能程度。来源:1)测量误差。2)区域化变量在小于抽样尺度h时所具有的内部变异。C0=微观结构+采样及试验误差

协方差函数和变异函数的关系:C(h)=C(0)-γ(h)  或  γ(h)=C(0)-C(h)

平稳假设:在线性地统计学研究中,只需假设Z(x)的1、2阶矩存在且平稳。

当区域化变量满足下列条件,称该区域化变量满足二阶平稳或弱平稳的

1)在整个研究区内,E[Z(x)]=m(常数)存在,任意x

2)在整个研究区内,区域化变量Z(x)的空间协方差函数存在且平稳

         cov[Z(x),Z(x+h)]=E[Z(x)·Z(x+h)]-m2=C(h)  任意x ,任意h

协方差平稳意味着方差、变异函数平稳。

内蕴假设:基本思想:只考虑区域化变量的增量而不考虑变量本身。

当区域化变量Z(x)的增量Z(x)-Z(x+h)满足下列两个条件时,则该区域化变量满足内蕴假设

1)在整个研究区内,区域化变量Z(x)的增量的数学期望为0,即:E[Z(x)-Z(x+h)]=0任意x,任意h

2)在整个研究区内,区域化变量Z(x)的增量的方差函数对于任意X和h存在,且平稳

     var[Z(x)-Z(x+h)]=E[Z((x)-Z(x+h)-0]2=E[Z((x)-Z(x+h)]2=2γ(α, h)=2γ(h)

随机函数Z(x)的增量只依赖于分割它们的向量h,而不依赖于具体位置x

求估计误差的方差:Z(xi)为某一区域化变量的实际值(或理论值),Z*(xi)为某一区域化变量的估计值

估计误差为:R(xi)=Z(xi)-Z*(xi) 数学期望为:E[R(xi)]=m E

估计误差的方差为: σ2E=var[Z(xi)-Z*(xi)]=E[R(xi)]2-{E[R(xi)]}2=E[R(xi)]2-m E2

注:如果Z(x)为区域化变量,则R(x)也为区域化变量;若Z(x)是二阶平稳,即数学期望存在,方差有限,则R(x)也是二阶平稳,数学期望存在,方差有限。

第四章

变异函数的理论模型:1、有基台值模型:球状模型,指数模型,高斯模型,线性有基台值模型,纯块金效应模型。无基台值模型:2、幂函数模型,线性无基台值模型,抛物线模型。3、孔穴效应模型(可有有基台或无基台模型)

结构分析的原因:具有复杂变化的区域化变量的空间变异性,往往不是单纯的一种结构,而是不同尺度上的多层次的结构叠加在一起,因而无法用一种理论模型来拟合它,为了全面了解区域化变量的变异性,必须进行结构分析。

结构分析概念:构造一个变异函数模型对于全部有效结构信息作定量化的概括,以表征区域化变量的主要特征。结构分析的主要方法是套合结构。

套合结构概念:把分别出现在不同距离h上和(或)不同方向α上同时起作用的变异性组合起来。套合结构可以表示为多个变异函数之和,每一个变异函数代表一种特定尺度上的变异性,套合结构的表达式为: γ(h)=γ0(h)+γ1(h)+……+γi(h)+……绝大多数变异函数由以下两个变异函数组成: γ(h)=γ0(h)+γ1(h),  γ0(h):代表纯块金变异函数  γ1(h):代表空间相关的变异函数

各向异性的种类:1、当区域化变量在不同方向上表现出变异程度相同而连续性不同时称为几何异向性。2、当区域化变量在不同方向上变异性之差,不能用简单几何变换得到时,就称为“带状异向性”。3、混合结构

变异函数理论模型的最优拟合:根据变异函数的计算值,选择合适的理论模型来拟合一条最优的理论变异函数曲线,通常称为最优拟合。拟合过程:1.确定曲线类型2.参数最优估计3.最优曲线的确定

参数最优估计:(两种方法)极大似然估计法、距估计法和最小二乘法?

最小二乘法:基本思想:使误差平方和最小,达到在误差之间一种平衡,以防止某一极端误差对决定参数的估计值起支配地位。这有助于揭示更接近真实的状况。

影响变异函数的主要因素:(1)样点间距离和支撑的大小:随着样点间距离增大,变异函数的随机成分不断增加,小尺度结构特征将被掩盖。因此,要确定采样的最小尺度。用块段取样时,变异程度随支撑增大而减小,因此,要考虑支撑的大小。(2)样本数量的大小:一般要求在变程a以内各距离上的点对数目不应小于20对。(3)异常值的影响:在变程内的异常值主要影响块金值,导致块金值增大,随机成分影响加强,而空间自相关方面的影响消弱。(4)比例效应:它会导致试验变异函数值产生畸变,使基台值和块金值增大,使估计精度降低,导致某些结构特征不明显。可通过对原始数据取对数来消除。(5)飘移的影响:当E[Z(x)]=m(x),γ*(h)不再是γ(h)的无偏估计量。

结构分析的基本步骤:(1)区域化变量选择【根据具体研究目的而定,要有明确物理意义,最好能定量表示。】(2)数据审议【包括:空间取样设计、样点间距离大小、取样方法、数据代表性、均匀性、时空一致性等。目的:校正数据误差、对某些特殊问题给予初步解释。】(3)数据统计分析【包括:平均值、方差、标准差、变异系数等统计分析。】(4)变异函数的计算【要考虑数据的结构】(5)变异函数的结构分析【包括:各向同性、各向异性分析块金效应分析、不同方向上的套合结构分析等。目的:根据实验变异函数来分析所研究的区域化现象的主要结构特征。】(6)理论变异函数模型的最优拟合及检验(7)变异函数理论模型的专业分析

第五章

空间插值定义:根据空间分布的离散采样点值求出未知点值,在数学上属于数值分析中的插值问题。即将离散的数据点转化为连续的数据曲面。

插值法分类:1、确定性插值法:全局插值法(全局多项式法),局部插值法(反距离加权插值法、局部多项式法、径向基函数法);精确性插值(反距离加权插值法、径向基函数法),非精确性插值(全局多项式法、局部多项式法)。  2、地统计插值法

反距离加权插值法(IDW):相近相似原理:两物体距离越近,它们的性质越相似。反之,两物体距离越远,它们的性质越不相似。

克里格插值法的概念:又称为空间局部估计或空间局部插值法,克立格法是建立在变异函数理论及结构分析基础上,在有限区域内对区域化变量的取值进行无偏最优估计的一种方法。

克里格估计量:Zv*(x)=∑λiZ(xi),i=1~n 其中λi为权重系数,Z(xi)为待估点影响范围内的有效样本值。

简单克里格法和普通克里格法的含义:当区域化变量Z(x)的E[Z(x)]=m已知,则称为简单克立格法。(计算简单、更精确,但目前较少使用)。若Z(x)的E[Z(x)]未知,则称为普通克立格法。

简单克里格法和普通克里格法的估值流程:

克立格法与空间确定性插值法的区别:克立格法:基于采样数据反映的区域化变量的结构信息(变异函数或协方差函数提供),根据待估点或块段有限邻域内的采样点数据,考虑样本点的空间相互位置关系(K矩阵)、与待估点的空间位置关系(Ma矩阵),对待估点进行的一种线性无偏最优估计,并且能给出估计精度,比其他传统方法更精确、更符合实际。空间确定性插值法:通过采样点的分布直接内插(反距离加权)或通过采样点拟合数学方程内插(全局、局部多项式、径向基函数)。

有关克立格法的说明:(1)克里格矩阵和估计构型(数据构型相同,克里格矩阵就相同)(2)表达式通用性(不论采样数据和待估数据为点或块段,不论协方差函数和变异函数表征为何种结构模型,克立格方程组和克立格估计方差完全通用。)(3)估计可靠性(4)若已知协方差函数或变异函数,则可提前计算克立格估计方差,用于指导采样设计(5)克里格权重系数(权重可正可负性:可获取大于最大或小于最小的样本值的插值结果。块金值的大小对权重影响:增加块金值会使插值过程更接近于简单算术平均,极端情形——纯块金效应模型,样本权重相同,结果为样本的算术平均。对称性:若区域化变量是各向同性,且无丛聚效应时,当已知样点对待估样点几何位置对称时,它们之间的克里格权重系数也具有对称性。丛聚效应:在克立格估计中,不会由于一些样点丛聚在一起而增大其权重系数。屏蔽效应:屏蔽效应与块金常数有很大的关系,当块金值很小或不存在时,已知样点的克立格权重系数的大小受屏蔽效应影响。当块金常数增大,屏蔽效应减弱。当为纯块金效应时,所有样点间相互独立,协方差函数为0,变异函数等于外延方差(即基台值),求出的采样点的克立格权重系数均相同,此时屏蔽效应消失。)(6)邻域内已知的样本数量对克里格估计的影响:(在地统计学克里格估计中,一般多采用10个左右邻域内的有效数据,再扩大有效数据,会产生屏蔽效应,而且对克里格估计精度不起作用。)(7)理论模型对克立格估计的影响:(①偏台值对克立格估计的影响,偏基台值越大,变异越强,块金值:越小,屏蔽效应越明显,距离近的权重就越大,估计方差越大。反之成立。② 变程:对克立格估计的影响,变程越大,变异越平缓,距离近的权重就变小,减弱了屏蔽效应,估计方差变小。反之成立。③块金值对克立格估计的影响,块金值:越大,屏蔽效应减弱,偏基台值越小,距离近的权重就变小,同时样点间相关性也越小,估计方差变大。反之成立。④模型种类对克立格估计的影响,模型的形状、参数都会对克立格估计产生影响。)

泛克里格法产生的原因:普通克里格要求区域化变量在给出的邻域内,是平稳的,至少是准平稳的,但实际中,许多区域化变量在研究区内是非平稳的。

泛克里格法含义:在漂移的形式E[Z(x)]=m(x)、非平稳随机函数Z(x)的协方差C(h)或变异函数γ(h)为已知条件下,一种考虑到有漂移的无偏、线性估计量的地统计学方法。   

克里格法的总结:(估值过程)

不同克里格插值法的使用条件:不同插值法的使用条件不同,普通克里格法、简单克里格法和泛克里格法前提条件是样本数据符合正态分布。当假设高程值的期望值是未知时,选用普通克里格法;当假设高程值为某一已知常数时,选用简单克里格法;当只需了解属性值是否超过某一阈值时,选用指示克里格法;当数据存在主导趋势时,选用泛克里格法;若不服从正态分布时,选用析取克里格法;当同一事物的两种属性存在相关关系,且一种属性不易获取时,可选用协同克里格方法,借助另一属性实现该属性的空间内插。

更多相关推荐:
医学统计学总结手持版

统计学(Statistics):应variable):变量的观察般用希腊字母表示。用统计学的原理与方法,或检测结果,也叫变量的统计量(statistic):根据研究数据的搜集、整理与观测值。样本个体值计算出来的…

医学统计学总结

1、同一资料的标准差是否一定小于均数?答:均数是描述定量资料集中趋势的指标,而标准差是描述定量资料离散程度的指标,二者反映的是资料分布特征的两个不同方面。2、极差、四分位间距、标准差、变异系数的适用范围有何异同…

医学统计学 总结 经典

Chapter基本概念显著性检验(testofsignificance):计算P值医学统计工作的内容:1、实验设计:最关键最重要2、收集资料:最基础原始资料:实验数据现场调查资料医疗卫生工作记录报表报告卡质量控…

医学统计学总结

一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验2)小样本偏态分布资料,则用成组…

医学统计学_总结_重点_笔记_复习资料

俄第一章2选1总体:总体(population)是根据研究目的确定的同质观察单位(研究对象)的全体,实际上是某一变量值的集合。可分为有限总体和无限总体。总体中的所有单位都能够标识者为有限总体,反之为无限总体。样…

统计学总结

一、两组或多组计量资料的比较1.两组资料:1)大样本资料或服从正态分布的小样本资料(1)若方差齐性,则作成组t检验(2)若方差不齐,则作t’检验或用成组的Wilcoxon秩和检验2)小样本偏态分布资料,则用成组…

统计学总结

通过课上学习总结如下:统计学原理知识总结统计学知识总结统计学是一门关于随机现象总体的数据资料进行收集、整理和分析的方法论科学。统计学的研究对象是对于客观存在的现象,只要能够按照特定性质加以归类,并能用总体性的数…

统计学内容总结--全

医学统计学纯概念复习提纲给点建议吧感觉全了一名解医学统计学是用统计学原理和方法研究生物医学问题的一门学科他包括了研究设计数据收集整理分析以及分析结果的正确解释和表达统计描述用统计指标统计图表对资料的数量特征及分...

医学统计学名词解释概念总结

一名解医学统计学是用统计学原理和方法研究生物医学问题的一门学科他包括了研究设计数据收集整理分析以及分析结果的正确解释和表达统计描述用统计指标统计图表对资料的数量特征及分布规律进行客观的描述和表达统计推断在一定的...

医学统计学_总结_重点_笔记_复习资料

第一章2选1总体总体population是根据研究目的确定的同质观察单位研究对象的全体实际上是某一变量值的集合可分为有限总体和无限总体总体中的所有单位都能够标识者为有限总体反之为无限总体样本从总体中随机抽取部分...

统计学小结

第一章统计总论一统计一词的含义二统计的研究对象特点三统计的职能四总体和总体单位五标志与标志表现六统计指标及其分类七变量的涵义及其分类一统计一词的含义统计有三种含义即统计工作统计资料和统计学二统计学的研究对象和特...

统计学总结

计量资料统计描述集中趋势离散趋势频数分布假设检验t检验单样本均数样本符合正态分布配对样本均数差值d符合正态分布两独立样本均数正态分布方差齐性方差分析满足正态性和方差齐性随机区组资料22交叉设计资料22析因设计资...

统计学总结(48篇)