简明统计学知识要点

时间:2024.5.13

简明统计学知识要点

第一章:导论

1、什么是统计学?统计方法可以分为哪两大类?

统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。

2、统计数据可分为哪几种类型?不同类型的数据各有什么特点?

按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。 按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。

3、举例说明总体、样本、参数、统计量、变量这几个概念。

总体是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量是说明现象某种特征的概念。比如商品的销售额是不确定的,这销售额就是变量。

第二章:数据的收集

1、调查方案包括哪几个方面的内容?

调查目的,是调查所要达到的具体目标。调查对象和调查单位,是根据调查目的确定的调查研究的总体或调查范围。调查项目和调查表,要解决的是调查的内容。

2、数据的间接来源(二手数据)主要是公开出版或公开报道的数据;数据的直接来源一是调查或观察,二是实验。

3、统计调查方式:抽样调查、普查、统计报表等。

抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。

除此之外,还有重点调查和典型调查。

4、统计数据的误差通常是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差

和非抽样误差两类。 抽样误差主要是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差是人为因素造成的(理论上可以消除)

5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理和研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。

6、数据的收集方法分为询问调查与观察实验。

7、统计调查方案包括哪些内容?

调查目的即调查所要达到的具体目标;调查对象和调查单位,调查对象是根据调查目的确定的调查研究的总体或调查范围,调查单位是构成调查对象中的每一个单位;调查项目和调查表,就是调查的具体内容;其它问题,即明确调查所采用的方式和方法、调查时间及调查组织和实施细则。

第三章:数据整理与展示

1、对于通过调查取得的原始数据,应主要从完整性和准确性两个方面去审核。

2、对分类数据和顺序数据主要是做分类整理,对数值型数据则主要是做分组整理。

3、数据分组的步骤:确定组数、组距,最后制成频数分布表 统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。 组中值=(下限值+上限值)/2

4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图和饼图。

5、直方图与条形图的差别:条形图是用条形的长度表示各类别频数的多少,宽度则是固定的,直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

第四章:数据分布特征的测度

1、一组数据的分布特征可以从哪几个方面进行测度?

一是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。

2、简述众数、中位数和均值的特点和应用场合及关系。

众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中趋势测度值。 中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。

均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。 关系:如果数据的分布是对称的,众数、中位数和均值必定相等,即Mo=Me=xbar;如果数据是左偏分布,说明数据存在极小值,三者之间的关系表现为:xbar<Me<Mo;如果数据是右偏公布,说明数据存在极大值,必然拉动均值向极大值一方靠,则Mo<Me<xbar(图)

3、为什么要计算离散系数?

第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。第二,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和计量单位不同对离散程度的测度值的影响,需要计算离散系数。

4、均值是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。

5、四分位差主要用于测度顺序数据的离散程度,数值型数据也可以计算四分位差,但不适合于分类数据。

6、方差是各变量值与其均值离差平方的平均数。方差的平方根是标准差。 方差、标准差计算公式(分组数据、未分组数据两种,自己写)

样本方差和标准差计算公式(同上)

7、对于分类数据,主要用异众比率来测度其离散程度;对于顺序数据,主要用四分位差来测度其离散程度;对于数值型数据,主要用方差或标准差来测度其离散程度。

8、经验法则:68%-1;95%-2;99%-3

第五章:抽样与参数估计

1、常用的概率抽样方法主要有:简单随机抽样,分层抽样,系统抽样,整群抽样 2、置信水平 : 置信水平是指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。

第七章:相关与回归分析

1、解释相关关系的含义,并说明其特点。

相关关系是变量与变量之间存在的不确定的数量关系。特点是:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。

2、简述相关系数的取值及其意义,并说明相关程度的几种情况。

相关系数-1≤r≤1 。若0≤r≤1 ,表明x与y之间存在正线性相关关系;若-1≤r<0 ,表明x与y之间存在负线性相关关系;若r=1,表明x与y之间为完全正线性相关关系;若r=-1 ,表明x与y之间为完全负线性相关关系。 |r|≥0.8时,可视为高度相关;0.5≤|r|<0.8时,可视为中度相关;0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,说明两个变量之间的相关程度极弱。

3、解释回归模型、回归方程、估计的回归方程的含义

回归模型是描述因变量y如何依赖于自变量x和误差项的方程。回归方程是描述因变量y的期望值如何依赖于自变量x的方程。估计的回归方程是利用最小二乘法,根据样本数据求出的回归方程的估计。

4、简述参数最小二乘估计的基本原理。

∧y = β0 + β1 ∧∧

这一公式的x和y的n对观察值,用于描述其关系的直线有多条,用距离观测点最近的一条

直线,用它来表示x与y之间的关系与实际数据的误差比其它任何直线都小。根据这一思想确定直线中未知常数β0和β1的方法称为最小二乘法,即:

??=1( yi - y)2 - ??=1∧∧∧(yi - β0 - βI xi)2 – 最小 ∧∧

5、简述判定系数的含义和作用

回归平方和占总平方和的比例,称为判定系数。它测度了回归直线对观测数据的拟合程度,它反映了在因变量y的总变量差中由于x与y之间的线性关系所解释的比例。

第八章:时间序列分析和预测

1、利用增长率分析时间序列时应注意哪些问题?

首先,当时间序列中的观察值出现0或负数时,不宜计算增长率;其次,在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝对水平的结合分析。

第九章:指数

1、什么是指数?它有哪些性质?

反映复杂现象在不同场合下综合变动的一种特殊相对数,称为指数。

性质:相对性;综合性;平均性;动态和静态兼有的特性。

2、指数有哪些类型?

根据对比场合不同,分为动态指数和静态指数;根据指数研究对象的范围不同,分为个体指数和总指数。;根据编制方法的不同,总指数分为综合指数和平均指数;根据指数反映的性质不同,分为质量指数、数量指数;根据比较时所采用的基期不同,分为定基指数和环比指数;根据计算采用权数与否,分为简单指数和加权指数。


第二篇:统计学重点知识要点


第一章:导论

1、什么是统计学?统计方法可以分为哪两大类

统计学是收集、分析、表述和解释数据的科学。统计方法可分为描述统计方法和推断统计方法。

2、统计数据可分为哪几种类型?不同类型的数据各有什么特点

按照所采用的计量尺度不同,分为分类数据、顺序数据和数值型数据;按照统计数据的收集方法,分为观测的数据和实验的数据;按照被描述的对象与时间的关系,分为截面数据和时间序列数据。

按计量尺度分时:分数数据中各类别之间是平等的并列关系,各类别之间的顺序是可以任意改变的;顺序数据的类别之间是可以比较顺序的;数值型数据其结果表现为具体的数值。按收集方法分时:观测数据是在没有对事物进行人为控制的条件下等到的;实验数据的在实验中控制实验对象而收集到的数据。按被描述的对象与时间关系分时:截面数据所描述的是现象在某一时刻的变化情况;时间序列数据所描述的是现象随时间而变化的情况。

3、举例说明总体、样本、参数、统计量、变量这几个概念

总体是包含研究的全部个体的集合。比如要检验一批灯泡的使用寿命,这一批灯泡构成的集合就是总体。样本是从总体中抽取的一部分元素的集合。比如从一批灯泡中随机抽取100个,这100个灯泡就构成了一个样本。参数是用来描述总体特征的概括性数字度量。比如要调查一个地区所有人口的平均年龄,“平均年龄”即为一个参数。统计量是用来描述样本特征的概括性数字度量。比如要抽样调查一个地区所有人口的平均年龄,样本中的“平均年龄”即为一个统计量。变量是说明现象某种特征的概念。比如商品的销售额是不确定的,这销售额就是变量。

第二章:数据的收集

1、调查方案包括哪几个方面的内容?

调查目的,是调查所要达到的具体目标。调查对象和调查单位,是根据调查目的确定的调查研究的总体或调查范围。调查项目和调查表,要解决的是调查的内容。

2、数据的间接来源(二手数据)主要是公开出版或公开报道的数据;数据的直接来源一是调查或观察,二是实验。

3、统计调查方式:抽样调查、普查、统计报表等。

抽样调查是从调查对象的总体中随机抽取一部分单位作为样本进行调查,并根据样本调查结果来推断总体数量特征的一种数据收集方法。特点:经济性,时效性强,适应面广,准确性高。普查是为某一特定目的而专门组织一次性全面调查。我国进行的普查主要有人中普查、工业普查、农业普查等。统计报表是按照国家有关法规的规定,自上而下地统一布置、自下而上地逐级提供基本统计数据的一种调查方式。

除此之外,还有重点调查和典型调查。

4、统计数据的误差通常是指统计数据与客观现实之间的差距,误差的主要类型有抽样误差和非抽样误差两类。

抽样误差主要是指在样本数据进行推断时所产生的随机误差(无法消除);非抽样误差是人为因素造成的(理论上可以消除)

5、统计数据的质量评价标准:精度,即最低的抽样误差或随机误差;准确性,即最小的非抽样误差或偏差;关联性,即满足用户决策、管理和研究的需要;及时性,即在最短的时间里取得并公布数据;一致性,即保持时间序列的可比性;最低成本,即在满足以上标准的前提下,以最经济的方式取得数据。

6、数据的收集方法分为询问调查与观察实验。

7、统计调查方案包括哪些内容?

调查目的即调查所要达到的具体目标;调查对象和调查单位,调查对象是根据调查目的确定的调查研究的总体或调查范围,调查单位是构成调查对象中的每一个单位;调查项目和调查表,就是调查的具体内容;其它问题,即明确调查所采用的方式和方法、调查时间及调查组织和实施细则。

第三章:数据整理与展示

1、对于通过调查取得的原始数据,应主要从完整性准确性两个方面去审核。

2、对分类数据和顺序数据主要是做分类整理,对数值型数据则主要是做分组整理。

3、数据分组的步骤:确定组数、组距,最后制成频数分布表

统计分组时“上组限不在内”,相邻两组组限间断,上限值采用小数点。

组中值=(下限值+上限值)/2

4、频数:落在各类别中的数据个数;频数分布指把各个类别及落在其中的相应频数全部列出,并用表格形式表现出来;比例:某一类别数据占全部数据的比值;百分比:将对比的基数作为100而计算的比值;比率:不同类别数值的比值;分类数据的图示包括条形图和饼图。

5、直方图与条形图的差别:条形图是用条形的长度表示各类别频数的多少,宽度则是固定的,直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。其次,直方图的各矩形通常是连续排列,而条形图则是分开排列。最后,条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。

第四章:数据分布特征的测度

1、一组数据的分布特征可以从哪几个方面进行测度?

一是分布的集中趋势反映各数据向其中心值靠拢或聚集的程度;二是分布的离散程度,反映各数据据远离其中心值的趋势;三是分布的形状,反映数据分布偏斜程度和峰度。

2、简述众数、中位数和均值的特点和应用场合及关系。

众数是一组数据分布的峰值,不受极端值的影响,缺点是具有不唯一性。众数主要作为分类数据的集中趋势测度值。

中位数是一组数据中间位置上的代表值,不受数据极端值的影响。中位数以及其他分位数主要适合于作为顺序数据的集中趋势测度值。

均值是就数值型数据计算的,具有优良的数学性质,缺点是易受数据极端值的影响。均值主要适合于作为数值型数据的集中趋势测度值。

关系:如果数据的分布是对称的,众数、中位数和均值必定相等,即Mo=Me=xbar;如果数据是左偏分布,说明数据存在极小值,三者之间的关系表现为:xbar<Me<Mo;如果数据是右偏公布,说明数据存在极大值,必然拉动均值向极大值一方靠,则Mo<Me<xbar(图)

3、为什么要计算离散系数?

第一,极差、平均差、方差和标准差等都是反映数据分散程度的绝对值,其数值的大小取决于原变量值本身水平高低的影响。第二,它们与原变量值的计量单位相同,采用不同计量单位计量的变量值,其离散程度的测度值也就不同。因此,为消除变量值水平高低和计量单位不同对离散程度的测度值的影响,需要计算离散系数。

4、均值是集中趋势的最主要测度值,它主要适用于数值型数据,而不适用于分类数据和顺序数据。

5、四分位差主要用于测度顺序数据的离散程度,数值型数据也可以计算四分位差,但不适合于分类数据。

6、方差是各变量值与其均值离差平方的平均数。方差的平方根是标准差。

方差、标准差计算公式(分组数据、未分组数据两种,自己写)

样本方差和标准差计算公式(同上)

7、对于分类数据,主要用异众比率来测度其离散程度;对于顺序数据,主要用四分位差来测度其离散程度;对于数值型数据,主要用方差或标准差来测度其离散程度。

8、经验法则:68%-1;95%-2;99%-3

第五章:抽样与参数估计

1、常用的概率抽样方法主要有:简单随机抽样,分层抽样,系统抽样,整群抽样

2、置信水平(P115)

第七章:相关与回归分析

1、解释相关关系的含义,并说明其特点。

相关关系是变量与变量之间存在的不确定的数量关系。特点是:一个变量的取值不能由另一个变量唯一确定,当变量x取某个值时,变量y的取值可能有几个。

2、简述相关系数的取值及其意义,并说明相关程度的几种情况。

相关系数-1≤r≤1 。若0≤r≤1 ,表明x与y之间存在正线性相关关系;若-1≤r<0 ,表明x与y之间存在负线性相关关系;若r=1,表明x与y之间为完全正线性相关关系;若r=-1 ,表明x与y之间为完全负线性相关关系。

|r|≥0.8时,可视为高度相关;0.5≤|r|<0.8时,可视为中度相关;0.3≤|r|<0.5时,视为低度相关;当|r|<0.3时,说明两个变量之间的相关程度极弱。

3、解释回归模型、回归方程、估计的回归方程的含义

回归模型是描述因变量y如何依赖于自变量x和误差项的方程。回归方程是描述因变量y的期望值如何依赖于自变量x的方程。估计的回归方程是利用最小二乘法,根据样本数据求出的回归方程的估计。

4、简述参数最小二乘估计的基本原理。

 这一公式的x和y的n对观察值,用于描述其关系的直线有多条,用距离观测点最近的一条直线,用它来表示x与y之间的关系与实际数据的误差比其它任何直线都小。根据这一思想确定直线中未知常数的方法称为最小二乘法,即:

5、简述判定系数的含义和作用

回归平方和占总平方和的比例,称为判定系数。它测度了回归直线对观测数据的拟合程度,它反映了在因变量y的总变量差中由于x与y之间的线性关系所解释的比例。

第八章:时间序列分析和预测

1、利用增长率分析时间序列时应注意哪些问题?

首先,当时间序列中的观察值出现0或负数时,不宜计算增长率;其次,在有些情况下,不能单纯就增长率论增长率,要注意增长率与绝对水平的结合分析。

第九章:指数

1、什么是指数?它有哪些性质?

反映复杂现象在不同场合下综合变动的一种特殊相对数,称为指数。

性质:相对性;综合性;平均性;动态和静态兼有的特性。

2、指数有哪些类型?

根据对比场合不同,分为动态指数和静态指数;根据指数研究对象的范围不同,分为个体指数和总指数。;根据编制方法的不同,总指数分为综合指数和平均指数;根据指数反映的性质不同,分为质量指数、数量指数;根据比较时所采用的基期不同,分为定基指数和环比指数;根据计算采用权数与否,分为简单指数和加权指数。

更多相关推荐:
统计学知识点总结

1统计的含义1统计工作即统计实践是指很据科学的方法从事统计设计收集整理分析研究和提供各种统计资料和统计咨询意见的活动的总称其成果是统计资料原始调查资料和加工处理后的系统资料2统计资料即统计工作过程中所获得的各种...

统计学知识点全归纳 全面、准确

统计学知识点汇总一统计学统计学是一门关于数据资料的收集整理分析和推断的科学二统计学的产生与发展1政治算术学派最早的统计学源于17世纪英国其代表人物是威廉配第代表作政治算术政治算术学派主张用大量观察和数量分析等方...

统计学知识点汇总

统计学知识点汇总第一章统计学是收集处理分析解析数据并从数据中得出结论的科学分类描述统计推断统计描述统计是研究数据收集处理和描述的统计学方法推断统计是研究如何利用样本数据来推断总体特征的统计学方法内容包括参数估计...

《统计》知识点精华总结

统计知识点精华总结1简单随机抽样的含义一般地设一个总体含有N个个体从中逐个不放回地抽取n个个体作为样本nN如果每次抽取时总体内的各个个体被抽到的机会都相等就把这种抽样方法叫做简单随机抽样简单随机抽样要特点总体的...

统计学总结

单选20120简答题3515计算题65第一章导论一什么是统计包括统计研究的主要内容统计学是一门收集整理显示和分析统计数据的科学二与其他学科有什么关系数学工商1统计学与数学都是研究数量规律的都要利用各种公式进行运...

大学统计学考点复习总结

统计学考点小结一、名词解释统计学:是研究大量社会现象(主要是经济现象)的总体数量方面的方法论科学。总体:亦称统计总体,是指客观存在的,在同一性质基础上结合起来的许多个别单位的整体。指标:亦称统计指标,是说明总体…

统计学总结

统计学个人总结报告我叫XX,学的是市场开发与营销专业。这学期学校为我们专业开设了统计学课程,通过一学期的学习我们对统计学应用领域及其类型和基本概念有了一个基本的了解。统计是处理数据的一门科学,是收集、处理、分析…

统计知识总结

统计知识总结普查个一个的调查注当样本容量较小或对个体要求精确时采用普查的方式抽样调查当样本容量较大时一般采用抽样调查的方式注抽样调查时样本的选取要有随机性不能有代表性例20xx四川内江下列调查中调查本班同学的视...

统计学基础知识要点

第一章导论1什么是统计学统计方法可以分为哪两大类统计学是收集分析表述和解释数据的科学统计方法可分为描述统计方法和推断统计方法2统计数据可分为哪几种类型不同类型的数据各有什么特点按照所采用的计量尺度不同分为分类数...

社会统计学知识点总结

社会统计学知识点总结一社会调查研究的步骤确定课题了解情况建立假设确立概念和测量方法设计问卷试填问卷调查实施校核与登录统计分析与命题的检验社会统计学介绍有关社会调查资料收集整理分析和推论的统计方法二社会调查资料的...

统计学基础知识要点(1)

第一章导论1什么是统计学统计方法可以分为哪两大类统计学是收集分析表述和解释数据的科学统计方法可分为描述统计方法和推断统计方法2统计数据可分为哪几种类型不同类型的数据各有什么特点按照所采用的计量尺度不同分为分类数...

统计学知识点归纳

作者Johnny医学统计学知识点归纳一概念1同质homogeneity是指观察单位或观察指标受共同因素制约的部分即性质相同的事物是统计分析的前提2变异variation是指同质的基础上个体间的差异也称个体变异包...

统计学知识总结(28篇)