数据的收集整理与描述知识点总结

时间:2024.4.20

数据的收集、整理与描述

第一节  统计调查

调查收集数据的过程与方法

(1)在统计调查中,我们利用调查问卷收集数据,利用表格整理数据,利用统计图描述数据,通过分析表和图来了解情况.
(2)统计图通常有条形统计图,扇形统计图,折线统计图.
(3)设计调查问卷分以下三步:①确定调查目的;②选择调查对象;③设计调查问题.
(4)统计调查的一般过程:
①问卷调查法-----收集数据;
②列统计表-----整理数据;
③画统计图-----描述数据.

全面调查(即普查)和抽样调查

1、统计调查的方法有全面调查(即普查)和抽样调查.
2、全面调查与抽样调查的优缺点:①全面调查收集的到数据全面、准确,但一般花费多、耗时长,而且某些调查不宜用全面调查.②抽样调查具有花费少、省时的特点,但抽取的样本是否具有代表性,直接关系到对总体估计的准确程度.
3、如何选择调查方法要根据具体情况而定.一般来讲:通过普查可以直接得到较为全面、可靠的信息,但花费的时间较长,耗费大,且一些调查项目并不适合普查.其一,调查者能力有限,不能进行普查.如:个体调查者无法对全国中小学生身高情况进行普查.其二,调查过程带有破坏性.如:调查一批灯泡的使用寿命就只能采取抽样调查,而不能将整批灯泡全部用于实验.其三,有些被调查的对象无法进行普查.如:某一天,全国人均讲话的次数,便无法进行普查.

总体  个体 样本 样本容量

(1)定义
     ①总体:我们把所要考察的对象的全体叫做总体;
     ②个体:把组成总体的每一个考察对象叫做个体;
     ③样本:从总体中取出的一部分个体叫做这个总体的一个样本;
     ④样本容量:一个样本包括的个体数量叫做样本容量.
(2)关于样本容量      样本容量只是个数字,没有单位.

抽样调查的可靠性

(1)抽样调查是实际中经常采用的调查方式.
(2)如果抽取的样本得当,就能很好地反映总体的情况,否则抽样调查的结果会偏离总体情况.
(3)抽样调查除了具有花费少,省时的特点外,还适用一些不宜使用全面调查的情况(如具有破坏性的调查).
(4)分层抽样获取的样本与直接进行简单的随机抽样相比一般能更好地反映总体.其特点是:通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本,该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况.

用样本估计总体是统计的基本思想.1、用样本的频率分布估计总体分布:
从一个总体得到一个包含大量数据的样本,我们很难从一个个数字中直接看出样本所包含的信息.这时,我们用频率分布直方图来表示相应样本的频率分布,从而去估计总体的分布情况.
2、用样本的数字特征估计总体的数字特征(主要数据有众数、中位数、平均数、标准差与方差 ).
一般来说,用样本去估计总体时,样本越具有代表性、容量越大,这时对总体的估计也就越精确

统计表

统计表可以将大量数据的分类结果清晰,一目了然地表达出来.统计调查所得的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格中,就形成“统计表”.统计表是表现数字资料整理结果的最常用的一种表格. 统计表是由纵横交叉线条所绘制的表格来表现统计资料的一种形式.

扇形统计图

(1)扇形统计图是用整个圆表示总数用圆内各个扇形的大小表示各部分数量占总数的百分数.通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.用整个圆的面积表示总数(单位1),用圆的扇形面积表示各部分占总数的百分数.
(2)扇形图的特点:从扇形图上可以清楚地看出各部分数量和总数量之间的关系.
(3)制作扇形图的步骤
①根据有关数据先算出各部分在总体中所占的百分数,再算出各部分圆心角的度数,公式是各部分扇形圆心角的度数=部分占总体的百分比×360°.

②按比例取适当半径画一个圆;按扇形圆心角的度数用量角器在圆内量出各个扇形的圆心角的度数;
④在各扇形内写上相应的名称及百分数,并用不同的标记把各扇形区分开来.

条形统计图

1) 定义:条形统计图是用线段长度表示数据,根据数量的多少画成长短不同的矩形直条,然后按顺序把这些直条排列起来.

2) 特点:从条形图可以很容易看出数据的大小,便于比较.

3) 制作条形图的一般步骤:
①根据图纸的大小,画出两条互相垂直的射线.
②在水平射线上,适当分配条形的位置,确定直条的宽度和间隔.
③在与水平射线垂直的射线上,根据数据大小的具体情况,确定单位长度表示多少.
④按照数据大小,画出长短不同的直条,并注明数量

折线统计图

(1)定义:折线图是用一个单位表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来.以折线的上升或下降来表示统计数量增减变化.
(2)特点:折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况.
(3)绘制折线图的步骤
①根据统计资料整理数据.
②先画纵轴,后画横轴,纵、横都要有单位,按纸面的大小来确定用一定单位表示一定的数量.

③根据数量的多少,在纵、横轴的恰当位置描出各点,然后把各点用线段顺序连接起来.

统计图的选择

统计图的选择:即根据常用的几种统计图反映数据的不同特征结合实际来选择.
(1)扇形统计图的特点:
①用扇形的面积表示部分在总体中所占的百分比.②易于显示每组数据相对于总数的大小.
(2)条形统计图的特点:
①条形统计图能清楚地表示出每个项目中的具体数目.②易于比较数据之间的差别.
(3)折线统计图的特点:
①能清楚地反映事物的变化情况.②显示数据变化趋势.
根据具体问题选择合适的统计图,可以使数据变得清晰直观.不恰当的图不仅难以达到期望的效果,有时还会给人们以误导.因此要想准确地反映数据的不同特征,就要选择合适的统计图.

象形统计图

(1)根据调查项目和调查目的,设计出用于记录数据的统计表格或对统计表格中缺少的数据进行完善.表格要求简明,覆盖所有调查数据.
(2)象形统计图是表现统计数字大小和变动的各种图形总称.其中有条形统计图、扇形统计图、折线统计图、象形图等.在统计学中把利用统计图形表现统计资料的方法叫做统计图示法.其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况.一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等.按图尺的数字性质分类,有实数图、累积数图、百分数图、对数图、坐标图、指数图等;其结构包括图名、图目(图中的标题)、图尺(坐标单位)、各种图线(基线、轮廓线、指导线等)、图注(图例说明、资料来源等)等.

第二节 直方图

频数与频率

(1)频数是指每个对象出现的次数.
(2)频率是指每个对象出现的次数与总次数的比值(或者百分比).即频率=频数数据总数
一般称落在不同小组中的数据个数为该组的频数,频数与数据总数的比值为频率.频率反映了各组频数的大小在总数中所占的分量.

频数(率)分布表

1、在统计数据时,经常把数据按照不同的范围分成几个组,分成的组的个数称为组数,每一组两个端点的差称为组距,称这样画出的统计图表为频数分布表.
2、列频率分布表的步骤:
  (1)计算极差,即计算最大值与最小值的差.
  (2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).
  (3)将数据分组.
  (4)列频率分布表.

频数(率)分布直方图

画频率分布直方图的步骤:
(1)计算极差,即计算最大值与最小值的差.(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).(3)确定分点,将数据分组.(4)列频率分布表.(5)绘制频率分布直方图.
  注:①频率分布表列出的是在各个不同区间内取值的频率,频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率.直角坐标系中的纵轴表示频率与组距的比值,即小长方形面积=组距×频数组距=频率.②各组频率的和等于1,即所有长方形面积的和等于1.③频率分布表在数量表示上比较确切,但不够直观、形象,不利于分析数据分布的总体态势.④从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容.

频数(率)分布折线图

一般利用直方图画频数分布折线图,在频数分布直方图中,把每个小长方形上面的一条边的中点顺次连接起来,得到频数折线图.
注意:折线图要与横轴相交,方法是在直方图的左右两边各延伸一个假想组,并将频数折线两端连接到假想组中点,它主要显示数据的变化趋势.


第二篇:数据的收集整理与描述知识点总结


第十章 数据的收集、整理与描述

10.1 统计调查

收集数据

整理数据

条形图  扇形图  描述数据

考察全体对象的调查叫做全面调查。

抽样调查:只抽取一部分对象进行调查,然后根据调查数据推断全体对象的情况。

要考察的全体对象称为总体,组成总体的每一个考察对象称为个体,被抽取的那些个体组成一个样本

样本中个体的数目称为样本容量

简单随机抽样

10.2 直方图

1. 计算最大值与最小值的差

2. 决定组距和组数  

把所有数据分成若干组,每个小组的两个端点之间的距离(组内数据的取值范围)称为组距。

3. 列频数分布表

对落在各个小组内的数据进行累计,得到各个小组内的数据的个数,叫做频数。整理得到频数分布。

4. 画频数分布直方图

本章知识结构图

数据处理的一般过程:

文本框: 制表 文本框: 绘图

更多相关推荐:
Java元数据总结

Java元数据总结:Java注释的使用和定义元数据从metadata一词译来,就是“关于数据的数据”的意思。越来越的开源框架都提供了“元数据”支持了,其实也就是注释支持。今天系统学习一下Java注释(Java元…

米尔敦植被数据总结报告英文翻译

米尔敦植被数据总结报告编写:锦江环保咨询公司307国街哈密尔顿59840导言本文件提供了一个简述的方法和植被领域的评估结果,目的是标记出米尔敦坝修复区现有工厂社区,杂草和植物种群修复潜力,以支持米尔敦坝修复区的…

建筑给排水设计中的数据总结

什么场合出现0.1m的间距或高度要求?1)第3.8.15条,水泵基础高出地面不应小于0.10m;2)第3.8.6条,水泵吸水喇叭口至池底的净距不应小于0.10m;3)第5.4.19条,膨胀管出口离接入水箱水面的…

电力大数据总结

电力大数据的发展随着数字信息化时代的迅猛发展,信息量也呈爆炸性增长态势。在人类充分享受信息化带来的资讯、方便和快捷时,也使得全球的数字信息资源正进入到一个前所未有的快速增长期。据IDC统计,20xx年全球数据量…

建筑工程最常用的数据总结

一、框架结构:(砼及钢筋含量)1、一般的框架结构中的混凝土用量可以按“建筑面积*0.22”得出,即一个标准层的折算厚度在22cm左右;2、框架结构的含钢量暂按每m2含钢量60kg计(暂时不考虑影响各建筑物含钢量…

常用数据总结

什么场合出现0.1m的间距或高度要求?1)第3.8.15条,水泵基础高出地面不应小于0.10m;2)第3.8.6条,水泵吸水喇叭口至池底的净距,不应小于0.8倍吸水管管径,且不应小于0.10m;3)第5.4.1…

投标经验数据总结

常见的基础常识12墙一个平方需要64块标准砖18墙一个平方需要96块标准砖24墙一个平方需要128块标准砖37墙一个平方需为192块标准砖49墙一个平方需为256块标准砖计算公式:单位立方米240墙砖用量1/(…

GUI数据传递总结

Matlab的GUI参数传递方式总结其实Matlab提供了很多种直接或间接方法实现多fig中的数据共享只是大家没有注意罢了1全局变量2作为函数的参数传递3利用控件的userdata数据4为handles结构体添...

Oracle 10g数据库查找数据的方法总结

Oracle10g查找数据主要有以下方式全表扫描和ROWID查找数据全表扫描FullTableScans有时Oracle数据库在评估最优执行计划时当去取大量数据时就会优先考虑使用全表扫描因为这时全表扫描是最优的...

大数据学习总结

大数据时代读后感一学习总结1关于作者维克托迈尔舍恩伯格ViktorMayerSchnberger他是十余年潜心研究数据科学的技术权威他是最早洞见大数据时代发展趋势的数据科学家之一2关于大数据1大数据是什么大数据...

数据挖掘的一些总结

深入浅出谈数据挖掘段勇编者的话本文对数据挖掘概念的产生数据挖掘与常规数据分析的主要区别所能解决的几大类问题和所应用的领域都有着非常清晰的论述作者在此篇文章中认为数据挖掘最重要的要素是分析人员的相关业务知识和思维...

大数据云计算学习总结

云计算与大数据环境下银行变革学习心得一大数据基本概念1大数据或称巨量资料指的是所涉及的资料量规模巨大到无法通过目前主流软件工具在合理时间内达到撷取管理处理并整理成为帮助企业经营决策更积极目的的资讯大数据不但包含...

数据总结(75篇)