统计学实验报告
实验一
数据的搜集与整理
一、数据的收集。
统计数据主要来源于两种渠道:一种是间接数据,这些数据来源于别人的调查或实验数据;另一种是直接数据来源于直接的调查获取,并进行相关的整理、研究得来的统计数据。
间接数据的搜集方法有两种:
第一是直接进入专业数据库网站查询数据,这种方法主要适用于目标明确并且能够找到对应专业数据库网站的一些数据;
例:1,进入浏览器 输入http://www.cdstats.chengdu.gov.cn/
2,在统计数据 年度数据中
选择统计年鉴 20##年数据下载后即可得到数据。
第二种是使用搜索引擎,适用于目标不明确并且数据库网站又没有直接提供的统计数据。
例,1,在百度中输入所需输入的信息名称
2,在搜索项中点击第一项成都市的统计局,进入统计数据。
即可擦看到成都市统计局关于20##年成都人口数的下载表
直接数据。这一类数据的收集获得途径有:科学实验、观察实验或者是直接调查。
二、数据的整理
数据的整理包括:数据编码、数据录入、数据文件的导入、数据的筛选、数据的排序以及数据文件的保存。
(1)数据的编码,数据编码是指把需要加工处理的数据库信息,用特写的数字来表示的一种技术是根据一定数据结构和目标特征,将数据转换为代码或码字符,在数据传输中表示数据组成,并作为送、接受和处理的一组规则和约定。
(2)数据的录入,数据的录入是将搜集到的数据直接输入到Excel中。
(3)数据的导入:
方法一:是使用“文件-打开”菜单,
方法二:是使用“数据-导入外部数据-导入数据”
(4)数据的筛选
数据的筛选是从大数据表单中选出分析所要用的数据。Excel中提供了两种数据的筛选操作,包括“自动筛选”和“高级筛选”。
(5)数据的排序
数据的排序主要依靠升序排列或者是降序排列工具按钮和数据-排序菜单实现。在选中排序的区域后,点击升序排列或者降序排列按钮,即可进行快速的排列。
(6)数据文件的保存
可以使用“保存”工具按钮,或者“文件-保存”菜单,还可以使用“文件-另存为”菜单。
实验二,描述数据的图表。
1,频数频率表 ferquency函数
意义:返回某一个选定区域中数据的频数分布,计算出给定的值域和接收与内,每个区间包含的数据个数。
实验操作步骤:
第一步:激活单元格并输入数据。第二布:选中未使用的单元格,点击函数调用卡片选择Frequency函数。
第三步:点击“插入函数”对话框确定按钮进入“函数参数”对话框。引用date-array用来计算频率的一个数组。
第四步:使用组合键“Ctrl+Shift+Enter”得到频数返回结果
直方图分析工具:
“工具”—“数据分析”—“直方图”
直方图制作:第一步:将数据输入到单元格。
第二步:使用“工具——数据分析”菜单,打开“数据分析”对话框,选择“直方图”。
第三步:单击确定按钮,进入“直方图”分析工具库对话框,点击“输入区域”右侧箭头选中输入数据的单元格,点击“接受区域”右侧箭头选中分组数据分单元格,“输出区域”只需要激活一个右侧和下侧都没有数据的单元格,选中图标输出和累计百分比。
点即确定后就出现了统计图,再对统计图进行部分修改即可。
饼子图制作
第一步:选择组别按住crlt 点击图表导向。
第二步:点击“数据标志”选项卡,选中值和百分比。
最后点击确定即可。在工具-数据分析里选择饼图。
或者如直方图的制作,
各种统计图的各自特点。
1,直方图:不支持手工输入,用来卡分布装抗
2,折线图:用来比较分心两组即以上的数据。
3,散点图:用来观察数据之间共同的变化趋势。
实验三、统计数据的描述
统计指标中包括众多的函数,包括算数平均数,调和平均数,集合平均数,众数,中位数,标准差,方差,偏度,还有风度等。
1,均值。1算数平均数 激活一空白单元格,输入公式敲击回车
2 几何平均数 使用GEOMEAN语法 求目标的几何平均数
3 中位数 使用median函数 计算中位数
4 众数 使用mode 进行计算
2,离散程度。 1 极差 max 计算最大值
Min 计算最小值
通过max-min构建函数组算出极差
2方差和标准差
Varp 计算方差
Var 估算样本的方差
Stdevp 返回整个总体的标准差
Stdev 估计样本的标准差
操作步骤:
1算术平均数:第一步,激活空白单元格,点击函数卡片
选择该函数点即确定
第二部:点击选择区域按钮拖选区域
点击确定后就出现平均值。
其他如调和平均数,集合平均数,众数(MODE),中位数(MEDIAM),标准差(stdev),方差(var),偏度(skew),还有风度(kurt)等操作步骤相同,在点击函数卡片后选择对应的函数即可进行计算。
2 :描述统计 工具
第一步:工具—数据分析—描述统计—点击数据分析对话框
第二部:进入“描述统计”对话框,分别选中输入输出区域。
第三部:分组方式,选择“逐列”,输出区域选择一个右方和下方都没有数据的单元格,点“标志位于第一行”、“击汇总区域”、“平均数置信度”、“第K大值”、“第K小值”。
几点说明
(1)观测值,计算数组数据的个数,使用函数COUNT(values1,values2,…),其中只有数值型的数据才能被统计。(2)第k大值和第k小值,第k大值是对数据按将序排列,对数据按升序排列。
(2)标准误差,使用Count、Stdev和Sqrt三个函数组合套用来计算标准误差,返回某一正数的算术平方根,使用的函数是SQRT(number).
(3)平均置信度,选中平均置信度复选框,手工输入置信度。
实验死、参数估计
1、抽样:“抽样”分析工具将输入区域视为总体,并使用总体来建立样本。当总体过大而无法处理或制成图表时,就可以使用代表样本。如果输入数据是周期性的,也可以建立只包含某个周期特定部分数值的样本。
第一步。在工具中选择数据分析到数据数发生器。
第二部,根据要求,进行随机数的发生。
第三步:打开“工具—数据分析—抽样”点击确定
第四步:选择索要数据的输入区域,样本单位个数,并在一个右方和下方没有数据的单元格确定输出数据,点击确定。
二、构建函数表单
在第一数列输入:样本统计量、样本个数、样本均值、用户输入、总体标准差、置信水平、计算结果、抽样平均误差、Z值、置信区间半径、置信区间下限、置信区间上限
第二部:在选择相对应的项目后。点击插入—名称—指定,然后选最左列复选框,再点击确定。
第三步:选中函数表中的所有单元格,点击插入—名称—指定,然后选最左列复选框,
第四步:样本个数=count(样本数据)
样本均值=average(样本数据)
抽样平均误差=总体标准差/sqrt(样本个数)
Z值=(样本均值—总体均值假设值)/抽样平均误差)
置信区间下限(=Normsive((1-置信水平)/2))
置信区间上限(=normsive((1-置信水平)/2)+置信水平))
置信区间半径(100*(1-a)%,总体标准差,样本个数)
最后确定。
三、返回总体平均值的置信区间半径:
第一步:点击置信区间半径所在行的空白单元格,点击函数卡片,找到“confidence”函数,点击确定。
第二步:在Alpha中填入用于计算的置信度,在standard_dev中填入数据的总体标准差,size为样本容量。
四、返回标准正态累积分布函数
第一步:在“Z值”所在行选择空白单元格,点击函数卡片,找到normsinv函数,点击确定。
第二步:在“probability”中输入0.95(置信区间),然后点击确定
五、返回作为概率和自由度的函数的t分布的t值
第一步:在t值所在行选择空白单元格,点击函数卡片,找到“tinv”函数,点击确定。
第二步:在“probability”中填入显著性水平,在“deg_freedom”中填入比样本个数少一个的值,然后点击确定。
实验五 假设检验
一、总体标准差已知,总体均值的假设检验——Z检验
1,抽样。抽样:“抽样”分析工具将输入区域视为总体,并使用总体来建立样本。当总体过大而无法处理或制成图表时,就可以使用代表样本。如果输入数据是周期性的,也可以建立只包含某个周期特定部分数值的样本。
第一步。在工具中选择数据分析到数据数发生器。
第二部,根据要求,进行随机数的发生。
第三步:根据所需要的数据要求选择变一个数,总体单位,获得数据。
2构建函数表单
第一步:确定需进行假设检验的总体参数,确定抽样样本统计量及其服从的分布(正态分布、t分布、f分布、卡方分布等),进行双侧或单侧假设设计,确定置信水平。
第二部:抽样平均误差(=总体标准差/sqrt(样本个数))
检验统计量(=(样本均值—总体均值假设值)/抽样平均误差)
检验区间下限(=Normsive((1-置信水平)/2))
检验区间上限(=normsive((1-置信水平)/2)+置信水平))
第三部:得出结论。
实验六,方差分析
1,单因素方差分析:
第一步:使用工具—数据分析菜单,打开数据分析,选择方差分析—单因素方差分析分析工具,确定
第二部:打开方差分析—单因素方差分析;输入区域要确定进行单因素方差分析数据所在单元格;分组方式的行、列单选框,确认分组总体数据是以行还是以列来划分;“标志位于”复选框确认输入区域数据是否包含标志;a框要求输入显著性系数,输出区域选择输出单元格。
第三部 点击方差分析:单因素方差分析
分析工具的返回结果由两部分构成:一部分是Summary(汇总),以表格的形式展示出每个组的观测数、求和、平均和方差结果;第二部分是方差分析表。
判断条件一:在一个给定的显著性水平a,如果计算的F检验统计量大于F的临界值就拒绝原假设,反之,不拒绝原假设。
判断条件二:在一个给定的显著性水平a,如果P值小于a就拒绝原假设,反之,不拒绝原假设。
2、无重复双因素方差分析
第一步:使用“工具—数据分析”菜单打开数据分析对话框,选择“方差分析—无重复双因素方差分析”分析工具,点击确定打开对话框。
第二部:输入区域要确认进行无重复交互作用的双因素方差分析数据所在的单元格;“标志”复选框确认输入区域是否包含标志复选框;a框输入显著性系数;输出区域选择输出单元格。
第三部:点击“方差分析:无重复双因素方差分析”点击确定
3、可重复双因素方差分析
第一步:使用工具—数据分”菜单打开数据分析对话框,选择“方差分析—可重复双因素方差分析”分析工具,点击确定打开对话框。
第二部:输入区域要确认进行无重复交互作用的双因素方差分析数据所在的单元格;“标志”复选框确认输入区域是否包含标志复选框;a框输入显著性系数;输出区域选择输出单元格。
第三部:点击“方差分析:可重复双因素方差分析”点击确定。
判断条件:在一个给定的显著性水平a下,如果计算的F检验统计量大于F的临界值,行因素P小于显著性系数0.05就拒绝原假设,反之,不拒绝原假设。
第二部分。
一获得数据:进入国家统计局网站。http://www.stats.gov.cn/
点击统计数据,数据年鉴,
点击链接EXCEL后进入软件,完成数据的获得。
筛选取得20##年到20##年的数据。
二.描述数据图表。
使用折线图来描述年底余额总计的变化。
完成从2001到20##年的收入余额的变化趋势。
从20##年到20##年的收入余额平均数为
3构建函数表单:
使用数据
Z值法
抽样。年底余额定期
T值
使用数据
定期为样本1 活期为样本2
抽样结果
定期 活期
假设检验
分差分析 单因素方差分析
数据如下
定期 活期
分差分析 可重复双因素分析
实验心得:
统计学实验课开设课程的次数并不多,就只有单单六次课。但是从上大学到现在,接触到的第一门具有与实践结合最为密切的课程。在理论方面学习了统计学,加上实验课的实践,对这么在经济学方面有着重要的意义的学科也有了更加深入的了解。
作为在社会科学里,偏向理学的学科,统计学对数学功底的要求不低,比如在第四章的统计数据分布特征的描述,第六章的抽样估计,第七章的假设检验,第八章的方差分析和第九章的回归与相关分析,对高等数学中的概率论与数理统计的知识有着不低的要求,所以作为一名文科生在学习这门课程的时候遇到咯不少的困难,特别是再进行哪些复杂的运算的时候常常出现错误,甚至是根本就无法下手进行计算,使得在今后的学习与工作当中即便是对理论知识有着很好的了解,知道如何将已经收集到的数据进行如何处理,但是面对复杂的数学处理工具却无从下手。
而统计学实验课的开设,却是很好的处理好了这个问题。EXCEL在我的眼睛里面就不仅仅知识一个全是表格的工具,它使我认识到咯,作为一个office最常用的三个软件之一,除了在表格问题的处理上有着很强大的功能,在统计计算数据上也有着很完善的处理能力。例如在构建函数表单,方差分析和假设检验,大大减轻了繁杂计算给实验者带来的不便。而张老师在讲课的时候充分明了的展示了EXCEL在统计方面的出色能力,以一种非常简单的方式教授我们尽快的掌握这种高级的而又易于入手的软件。
同时在学习书本知识的同时也扩张咯我们的视野,促进了我们对书本之外的知识的了解也吸收,我想在提升知识水平的情况下,提高处理信息的能力更为重要。完成了实验课的作业,我想这只是仅仅对EXCEL这一类能够对数据进行综合处理的软件有了一个大概的了解,当然这个肯定是不够的,如果想更加深入的了解,我想必须更加的切合生活的实际,多多参加社会实践,和书本上的知识有一个更好的结合。
建议:希望张老师以后在讲课的同时多多加入一些,也实际更为联系紧密的内容,在课堂上留够更多的时间交给学生自己操作,加强考勤。