非参数统计实验报告 南邮

时间:2024.3.31

实 验 报 告

( 20## / 20##学年 第一学期)

实验一

一、实验题目

某航空公司为了解旅客对公司服务态度的满意程度,对50名旅客作调查,要求他们写出对乘机服务、机上服务和到达机场服务的满意程度,满意程度评分从0到100.分数越大,满意程度越高。下表是收集到得数据。

50名旅客对乘机服务、机上服务和到达机场服务的满意程度的评分

1、对50名旅客关于乘机服务的满意程度数据作描述性统计分析;

2、对50名旅客关于机上服务的满意程度数据作描述性统计分析;

3、对50名旅客关于到达机场服务的满意程度数据作描述性统计分析;

4、对50名旅客关于这三个方面服务的满意程度数据作一个综合比较的描述性统计分析。

二、实验步骤

1、乘机服务

1)、直方图

2)、箱线图

3)、数值分析

2、机上服务

1)、直方图

2)、箱线图

3)、数值分析

3、到达机场服务

1)、直方图

2)、箱线图

3)、数值分析

5、综合比较

实验二

一、实验题目

某地区从事管理工作的职员的月收入的中位数是6500元,现有一个该地区从事管理工作的40个妇女组成的样本,她们的月收入数据如此下:

5100  6300  4900  7100 

4900  5200  6600  7200

6900  5500  5800  6400

3900  5100  7500  6300

6000  6700  6000  4800

7200  6200  7100  6900

7300  6600  6300  6800

6200  5500  6300  5400  4800

(1)使用样本数据检验:该地区从事管理工作的妇女的月收入的中位数是否低于6500元?

(2)使用样本数据给出该地区从事管理工作的妇女的月收入的中位数的点估计和95%的区间估计。

二、实验步骤

H0:中位数等于6500元  H1:中位数低于6500元

中位数的符号检验: C1

中位数 =  6500 与 < 6500 的符号检验

     N  下方  相等  上方       P  中位数

C1  40    26     1    13  0.0266    6200

MTB >

P=0.05>0.0266,所以拒绝原假设,认为中为数低于6500.

符号置信区间: C1

中位数的符号置信区间

                取得的   置信区间

     N  中位数  置信度  下限  上限       位置

C1  40    6200  0.9193  5800  6400          15

                0.9500  5800  6459  非线性插值

                0.9615  5800  6500          14

MTB >

所以中位数95%的置信区间为[5800,6459].

实验三

一、实验题目

为检验两种燃料添加剂对客车每加仑汽油行驶里程数的影响是否不同,随机挑选12辆车,让每一辆车都先后使用这两种添加剂。12辆车使用这两种添加剂每加仑汽油行驶里程数的检验结果如下:

试检验:这两种添加剂有没有差异?

二、实验步骤

H0:两种添加剂无差异    H1:两种添加剂有差异

1)符号检验法:

MTB > Let C3 = C1-C2

MTB > SInterval 95.0 C3.

符号置信区间: C3

中位数的符号置信区间

                取得的    置信区间

     N  中位数  置信度   下限   上限        位置

C3  12   1.195  0.8540  0.430  1.840           4

                0.9500  0.342  2.024  非线性插值

                0.9614  0.310  2.090           3

2)Wilcoxon符号秩和检验法:

MTB > Let C3 = C1-C2

MTB > WInterval 95.0 C3.

Wilcoxon 符号秩置信区间: C3

        估计中  取得的   置信区间

     N    位数  置信度  下限  上限

C3  12    1.23    94.5  0.38  2.07

3)单样本t检验:

MTB > Onet C3.

单样本 T: C3

                          平均值

变量   N  平均值  标准差  标准误   95% 置信区间

C3    12   1.241   1.355   0.391  (0.380, 2.102)

结果分析:

综合1、2、3三种方法可以看出,接受原假设,认为两种添加剂无差异。

实验四

一、实验题目

某汽车驾驶员记录了使用5种不同牌子的汽油每5加仑行驶的距离(哩),数据如下:

牌1:37.5   31.3   33.8    32.5

牌2:36.3   32.5   36.3    35.0

牌3:40     40    43.8    46.3

牌4:36.3   42.5   40     41.3

牌5:40    32.5   38.8    33.8

这些数据是否说明这5种牌子的汽油每加仑平均行驶的哩数全相等?

二、实验步骤

检验问题::这5种牌子的汽油每加仑平均行驶的哩数全相等

       :这5种牌子的汽油每加仑平均行驶的哩数不全相等

在 C1 上的 Kruskal-Wallis 检验

C2     N  中位数  平均秩      Z

1      4   33.15     5.1  -2.03

2      4   35.65     7.0  -1.32

3      4   41.90    17.0   2.46

4      4   40.65    14.6   1.56

5      4   36.30     8.8  -0.66

整体  20            10.5

H = 11.82  DF = 4  P = 0.019

H = 12.00  DF = 4  P = 0.017(已对结调整)

l  注 * 一个或多个小样本

P值小于0.05,拒绝原假设,这5种牌子的汽油每加仑平均行驶的哩数不全相等

实验五

一、实验题目

 有四架测量纺织纤维弹性的测量仪器,为检验这些测量仪器之间有没有差异,找了八位质量检验员,要求每一位检验员使用每一架测量仪器对同一批原料进行测量,实验数据如下,这四架测量仪器有没有差异?

二、实验步骤

Friedman 检验: C1 与 C3,按 C2 区组

:四架测量仪器没有差别  :四架测量仪器有差别

S = 8.44  DF = 3  P = 0.038

S = 9.12  DF = 3  P = 0.028(已对结调整)

C3  N  估计中位数  秩和

1   8      73.125  18.5

2   8      75.125  25.5

3   8      74.750  24.0

4   8      71.000  12.0

总中位数 = 73.500

MTB >

P值小于0.05拒绝原假设

实验六

一、实验题目

某部门有26位女职工和24位男职工。他们的年收入如下:

(1)使用MOOD中位数检验法回答问题:收入和性别有没有关系?女职工的收入是否比男职工的收入低?

(2)使用Wilcoxon秩和检验法回答上述问题。

二、实验步骤

(1)H0:收入与性别之间无关系 ,女职工的收入不比男职工的收入低

    H1:收入与性别有关系,女职工的收入比男职工的收入低

MTB > Mood C1 C2.

Mood 中位数检验: C1 与 C2

C1 的 Mood 中位数检验

卡方 = 8.01    DF = 1    P = 0.005

                            单组 95.0% 置信区间

C2  N<=  N>  中位数  Q3-Q1  ---------+---------+---------+-------

1    18   8   31325   5500  (---*-------)

2     7  17   36200   5288               (----------*-----)

                            ---------+---------+---------+-------

                                 32500     35000     37500

整体中位数 = 33400

中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-6950,-1600)

结果:

由于中位数落入0.95置信区间,接受原假设,故H0成立,收入与性别之间无关系,女职工的收入不比男职工的收入低

 (2)H0:收入与性别之间无关系 ,女职工的收入不比男职工的收入低

      H1:收入与性别有关系,女职工的收入比男职工的收入低

Mann-Whitney 检验和置信区间: C1, C2

     N  中位数

C1  26   31325

C2  24   36200

ETA1-ETA2 的点估计为 -4325

ETA1-ETA2 的 95.1 置信区间为 (-6400,-2150)

W = 478.0

在 0.0002 上,ETA1 = ETA2 与 ETA1 < ETA2 的检验结果显著

在 0.0002 显著性水平上,检验结果显著(已对结调整)

结果:

(3)由于 W 为 < 663.0,接受原假设,故H0成立,收入与性别之间无关系,女职工的收入不比男职工的收入低

除性别外,还有很多因素例如文化程度、工龄和职位等与职工工资的高低有关,为此考虑男女职工在文化程度、工龄和职位方面有没有差异,该部门的26位女职工和24位男职工的年收入和工龄的数据如下:

1、男女职工的工龄有没有差异?男职工的工龄是否比女职工长?

2、收入与工龄有没有关系?工龄越长,收入是否越高?

3、职工的收入究竟与性别有没有关系?

H0:收入与性别之间无关系  H1:收入与性别有关

Mood 中位数检验: C1 与 C3

C1 的 Mood 中位数检验

卡方 = 8.01    DF = 1    P = 0.005

                            单组 95.0% 置信区间

C3  N<=  N>  中位数  Q3-Q1  ---------+---------+---------+-------

1    18   8   31325   5500  (---*-------)

2     7  17   36200   5288               (----------*-----)

                            ---------+---------+---------+-------

                                 32500     35000     37500

整体中位数 = 33400

中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-6950,-1600)

由于中位数(c1-c3)落入0.95置信区间,故拒绝原假设,H0成立,收入与性别之间无关系

H0:工龄与性别之间无关系  H1:工龄与性别有关

Mood 中位数检验: C2 与 C3

C2 的 Mood 中位数检验

卡方 = 13.48    DF = 1    P = 0.000

                            单组 95.0% 置信区间

C3  N<=  N>  中位数  Q3-Q1  --------+---------+---------+--------

1    20   6     3.0   15.3  (-*-----------)

2     6  18    19.5   16.5                       (----*--------)

                            --------+---------+---------+--------

                                  7.0      14.0      21.0

整体中位数 = 15.0

中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-22.0,-9.0)

由于中位数(c2-c3)落入0.95置信区间,故拒绝原假设,H0成立,工龄与性别之间无关系

计算收入与工龄的秩相关系数

H0:工龄与收收入相互独立  H1:工龄与收入正相关

相关: C4, C5

C4 和 C5 的 Pearson 相关系数 = 0.855

P 值 = 0.000

拒绝原假设,H1成立,工龄与收入正相关


第二篇:非参数统计课程实验报告


非参数统计课程实验报告

姓名:樊凡

学号:20082461

成绩:

指导老师:徐建文

Wilcoxon 秩检验方法及其应用

【内容提要】

本实验要求掌握Wilcoxon 秩检验方法和步骤:掌握对两独立样本数据的秩和检验方法;理解Wilcoxon 秩检验方法的基本原理;在R软件环境下编写相关程序;本文用实际例子说明Wilcoxon方法的具体步骤。

Wilcoxon 秩检验方法定义】

威尔科克森符号秩检验是由威尔科克森(F·Wilcoxon)于1945年提出的。该方法是在成对观测数据的符号检验基础上发展起来的,比传统的单独用正负号的检验更加有效。它适用于T检验中的成对比较,但并不要求成对数据之差di服从正态分布,只要求对称分布即可。检验成对观测数据之差是否来自均值为0的总体(产生数据的总体是否具有相同的均值)。

Wilcoxon 秩检验方法步骤】

正负符号检验和威尔科克森符号秩检验,都可看作是就成对观察值而进行的参数方式的T检验的代用品,非参数检验具有无需对总体分布作假定的优点,而就成对观察值作的参数方式的T检验,必须假定有关的差别总体服从正态分布。

  该方法具体步骤如下:

  第一步:求出成对观测数据的差di,并将di的绝对值按大小顺序编上等级(曼-惠特尼U检验)。

  第二步:等级编号完成以后恢复正负号,分别求出正等级之和T+和负等级之和T-,选择T+和T-中较小的一个作为威尔科克森检验统计量T。

  第三步;作出判断。

  根据显著性水平α查附表,得到临界值Tα,若T<Tα,则拒绝原假设H0。当观测值不少于20对时,统计量T的均值和方差分别为:

  (n为成对观测的个数)

  (近似服从标准正态分布)

若Z<-Zα(单侧)或Z<-Zα/2(双侧),则拒绝H0。

【实验环境】

Windows XP;R软件

【实验方案设计】

(1)  为研究我国上市公司公报对股价是否有显著影响。现从上海证券交易所的上市公司随机抽取10家,观察其20##年年终财务报告公布前后三日的平均股价

(2)  结果如下表:

                20##年财务公告公布前后三日平均股价

设Xi和Yi分别为公布前后的第i组观察值,对i=1,2...10.计算各观察值对的偏差Di=Xi-Yi;   求偏差的绝对值|Di|=|Xi-Yi|;按偏差绝对值大小顺序排列,考虑各偏差的符号,利用R软件的求出偏差|Di|的秩,如下表所示:

(3) 的秩的和,而的秩的和,则 

【参考文献】

[1]Efron.B.Bootstrap Methods:Another look at the Jackknife[J].Ann.Statist,1979,7(1):1-26
[2]施锡铨.关于Bootstrap的回顾[J].应用概率统计,1987,3(2):167-177

【附录】

更多相关推荐:
《统计学》实验报告

实验报告24567

统计实验报告

统计实验报告课程名称:统计实验实验名称:参数估计分组组长:组员:专业班级:实验日期:一、实验目的了解Excel中的各种参数估计统计函数,能够运用Excel统计函数对正态单总体参数进行区间估计。二、实验内容(1)…

统计学实验报告与总结

统计学实验报告与心得体会班级姓名学号成绩一实验报告成绩实验一数据的搜集与整理实验目的和要求培养学生处理数据的基本能力熟悉Excel20xx的基本操作界面熟悉间接和直接数据的搜集方法掌握不同类型的数据处理方法以及...

《统计学》上机实验报告(一)

统计学实验报告一姓名王璐专业财政学税收方向学号20xx128107日期20xx年10月9日地点实验中心701实验项目一描述性统计区间估计在EXCEL里的实现一实验目的1掌握利用EXCEL菜单进行数据的预处理2掌...

统计实验报告

浙江万里学院实验报告课程名称实验名称数据整理和数据描述分组组长组员专业班级实验日期一实验目的能熟练地进行统计数据的录入分组汇总及各种常用统计图的绘制二实验内容数据的排序分类汇总统计分组数据透视分析绘制统计图三实...

统计学实验报告格式及范例

统计学实验报告

统计学实验报告姓名:学号:班级:成绩:一、实验步骤总结成绩:(一)数据的搜集与整理1.实验一:数据的收集与整理实验步骤:一、统计数据的整理(一)数据的预处理1、数据的编码及录入(1)数据的编码(2)数据的录入2…

统计学实验报告一

统计学实验报告一姓名专业学号日期地点实验项目一描述性统计区间估计在EXCEL里的实现一实验目的1掌握利用EXCEL菜单进行数据的预处理2掌握利用EXCEL进行描述性统计3掌握利用EXCEL进行区间估计二实验要求...

统计学实验报告

实验1数据整理一实验目的1掌握Excel中基本的数据处理方法2学会使用Excel进行统计分组能以此方式独立完成相关作业二实验时间及地点试验时间20xx年9月23日实验地点计算机房三实验内容和操作步骤一问题与数据...

统计学实验报告

统计学实验报告学院经管学院姓名徐某人学号311110010000专业班级工商1103河南理工大学统计学实验报告实验二用Excel计算置信区间煤炭企业管理1月7日上午8点到10点地点3105博弈论1月7日晚上7点...

统计学实验报告

统计学实验报告20xx级财务管理01班丁朝飞20xx0730重庆大学学生实验报告实验课程名称统计学开课实验室DS1421学院建管学院年级20xx级专业班级财务管理1班学生姓名丁朝飞学号20xx0730开课时间学...

概率论与数理统计实验报告

电子31JL21405106杨路生概率论与数理统计实验报告1n个人中至少有两人生日相同的概率是多少通过计算机模拟此结果n个人生日的组合为a365nn个人中没有生日相同的组合为b365364365n1则n个人中至...

统计实验报告(35篇)