实 验 报 告
( 20## / 20##学年 第一学期)
实验一
一、实验题目
某航空公司为了解旅客对公司服务态度的满意程度,对50名旅客作调查,要求他们写出对乘机服务、机上服务和到达机场服务的满意程度,满意程度评分从0到100.分数越大,满意程度越高。下表是收集到得数据。
50名旅客对乘机服务、机上服务和到达机场服务的满意程度的评分
1、对50名旅客关于乘机服务的满意程度数据作描述性统计分析;
2、对50名旅客关于机上服务的满意程度数据作描述性统计分析;
3、对50名旅客关于到达机场服务的满意程度数据作描述性统计分析;
4、对50名旅客关于这三个方面服务的满意程度数据作一个综合比较的描述性统计分析。
二、实验步骤
1、乘机服务
1)、直方图
2)、箱线图
3)、数值分析
2、机上服务
1)、直方图
2)、箱线图
3)、数值分析
3、到达机场服务
1)、直方图
2)、箱线图
3)、数值分析
5、综合比较
实验二
一、实验题目
某地区从事管理工作的职员的月收入的中位数是6500元,现有一个该地区从事管理工作的40个妇女组成的样本,她们的月收入数据如此下:
5100 6300 4900 7100
4900 5200 6600 7200
6900 5500 5800 6400
3900 5100 7500 6300
6000 6700 6000 4800
7200 6200 7100 6900
7300 6600 6300 6800
6200 5500 6300 5400 4800
(1)使用样本数据检验:该地区从事管理工作的妇女的月收入的中位数是否低于6500元?
(2)使用样本数据给出该地区从事管理工作的妇女的月收入的中位数的点估计和95%的区间估计。
二、实验步骤
H0:中位数等于6500元 H1:中位数低于6500元
中位数的符号检验: C1
中位数 = 6500 与 < 6500 的符号检验
N 下方 相等 上方 P 中位数
C1 40 26 1 13 0.0266 6200
MTB >
P=0.05>0.0266,所以拒绝原假设,认为中为数低于6500.
符号置信区间: C1
中位数的符号置信区间
取得的 置信区间
N 中位数 置信度 下限 上限 位置
C1 40 6200 0.9193 5800 6400 15
0.9500 5800 6459 非线性插值
0.9615 5800 6500 14
MTB >
所以中位数95%的置信区间为[5800,6459].
实验三
一、实验题目
为检验两种燃料添加剂对客车每加仑汽油行驶里程数的影响是否不同,随机挑选12辆车,让每一辆车都先后使用这两种添加剂。12辆车使用这两种添加剂每加仑汽油行驶里程数的检验结果如下:
试检验:这两种添加剂有没有差异?
二、实验步骤
H0:两种添加剂无差异 H1:两种添加剂有差异
1)符号检验法:
MTB > Let C3 = C1-C2
MTB > SInterval 95.0 C3.
符号置信区间: C3
中位数的符号置信区间
取得的 置信区间
N 中位数 置信度 下限 上限 位置
C3 12 1.195 0.8540 0.430 1.840 4
0.9500 0.342 2.024 非线性插值
0.9614 0.310 2.090 3
2)Wilcoxon符号秩和检验法:
MTB > Let C3 = C1-C2
MTB > WInterval 95.0 C3.
Wilcoxon 符号秩置信区间: C3
估计中 取得的 置信区间
N 位数 置信度 下限 上限
C3 12 1.23 94.5 0.38 2.07
3)单样本t检验:
MTB > Onet C3.
单样本 T: C3
平均值
变量 N 平均值 标准差 标准误 95% 置信区间
C3 12 1.241 1.355 0.391 (0.380, 2.102)
结果分析:
综合1、2、3三种方法可以看出,接受原假设,认为两种添加剂无差异。
实验四
一、实验题目
某汽车驾驶员记录了使用5种不同牌子的汽油每5加仑行驶的距离(哩),数据如下:
牌1:37.5 31.3 33.8 32.5
牌2:36.3 32.5 36.3 35.0
牌3:40 40 43.8 46.3
牌4:36.3 42.5 40 41.3
牌5:40 32.5 38.8 33.8
这些数据是否说明这5种牌子的汽油每加仑平均行驶的哩数全相等?
二、实验步骤
检验问题::这5种牌子的汽油每加仑平均行驶的哩数全相等
:这5种牌子的汽油每加仑平均行驶的哩数不全相等
在 C1 上的 Kruskal-Wallis 检验
C2 N 中位数 平均秩 Z
1 4 33.15 5.1 -2.03
2 4 35.65 7.0 -1.32
3 4 41.90 17.0 2.46
4 4 40.65 14.6 1.56
5 4 36.30 8.8 -0.66
整体 20 10.5
H = 11.82 DF = 4 P = 0.019
H = 12.00 DF = 4 P = 0.017(已对结调整)
l 注 * 一个或多个小样本
P值小于0.05,拒绝原假设,这5种牌子的汽油每加仑平均行驶的哩数不全相等
实验五
一、实验题目
有四架测量纺织纤维弹性的测量仪器,为检验这些测量仪器之间有没有差异,找了八位质量检验员,要求每一位检验员使用每一架测量仪器对同一批原料进行测量,实验数据如下,这四架测量仪器有没有差异?
二、实验步骤
Friedman 检验: C1 与 C3,按 C2 区组
:四架测量仪器没有差别 :四架测量仪器有差别
S = 8.44 DF = 3 P = 0.038
S = 9.12 DF = 3 P = 0.028(已对结调整)
C3 N 估计中位数 秩和
1 8 73.125 18.5
2 8 75.125 25.5
3 8 74.750 24.0
4 8 71.000 12.0
总中位数 = 73.500
MTB >
P值小于0.05拒绝原假设
实验六
一、实验题目
某部门有26位女职工和24位男职工。他们的年收入如下:
(1)使用MOOD中位数检验法回答问题:收入和性别有没有关系?女职工的收入是否比男职工的收入低?
(2)使用Wilcoxon秩和检验法回答上述问题。
二、实验步骤
(1)H0:收入与性别之间无关系 ,女职工的收入不比男职工的收入低
H1:收入与性别有关系,女职工的收入比男职工的收入低
MTB > Mood C1 C2.
Mood 中位数检验: C1 与 C2
C1 的 Mood 中位数检验
卡方 = 8.01 DF = 1 P = 0.005
单组 95.0% 置信区间
C2 N<= N> 中位数 Q3-Q1 ---------+---------+---------+-------
1 18 8 31325 5500 (---*-------)
2 7 17 36200 5288 (----------*-----)
---------+---------+---------+-------
32500 35000 37500
整体中位数 = 33400
中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-6950,-1600)
结果:
由于中位数落入0.95置信区间,接受原假设,故H0成立,收入与性别之间无关系,女职工的收入不比男职工的收入低
(2)H0:收入与性别之间无关系 ,女职工的收入不比男职工的收入低
H1:收入与性别有关系,女职工的收入比男职工的收入低
Mann-Whitney 检验和置信区间: C1, C2
N 中位数
C1 26 31325
C2 24 36200
ETA1-ETA2 的点估计为 -4325
ETA1-ETA2 的 95.1 置信区间为 (-6400,-2150)
W = 478.0
在 0.0002 上,ETA1 = ETA2 与 ETA1 < ETA2 的检验结果显著
在 0.0002 显著性水平上,检验结果显著(已对结调整)
结果:
(3)由于 W 为 < 663.0,接受原假设,故H0成立,收入与性别之间无关系,女职工的收入不比男职工的收入低
除性别外,还有很多因素例如文化程度、工龄和职位等与职工工资的高低有关,为此考虑男女职工在文化程度、工龄和职位方面有没有差异,该部门的26位女职工和24位男职工的年收入和工龄的数据如下:
1、男女职工的工龄有没有差异?男职工的工龄是否比女职工长?
2、收入与工龄有没有关系?工龄越长,收入是否越高?
3、职工的收入究竟与性别有没有关系?
H0:收入与性别之间无关系 H1:收入与性别有关
Mood 中位数检验: C1 与 C3
C1 的 Mood 中位数检验
卡方 = 8.01 DF = 1 P = 0.005
单组 95.0% 置信区间
C3 N<= N> 中位数 Q3-Q1 ---------+---------+---------+-------
1 18 8 31325 5500 (---*-------)
2 7 17 36200 5288 (----------*-----)
---------+---------+---------+-------
32500 35000 37500
整体中位数 = 33400
中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-6950,-1600)
由于中位数(c1-c3)落入0.95置信区间,故拒绝原假设,H0成立,收入与性别之间无关系
H0:工龄与性别之间无关系 H1:工龄与性别有关
Mood 中位数检验: C2 与 C3
C2 的 Mood 中位数检验
卡方 = 13.48 DF = 1 P = 0.000
单组 95.0% 置信区间
C3 N<= N> 中位数 Q3-Q1 --------+---------+---------+--------
1 20 6 3.0 15.3 (-*-----------)
2 6 18 19.5 16.5 (----*--------)
--------+---------+---------+--------
7.0 14.0 21.0
整体中位数 = 15.0
中位数 (1) - 中位数 (2) 的 95.0% 置信区间: (-22.0,-9.0)
由于中位数(c2-c3)落入0.95置信区间,故拒绝原假设,H0成立,工龄与性别之间无关系
计算收入与工龄的秩相关系数
H0:工龄与收收入相互独立 H1:工龄与收入正相关
相关: C4, C5
C4 和 C5 的 Pearson 相关系数 = 0.855
P 值 = 0.000
拒绝原假设,H1成立,工龄与收入正相关
第二篇:非参数统计课程实验报告
非参数统计课程实验报告
姓名:樊凡
学号:20082461
成绩:
指导老师:徐建文
Wilcoxon 秩检验方法及其应用
【内容提要】
本实验要求掌握Wilcoxon 秩检验方法和步骤:掌握对两独立样本数据的秩和检验方法;理解Wilcoxon 秩检验方法的基本原理;在R软件环境下编写相关程序;本文用实际例子说明Wilcoxon方法的具体步骤。
【Wilcoxon 秩检验方法定义】
威尔科克森符号秩检验是由威尔科克森(F·Wilcoxon)于1945年提出的。该方法是在成对观测数据的符号检验基础上发展起来的,比传统的单独用正负号的检验更加有效。它适用于T检验中的成对比较,但并不要求成对数据之差di服从正态分布,只要求对称分布即可。检验成对观测数据之差是否来自均值为0的总体(产生数据的总体是否具有相同的均值)。
【Wilcoxon 秩检验方法步骤】
正负符号检验和威尔科克森符号秩检验,都可看作是就成对观察值而进行的参数方式的T检验的代用品,非参数检验具有无需对总体分布作假定的优点,而就成对观察值作的参数方式的T检验,必须假定有关的差别总体服从正态分布。
该方法具体步骤如下:
第一步:求出成对观测数据的差di,并将di的绝对值按大小顺序编上等级(曼-惠特尼U检验)。
第二步:等级编号完成以后恢复正负号,分别求出正等级之和T+和负等级之和T-,选择T+和T-中较小的一个作为威尔科克森检验统计量T。
第三步;作出判断。
根据显著性水平α查附表,得到临界值Tα,若T<Tα,则拒绝原假设H0。当观测值不少于20对时,统计量T的均值和方差分别为:
(n为成对观测的个数)
(近似服从标准正态分布)
若Z<-Zα(单侧)或Z<-Zα/2(双侧),则拒绝H0。
【实验环境】
Windows XP;R软件
【实验方案设计】
(1) 为研究我国上市公司公报对股价是否有显著影响。现从上海证券交易所的上市公司随机抽取10家,观察其20##年年终财务报告公布前后三日的平均股价
(2) 结果如下表:
20##年财务公告公布前后三日平均股价
设Xi和Yi分别为公布前后的第i组观察值,对i=1,2...10.计算各观察值对的偏差Di=Xi-Yi; 求偏差的绝对值|Di|=|Xi-Yi|;按偏差绝对值大小顺序排列,考虑各偏差的符号,利用R软件的求出偏差|Di|的秩,如下表所示:
(3) 令为的的秩的和,而为的的秩的和,则 ,
【参考文献】
[1]Efron.B.Bootstrap Methods:Another look at the Jackknife[J].Ann.Statist,1979,7(1):1-26
[2]施锡铨.关于Bootstrap的回顾[J].应用概率统计,1987,3(2):167-177
【附录】