spss的数据分析报告

时间:2024.4.20

基于SPSS的淮安地区359人旅游情况统计分析报告

                                       曾海滨 营销1121班 1121810436

一、引言:

旅游统计是国家对旅游行业实施全行业研究、管理、监督、引导和控制的信息基础,是各种旅游企业、事业单位和机构从事业务管理和决策的信息依据。改革开放以来,我国旅游统计工作已初步建立了一套旅游统计指标体系,确立了旅游统计调查方法和制度,为旅游经济发展和研究等基础理论提供有效的数据支持,为政府制定旅游发展规划所必需,而且对研究、规划国民经济其他相关行业的发展,进而对国民经济的宏观调控、对保持国民经济的综合平衡与良性循环,都具有重要的实际意义。

二、数据来源:

此数据来源于http://www.amstat.org/publications/jse/jse_data_archive.htm

本次分析的数据为359个人旅游情况状况统计表,其中共包含七种变量,分别是:年龄,为三类变量;性别,为二类变量(0代表女,1代表男);收入,为一类变量;旅游花费,为一类变量;通道,为二类变量(0代表没走通道,1代表走通道);旅游的积极性,为三类变量(0代表积极性差,1代表积极性一般,2代表积极性比较好,3代表积极性好 4代表积极性非常好);额外收入,一类变量。

通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析。以了解359人旅游情况的综合状况,并分析个变量的分布特点及相互间的关系。

三、频数分析:

基本的统计分析往往从频数分析开始。通过频数分地区359个人旅游基本状况的统计数据表,在性别、旅游的积极性不同的状况下的频数分析,从而了解男女职工数量、不同积极性况的基本分布。

     

首先,对该男女性别分布进行频数分析,结果如下:

    表说明,在该地区被调查的359个人中,有198名女性,161名男性,男女比例分别为44.8%和55.2%,该公司职工男女数量差距不大,女性略多于男性。

其次对原有数据中的旅游的积极性进行频数分析,结果如下表 :

  其次对原有数据中的是否进通道进行频数分析,结果如下表 :

表说明,在被调查的359个人中,有没走通道的占81.6%,占绝大多数。

上表及其直方图说明,被调查的359个人中,对与旅游积极性差的组频数最高的,为171 人数的47.6%,其次为积极性一般和比较好的,占比例都为22.0%,积极性为好的和非常好的比例比较低,分别为24人和6人,占总体的比例为6.7%和1.7%。

四 、探索性数据分析

(1)通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,现以现性别与旅游积极性的列联表分析为例,读取数据:

上联表及Bar Chart涉及两个变量,即性别与积极性的二维交叉,反映了在不同的性别对于旅游积极性分布情况。上表中,性别成为行向量,积极性列向量。

(2)茎叶图 :   

结果分析如下:

                                                收入

                                  女                        男

平均数                        1005.28562                1066.92791                      

均数的95%可信区间    (907.63853,1102.93272) (936.59779,1197.25802)

5%的调整均数               957.92011                   986.95497 

中位数                      937.50000                   937.50000

标准差                      696.734940                  837.360082

标准差                      485439.577                  701171.907

最小值                      7.426                        58.630

最大值                      3125.000                     6250.000

极差                        3117.574                     6191.370

四分位数间距                937.563                      718.750

偏度系数                    2.370                         2.370

峰度系数                    7.310                         10.166

(3)p-p图分析

结果分析:

年龄在正态p-p图的散点近似成一条直线,无趋势正态p-p图的散点均匀分布在直线y=0的上下,故可认为本资料服从正态分布。

五、证实性分析

1、相关分析:相关分析是分析客观事物之间关系的数量分析法,明确客观事之间有怎样的关系对理解和运用相关分析是极其重要的。

事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。如何测度事物之间的统计关系的强弱是人们关注的问题。相关分析正是一种简单易行的测度事物之间统计关系的有效工具。

上表是对本次分析数据中,旅游花费、收入、额外收入的相关分析,表中相关系数旁边有两个星号(**)的,表示显著性水平为0.01时,仍拒绝原假设。一个星号(*)表示显著性水平为0.05是仍拒绝原假设。由上表可知,旅游花费与额外收入的相关性最大。

2、有相关性分析可得收入,旅游花费呈线性相关,因此作回归分析:

Charts:

    由上图可知回归方程:

    y=91.563+ 0.024 (x1)          ,      (P(Sig=0.000)<0.01)

    即  旅游花费=91.563+0.024*收入   ( p<0.01)

 3、单样本T检验:

   首先对现工资的分布做正态性检验,结果如下:

 

由上图可知,现工资的分布可近似看作符合正态分布,现推断现工资变量的平均值是否为$3,000,0,因此可采取单样本t检验来进行分析。分析如下:

由One-Sample Statistics可知,359个被调查的人中收入平均值1032.93021,标准差为762.523942,均值标准误差为40.244474。图表One-Sample Test中,第二列是t统计量的观测值为25.666;第三列是自由度为358(n-1);第四列是t统计量观测值的双尾概率值;第五列是样本均值和检验值的差;第六列和第七列是总体均值与原假设值差的95%的置信区间为(953.78493 , 1112.07550)。该问题的t值等于25.666对应的临界置信水平为0,远远小于设置的0.05,因此拒绝原假设,表明该地区被调查的359名人中收入与1032.93021存在显著差异。结果分析:旅游花费不成显著性差异,由图中可知旅行的旅游花费较高。

六、旅游情况分析总结:

由上述数据可得出旅游业发展趋势特点:

1、消费大众化。随着社会经济的发展,大众化休闲度假需求已经产生。

2、市场层次化。根据不同的消费能力,区分高端、中端、低端消费市场。

3、追求个性化。个性化追求更加突出,需要研究消费者的个性化需求,提供个性化产品和服务


第二篇:spss的数据分析报告


关于某公司474名职工综合状况的统计分析报告

一、数据介绍:

本次分析的数据为某公司474名职工状况统计表,其中共包含十一变量,分别是:id(职工编号),gender(性别),bdate(出生日期),edcu(受教育水平程度),jobcat(职务等级),salbegin(起始工资),salary(现工资),jobtime(本单位工作经历<月>),prevexp(以前工作经历<月>),minority(民族类型),age(年龄)。通过运用spss统计软件,对变量进行频数分析、描述性统计、方差分析、相关分析、。。。以了解该公司职工上述方面的综合状况,并分析个变量的分布特点及相互间的关系。

二、数据分析

1、频数分析。基本的统计分析往往从频数分析开始。通过频数分析能够了解变量的取值状况,对把握数据的分布特征非常有用。此次分析利用了某公司474名职工基本状况的统计数据表,在gender(性别)、edcu(受教育水平程度)、不同的状况下的频数分析,从而了解该公司职工的男女职工数量、受教育状况的基本分布。

Statistics

首先,对该公司的男女性别分布进行频数分析,结果如下:

Gender

上表说明,在该公司的474名职工中,有216名女性,258名男性,男女比例分别为45.6%和54.4%,该公司职工男女数量差距不大,男性略多于女性。

其次对原有数据中的受教育程度进行频数分析,结果如下表 :

Educational Level (years)

上表及其直方图说明,被调查的474名职工中,受过12年教育的职工是该组频数最高的,为190人,占总人数的40.1%,其次为15年,共有116人,占中人数的24.5%。且接受过高于20年的教育的人数只有1人,比例很低。

2、描述统计分析。再通过简单的频数统计分析了解了职工在性别和受教育水平上的总体分布状况后,我们还需要对数据中的其他变量特征有更为精确的认识,这就需要通过计算基本描述统计的方法来实现。下面就对各个变量进行描述统计分析,得到它们的均值、标准差、片度峰度等数据,以进一步把我数据的集中趋势和离散趋势。

Descriptive Ststistics

如表所示,以起始工资为例读取分析结果,474名职工的起始工资最小值为$9000 ,最大值为$79980,平均起始工资为$17016,标准差为$7870.638,偏度系数和峰度系数分别为2.853和12.390。其他数据依此读取,则该表表明474名职工的受教育水平、起始工资、现工资、先前工作经验、现在工作经验的详细分布状况。

3、Exploratory data analysis。

(1)交叉分析。

通过频数分析能够掌握单个变量的数据分布情况,但是在实际分析中,不仅要了解单个变量的分布特征,还要分析多个变量不同取值下的分布,掌握多个变量的联合分布特征,进而分析变量之间的相互影响和关系。就本数据而言,需要了解现工资与性别、年龄、受教育水平、起始工资、本单位工作经历、以前工作经历、职务等级的交叉分析。现以现工资与职务等级的列联表分析为例,读取数据(下面数据分析表为截取的一部分):

Current Salary * Employment Category Crosstabulation

Count

上联表及Bar Chart涉及两个变量,即现工资与职务级别的二维交叉,反映了在不同的职务级别下现工资的分布情况。上表中,职务级别成为行向量,现工资称为列向量。

(2)单因素方差分析。

单因素分析用来研究一个控制变量的不同水平是否对观测变量产生了显著影响。下面我们把受教育水平和起始工资作为控制变量,现工资为观测变量,通过单因素方差分析方法研究受教育水平和起始工资对现工资的影响进行分析。分析结果如下:

上表是起始工资对现工资的单因素方差分析结果。可以看出:F统计量的观测值为33.040,对应的概率P值近似等于0,如果显著性水平为0.05,由于概率值P小于显著性水平q,则应拒绝原假设,认为不同的起始工资对现工资产生了显著影响。

同理,上表是受教育水平对现工资影响的单因素分析结果,其结果亦为拒绝原假设,所以不同的受教育水平对现工资产生显著影响。

4、相关分析。相关分析是分析客观事物之间关系的数量分析法,明确客观事物之间有怎

样的关系对理解和运用相关分析是极其重要的。

函数关系是指两事物之间的一种一一对应的关系,即当一个变量X取一定值时,另一个变量函数Y可以根据确定的函数取一定的值。另一种普遍存在的关系是统计关系。统计关系是指两事物之间的一种非一一对应的关系,即当一个变量X取一定值时,另一个变量Y无法根据确定的函数取一定的值。统计关系可分为线性关系和非线性关系。

事物之间的函数关系比较容易分析和测度,而事物之间的统计关系却不像函数关系那样直接,但确实普遍存在,并且有的关系强有的关系弱,程度各有差异。如何测度事物之间的统计关系的强弱是人们关注的问题。相关分析正是一种简单易行的测度事物之间统计关系的有效工具。

上表是对本次分析数据中,现工资、起始工资、本单位工作时间、以前工作时间、年龄五个变量间的相关分析,表中相关系数旁边有两个星号(**)的,表示显著性水平为0.01时,仍拒绝原假设。一个星号(*)表示显著性水平为0.05是仍拒绝原假设。先以现工资这一变量与其他变量的相关性为例分析,由上表可知,现工资与起始工资的相关性最大,相关系数为0.880,而与在本单位的工作时间相关性最小,相关系数为0.084。

5、参数检验。

首先对现工资的分布做正态性检验,结果如下:

由上图可知,现工资的分布可近似看作符合正态分布,现推断现工资变量的平均值是否为$3,000,0,因此可采取单样本t检验来进行分析。分析如下:

One-Sample Statistics

One-Sample Test

由One-Sample Statistics可知,474名职工的现工资平均值为¥34,419.57,标准差为$17,075.661,均值标准误差为$784.311。图表One-Sample Test中,第二列是t统计量的观测值为5.635;第三列是自由度为473(n-1);第四列是t统计量观测值的双尾概率值;第五列是样本均值和检验值的差;第六列和第七列是总体均值与原假设值差的95%的置信区间为($2,878.40 , 5,960.73)。该问题的t值等于5.635对应的临界置信水平为0,远远小于设置的0.05,因此拒绝原假设,表明该公司的474名职工的现工资与$3,000,0存在显著差异。

6、非参数检验。对本数据中的年龄做正态分布检验,结果如下:

由上图两图可知,474名职工的年龄分布并不完全符合正态分布,所以现推断其职工年龄的平均数在40-45岁之间,可对其采用非参数检验的方法进行检验。检验结果如下:

Chi-Square Test

上面的第一个表为卡方检验的频率表,输出有关频率统计。从表中可知,职工年龄为40岁的有41名,期望值为23.5,残差为17.5,其余读取方式相同。第二个表是卡方检验统计表,显示检验的卡方值,自由度和渐进显著性水平分别是28.489、5、0。因为显著性水平0小于0.05,因此拒绝原假设,即474名职工的平均年龄不在40到45岁之间。

更多相关推荐:
spss的数据分析报告

关于某公司474名职工综合状况的统计分析报告一数据介绍本次分析的数据为某公司474名职工状况统计表其中共包含十一变量分别是id职工编号gender性别bdate出生日期edcu受教育水平程度jobcat职务等级...

spss数据分析报告怎么写

spss数据分析报告怎么写今天乔布简历小编就和大家一起来看看spss数据分析报告怎么写关键词spss数据分析报告怎么写我们用一个例子来分析spss数据分析报告的写法以某公司474名职工的综合状况为例进行分析一数...

spss的数据分析报告

关于某公司474名职工综合状况的统计分析报告一数据介绍本次分析的数据为某公司474名职工状况统计表其中共包含十一变量分别是id职工编号gender性别bdate出生日期edcu受教育水平程度jobcat职务等级...

spss数据分析报告

关于某班级20xx年度考试成绩获奖情况统计分析报告一数据介绍本次分析的数据为某班级学号排列最前的15个人在20xx年度学习获奖统计表其中共包含七个变量分别是专业学号姓名性别第一学期的成绩第二学期的成绩考级考证数...

spss对数据进行相关性分析实验报告

管理统计实验报告实验一一实验目的掌握用spss软件对数据进行相关性分析熟悉其操作过程并能分析其结果二实验原理相关性分析是考察两个变量之间线性关系的一种统计分析方法更精确地说当一个变量发生变化时另一个变量如何变化...

spss分析报告

基于全国36个省市主要经济指标数据的spss分析一.数据来源与描述1.数据来源《中国劳动统计年鉴─2008》(http://www.stats.gov.cn/tjsj/ndsj/2008/indexch.htm…

spss分析报告

关于我校学生对海外娱乐文化关心状况的分析报告本次调查共发放问卷230份回收216份其中有效问卷为216份回收率为939有效率为939下面是我们对调查结果的分析一研究的背景研究背景在当代中国海外娱乐文化普及率日益...

关于员工工资水平影响因素的spss数据分析报告

关于员工工资水平影响因素的数据分析报告个体收入的影响因素分析是社会学研究的经典课题个体收入不仅是经济含义的变量同时也是决定个体经济社会地位的重要指标之一所以分析个体收入的影响因素具有重要的社会意义本报告基于某企...

关于某企业员工工资水平影响因素的spss数据分析报告

关于某企业员工工资水平影响因素的数据分析报告一研究目的个体收入的影响因素分析是社会学研究的经典课题个体收入不仅是经济含义的变量同时也是决定个体经济社会地位的重要指标之一所以分析个体收入的影响因素具有重要的社会意...

spss对数据进行相关性分析实验报告

管理统计实验报告实验一一实验目的掌握用spss软件对数据进行相关性分析熟悉其操作过程并能分析其结果二实验原理相关性分析是考察两个变量之间线性关系的一种统计分析方法更精确地说当一个变量发生变化时另一个变量如何变化...

关于员工工资水平影响因素的spss数据分析报告

关于员工工资水平影响因素的数据分析报告个体收入的影响因素分析是社会学研究的经典课题个体收入不仅是经济含义的变量同时也是决定个体经济社会地位的重要指标之一所以分析个体收入的影响因素具有重要的社会意义本报告基于某企...

关于员工工资水平影响因素的spss数据分析报告 (2)

关于员工工资水平影响因素的数据分析报告信科1021谢昭红1003220xx个体收入的影响因素分析是社会学研究的经典课题个体收入不仅是经济含义的变量同时也是决定个体经济社会地位的重要指标之一所以分析个体收入的影响...

spss的数据分析报告(16篇)