多元统计分析报告

时间:2024.4.21

我国大中城市商品零售价格指数的统计分析

摘要:城市居民消费价格指数能够反映出该城市的消费水平高低。本文章主要通过叙述spss软件在对36个大中城市商品零售价格指数进行聚类分析的过程说明多元统计分析在实际上的应用。本文通过聚类分析,将36个大中城市分为四个大类,从而将这些城市划分为一级消费水平城市至四级消费水平城市四个层次,同时对比我国一二三线城市划分标准,从两者的相似性论证了多元统计思维方式在经济学中的应用。本文数据取自中国经济与社会发展统计数据库国家及各省市统计局20##年10月份数据。

关键词:消费价格指数 spss软件 聚类分析

1、引言

消费是社会再生产的重要环节,是社会经济活动的出发点和归宿,消费结构的状况不仅反映社会经济发展的水平,又涉及到社会经济诸多方面,近年来,随着我国经济快速发展,居民消费结构也发生很大变化。在居民全部消费支出八项指标中,反映基本生存需要的食品、衣着等项所占的比重大幅度下降,而体现发展与享受需求的住房、交通等项支出的比重则迅速上升,生活质量进一步提高。但是,由于各地区的经济发展不均衡,使得各地区的消费结构仍然存在着明显差别。为了进一步改善消费结构,正确引导消费,提高我国城镇居民的消费水平,有必要考察我国各地区城镇居民的消费结构之间的差异并进行比较研究,从宏观上把握各地区城镇居民的消费现状和不同地区消费水平的差异,为提高我国各地区消费水平提供决策依据。很多学者从不同的角度对其进行深入研究,主要利用三种统计方法进行分析:主成分分析法、因子分析法、聚类分析法。本文选取20##年我国城镇居民人均消费支出数据,利用聚类分析法和因子分析法,将全国31个省、市、自治区进行分类和排序,并与人们实际观察到的情况进行比较。

2、数学思想

本文主要运用的多元统计分析思想为聚类分析思想,即将分类对象分成若干类,相似的归为同一类,不相似的归为不同的类,此处采用系统聚类法解决问题。

系统聚类法是目前应用最为广泛的一种聚类方法,它是对多种属性统计样本进行分类的一种多元统计分析方法。系统聚类分析的基本思想是:一般认为,所研究的样品或指标之间存在着程度不同的相似性。于是根据一批样品的多个观测指标,具体找出一些能够度量样品或指标之间相似程度的统计量,以这些统计量为划分类型的依据,把一些相似程度较大的样品聚为一类。关系密切的聚为一个小的分类单位,关系疏远的聚为一个大的分类单位,直到把所有样品或指标都聚类完毕,这样就可以形成一个由小到大的分类系统。

具体来说,先将待聚类的n个样品(或者变量)各自看出一类,共有n类;然后按照事先选定的方法计算每两类之间的聚类统计量,即某种距离(或者相似系数)将关系最密切的两类并为一类,其余不变,即得n-1类;再按前面的计算方法计算新类与其他类之间的距离(或者相似系数),再将关系最密切的两类并为一类,其余不变,即得n-2类;如此继续下去,每次重复都减少一类,直到最后所有样品(或者变量)归为一类为止。

系统聚类分为Q型聚类和R型聚类两种:Q型聚类是对样本进行聚类,它使具有相似特征的样本聚集在一起,使差异性大的样本分离开来;R型聚类是对变量进行聚类,它使差异性大的变量分离开来,相似的变量聚集在一起,这样就可以在相似变量中选择少数具有代表性的变量参与其他分析,实现减少变量个数、降低变量维度的目的。在本例中进行的是Q型聚类。

3、数据处理

本文引用的是中国经济与社会发展统计数据库国家及各省市统计局数据,选取20##年10月份《我国36个大中城市商品零售价格指数》,一共有17个商品价格指标,包含了食品、衣着、家具、交通、教育、医疗、建筑等各个方面,如表1所示。

在分析数据之前,先对整体数据进行了统计描述,最大值为纺织品114.5,其次是食品和电子出版物,最小值为文化办公用品90.3,其次是交通通讯。从大中城市的商品平均值来看,全国36个大中城市只有4种商品指标是低于100,也就是价格较去年相比是下降的。如表2所示。

利用SPSS统计软件进行Ward法聚类分析和最邻近元素法分析,将36个大中城市分成4类,并对结果进行对比,结果如下:

表1 36个大中城市商品零售价格指数

V1:饮料、烟酒商品零售价格指数(上年同期=100)

V2:食品商品零售价格指数(上年同期=100)

V3:文化办公用品商品零售价格指数(上年同期=100)

V4:日用品商品零售价格指数(上年同期=100)

V5:金银珠宝商品零售价格指数(上年同期=100)城市 20##年10月

V6:家具商品零售价格指数(上年同期=100)

V7:书报杂志及电子出版物商品零售价格指数(上年同期=100)

V8:体育娱乐用品商品零售价格指数(上年同期=100)

V9:建筑材料及五金电料商品零售价格指数(上年同期=100)

V10:纺织品商品零售价格指数(上年同期=100)

V11:商品零售价格指数(上年同期=100)

V12:中、西药品及医疗保健用品商品零售价格指数(上年同期=100)

V13:交通、通信用品商品零售价格指数(上年同期=100)

V14:化妆品商品零售价格指数(上年同期=100)

V15:家用电器及音像器材商品零售价格指数(上年同期=100)

V16:服装、鞋帽商品零售价格指数(上年同期=100)

V17:燃料商品零售价格指数(上年同期=100)

表2 商品价格指数统计描述表

利用SPSS统计软件进行Ward法聚类分析和最邻近元素法分析,将36个大中城市分成4类,并对结果进行对比。由于本文的数据为价格指数,不存在单位问题,故不用提前标准化。进行系统聚类分析的步骤如下:

在分析中选择了“分类”项,选定“系统聚类法”,各项设置如下:

 

图1 系统聚类分析方法

在选用聚类方法时,分别用了最近邻元素法、ward法和最远邻元素法三种,并对结果进行分析比较。进行分析后输出以下结果:

表2 最近邻元素法聚类表

图1 Ward 法谱系图

表3 三种方法分类结果对比

结果表明,这三种方法得出的结果有所不同。Ward法分类结果相对较好,且不同地区的消费结构有着各自的特点。其中北京,上海,广州,合肥,青岛,深圳,郑州、银川、厦门、西宁、石家庄、沈阳这12个城市的分类结果相同,都是属于第一类。这些省份中,除了文化办公用品、金银珠宝商品、交通、通信用品商品、家用电器及音像器材商品这四个指标较去年相比是降低之外,其余商品价格全部上涨。

结合我国实际情况和分类结果,将我国大中城市零售商品的消费分成四类,很好地反映了人们观察到的实际情况。

第一类:北京,上海,广州,合肥,青岛,深圳,郑州、银川、厦门、西宁、石家庄、沈阳、福州、贵阳、乌鲁木齐。这些城市的价格指数涨幅不大,一般都是100±3%。这里有北京、上海这样的一线城市,也有贵阳、银川这样经济不太发达的地区,但是他们的价格涨幅情况都类似。

第二类:长春、长沙、海口、大连、呼和浩特、昆明、杭州、济南、拉萨、南京、南宁、宁波、天津、重庆。这些城市涨幅相对第一类要大一点。

第三类:哈尔滨、兰州、南昌

第四类:太原、西安、武汉。这三个城市的商品价格涨幅波动都比较大,物价不稳定。

结合整个数据,我国价格上涨趋势很严重。太原市的纺织品上涨幅度最大,达到14.5%。武汉市的金银珠宝商品下跌幅度最大为9.7%。这可能是由于中国地质大学(武汉)是全国唯一珠宝认证机构,因此这里珠宝价格相对比较便宜。就全国来说,文化办公、金银珠宝、交通通信和家用电器的零售价格是下降的,随着科技的发展,交通的便利和消费水平的提高,手机通讯等产品和打电话上网越来越便宜,家用电器也是越来越便宜。但是除此之外食品、日用、医疗、服饰这些与人们生活密切相关的商品却一直在上涨,有些涨幅还特别大。物价上涨情况不容乐观。

商品价格需要政府宏观调控和当地有关经济发展相结合,控制商品价格涨幅,使人们的生活更加美好。

4、总结

本文根据20##年10月全国36个大中城市商品零售价格指数数据,利用系统聚类分析方法将36个城市分为四类。首先对全体数据进行统计描述,再利用系统分析法中的最近邻元素法、最远邻元素法以及Ward法三种方法进行比较,发现最近邻元素法和最远邻元素法结果差别不是很大,但效果不是很好,相比而言Ward方法聚类效果较好,最后结合是三种分析得到最终结果。

需要指出的是:零售价格指数的变化和城市的经济发展并没有直接密切的关系。有些一线城市和三线城市涨幅情况相仿。本次的分类结果和一二三线城市的结果有着很大的出处,这说明地区商品的涨幅不能单单依据城市的消费水平和经济发展情况,还要依赖于政府宏观调控和当地自身发展相结合。当然,这个分类结果仅供参考,聚类分析只是简单地进行分类,存在一定缺陷,并且从聚类分析本身就有很多种方法,不同的方法得到的结果也不尽相同。要想得到更加准确的分类结果还要对数据进行进一步的分析。另外需要注意的一个地方是:本次分析只是采用了20##年10月份的数据,其代表性远远不及年度数据,因此出现了个别分析错误,也是可以接受的。

综合以上分析,可以得出结论,运用spss软件进行多元统计分析可以用来解决实际问题。

参考文献

[1] 向东进. 实用多元统计分析[M]. 武汉:中国地质大学出版社. 2005.

[2] 薛薇. 基于SPSS的数据分析 .中国人民大学出版社. 2006

[3] 朱建平.应用多元统计分析[M].北京:科学出版社. 2006.


第二篇:多元统计分析报告


班级:11级统计二班

学号:***

姓名:***

时间:20XX年6月28日

关于城镇各个行业

就业人数平均工资的多元统计分析

摘要

20世纪90年代以来,随着市场经济体制进程的加快和经济结构的调整,我国的经济出现了快速的发展。就业人员的工资也随之而增长。由于我国就业人员整体素质普遍低下,我国的分配制度并不是很完善等原因,导致就业人员工资在各行业和各部门的差距较大。随着经济的发展,这个差距越来越大。 

由于我国人口众多,素质较低,而且就业观念较落后,导致我国劳动力普遍廉价,就业职工工资普遍低下。刚毕业的大学生人数众多,城市发展速度与农村发展速度不平衡,各省市自治区的就业条件和国家政策,就业环境不同,导致职工工资存在行业间的工资水平存在着巨大的差异,从另一个方面反映出了中国贫富差距的不断扩大。对我国就业人员职工工资的研究,对我国的社会保障政策和就业政策,教育政策等具有重要的决策意义。也为对我国经济社会的研究提供了一个因素。我国就业职工工资水平的行业间的差异已经日益成为我国政府重视的一个问题。

[关键词] 不同行业 就业 平均工资

一、引言

当前我国处于经济发展快速时期,由于我国人口总数较大,就业人员众多。因此,就业问题成为了我国社会的一个焦点问题。研究好行业间就业问题以及就业职工工资问题,能够有效的把握好社会状况,能够帮助大学生更准确的定位自己,找到自己满意的工作。制定正确的就业政策和社会保障,社会福利政策,来促进大学生的就业问题以及我国国民经济的发展。

本文选取20##年我国各行业城镇单位就业人员平均工资的数据,主要利用以下几种统计方法进行分析:因子分析法、聚类分析法。将全国各省按照不同行业就业人数进行分类和排序,并与人们实际观察到的情况进行比较分析。

因子分析是指研究从变量群中提取共性因子的统计技术。因子分析可在许多变量中找出隐藏的具有代表性的因子。将相同本质的变量归入一个因子,可减少变量的数目,还可检验变量间关系的假设。

聚类分析是一组将研究对象分为相对同质的群组的统计分析技术,依据研究对象(样品或指标)的特征,对其进行分类的方法,减少研究对象的数目。

二、数据

下表是我国按行业分城镇单位就业人员平均工资的原始数据,数据来源于《2013中国统计年鉴》,X1~X19分别代表农林牧渔业、采矿业、制造业、电力热力燃气及水生产和供应业、建筑业、批发零售业、交通运输仓储和邮政业、住宿和餐饮业、信息传输软件和信息技术服务业、金融业、房地产业、租赁和商务服务业、科学研究和技术服务业、水利环境和公共设施业、居民服务修理和其他服务业、教育、社会卫生和工作、文化体育和娱乐业、公共管理社会保障和社会组织。

三、分析

(一)因子分析

1、因子分析的适用性判定

如图所示,从KMO测度来看,KMO值等于0.705大于0.5,可以做因子分析,从巴特莱特球体检验来看,其零假设是相关矩阵为单位矩阵,P值等于0,说明拒绝原假设,原始数据适合进行因子分析。

上图说明因子解释原始变量方差的情况,提取了三个主成分因子,第一主成分的特征值为14.527,第二主成分的特征值为1.101,第三主成分的特征值为0.860,这三个主成分特征值的累计概率达到了86%,说明解释了原始数据86%的信息。

上图为各个变量的共同度,大多数变量的共同度都达到了0.9以上,说明提取的信息较多。

图为旋转前的因子载荷矩阵,旋转前各变量在各个载荷区别并不是很明显。根据X=aF+…+aF+ε可以算出各公共因子的线性组合。

图为旋转后的因子载荷矩阵,可以看出,电力热力、批发零售业、交通运输 住宿和餐饮业、信息传输、金融业、房地产服务业、租赁、公共设施服务业、教育社会工作、卫生、体育社会保障、公共管理和社会组织对第一主成分的贡献较大,称为社会工作因子;农林牧业、采矿业、制造气燃气、建筑业对第二主成分的贡献较大,称为工农建筑业因子;居民服务、服务业对第三主成分的贡献较大,称为居民服务因子。

图为主成分的得分系数矩阵,根据FXX+…+βX算出各主成分的得分如下表所示。

上图为各个省份的主成分得分和综合得分情况。

图为主成分得分和综合得分的排名。从第一主成分来看,东部地区和东南部发达地区的得分比较高,说明这些地方的社会工作,金融服务业的平均工资比较高。从第二主成分来看,是一些经济发达的地区和资源比较丰富的地区,在经济发达的地区,制造气燃气和建筑业的平均工资的比较高,而在资源发达的地区,农林牧渔业和采矿业的就业人员的工资比较高。从第三主成分来看,也是一些经济较为发达的东部地区,说明这些地区的居民服务人员的工资水平较高。

从综合得分来看,还是东部沿海地区的平均工资比较高,例外的是西藏的平均工资也比较高,当然工资比较高,所面临的就业压力和竞争也就比较大。从这个方面可以反映出来,我们大学生在选择就业地区的时候,不一定要选择工资高的地方,也可以选择一些工资适中,就业压力不是很大的地区。这些可以为我们在选择就业的时候提供一些根据。

(二)聚类分析

说明31个数据全部参加了聚类,而且没有缺失值。

图为凝聚顺序表,表明了31个样品的聚类过程。

图是聚类树状图,也叫聚类谱系图,从图中不但可以看出具体的聚类过程,也可以将样品合理分类。图中从上到下可以看到,按距离的亲疏关系,首先将3,24,27,28,29并为一类,12和15并为一类,依次这样合并,最后和为三大类。

结论:根据以上的图标的聚类过程,可以对原有31个省市各行业的城镇就业人口平均工资进行分类。如果粗略地将全部样品分为两大类,则第一类为中西部地区和中南部地区,第二类为东部地区和经济发达地区。说明我国各个行业之间的平均工资差异还是比较大的,在经济发达的东部地区的工资明显高于西部落后地区。

如果要进一步细分,则可分为四个小组。第一组:甘肃,青海,贵州,陕西,河北,河南,山西,山东;第二组:江西,湖北,广西,四川,湖南,重庆,云南;第三组:内蒙古,吉林,辽宁,新疆,黑龙江,海南,北京;第四组浙江,江苏,福建,广东,天津,上海。第四组都属于经济最为发达的地区,其人口流量大,人口密度高,同时各个产业都相对最为发达,因此各行业的平均工资也相对较多较集中。第二组中的六个省市都来自中南部地区,因此行业结构比较类似,就业人员数也比较类似。

第一组中的省市产业以农业和工业为主,服务类行业、金融、房地产行业不太发达,因此人员就业的平均工资也不算太高。第三组中的六个省市都有其最为突出的重点产业,比如海南、新疆的旅游业较为发达;内蒙古自然资源丰富,尤其是能源及矿产资源丰富,因此工业比较发达;东三省工业发达的同时其农业也比较发达;而北京是我国的政治中心和金融中心,因此在这六个省市在产业结构上有最为突出的特点,就业人员的平均工资比较高。

从上面也可以看出,各个行业之间的差距还是较大的,这对于我们刚刚或即将毕业的大学生来说,也是一种对就业行业的一种指导,可以引导自己去选择适合自己的工作。

四、总结

通过以上两种种多元统计方法的分析,总体来说经济发达地区的平均工资也相对较多,但由于各地区产业侧重点不同就业人数有一定差异。比如,经济越发达的地区,服务业也越发达,则从事服务行业的人员也相对较多;而自然资源发达的地区。另外,通过将各省市进行分类也可以看出不同的地区有不同的产业优势,因此从事各行业的人员分布也具有一定的特点。比如个别省份有其最为突出的产业,则各行业的从业人员特点鲜明,当地特色行业的从业人数较多,而其他行业的人才可能就比较稀缺。这也直接导致了各个行业之间平均工资的差异。因此,本科毕业生在择业的时候,可以根据不同地区的特点以及工资结合自己的专业进行选择。

参考文献

[1] 付德印:《应用多元统计分析》. 北京:高等教育出版社,2013

[2] 何晓群:《应用多元统计分析》.北京:中国统计出版社,2010

[3] 中国统计年鉴20##年.中国统计出版社.

更多相关推荐:
多元统计分析报告 以食品含量为例

食品营养分析案例背景分析民以食为天这是人类千百年来的老话作为花费一百万年时间才爬到生物链顶端的人类自然能随意的享尽天下美食但俗话说祸从口出病从口入吃得多并不代表吃得舒心吃得广并不代表吃得健康如果没有均衡的膳食全...

多元统计分析上机报告

大连民族大学数学实验报告课程多元统计分析实验题目多元数据的假设检验系别专业姓名班级指导教师完成学期年月日

多元统计分析——典型相关分析实验报告

多元统计分析实验报告1234567

多元统计分析报告

财经大学20xx20xx学年第一学期多元统计SPSS软件应用描述统计实验报告系别专业学号姓名20xx年居民消费分类指数分析实践报告下表是20xx年居民消费分类指数表记录了20xx年我国居民对于各类商品的消费指数...

多元统计分析报告

班级11级统计二班学号20xx06010215姓名聂廷侦时间20xx年6月28日关于城镇各个行业就业人数平均工资的多元统计分析摘要20世纪90年代以来随着市场经济体制进程的加快和经济结构的调整我国的经济出现了快...

多元统计分析报告

多元统计分析报告按收入等级分家庭平均每人全年购买力差异1问题背景11数据来源数据完全来源于中国统计年鉴20xx年的数据统计原统计数据总共统计20xx年各个等级家庭平均购买的物品有17种考虑到自身对多元统计的不娴...

多元统计分析报告

吉林财经大学20xx20xx学年第一学期多元统计分析聚类分析实验报告院别专业年级姓名学号聚类分析探究我国近期国民消费状况一问题概述消费是社会再生产过程中的一个重要环节也是最终环节它是指利用社会产品来满足人们各种...

多元统计分析论文

多元统计分析论文论科研经费与效益的关系一因子分析及其结果因子分析是多元分析中的一个主要内容而多元分析主要讨论如何把一元正态总体的统计理论和方法推广到多元正态总1体多元正态总体的分布由两组参量即均值向量和协方差矩...

多元统计学分析报告

多元统计学作业分析报告姓名:##学号:##班级:统计09-2班我国16个地区农民在1982年支出情况的抽样调查数据的汇总资料,每个地区都调查了反应每人平均消费生活消费支出情况的六大指标。对16个地区进行分析。一…

多元统计分析实验报告_聚类分析

武汉理工大学实验实训报告项目名称实验2聚类分析所属课程名称多元统计分析项目类型设计性实验实验实训日期年月日班级学号姓名指导教师武汉理工大学统计学系制实验报告2聚类分析设计性实验实验原理聚类分析的目的是将分类对象...

多元统计分析实验报告

多元统计分析课程实验数据分析报告08统计2班辛岩应用多元统计分析课程实验报告多元统计分析课程实验数据分析报告08统计2班辛岩一引言数据说明19xx年财政部国家经贸委人事部和国家计委联合发布了国有资本金绩效平价规...

人口统计分析报告

96年度人口統計分析報告高雄市少子女化之人口政策分析探討撰寫機關高雄市鹽埕區戶政事務所撰寫人朱淑華中華民國96年9月目錄壹前言一撰研動機二撰研目的三分析範圍貳現況研析一人口成長之自然演變二婚姻移民人口與出生率三...

多元统计分析报告(30篇)