浙江财经学院东方学院毕业论文
(或毕业设计)
开 题 报 告
论文题目:浙江省各市经济发展水平差异的因素分析
(黑体,小二)
学生姓名 (四号,宋体) 指导教师
分 院 金融与经贸分院 专业名称
班 级 03东方国贸1 学 号
年 月 日
浙江财经学院东方学院毕业论文(设计)开题报告
第二篇:我国各地区经济发展水平差异性分析
武汉理工大学《多元统计分析》课程设计(论文)
我国各地区经济发展水平差异性分析
摘要
利用统计学中的因子分析方法,选取8项经济指标,对20xx年全国31个省、市、自治区经济发展的基本状况进行分析,提取出3个综合因子,并给出综合排名,然后从综合得分的角度对各地区的经济实力作综合的评价,最后,分析了我国进行西部大开发和振兴东北老工业基地的必要性。
关键字:因子分析;综合得分;经济发展状况
AnalyticMethodofFactorscontributingtoeconomicdevelopmentconditionsofareasinourcountry
Abstract
Thispapersgivestheintegrativeevaluationoftheeconomicdevelopmentconditionsoftheareasinourcountrybytheprinciplecomponentanalysis,choosingeighteconomicelements.Itgetstheintegrativerankandanalyzingthenecessityofdevelopingthewestandtheoldeastindustrialbasesnortheast.
Keywords:factoranalysis;integrativescores;economicdevelopmentconditions
-1-
武汉理工大学《多元统计分析》课程设计(论文)
0引言
衡量一个省(自治区或直辖市)经济发展的基本状况,应该从多方面比如从该省(自治区或直辖市)的工业生产总值、固定资产投资、居民消费水平、职工平均工资、居民消费价格指数、货物周转量等指标去考察。而由于这些指标都是对经济发展基本状况的反映,它们自身之间就存在着较强的相关性,这样在用这些指标反映经济发展状况时就造成了信息的大量重叠,这种信息的大量重叠有时甚至会抹杀经济发展状况的内在规律,所以如果能找到一组较少的但却包含着较多信息量的变量来研究这个问题,就更容易使人抓住主要矛盾,同时使问题得到简化。因子分析正是解决这样问题的有效方法。本文就是运用因子分析方法,对20xx年全国31个省、市、自治区选取影响经济发展的8项指标进行分析,提取了3个综合因子,再用这3个综合因子进行分析,从而使复杂的问题得以简化。选取的8项主要指标分别是:地区国民生产总值X1,居民消费水平X2,固定资产投资X3,职工平均工资X4,货物周转量X5,居民消费价格指数X6,商品零售价格指数X7,工业总产值X8所有数据均来自20xx年中国统计年鉴。
1基本理论(因子分析的数学模型)
因子分析是一种用较少的综合变量来表达多个观测变量的多元统计分析方法。它的基本思想是:由相关性大小把变量分组,同组内的变量之间有较高的相关性,不同组的变量相关性较低。它的基本目的是用少数几个综合变量(也称“综合因子”)去刻画较多变量之间的协方差关系,而各个综合变量之间是不相关的。这样,在保证数据信息丢失最少的原则下,对高维变量空间做了降维处理,.因子分析的结果经常用于综合判定。它的数学模型可表示如下:
?X1=α11Y1+α12Y2+L+α1mYm+α1ε1?X=αY+αY+L+αY+αε?22112222mm22?? LL
?Xp=αp1Y1+αp2Y2+L+αpmYm+αpεp?
其中,X1,X2LXp为p个原始变量,是均值为0,方差为1的标准化变量,Y1,Y2LYm为m个综合因子变量,m小于p,αij为因子载荷,表示的是第i个原始变量在第j个因子
-2-
武汉理工大学《多元统计分析》课程设计(论文)
变量上的负荷,如果把变量Xi看成是m维因子空间中的一个向量,则αij为Xi在坐标轴Yj上的投影,相当于多元回归中的标准回归系数,模型表示成矩阵形式为X=AY+E,其中
X为原始变量向量,A为因子载荷矩阵,Y为因子变量或公共因子,E=αε由于残差E的影
响可以忽略不记,这时数学模型就变为X=AY,因子分析的核心问题是构造因子变量,并对因子变量进行命名解释。
3具体问题的分析
本文对我国31个省、市、自治区经济发展的基本状况采取8个主要指标进行了主成分分析,由于多个指标量纲不同,数据缺少可比性,因此必须将原始数据标准化,使得各个指标具有可比性,做以下变换:x=
*ij
xij?xjσj
1
,其中,xj=?
n
∑
i=1
n
1
xij,σ=
n
2j
∑(x
i=1
n
ij
?xj)2令
这样用得到的标准化数据做因子分析。采用的统计软件是SPSS数据处理系统得到的样本相关系数阵如表一所示:
表一八个指标的样本相关系数阵
消费水平
生产总值消费水平资产投资平均工资货物周转价格指数零售指数工业产量
10.3240.9230.1730.4470.0180.0540.991
0.32410.2460.7260.737-0.435-0.5420.325
资产投资0.9230.24610.0030.4710.1190.0960.912
平均工资0.1730.7260.00310.420-0.421-0.5630.187
货物周转0.4470.7370.4710.4201-0.167-0.3830.469
价格指数0.018-0.4350.119-0.421-0.16710.4630.002
零售指数0.054-0.5420.096-0.563-0.3830.46310.037
工业产量0.9910.3250.9120.1870.4690.0020.0371
利用因子分析有一个潜在的要求,即原始变量之间要有比较强的相关性,如果原始变量之间不存在较强的相关关系,那么就无法从中综合出共同特性的少数因子来。因此,在作因子分析时,需要对原始变量做相关分析,利用SPSS数据处理系统提供KMO和巴特利球形检验来判断变量是否适合做因子分析,当KMO检验值大于0.6时,适合做因子分析,通过SPSS软件计算得到本例中的KMO检验值为0.688,因此适合做因子分析。由表二,我们取前3个因子,累积贡献率已经达到85.734,可见提取3个因子后,它们反映了原始变量的大部分信息,同时也起到了降维的作用。
-3-
武汉理工大学《多元统计分析》课程设计(论文)
表二旋转后的因子特征值、贡献率和累计贡献率
特征值
123
3.0902.6451.124
贡献率(%)
38.62433.06514.046
累计贡献率(%)
38.62471.68985.734
由表三可以看出,在第1个因子的表达式中X1,X2,X3,X4,X5,X8起主要作用,在第2个因子的表达式中X7起主要作用,在第3个因子的表达式中X6起主要作用。因此可以把第l个因子看成是由X1,X2,X3,X4,X5,X8所刻划的反映经济发展状况的综合指标,把第2个因子单独看成是X7的影响,把第3个因子单独看成是X6的影响这个结果是不大令人满意的。因为在第2个因子中,X1,X6,X3对第2个因子的影响也是比较大的,与X7对第2个因子的影响相比相差不多,所以在解释第2个因子的实际意义时应该把X1,X6,X3考虑在内。可
X1,X3主要反映的是第1个因子,X6主要反映的是第3因子。这样,3个因子的实际意义解
释就发生了相互重叠。要克服这个缺点,使得每个原始变量代表的信息主要集中在某1个因子中,就要将因子进行旋转,旋转后的因子载荷矩阵如表四。
表三公共因子矩阵
公共因子
1
生产总值消费水平资产投资平均工资货物周转价格指数零售指数工业产量
0.8160.7660.7470.5710.788-0.291-0.3840.824
20.532-0.4970.612-0.613-0.1600.6210.7230.515
表四旋转后的公共因子矩阵
公共因子
1
生产总值消费水平资产投资平均工资货物周转价格指数零售指数工业产量
0.9810.2340.9570.041550.4140.034010.1700.977
20.1130.8840.063270.7740.782-0.298-0.7290.129
3-0.01689-0.1730.123-0.3200.1820.9110.334-0.02523-0.6120.177-0.05470.039230.4120.670-0.0495-0.161
-4-
武汉理工大学《多元统计分析》课程设计(论文)
从表四可以看出由旋转后的因子载荷矩阵可以得到8个原始变量与这3个因子之间的表达式如下:
X1=0.981Y1+0.113Y2?0.0169Y3X2=0.234Y1+0.884Y2?0.173Y3X3=0.957Y1+0.06327Y2+0.123Y3X4=0.04155Y1+0.774Y2?0.320Y3X5=0.414Y1+0.782Y2+0.182Y3X6=0.034Y1?0.298Y2+0.911Y3X7=0.170Y1?0.729Y2+0.334Y3X8=0.977Y1+0.129Y2?0.0252Y3
由表达式可见Y1,的系数在X1,X3,X8里最大,在其余的5个原始变量中的系数非常小,所以可以把第1因子看成主要是由国民生产总值X1,固定资产投资X3,工业总产值X8,构成的,这3方面都是从总体角度衡量一个地区经济发展状况的,因此命名为“总量因子”Y2的系数在X2,X5,X4中最大,且为正,所以可以把第2因子看成是由居民消费水平X2,货物周转量X5,职工平均工资X4三方面构成的,这三方面都是反映消费水平的,因此命名为“消费因子”.同时注意到Y2在X7中的负荷量相对来讲也比较大,但是负的,代表的是商品零售价格指数,这和我们分析的正好吻合,因为商品零售价格越低越促进消费,所以将第2因子命名为“消费因子”是合理的。Y3在X6,X7中系数最大,且均为正,X6代表居民消费价格指数,X7代表商品零售价格指数,因此把第3因子命名为“价格因子”。要求得3个主要因子与原始变量之间的表达式,就要计算因子得分系数矩阵。SPSS软件求得结果,如表五:
表五因子得分系数矩阵
公共因子
1
生产总值消费水平资产投资平均工资货物周转
0.347-0.0170.323-0.0480.007
2-0.0920.368-0.0600.2810.426
3-0.1360.1010.015-0.0840.453
价格指数零售指数工业产量
-0.0920.1170.345
-5-
0.192-0.283-0.086
0.9580.084-0.139
武汉理工大学《多元统计分析》课程设计(论文)
由因子得分系数矩阵可以得到这3个因子与8个原始变量之间的表达式:
Y1=0.374X1?0.017X2+0.323X3?0.048X4+0.007X5?0.092X6+0.117X7+0.345X8Y2=?0.092X1+0.368X2?0.06X3+0.281X4+0.426X5+0.192X6?0.283X7?0.086X8Y3=?0.136X1+0.101X2+0.015X3?0.084X4+0.453X5+0.958X6+0.084X7?0.139X8
因此分析l个省(自治区或直辖市)经济发展的基本状况,不必通过8个原始变量从8个角度去分析,可以从总量因子Y1,消费因子Y2和价格因子Y3这3个方面去衡量.由表二“相关特征值及贡献率”可知,旋转后3个综合因子Y1,Y2,Y3的贡献率分别为γ1=38.624,γ2=33.065,
γ3=14.046,
令
γ1/γ1+γ2+γ3=38.624/38.624+33.065+14.046=0.451γ2/γ1+γ2+γ3=33.065/38.624+33.065+14.046=0.386γ3/γ1+γ2+γ3=14.046/38.624+33.065+14.046=0.164
为综合因子Y1,Y2,Y3的权重。令Y=0.451Y1+0.386Y2+0.164Y3为经济综合实力,根据各省市自治区经济综合实力Y的得分大小给出排名:
表六各城市综合得分排名
排名123xxxxxxxxxxxx3141516
城市上海山东广东浙江天津江苏河北辽宁湖北湖南河南北京四川内蒙古福建安徽
综合得分1.587061.045720.9190150.7910440.7890830.7235550.6730480.5391070.2202160.1907360.1420540.002729-0.01348-0.03943-0.04312-0.09839
-6-排名171xxxxxxxxxxxx25262728293031
城市黑龙江山西陕西吉林青海云南广西宁夏甘肃西藏贵州江西重庆新疆海南
综合得分-0.15455-0.16117-0.30958-0.37601-0.44875-0.45094-0.48412-0.48743-0.53707-0.57137-0.58361-0.59945-0.62446-0.62788-1.01253
武汉理工大学《多元统计分析》课程设计(论文)
4结束语
由表六经济综合实力的排名可知,上海、浙江、山东、广东、江苏、天津东部沿海省份的经济总量最高,表明经济发展水平较好;辽宁、黑龙江、吉林东北老工业基地和大部分中原地区的经济总量居中,表明经济发展水平居中;江西、甘肃、贵州、西藏、新疆等西部地区经济总量最少,经济发展较落后。从这里可以看出我国东西部经济综合实力还存在着较大的差别,因此在保持东部沿海地区经济稳定发展的基础上加大对西部地区的开发,可使我国的经济总量稳定持续增加,因此从这个角度上讲实施“西部大开发”战略是非常必要的,而且从这里就可见其部分成效,因为河南、四川经济综合实力排名和大部分中原、西部地区相比靠前,很大程度上也是西部大开发给其带来的结果。东北老工业基地在过去的历史时期曾为我国的经济发展做出了巨大贡献,但从这个排名中可以看出现在的发展不及东部沿海地区,因此近两年提出的“振兴东北老工业基地”的政策也是非常符合实际情况的。
-7-
武汉理工大学《多元统计分析》课程设计(论文)
[参考文献]
[1]中国统计年鉴编委会.中国统计年鉴2004。北京:中国统计出版社,2004
[2]刘先勇,袁长迎,段宝福,周方洁,统计分析软件与应用SPSS10.0
[3]余建英,何旭宏,数据统计分析与SPSS应用.北京人民邮电出版社,2003.
[4]王裕国,西部大开发与四川经济发展问题探索:西南财经大学出版社,2001
[5]王华昌,夏保林西部大开发与河南城市发展研究,2001.
[6]何晓群,多元统计分析.北京:中国人民大学出版社,2000.
-8-