这次作业,由于我查的数据均是以当年各省市的总量为统计量,所以并不需要化为人均,直接以总量来求解.
1. 对数据进行因子分析,首先将提取的因子数暂定为4,看看可以用多少个因子来解释总体数据.由表一可知,Person相关系数均大于0.62,且显著水平全部等于0,表明这十二个变量之间存在显著的相关关系.由表二和表三也可知,数据能够进行因子分析,且选择两个公共因子可以提取99.65%的公共信息.
2.由表四可知,第一主成分的特征根为8.401,第二主成分的特征根为 2.413,总的解释量达到了99%以上.又从碎石图可得,对于原始的八个变量,只需要提取第一和第二主成分即可.
3.建立因子模型
F1=0.95x1+0.95x2+0.948x3+0.381x4+0.357x5+0.607x6+0.409x7+0.403x8 +0.393x9+0.746x10+0.751x11+0.751x12
F2=0.31x1+0.312x2+0.316x3+0.915x4+0.923x5+0.386x6+0.911x7+0.915x8 +0.919x9+0.445x10+0.47x11+0.488x12
4.对第一与第二因子进行解释.我们可以看出
房地产市场的需求水平由住宅投资与储蓄总额组成决定,而其供给水平则由各年的新施工面积与竣工面积联合决定.
5.对因子分析结果进行聚类分析:
在因子分析结束后,生成并保存了两列新变量”FAC_1”,”FAC_2”用来记录各省市的因子得分情况.对其绘散点图,可以观察大致得出所有省市分为可分为三类.
5要 要要
如上表,将全国各城市分隔成了三个部分,以江苏,浙江为一类,广东为三类,其余均为二类.由表格可知,江苏,浙江供大于求,而广东那边则严重供不足需,全国其它地方供需较为平衡.
此次作业之后,我还查阅了相关资料,根据我的理解,需求可以用售房数来权衡,根据网上的资料显示,北京及大部分地方,每年的售房数大于竣工房数.这是因为现在很多的地方采取先售房的的方式造成的房子没建好之前,消费者已经购买下了.但是如果单纯的用售房数来说明需求量的话,是不太客观的,因为现在中国的房价比较高,很多需要住房的人购买不起,这部分人的需求被忽略了,不能满足.
附录:
本文采用了因子数为四,最后绘制的碎石图为三维的,因为已经得出结论二个因子是可以描述总体数据的,所以最终在附录中留下的是二因子分析得出的碎石图.
因为对相关统计知识与软件的不熟悉,本文制作显得粗糙,深表歉意!
第二篇:因子分析SPSS操作
因子分析作业:
全国30个省市的8项经济指标如下:
要求:先对数据做标准化处理,然后基于标准化数据进行以下操作
1、给出原始变量的相关系数矩阵;
2、用主成分法求公因子,公因子的提取按照默认提取(即特征值大于1),给出公因子的方差贡献度表;
3、给出共同度表,并进行解释;
4、给出因子载荷矩阵,据之分析提取的公因子的实际意义。如果不好解释,请用因子旋转(采用正交旋转中最大方差法)给出旋转后的因子载荷矩阵,然后分析旋转之后的公因子,要求给各个公因子赋予实际含义;
5、先利用提取的每个公因子分别对各省市进行排名并作简单分析。最后构造一个综合因子,计算各省市的综合因子的分值,并进行排序并作简单分析。
1、输入数据,依次点选分析?描述统计?描述,将变量x1到x8选入右边变量下面,点选“将标
准化得分另存为变量”,点确定即可的标准化的数据。
依次点选分析?降维?因子分析,打开因子分析窗口,将标准化的8个变量选入右边变量下面,点选描述?相关矩阵下选中系数及KMO和Bartlett的检验,点继续,确定,就可得出8个变量的相关系数矩阵如下图。
由表中数据可以看出大部分数据的绝对值都在0.3以上,说明变量间有较强的相关性。
由上图看出,sig.值为0,所以拒绝相关系数为0(变量相互独立)的原假设,即说明变量间存在相关性。
2、依次点选在因子分析窗口点选抽取?方法:主成分;分析:相关性矩阵;输出:未旋转的因
3个图。
表看出前3个主成分的累计贡献率就达到了89.599%>85%,所以选取主成分个数为3。选y1为第一主成分,y2为第二主成分,y3为第三主成分。且这三个主成分的方差和占全部方差的89.599%,即基本上保留了原来指标的信息。这样由原来的8个指标变为了3个指标。
3。与按累计贡献率确定的主成分个数是一致的。
80%以上的信息。
由上表数据第一列表明:第一主成分与各个变量之间的相关性;第二列表明:第二主成分与各个变量之间的相关性;第三列表明:第三主成分与各个变量之间的相关性。可以得出:x1x3x8主要由第一主成分解释,x4x5主要由第二主成分解释,x6主要由第三主成分解释。但是x2是由第一主成分还是第二主成分解释不好确定,x7是由三个主成分中的哪个解释也不好确定。 下面作因子旋转后的因子载荷阵。
在因子分析窗口,抽取?输出:旋转的因子解,继续;旋转?方法:最大方差法,继续;确定。输出结果如下2图;
由上表数据可以得出:x1x3x5x8主要由第一主成分解释,x2x4主要由第二主成分解释,x6x7主要由第三主成分解释。与第一因子关系密切的变量主要是投入(投资:固定资产投资)与产出(产值:国内生产总值、工业总产值)方面的变量,货物周转又是投入产出的中介过程,可以命名为投入产出因
子;与第二因子关系密切的都是反映民众生活水平的变量,可以命名为消费能力因子;与第三因子关系密切的是价格指数方面的变量,可以命名为价格指数因子。
由上表可以看出:第二列数据表明,各个主成分的贡献率与旋转前的有变化,但是3个主成分的累积贡献率相同都是89.599%。
5、在因子分析窗口,得分?因子得分保存为变量f1f2f3;方法:回归。再按三个主成分降序排列:数据?排序个案:将f1选入排序依据,排列顺序:降序。同理得出按f2f3排序的结果。结果如下; 最后,以各因子的方差贡献率占三个因子总方差贡献率的比重作为权重进行加权汇总,得出各城市的综合得分f。即
f=(0.40089*f1+0.277*f2+0.2174*f3)/0.89599
f得分在转换?计算变量中的出。最后再按f得分排序。排序结果如下:
f1
2.11763 2.03281 1.48171 1.22895 1.10693 1.07313 0.96184 0.65225 0.60326 0.60136 0.26238 0.23633 -0.06617 -0.26842 排序 f2
山东 3.66094 江苏 1.6829 广东 1.58836 河北 0.99048 四川 0.74993 河南 0.6314 辽宁 0.27409 浙江 0.26647 上海 0.18476 湖北 0.11802 湖南 0.04579 黑龙江 0.00117 安徽 -0.15123 福建 -0.19777 排序 f3
上海 2.07204 广东 1.69291 北京 1.28542 天津 1.16111 浙江 0.98784 西藏 0.90343 福建 0.84557 江苏 0.77625 青海 0.62601 新疆 0.53464 云南 0.47211 海南 0.25513 宁夏 0.21824 山东 -0.00481 排序 f 云南 1.62 贵州 0.95 湖北 0.95 新疆 0.88 四川 0.58 陕西 0.5 上海 0.44 甘肃 0.42 广西 0.25 湖南 0.14 青海 0.09 山东 0.07 内蒙 -0.02 西藏 -0.05 排序
上海 山东 江苏 广东 四川 湖北 浙江 云南 北京 辽宁 湖南 新疆 贵州 河南
-0.28002 -0.28376 -0.36466 -0.39638 -0.41389 -0.47727 -0.51327 -0.56026 -0.57753 -0.74551 -0.76636 -0.88229 -1.34465 -1.35668 -1.46804 -1.59344 云南 -0.27211 广西 -0.29037 山西 -0.29779 北京 -0.34462 陕西 -0.37617 内蒙 -0.39701 吉林 -0.43068 江西 -0.52044 新疆 -0.52561 甘肃 -0.53203 贵州 -0.66221 天津 -0.68 青海 -0.79471 宁夏 -0.88339 海南 -1.3165 西藏 -1.52165 广西 -0.0403 甘肃 -0.13117 湖北 -0.13995 贵州 -0.17691 黑龙江 -0.25054 吉林 -0.32565 辽宁 -0.46473 湖南 -0.57616 四川 -0.61312 陕西 -0.78714 山西 -0.79854 江西 -0.94379 安徽 -1.1953 内蒙 -1.50695 河南 -1.62403 河北 -2.25163 江西 宁夏 山西 江苏 北京 浙江 河南 黑龙江 辽宁 河北 福建 吉林 广东 安徽 天津 海南 -0.05 -0.12 -0.12 -0.16 -0.23 -0.24 -0.4 -0.42 -0.43 -0.47 -0.5 -0.52 -0.59 -0.66 -0.69 -1.23 广西 陕西 河北 黑龙江 甘肃 福建 山西 青海 内蒙 江西 天津 西藏 吉林 安徽 宁夏 海南
有了对各个公因子的合理的解释,结合各个城市在三个公因子的得分和综合得分,就可对各城市的经济发展水平进行评价了。在投入产出因子f1上得分最高的6个城市是山东、江苏、广东、河北、
四川。其中山东得分为2.11763,江苏得分为2.03281,高于其他城市,说明山东、江苏的工业的投入产出能力最高,工业发展相对较快,从而推动城市发展;而青海、宁夏、海南、西藏的投入产出能力较差,可能由于地理位置的缘故工业发展相对落后。上海、广东、北京、天津在消费能力因子f2上的得分较高,说明它们的消费能力较高,人们的收入也较高,从而生活质量较好,城市发展较快;而河南、河北得分较低,它们的消费能力较低,从而说明人们的收入也相对较低,生活质量相对差一点,城市发展较慢。云南、贵州、湖北、新疆在价格指数因子f3上的得分较高,说明在这些城市物价相对较高,可能以些非本地产的东西由于运输的不方便,使得这些物价相对较高,而广东、安徽、天津、海南的价格指数较低,说明,在这些城市,交通相对便捷,运输方便,或者本地产的东西较多基本满足需求,使得物价相对较低,但从侧面也可看出这些城市与其他城市的联系可能较少,不利于自己的总和发展,从而也说明了这些城市的发展相对较慢。由综合因子f的分就可综合评价城市的经济发展水平,综合得分的前3名上海、山东、江苏,得分最低的3个城市安徽、宁夏、海南。