《统计分析软件(双语)》实验报告
题目:关于买房数据的分析报告
姓名:
学号:
专业: 统计学
院系: 统计学院
指导教师:
完成日期: 20##年12月7日
摘 要
近年来,随着我国市场化改革的快速推进,房地产业已经成为拉动经济增长的支柱产业,从住房制度改革以来短短几年时间,纵观国内,从沿海开放城市到中西部欠发达地区,中国大地上几乎所有城市商品房都如雨后春笋般拔地而起,而随之而来的便是房价的疯狂上涨,而今,“炒房热”依然成为了一种另类的时尚。
此报告通过分析软件,将买房数据进行交叉分析、相关分析、单因素方差分析、二项分布、检验T检验、K-S检验等各种分析,得到了报告中的结论。
关键字:买房难、买房年龄
目 录
一.数据简要... 1
二.数据分析... 1
(一).描述性统计分析... 1
1.买房年龄段分布... 1
2.年龄段与文化程度的交叉分析... 2
3. 从业状况与文化程度的交叉分析... 3
4. 买房人中家庭类型的分布... 3
5.现居住面积的分布... 4
(二).相关分析... 4
1.家庭每月总收入和购买户型的相关分析... 4
2.家庭类型、家庭每月总收入和现居住面积的相关分析... 5
(三).检验和方差分析... 6
1.人均现住面积的T检验... 6
2. 现居住面积对住房满意度的单因素方差分析... 7
3.住房满意度的二项分布检验... 7
4.人均现住面积的K-S检验... 8
三.小结... 9
一.数据简要
现居住面积、人均现住面积为定距型变量,年龄段、文化程度、从业状况、家庭类型、家庭每月总收入、住房满意度、是否卖掉现房、购买户型与是否贷款为定序型变量。
二.数据分析
一.描述性统计分析
1.买房年龄段分布
有图一可看出,买房年龄段集中在25~45岁之间,仅这两个年龄段占总体的68%。25~45岁之间既要成家也要立业,如今,社会初婚平均年龄:男性29.2岁、女性27.1岁。男性:北京28.2、上海31.1、广州30.8、昆明28.4、成都29.2、西安28.3、长沙28.0女性:北京26.1、上海28.4、广州28.2、昆明26.5、成都27.1、西安26.2、长沙25.9大部分在25岁之后,所以买房高峰期也从之前允婚年龄推迟到25岁左右。而35~45之间,迎来人生中事业的最后一个高峰期,45岁之后很多人的工作,也不会有太大的变化,而且这个年龄段也将是家中新增一个生命的高峰期。因此,买房年龄大多集中在25~45岁之间。
2.年龄段与文化程度的交叉分析
此表可看出,该地区高中学历学历的人所占比重较大。个人认为现如今,本来就是越高学历也不好就业,不仅如此,大学和研究生毕业后都倾向与找工作而不是创业。20##年3月20日的新京报报道,靠工资买房,北上广至少需要28年。其中报道,上海中等价位住宅总价与中等家庭年收入之比约为30,这也意味着在上海,一个中等收入家庭买一套100平米的两居室需要奋斗30年,为当前内地最高;广州与北京次之,约为28;成都约为20。所以,现今高工资买房就是一个“梦”。但是,高中毕业的人,往往选择先出去打工几年,等有了一定的积蓄再创业,自己做生意,做生意买房压力较靠工资买房小且容易,所以,自己买房年龄段集中在高中及中专。
3. 从业状况与文化程度的交叉分析
此表可看出,买房的大多数人的文化程度都集中在高中(中专),不仅如此,收入较高的人也集中在高中(中专)这个文化程度,进一步验证了(表一)的结论。
4. 买房人中家庭类型的分布
20##年社科院“中国城市家庭结构和家庭关系变迁”课题组在对广州、杭州、郑州、兰州和哈尔滨五城市4013户的样本进行调查后,认为中国家庭结构发生了根本性的改变,4013户平均家庭人口为3.22人,三口之家是中国现代家庭的主要模式,这也符合国际上所认定的现代家庭的模式。三口之家已是当今社会的主流家庭模式,自然而然买房也是此主流模式所占比重最大。
5.现居住面积的分布
现居面积均值是58.9062m^2,去掉两端各5%的极端值后,截尾均数为57.9815m^2,中位数为56m^2,三者基本相等。因此,可以推测数据应当是对称分布的。
二.相关分析
1.家庭每月总收入和购买户型的相关分析
家庭每月总收入与购买户型的简单相关系数为0.329,说明两者之间存在正的弱相关性。其相关系数检验的概率p值都近似为0.因此,当显著性水平α为0.05或0.01时,都应拒绝相关系数检验的原假设,认为两总体不是零相关。
2.家庭类型、家庭每月总收入和现居住面积的相关分析
从表中可知,家庭每月总收入和现居住面积的相关系数r=0.374,对应的显著性水平为0,则家庭每月总收入和现居住面积显著相关。排除家庭类型的干扰,家庭每月总收入和现居住面积的相关系数r=0.362,对应的显著性水平为0,则家庭每月总收入和现居住面积依旧显著相关。
三.检验和方差分析
1.人均现住面积的T检验
有表六a可知,719个家庭的人均现住面积的平均值为22平方米,标准差为12.7平方米,均值标准误差为0.47.表六b中,第二列是t统计量的观测值为1.169;第三列的自由度为718.第六列和第七列的是总体均值与原假设值差的95%的置信区间,由此可计算出总体均值的95%的置信区间为(19.62,21.49)平方米。
2. 现居住面积对住房满意度的单因素方差分析
表七是现居住面积对住房满意度的单因素方差分析结果。可以看到:观测变量住房满意度的离差平方总和为122.718;如果仅考虑现居住面积单个因素的影响,则住房满意度总变差中,不同现居住面积可解释的变差为26.782.,抽样误差引起的变差为95.935,它们的方差分别为0.225和0.160,相除所得的F统计量的观测值为13.43,对应的P值等于0.006。如果显著性水平α=0.05,由于P<α,则拒绝原假设,认为不同的现居住面积对住房满意度产生了显著影响,不同住房面积对住房满意度的影响效应不全为0.
3.住房满意度的二项分布检验
表八表明,719个样本中不满意为562人,满意为157人,不满意的实际比例为0.8。检验的满意度为0.2。如果显著性水平α=0.05,由于概率P值大于显著性水平α,则认为满意度仅为20%。
4.人均现住面积的K-S检验
表九表明,数据的均值为20.5448,标准差为12.72888.最大绝对差值为0.166,最大正值为0.166,最小负值为-0.112。如果显著性水平α=0.05,由于概率P值小于显著性水平α,因此,可以认为人均居住面积的总体分布为正态分布。
三.小结
从此报告可看出,现今社会买房难,靠工资买房更难。大多数的家庭的人均现住面积仅为20.5平米,近百分之八十的人对目前的住房不满意。因为一半的家庭为三口之间,所以购买户型也大多为两室一厅或者三室两厅。买房年龄集中在30岁左右,大多数的人选择在结婚前后买房。买的起大房的一般都是工作在私营企业和国营企业的工作的人,行政事业单位及在学校的工作人员购房户型一般都是中小型户型。