话说呢,这其实是我们概统小组(褚君、刘畅、韩冰、李铖)的小组作业,应广大人民同志的要求,特意发上来~~
特别鸣谢:
褚君、刘畅两位技术大牛!!!没有你们就没有这篇惊天地泣鬼神的报告!!有木有!!
还有冰哥!!@起人来灰常给力!!
一、问题提出
从古到今,青年男女的恋爱总是大家评论的热门话题。在中国古代,青年男女秉承父母之命、媒妁之言,通过媒婆相互共同,最终达成秦晋之好。
时至今日,社会风气自由开放,人们更加推崇给予当事人更大自主权的“婚姻自由,恋爱自由”之原则。因此,选择伴侣的过程由一家之言逐渐演化成为多因素共同决定、相互影响的过程。
具体到大学生而言,由于绝大部分大学生基本已步入成年,对选择伴侣一事已具有一定的自主权与自由,如何能找到最佳的伴侣也成为不少大学生,尤其是男生所考虑的一件事。而对于究竟何种特质左右着男生“脱光”与否一事,则是仁者见仁,智者见智。
因此,基于以上现状,我们觉得有必要影响对大学男生“脱光”的特质进行探究,以为广大寄希望于在大学生活中收获美满爱情的男生提供具有一定价值与说服力的指导。
二、研究设计
(一)实验变量
在进行待探究变量的选取时,我们从个人基本信息、生活习惯及恋爱预期三个方面出发进行变量的筛选,其中囊括了连续变量与离散变量,具体如下。
1.连续变量:身高(cm) 体重(kg) 当前平均绩点 意愿为恋爱活动花费的金额上限
2.离散变量:年级、现在恋爱状态(是或否)、是否具有恋爱经历(是或否)、进入大学的途径(正常高考、竞赛保送、自主招生)、每周花费在课程学习上的小时数(分段计量)、每周花费在社团活动方面的小时数(分段计量)、在电子游戏方面花费的小时数(分段计量)、各类社交网络方面花费的小时数(分段计量)、每周洗澡的次数 每学期剪发的次数、平均每餐饭需要的米饭量、体质健康测试的成绩、《思想道德修养与法律基础》总评成绩、平均每月所需的生活费(分段计量)
(二)问卷研究
1.问卷目的:
充分收集现象,为对总体进行估计提供基础。
2.问卷设计
问卷主要由三部分构成:
其一,向被调查者说明本组研究目的,并向其承诺问卷调查结果将被严格保密。
其二,个人信息部分,针对被调查者个人的基本状况的调查部分。
其三,主要问题部分,针对被调查者对于各问题偏好的调查部分。
3.问卷测试、发放与回收
在正式发放问卷之前,我们首先打印了15份纸质版问卷在私下进行小范围的发放,通过被调查者的反馈与建议,我们对问卷中的措辞及选项设计的不当进行了更正。
正式问卷的发放采用专业的问卷网站“问卷星”进行。问卷发放采取在人人网等社交网站平台上对符合条件的被调查者(男生)进行邀请的方法。据统计,本组问卷页面的访问人次达到449次(其中独立IP数为262),最终有效答卷为137份,完成率为30.51%。
三、数据统计与分析
(一)统计结果描述
1.性别分布
由于本研究针对男生进行,因此本次问卷回答者均为男性。
2.年级分布
本次接受调查者普遍为本科全日制在校大学生(除两人为研究生),其中,各年级人数分布如下:
Figure 1 年级分布
由上图可以看出,本次调查中大二年级的同学占绝大多数,达51.2%,其次为大一同学,占23.36%,大三与大四同学分别占到14.6%与9.49%,本科以上学历者仅占到1.46%。
3.现在所处感情状态与感情经历
Figure 2 目前感情状态
Figure 3 感情经历
由上图可以看出,在本次的被调查人群中,目前无伴侣者约占到总人数的3/4,而有伴侣者仅占到1/4。在目前无伴侣的调查者中,约1/2(总样本的3/8)的调查者曾有过感情经历,而另外1/2(总样本的3/8)还未曾有过感情经历。
4.入学途径
Figure 4 入学途径
在关于入学途径的调查中,通过普通高考进入大学的被调查者占绝大多数,达到67.15%;其次为自主招生,占到19.71%;竞赛保送的同学占到13.14%。
5.身高
本次被调查者的总体身高分布情况,及对应正态分布图线如上图所示。
据统计,本次调查中,被调查者身高的样本均值为175.86cm,标准差为5.38。其中,中位数为176cm,众数为170cm,最大值与最小值分别为192cm与160cm。
6.体重
本次被调查者总体体重分布情况,及正态分布图线如上图所示
据统计,本次调查中,被调查者体重的样本均值为66.56kg,标准差为8.01。其中,中位数与众数均为65kg,最大值与最小值分别为87kg与50kg。
7.平均绩点
本次被调查者总体绩点分布情况,及正态分布图线如上图所示(由于被调查人群中大一年级同学尚未得知其平均绩点,因此仅选择了非大一年级同学的剩余92份调查结果)
据统计,本次调查中,被调查者体重的样本均值为3.33,标准差为0.31。其中,中位数为3.37,众数为3.25,最大值与最小值分别为3.85与2.39。
(二)交叉分析
1.年级与平均身高
以上为通过ANOVA法,对获得的身高值与所在年级的数据处理之后的结果。我们发现,观测到的数据的p-value=0.84728,非常大,因此我们可以认为,原假设“μ1=μ2=μ3=μ4”可以被接受。这个同样可以通过F值的比较看出来。由上表我们看出,在α=0.05的条件下,F3,119,0.05=2.680811,而观测到的F值为0.2695,远小于前者,因此我们同样可以得出结论,原假设应当被接受。所以,我们得出结论,年级对于男生的身高没有很大的影响。
2. 年级与平均体重的影响
同样的,P-value 明显高于显著性水平,因此我们得出结论:年级对于男生的体重没有显著影响。
3.出生地与绩点
类似的,我们做出了不同地域的同学的平均绩点的差异比较。组1是来自一线城市的同学的数据,组2是来自其他地区城市的同学的相应数据。我们在本次研究中把“一线城市”定义为:北京,上海,广州,重庆,天津,香港,台北。通过ANOVA表我们看出,“一线城市”同学的平均绩点要比其他城市同学的要稍微高一点点,可是差别并不显著,因为P-value也较大。因此我们认为,来自不同地区的同学的成绩并不存在显著的差异。
4.身高与体重
由上表及残差图我们可以看出,由回归得出的β0以及β1的P-value的值都很小,说明身高与体重是具有显著的线性相关关系的。F检验的显著性水平和残差图都让我们相信,这个回归模型是可行且有效的。因此,该结果检验了一个大家公认的道理,体重与身高水平间是具有明显的相关性的。
(三)针对影响脱光与否的变量的探究
1.样本数据的整理
由于大一新生缺乏体侧和GPA等数据,而我们推测这些数据应该与是否脱光有一定联系,所以做出了两个样本,Sample1包含大二至大四的93位同学的数据,包括体测与GPA等数据,Sample2包括大一到大四所有有效问卷的所有变量数据。
由于问卷设计的问题,对于恋爱史这个问题的回答,如果已经脱光的人这个问题就直接跳转了,所以所有已经脱光的同学的第三题回答都是“跳过”,造成做Logistic回归时,百分百匹配的错误结果。
2.logistic回归模型理论回顾及应用
1)Logistic 回归理论:
Logistic回归模型是一种概率模型,适合于病例—对照研究、随访研究和横断面研究,且结果发生的变量取值必须是二分的或多项分类。可用影响结果变量发生的因素为自变量与因变量,建立回归方程。
令: y=1 发病(阳性、死亡、治愈等),y=0 未发病(阴性、生存、未治愈等)
发病的概率记为P,它与自变量x1, x2,…,xp之间的Logistic回归模型为:
可知,不发病的概率为:
经数学变换得:
定义:
Logistic变换即为:
流行病学的常用指标优势比(odds ratio,OR)或称比数比,定义为:暴露人群发病优势与非暴露人群发病优势之比。即Xi的优势比为:
2)Logistic回归模型在本研究中的应用
A. Sample1分析:
l 变量说明
l Logistic regression
Sample1的伪R方很低,说明模型对数据的解释程度很小,没有发现显著的相关性。
B. Sample 2分析
l 变量说明
l Logistic regression
C.回归结果分析
观察伪R方,为0.1825,因为是取实际数据而且对于总的人口来说,大小为93的样本略小,所以模型拟合度较低也是在接受范围之内。
观察P值,可以发现x6和x18是显著的,分别代表GPA和填写问卷用时,他们的Odds Ratio均为正,分别是10.43962和.9904828,Odds ratio代表的是自变量对因变量变化率的关联程度,由此我们发现相比于其他的变量GPA显著与是否脱光具有正相关性,但是由于不清楚因果顺序,我们并不能断定是“是否脱光”导致高GPA,还是高GPA导致了更容易脱光。
对于填写问卷时间,这里由于不是所有人都填写了这份问卷,所以这个变量的说明性不强,但是我们可以做出假设填写问卷的时间有可能反映了这个人的耐心程度,一定程度上是个人特质的反映。所以也和是否脱光有正相关。
我们删掉变量x18(即问卷填写用时)后,重新对Sample2进行logistic回归:
l Logistic regression
发现除x6显著的同时,x11也显著p值为0.059,Odds Ratio为1.994701,说明洗澡次数的多少和是否脱光有显著正相关,但是在交叉分析的时候也可以看见,并不是洗澡次数越多越好,而是在洗澡次数为一周5-6次的人群中脱光比率最高。同时观察到P值较小的x7(学习时间),我们猜测GPA和学习时间之间是否有相关性,所以对绩点和学习时间做了相关性分析:
由相关性分析得出,绩点与学习时间的相关系数为0.2356,相关性显著水平为0.0230,说明他们是显著相关的,于是我们再调整logistic 回归模型,去掉学习时间后再做回归:
l Logistic regression
从以上回归分析结果来看,仍然为绩点和洗澡次数较为显著。
3. 卡方检验(Goodness of Fit Test)理论回顾及应用
1)卡方检验理论回顾
l 理论依据:
H0: pij=pi.p.j for i=1,…,R and j=1,…,C
H1: The hypothesis H0 is not true.
l 需要检验的统计量:
2)卡方检验在本研究中的应用
A. Sample 1卡方检验——检验地域,年级和是否脱光的独立性:
l 地域与是否脱光对应的列联表如下:
经过计算得出,该卡方检验的P值为0.608。
l 年级与是否脱光对应的列联表如下:
经过计算得出,该卡方检验的P值为0.361。
在我们选定的0.05的显著性水平下,对于以上两个检验的原假设我们均接受。说明地域分布,年级与脱光与否没有显著相关性。
5.研究结果综述
在本次研究中,我们用Logistic模型研究了“x1 入学途径;x2 眼镜度数;x3 身高;x4 体重;x5 出生地城市等级(一线或者二线);x6 平均绩点;x7 每周学习时间;x8 每周社团活动时间;x9每周花在游戏上的时间;x10 每周在社交网络时间;x11 每周洗澡次数;x12 每学期剪发次数;x13 每餐饭饭量;x14 体质健康测试成绩;x15 《思想品德修养》成绩;x16 月平均生活费;x17 恋爱活动花销上限;x18 填写问卷所用时间;x19 年级”等19个变量对于脱光与否的影响。我们把样本数据分为两组,其中第一组包含19个自变量,针对非大一同学;另一组包含16个自变量(以上19个数据中除去“x6平均绩点,x14体质健康测试成绩和x15《思想品德修养》成绩”),针对所有参与调查的同学。
在两组数据的分析中,我们惊奇的发现,在罗列出来的所有变量中,最后都只有“绩点”和“每周洗澡次数”同脱光与否有显著的正相关关系。其余的17个变量与脱光与否的关系不显著。这说明绩点越高的男生,他脱光的机会就越大;同样,“每周洗澡次数”越多,他就更有可能赢得女生的青睐。而至于其他的因素,像来自一线城市还是二线城市,身高体重如何,家境如何,所在年级,均与脱光与否没有直接相关关系。
所以,对于尚未脱光的男生们,大家一定不要懊丧于自己的家庭状况和所生活的城市,也不要懊恼于自己的身体条件,或者苦恼于自己的思想道德水平没有其他人人高尚,抑或是自己在不同活动上的时间分配不合理,它们对于脱光与否都不是主要因素!而如果你想在恋爱问题上取得突破,突破口便是自身的形象的维护和学习成绩的提高。
最后在报告的结尾部分,我们衷心提醒广大男同胞们,每周“多洗几次澡”,“多看一些书”,你的脱光之路将不再漫长。真心祝愿每位有情人找到属于自己的真爱!
第二篇:统计调查报告范例
《重庆市大学生对公租房的需求及预期》
统计调查报告
学 生:
学 号:
专 业:
班 级:
重庆大学建设管理与房地产学院
二O##年
摘 要
重庆市政府决定从20##年起,大力推进公共租赁住房建设,建立以公共租赁住房为主导的住房保障体系。
对于大学生群体而言,房价持续攀升,高房价必然给大学生施加很大的压力。买房难,住房难犹然而生,普遍大学生会选择租住公租房来缓解自己的住房和经济压力,对公租房具有需求欲望和预期。
目 录
摘 要... II
一、 调查背景... 4
二、 调查目的和调查内容... 4
(一) 调查目的... 4
(二) 调查内容... 4
三、 调查对象和调查单位的确定... 5
(一) 调查对象... 5
(二) 调查单位的确定... 5
四、 调查时间... 6
(一) 调查资料所属的时间... 6
(二) 调查工作的起讫时间... 6
五、 调查项目和调查表... 6
(一) 调查项目... 6
(二) 调查表... 7
六、 调查的组织和队伍... 7
七、 调查方式和数据收集技术... 7
(一) 调查方式... 7
(二) 数据收集技术... 7
八、 数据处理和上报方式... 7
(一) 数据处理... 7
(二) 数据取得... 7
(三) 数据上报... 8
九、 数据分析... 8
(一) “汶川大地震”后成渝两地购房者购房决策因素差异比较... 8
(二) 成渝两地购房者感知到的安全风险因素差异比较... 9
(三) 成渝两地购房者感知到的安全风险构面比较... 10
十、 结论... 12
一、 调查背景
改革开放以来,随着城镇住房制度改革不断深化和住房分配货币化的逐步实行,重庆市住房供应严重不足的状况得到有效缓解。但由于住房供应体制的单一性,低收入住房困难群体买不起房的问题越来越突出。虽然重庆市用廉租住房等五种方式开展住房保障工作,取得了一定成效。但由于廉租住房主要保障低收入群体,经济适用住房制度设计上还不完善,危旧房和棚户区改造安置有阶段性,新生代就业人员和暂时买不起住房又不能纳入廉租住房保障的“夹心层”群体的住房问题就凸显了出来。市委、市政府高度重视解决群众“住房难”问题。
二、 调查目的和调查内容
(一) 调查目的
(二) 调查内容
本研究构建了大地震后购房者感知住宅建筑安全风险的九个维度:抗震烈度、楼层、选址、稳固性、安全通道、建筑密度、室内避难空间、室外避难场所与政府应对灾难能力(如图一所示)。通过九个维度构成的购房者安全风险构面,来描述地震安全风险,从而探讨地震发生后,成渝两地购房者所感知到的建筑安全的不确定性。地震对购房者购房心理的影响,其中一方面主要体现在地震影响购房者感知到的住宅建筑安全风险(以后简称“安全风险”),进而导致购房者购房决策的变化。研究汶川大地震后成渝两地购房者感知到的安全风险可以从购房者决策行为变化的角度出发,即以影响购房者决策的因素为切入点,研究购房者感知到的安全风险的构面,以及安全风险在购房决策因素中所占的权重。
图一 购房决策因素及安全风险构面示意图
三、 调查对象和调查单位的确定
(一) 调查对象
在重庆和成都两地的所有购房者。但是为了便于研究,最终本次调查的对象选定为20##年5月成都房交会和20##年6月重庆江北房交会购房者。
(二) 调查单位的确定
在重庆和成都两地的每一位购房者。但是由于受到时间、资金等资源方面的限制,本次调查最终只随机选定20##年5月成都房交会的100名购房者和20##年6月重庆江北房交会的170名购房者。
四、 调查时间
(一) 调查资料所属的时间
调查时间为汶川地震后一周年左右。分别为20##年5月成都房交会和20##年6月重庆江北房交会。
(二) 调查工作的起讫时间
成都调研工作起讫时间为20##年4月30日-20##年5月3日
重庆调研工作起讫时间为20##年6月6日-20##年6月9日
五、 调查项目和调查表
(一) 调查项目
本研究将问卷设计分为两个层次,第一层次研究影响购房者决策的因素,共有9个,如图一所示,称之为购房决策因素,第二层次为住宅建筑安全风险因素,共有9个,如图一所示,这9个因素为购房者感知到安全不确定性的来源,称之为安全风险构面。这两个层次的因素是经过本课题研究组多次到重庆大学附近的六个楼盘调查访问,并且对重庆大学房地产学院的师生进行深度访谈后总结归纳出来的,可以认为基本涵盖了影响购房者决策的因素和购房者感知到的安全风险因素。
经过反复论证本研究决定问卷的第一层次采用0-1法,本研究请被试对第一层次的9个因素两两进行比较,认为相对重要的给1分,相对不重要的给0分;问卷的第二层次采用0-4法,对第二层次的9个因素两两进行比较,认为相对非常重要的给4分,相对重要的给3分,同等重要的给2分,相对不重要的给1分,相对非常不重要的给0分。
据此可以统计出第一层次各要素在购房决策中的权重(Q1、Q2、Q3…Q9)和第二层次购房者感知到的安全风险各要素在安全风险构面的比重(q1、q2、q3…q9),将安全风险各要素的比重(q1、q2、q3…q9)乘以建筑安全及周边环境安全在购房决策中所占的权重Q5,便可以得到各个安全风险因素在购房者购房决策中所占的比重(Q51、Q52、Q53…Q59)。
(二) 调查表
见附件1。
六、 调查的组织和队伍
重庆大学建设管理与房地产学院20##级学生王环、罗伟涛、王睿、高原、付维维。
七、 调查方式和数据收集技术
(一) 调查方式
典型调查与随机抽样调查结合。
(二) 数据收集技术
问卷调查方式。
八、 数据处理和上报方式
(一) 数据处理
对第一层次数据的分析本课题研究组进行了独立样本T检验(见表一),对第二层次本课题研究组进行了独立样本T检验(见表二)和配对样本T检验(见表三、四)。数据处理软件用SPSS16. 0。
(二) 数据取得
通过问卷调查方式取得。调查对象为随机抽样的20##年5月参加成都房交会和20##年6月参加重庆江北房交会的购房者,调查时间为汶川地震后一周年左右。本次调查发放问卷270份,有效问卷238份;其中,成都地区共发放100份,收回99份,有效问卷84份,重庆地区发放问卷170份,收回160份,有效问卷154份。
(三) 数据上报
在搜集汇总各调查资料后,在20##年6月前以调研报告的形式提交给重庆大学实验室及设备管理处。
九、 数据分析
(一) “汶川大地震”后成渝两地购房者购房决策因素差异比较
根据第一层次的调查结果统计出成渝两地购房者对决策因素的排序(见表一),决策因素的排序不同意味着群体对各个决策因素的不同重视程度:对于同一群体来说,某个决策因素的排位越靠前,重视程度越高;对于不同群体来说, 即使某个决策因素的排位不相同,但两者重视程度仍有可能一致。
购房决策因素的重要性排序显示:灾后重庆和成都购房者都把住宅建筑安全放在决策因素的首位,且该因素的比重Q5成都=0.1533大于Q5重庆=0.1433;两地购房者对其他因素的排序则略有不同,重庆购房者把价格因素放在决策因素的第二位而成都购房者把价格因素放在了第四位,说明了重庆购房者较成都购房者对价格因素更为敏感。
对第一层次数据进行独立样本T检验显示:各个决策要素的p值均大于0.05,说明成渝两地购房者对各个因素的重要性程度不存在显著差异,即重庆、成都购房者对各个决策因素的重要性意见倾向一致。
(二) 成渝两地购房者感知到的安全风险因素差异比较
第二层次的调查结果,统计得出了成渝两地购房者对住宅建筑安全风险因素的重要性排序(见表二):从表二可以看出,地震后成渝购房者感知安全风险因素的重要性的排序除了因素X53、X54、X55、X56不同外,其他因素排序相同。
对第二层次数据进行独立样本T检验,感知到的各个安全风险因素的p值均大于0.05,说明重庆、成都两地购房者对各个因素的重要性程度不存在显著差异,即重庆、成都购房者对各个安全风险因素的重要性意见倾向一致。
表二 震后成渝两地购房者感知到的安全风险因素差异比较
(三) 成渝两地购房者感知到的安全风险构面比较
从表三可以看出,在重庆地区购房者感知到的安全风险因素的排位中,X52、X57和X58这三个因素两两之间不存在显著差异;X53和X54两个因素之间不存在显著差异;X55和X56之间不存在显著差异;而其他风险要素两两之间都是存在显著差异的。
表三 震后重庆地区购房者感知到的安全风险因素配对T检验结果
从表四可以看出,在成都地区购房者感知到的安全风险因素的排位中,X52、X56、X57和X58这四个因素两两之间不存在显著差异;X53和X54两个因素之间也不存在显著差异;X55和X56这两个因素之间不存在显著差异;而其他风险要素两两之间都是存在显著差异的。
表四 震后成都地区购房者感知到的安全风险因素配对T检验结果
由此,根据各个安全风险因素的重要性和排序的差异性本研究可以得到成渝购房者感知到的安全风险构面,如表五所示。
表五 震后成渝购房者感知到的安全风险构面
十、 结论
1、震后成渝购房者对决策因素的重要性意见倾向一致,但各自对决策因素的重要性排序不同。这可能与成渝地区的文化差异、地理环境、城市人群性格等有关。但是本研究未涉及此类议题,因此不能说明原因。
2、震后成渝购房者都把住宅建筑安全放在了第一位,说明了两地区购房者对该因素都很重视。
3、成渝购房者对各个安全风险因素的重要性意见倾向一致,对各安全风险因素的重要性排序不存在显著差异。
4、成渝购房者感知到的安全风险构面(见表五)是很接近的,两者的区别仅在于重庆购房者把X52、X57、X58这三个风险因素放在了第四层次,导致这种区别的原因可能在于重庆地区先天的地理环境:重庆地处山区,用地紧张,人口密集、建筑多为高层建筑。