《网络课程设计与开发》网络课程设计方案
1.浏览以下课件,理解SPSS的应用。
Spss for windows.ppt
数据资料变量的统计与推断.pdf
方差分析.pdf
3. 尝试用上面所学的知识分析问卷。
相关数据:四川省青川教育信息化建设与应用情况调查问卷.doc
灾区教师培训-数据总表.xlsx
第二篇:spss总结
SPSS
1.数据排列:数据—→排列个案(可以有一级二级)
2.纵向合并数据文件(添加个案):数据—→合并文件—→添加个案
3.横向合并数据文件(添加变量):数据—→合并文件—→添加变量
4.变量计算(通过旧的变量添加新变量,可排除个案,tips:如果是字符注意加引号,如:zgh="22x"):转换—→计算变量
5.分类求均值:数据—→分类汇总
6.筛选特定变量到新数据文件:数据—→选择个案
7.数值型数据分组覆盖原值(就是将数值型换成1.2.3分组)在:转换—→重新编码为相同变量—→旧值和新值。填写旧值再填写新值 按添加 注意范围的填写lowest thru到 thru highest
8.频数分布表:分析—→描述统计—→频率(图表里有条形图、饼图、直方图。)注意:可以同时选很多变量,都会一一统计其频率,在不同的图上。
*******************************
? 直方图(有正态分布线)与条形图有以下几点区别:
(1)条形图是用条形的长度(横置时)表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。
(2)由于分组数据具有连续性,直方图的各矩形通常是连续排列,而条形图则是分开排列。
(3)条形图主要用于展示分类数据,而直方图则主要用于展示数值型数据。
********************************
9.分布特征和描述统计量:分析—→描述统计—→描述
选项中勾选:均值、标准差(越大,变量值之间差异越大,距均值的离散趋势越大)、最小值、最大值(两者相减得全距,全距大的比全距小的数据分散)、均值的标准误、峰度(大于零是尖峰分布,比正态分布更陡峭。小于零是平峰分布,比正态分布平缓)
*偏度(>0正偏、右偏,长尾在右边。<0负偏、左偏。)
【分析时写明:集中趋势(均值,中位数)、离散程度、形状】
10.二维交叉列联表(检验是否有关联):分析—→描述统计—→交叉表 单元格中勾选百分比三项
11.交叉分组,卡方检验:分析—→描述统计—→交叉表 统计量中勾选“卡方” 原假设一般为没有关系,也就是不同XX下BB是一样(致)的。若p值(pearson卡方 渐进sig双侧值)小于0.05则拒绝,认为不一致。
【解题步骤】1.假设检验,原假设没关联,备择假设:2.卡方统计量p值 3.结论
12.是否符合标准:分析—→比较均值—→单样本t检验(记得填检验值)注意:可能需要分组,原假设是:总体均值与检验值之间不存在显著性差异(也就是一致),把带等号的放在原假设里。只有当p<0.05时拒绝原假设
********************************
分组:数据→拆分文件→选择“比较组”→将分类依据放入框中→确定(此处看不出效果)
然后再用“单样本t检验”
********************************
13.前后对比:分析—→比较均值—→配对样本t检验(左前右后)注意:原假设是两总体均值无显著性差异,就是H0:a1-a2=0
SPSS
********************************
独立样本t检验 与 配对样本t检验
独立样本的T检验过程用于检验两个独立样本是否来自具有相同均值的总体,相当于检验两个正态分布总体的均值是否相等,即检验假设Ho:μ1=μ2是否成立,此检验以T分布为理论基础.
配对样本用于检验两个相关的样本是否来自具有相同均值的正态总体.即检验假设Ho:μ=μ1-μ2=0,实质就是检验差值的均值和零均值之间差异的显著性.此检验任然是以T分布为理论基础
1)假如人造纤维缩水后能够复原。
*如果同一根人造纤维,在60度测试后再在80度中测试,使用配对检验。
*如果同一批人造纤维的样品,一半测试60度,一半测试80度,则使用独立检验。
2)假设该产品一个100件
*如果两名人员对这100件都测量了一次,那么可以把数据对应起来做配对检验。
*如果每人各随机测量了其中的50件,那么做独立检验。
两种检验的区别在于,配对检验是基于对同一样本中相同个体的多次测量数据的检验;独立检验是对于不同样本的个体的测量数据。
********************************
14.x对y的影响(单因素方差分析):分析—→比较均值—→单因素ANOVA(因子是x)
15.几个x对y的影响(多因素方差分析):分析—→一般线性模型—→单变量(固定因子是x)注意:零假设是“各控制变量不同水平下观测变量各总体的均值无显著差异”必须在两者交互作用影响不显著的前提下进行。还可以添加“协变量”影响结果
【建立不饱和】 指的是不算交互作用的检验,可以通过选择“模型”→主效应→两个放在右侧,到达目的
**当误差值为0,也就是sse为0时,F值无法检验。**
**一般把不受人为控制的控制因素,或者数值型变量作为协变量,分析中不需要写协变量的假设,只是作为参考,所以一般这类假设检验就是写主因素(单个)以及主因素之间的交互作用(注意三个以上交互作用分:ab,bc,abc)**
16.散点图:图形—→旧对话框—→散点/点状—→简单分布 选择x轴、y轴
17.矩阵散点图(相关分析):图形—→旧对话框—→散点/点状—→矩阵分布 要检验的变量都放在“矩阵变量”里
另外可以通过:分析—→相关—→双变量 将所有变量放入“变量”中
零假设:不存在线性相关,。 当显著性(双侧)小于0.01时,拒绝相关系数的零假设,认为两总体存在线性关系。
18.最佳曲线模型:分析—→回归—→曲线估计 因变量、(自)变量、个案标签(一般为年份)都填好。模型能勾都勾选。
出来的表格看模型汇总里的R方值,也就是其拟合优度,接近1拟合优度越好。观测值越接近那条曲线。常数是β0,b1值是β1以此类推。注意这些回归系数是否与实际情况相符合,如果不符合就不能采纳此模型。
还要看系数能否通过检验(sig是否<0.02)
具体模型公式看书:P207-208
19.线性回归分析(多自变量,需要筛选的):分析—→回归—→线性
方法:【进入】所选变量都放入回归方程里不筛选
【逐步】逐步筛选策略(最优方程用这个)
**做线性回归,有一个步骤是回归变量的选择,在开始回归之前,如果已经对各项因素很熟悉了,基本确定影响因素,那么可以选“进入”,如果对因素不甚了解,对其主次顺序还不太明确时,建议用“逐步”的方法;另外,逐步的方法可以对回归方程进行优化,所以,最终得到的方程一般来讲是最优的.* *
B是系数