哈尔滨商业大学
数学实验报告
实验题目:___用SPSS软件实现多元线性回归分析___
姓 名:____张彦琛____ 学号:_201214390009__
专 业:________数学与应用数学_______________
日 期:________20##-10-27___________________
一、实验目的
用SPSS软件来实现多元线性回归分析及其应用。
二、实验内容
水泥凝固时放出的热量Y与水泥中的四种化学成分x1,x2,x3,x4有关,今测得一组数据如下,试用多元回归分析的方法建立模型。
三、实验步骤及结论
(一)实验步骤
把实验所用数据从Word文档复制到Excel,并进一步导入到SPSS数据文件中进行回归分析。选择菜单“分析—>回归—>线性”,为了解决多重共线性问题,采用逐步回归法。
(二)实验结论
表一:
表一显示了用逐步回归法得到了两个回归模型的拟合情况。由表可知,引入x4得到模型1,模型1的R方为0.675,调整R方为0.645,x4对y影响显著。同时又引入x1得到模型2,模型2的R方为0.972,调整R方为0.967,x4,x1对y影响最为显著。由0.675<0.972,0.645<0.967,且接近1,说明模型的拟合效果很好。
表二:
表二给出了两个回归模型的方差分析及检验结果。模型1的F值为22.799,Sig.值为0.001<0.05。模型2的F值为176.627,Sig.值为000<0.05。模型1,2都通过F检验,可见模型1与模型2在整体上都是显著的。
表三:
表三给出了回归模型的非标准化估计系数、标准化估计系数、系数的显著性检验结果以及共线性统计量的方差膨胀因子VIF。在模型1,2中,对应t统计量的Sig.的值均小于0.05,则说明每个系数对y的影响是显著的。共线性统计量中VIF<10,则克服了共线性的影响。模型1,2都通过了统计显著性检验,由表可得两个回归模型。
模型1:y=117.568-0.738x4
模型2:y=103.097+1.440x1-0.614x4
四、心得体会
1. 通过这次上机实验,我学会了用SPSS软件来实现多元线性回归分析,用所学的来解决实际问题。
2.通过老师的讲解,学会了如何操作SPSS软件,知道如何分析所得到的实验结果,读懂实验表格。
3.实际生活中很多的问题都会用到多元回归分析模型,因此应该充分了解多元回归分析的思想,将实际问题进行数字化,建立正确的模型。
第二篇:基于SPSS软件与多元线性回归分析理论的分_省略_析儿童血液必需元素与血红蛋白浓
信息技术与信息化
研究与探讨
基于SPSS软件与多元线性回归分析理论的分析
????分析儿童血液必需元素与血红蛋白浓度的相关关系
TheAnalysisBasedonStatisticSoftwareSPSSandMultipleLinearRegressionAanalysis
魏志静*?刘希玉?赵庆祯?井?源*
*
WEIZhi?jing?LIUXi?yu?ZHAOQing?zhen?JING?Yuan
摘?要
?基于多元线性回归分析的理论和方法,应用统计软件SPSS对儿童血液中血红蛋白含量和钙元素、铁元素、铜元素含量进行统计分析,得出了结论如下:钙元素对儿童血红蛋白浓度存在显著性差异,存在负相关性;铁元素对儿童血红蛋白浓度存在显著性差异,存在正相关性;而铜元素对儿童血红蛋白浓度不存在显著性差异。
关键词
?SPSS软件?多元线性回归?方差分析
??Abstract?Tostudytherelationbetweenthecontentofhemoglobinandcalcium,ironandcupruminchildren sblood,weusemultiplelinearregressionanalysis.Theconclusionshowswhetheritisdistinctdifferentfromdifferentes?
sentialchemicalelementandthecertainrelationbetweenthem.
Keywords?StatisticalPackagefortheSocialScience?Multiplelinearregressionanalysis?Analysisofvariation
??
素的含量的测量结果进行换算整理,得出儿童每100毫升血液中血红蛋白与钙、铁、铜元素的含量,并绘制表格。数据表如表1所示。
表1?血红蛋白与钙、铁、铜必需元素含量(血红蛋白单位为g;钙、铁、铜元素单位为ug)
case123xxxxxxxxxxxx31415161xxxxxxxxxxxx24252627282930
y7.007.257.507.758.008.258.508.759.009.259.509.7510.0010.2510.5010.7511.0011.2511.5011.7512.0012.2512.5012.7513.0013.2513.5013.7514.0014.25
ca76.9073.9966.5055.9965.4950.4053.7660.9950.0052.3452.3049.1563.4370.1655.3372.4669.7660.3461.4555.1061.4287.3555.0845.0273.5263.4355.2154.1665.0060.01
fe295.30313.00350.40284.00313.00293.00293.10260.00331.21388.60326.43343.00384.48410.00446.00440.01420.06383.31449.01406.02395.68454.26450.06410.63470.12446.58451.02453.00471.12458.00
cu0.8401.1540.7001.4001.0341.0441.3221.1970.9001.0230.8230.9260.8691.1901.1921.2101.3610.9151.3801.3001.1421.7711.0120.8891.6521.2301.0181.2201.2181.000
1?引言
人体必需元素分宏量元素与微量元素两种。这些元素在人体内保持平衡状态,一旦缺乏或过量,平衡就受到破坏,进而影响身体健康。而婴幼儿是人生中必需元素变化(缺乏或过剩)最敏感的时期,它与疾病的发生与发展息息相关。随着医疗水平的不断提高,必需元素与人体健康的关系得到了认识,人们更加关心补充必需元素。目前,很多家长都在给孩子补钙、锌、铁等元素,那么这些必需元素与儿童身体健康有怎样的关系?是不是在人体内含量越多越好呢?对于这一系列问题,现搜集数据,基于多元线性回归分析的理论和方法,用SPSS软件对儿童体内某几种必需元素与血红蛋白浓度的关系进行了科学分析。分析结果对医学工作者做出更可靠的诊断有很大帮助。
2?数据获取
目前我国的各级医疗保健单位,尤其是妇幼保健单位、儿童医院、综合医院等,已经将人体元素(铅、锌、铜、钙、镁、铁等)检测作为常规项目。儿童来医院门诊健康检查时抽取的血液,经测定可以得出儿童血液内钙,铁,铜等必需元素含量的数据。从医院搜集数据,数据的真实性和可靠性可以得到保证。因此我们选定山东省济宁市妇女儿童医院作为数据获取单位。
调查总体选取年龄1~13岁儿童的40微升的全血。采用分层抽样法,根据血红蛋白含量值把样本分成若干群,然后在群的内部进行简单随机抽样,在总体中抽取30个样本进行分析研究。人体必需元素选取了具有代表性的宏量元素钙和微量元素铁、铜,然后对儿童血红蛋白与钙、铁、铜元*山东师范大学信息管理学院?济南?250014**山东省济宁市公安消防支队?272100
?20xx年第2期107
研究与探讨
3?分析方法
信息技术与信息化
表2?进入模型的变量说明表VariablesEntered/Removedb
Model1
VariablesEnteredVariablesRemovedMethodEnter
多元统计分析是数理统计的一个分支。它研究如何有效地整理和分析受随机影响的数据,并对所考察的问题作出推断或预测。多元统计分析一般不对数据作统计模型假设,而直接从实际出发,考察和分析大量数据的结构和特征,从中提取主要而准确的信息,能帮助我们正确认识事物客观存在的统计规律。在实际生活中,某个现象的发生或某种结果的得出往往与其他某个或某些因素有关,但这种关系又难以从机理上给出准确的定量描述,只是从数据上可以看出有!有关的趋势?。线性回归分析可以用来研究具有这种特征的变量之间的相关关系,它假设因变量与自变量之间为线性关系,用一定的线性回归模型来拟合因变量和自变量的数据,并通过确定模型参数来得到回归方程,然后可以通过此回归方程分析变量之间的相关关系。现在我们需要研究儿童体内的钙、铁、铜必需元素与血红蛋白浓度的相关关系,所以采用多元线性回归来解决。
SPSS(StatisticalPackagefortheSocialScience,社会学统计软件包)是国际上著名的通用统计软件之一。SPSS提供一个使初级用户易于使用、使熟练用户更方便地应用统计分析的用户界面。简单的菜单和交互式对话框使复杂的分析成为可能,而不需要学习语法编程操作,是我们用来进行测试分析的理想工具。它不仅适用于社会科学,同样可应用于经济学、心理学、医学等领域。本文中数据的分析处理就是借助于SPSS实现的。
??a.Allrequestedvariablesentered.??b.Dependentvariable:血红蛋白g
??表2说明了因变量和自变量及自变量进入方程的情况。
表3?模型总体参数表
ModelSummary
Model1
R
RSquare
AdjustedRSquare0.799
Std.ErroroftheEstimate0.98564
0.8200.906a
??a.Predictors:(Constant),铜含量ug,铁含量ug,钙含量ug??从表3可以看出,相关系数R为0.906,说明自变量与因变量之间有比较好的相关性。决定系数RSquare为0.820(RSquare反映出总体回归效果,越接近1越好。),即在因变量的变异中,有82.0%可由自变量的变化来解释。
表4?回归方差分析表
ANOVAb
Model
Sumof
Squares
df32629
MeanSquare38.4030.971
F39.530
Sig0.00a
1?Regression115.210Residual25.259Total140.469
??a.predictors:(Constant),铜含量ug,铁含量ug,钙含量ug
b.DependentVariable:血红蛋白g
??表4是使用方差分析AnalysisofVariance对整个回归方程作显著性检验,其中F=39.530,P=0.000,差异有显著性意义,即此回归方程有必要成立。
4?分析过程
4.1?进行全回归
利用SPSS软件,经计算得到统计结果如下:
表5?回归系数及显著性检验表
Coefficientsa
Unstandardixed
Model
B
1?(Constant)钙含量ug铁含量ug铜含量ug
1.5250.0570.0291.042
Coefficients
Std.Error1.4770.0210.0030.888
-0.2480.8830.114StandardizedCoefficientsBeta
1.033-2.6629.9971.173
0.3110.0130.0000.251
t
Sig
LowerBound-1.511-0.1000.023-0.784
95%ConfidenceIntervalfor
B
UpperBound
4561-0.0130.0362.868
??a.DependentVariable:血红蛋白g
??表5是用方差分析对每个因变量做偏回归分析。是关于回归系数及显著性检验的计算结果。说明如下:
表中,常数项的t的显著性概率为0.311>0.05,表示常数项与0没有显著性差异,表明常数项不应出现在方程中。
钙含量的t的显著性概率为0.013<0.05,表示钙含量的系数与0有显著性差异,钙含量应当作为解释变量出现在方程中。
铁含量的t的显著性概率为0.000<0.05,表示铁含量的
系数与0有显著性差异,铁含量应当作为解释变量出现在方程中。
铜含量的t的显著性概率为0.251>0.05,表示铜含量的系数与0没有显著性差异,表明铜含量不应作为解释变量出现在方程中。
由此可见,钙含量和铁含量可以作为解释变量存在于方程中来解释血红蛋白含量的变化,而铜含量应该剔除。4.2?将铜含量从!解释变量?中剔除
108?20xx年第2期
信息技术与信息化
再次运行SPSS,得出结果。两次统计结果的区别在于:a.自变量减少一个!铜含量?;
b.RSquare值由0.820变为0.811,可见去掉!铜元素?以后,线性回归方程中的自变量对因变量的影响变化不大;
c.F值由原来的39.530上升为57.803.F值越大越好,表明整体回归效果更佳;
d.常数项的t的显著性概率为0.269>0.05,表示常数项与0没有显著性差异,表明常数项不应出现在方程中。4.3?采用标准回归方程及其系数,得出多元线性回归方程
这里需要指出的是,有常数项与无常数项是两种不同的数学模型,其决定系数的值不能作简单的比较。究竟哪个回归方程更合适,必须把它们放到医学的实际中检验,才能得出正确的结论。实际工作中,是否保留常数项,由医学原理来决定[3]。这里我们应该采用不带常数项的方程来研究,故多元线性回归方程为:
Z=-0.202X+0.914Y??(置信系数取a=0.05)其中,Z表示儿童每100毫升血中的血红蛋白的含量,单位为g;
X表示儿童每100毫升血中钙元素的含量,单位为ug;Y表示儿童每100毫升血中铁元素的含量,单位为ug。
研究与探讨
5?结论
基于多元线性回归分析的理论和方法,应用统计软件SPSS对儿童血液中血红蛋白含量和钙元素、铁元素、铜元素含量进行统计分析。结果表明,铁元素含量与血红蛋白含量存在正相关性,而钙元素含量与血红蛋白含量存在负相关性。所以当人体内血红蛋白浓度偏低时,需要补充铁元素;铜元素没有显著影响;如果此时摄入过多钙元素,会造成血红蛋白浓度更低,有害而无益。
参考文献:
[1]?孔祥和,尹洪臣等主编.微量元素与小儿疾病[M].北
京:人民卫生出版社,1989:10.
[2]?杨虹,陆崇义,罗荔等.广西运动员贫血和营养状况的
研究.营养学报,1991,3(3).
[3]?马斌荣.SPSSFORWINDOWS在医学统计中的应用北
京:科学出版社,2003.132~137.
[4]?GoyerRA.Toxicandessentialmetalinteractions[J].Annu
RevNutr,1997,17:37~50.
[5]?马庆国.管理统计[M].北京:科学出版社,2003,267~274.??[作者简介]?魏志静(1981~),女,山东省济宁市。主要研究方向:分形,遗传算法。
(收稿日期:2005?08?01)
(上接第52页)
又有实际应用价值的研究课题。在本文中根据原始图像的大小,采用小波分解提取人脸的低频子带图像,在保留大部分识别信息的前提下,减少了后续处理的运算量。采用ICA
方法可以提取信号的高阶相关特性,比较适合于特征提取,结果表明此方法优于PCA方法,而BP神经网络具有较强的自适应性和良好的分类识别能力,在分类方面优于常用的最近邻距离分类器。因此,采用ICA与BP网络相结合的方法在人脸识别中取得了较好的识别效果。
pendentcomponentanalysis[J].IEEETrans.OnNeuralNet?works,1999,10(3):626?634.
[4]?孟继成,杨万麟.独立分量分析在模式识别中的应用[J].计算机应用,2004,24(8):28?31.
[5]?戚德虎,康继昌.BP神经网络的设计[J].计算机工程
与设计,1998,19(2):48?50.
??[作者简介]?韩柯(1979~),男,南京邮电大学通信与信息工程学院,博士研究生。主要研究方向:图像处理、多媒体通信与模式识别等。朱秀昌(1947~),男,南京邮电大学通信与信息工程学院教授,博士生导师。主要研究方向:图像通信和图像处理等。
王汇源(1958~),男,山东大学信息科学与工程学院教授,硕士生导师。主要研究方向:图像处理、信号处理、图像通信、模式识别等。
(收稿日期:2005?12?05)
参考文献:
[1]?黄贤武,仲兴荣,王加俊.基于WT?PCA的自适应神经
网络人脸识别方法.计算机应用,2003,23(6):1?4.[2]?CardosoJ?F.Blindsignalseparation:statisticalprinciples
[J].ProceedingsoftheIEEE,1998,86(10):2009?2025.[3]?Hyv#arinenA.Fastandrobustfixed?pointalgorithmsforinde?
?20xx年第2期109