统计分析报告的撰写
从程序上来讲,撰写统计分析分为五个部分:选题、拟定提纲、搜集资料和数据、分析研究 归纳研究结论和提出解决问题的思路。
选题环节:一是选题要有现实意义;二是选题要有资料支撑,主要是数据支撑。
拟定提纲环节:提纲要紧扣主题,而且提纲可以在研究的过程中进行适当调整,以使研究更加深入更加可行。
搜集资料和数据环节:首先要充分利用现有资料,注意资料的可行性,借鉴别人研究成果和数据要注明出处。
分析研究环节:注意运用适当的方法,体现出研究的层次性和逻辑性。
归纳研究结论和提出解决问题思路环节:注意归纳的研究结论要和分析研究的结果一致;提出的解决思路要和归纳出的研究结论相一致,并且解决思路要具有可行性。
从展现研究成果的角度来讲,可以分为:选定研究题目、引出研究问题并阐述其重要性、选定研究视角和方法、说明数据来源、问题分析、问题成因的描述性分析、问题成因的实证分析、研究结论及启示等8个部分。
一、选定研究题目
研究题目要突出自己的研究特色(问题、观察问题的视角、研究方法、研究结果)、简练、醒目、能够引起人的强烈兴趣。
二、引出研究问题并阐述其重要性
首先,我们应该明确研究的具体问题是什么,譬如是研究城乡居民收入差距还是农户之间的收入差距,还是农户的土地流转等等问题,这一点要明确。
其次,简要阐述研究问题的重要性,这种重要性主要体现在现实意义上,读者只会对有重要意义的问题分析感兴趣。
最后,提出研究问题并阐述其重要性时要注意表达技巧。
第一,提出问题要简练、明确但不能太直白,给人一种突兀感。提出研究问题之前要有语言铺垫,这种铺垫可以是阐述问题产生的背景,也可是与研究问题密切相关的经济现象,也可是对取得成就的肯定,等等,这都要根据掌握的知识以及研究的问题所定。
第二,铺垫语和提出问题的语句中间尽量使用具有转承含义的词。这种表达方式的一个好处是,能够引起人的注意力。一般情况下,人们在看文章、听人讲话时,往往特别关注转承词后面的内容。这样,运用转承词可以再次把人们的注意力聚焦起来,聚焦到你所要研究的问题上去。
第三,用数据或者经济理论或逻辑阐述问题的重要性但不能太啰嗦,不要过于展开,起到说明问题的作用即可,这不是分析报告的重点内容,其作用只是引起读者的注意力详尽的分析在后面的分析研究部分。
譬如,对农户收入差距的研究,提出问题的时候,并没有很直白地说:我研究的问题是“农户之间的收入差距”,这样一种提法就很突兀,就感觉我们大清早刚出门迎头就是一座大山挡在前面。
换种方式,如表述为
近年来,随着农业经济的稳步发展,农民收入呈现持续增长态势。然而[lidx1] ,农户之间的收入差距也呈现出逐渐拉大的趋势。对河南4200个农户进行的抽样调查显示(见表1),最高收入组与最低收入组农户家庭人均纯收入的差额由20##年的5139.25元,扩大到20##年的6604.02元。[lidx2] 农户收入差距过大不仅会影响农村社会的稳定,制约农村发展,也不利于扩大农村消费,实现“扩消费保增长”的政策意图[lidx3] 。
譬如在“河南农户土地流转的影响因素”这一课题中,也是采用了类似聚焦问题的方法。文章开头没有直接说明 “本论文研究的主要问题是影响河南农户土地流转的因素”,而是表达为
“土地是重要的生产要素,更是农业最基本的生产资料。农村土地承包经营权流转,作为农业生产要素流动和土地市场交易的重要内容和特殊形式,同耕地保护和国家粮食安全,同农业要素资源配置效率提高、农村社会经济的发展及农民权益的实现等,都存在密切关系。[lidx4] 尽管中央一再强调,家庭承包经营是我国农村一项基本经济制度,允许土地流转,与农业规模经营并不矛盾。十七大报告再次强调“按照依法自愿有偿原则,健全土地承包经营权流转市场,有条件的地方可以发展多种形式的适度规模经营。”今年出台的《中华人民共和国物权法》还对土地承包经营权进行了专章论述,确立其物权性质,指出“土地承包经营权人依照农村土地承包法的规定,有权将土地承包经营权采取转包、互换、转让等方式流转。”[lidx5] 然而[lidx6] ,总体上看,全国土地流转率仍然较低,而且地区之间呈现较大差异。中国民盟估计全国农村土地流转率不会超过10%(中国民主同盟,2008);发达地区较高,如浙江省19.8%(浙江省农业厅经管处,2007),江苏省15.3%(江苏农业网,2007);但内陆欠发达地区的土地流转率较低,如重庆市10.89%(中国发展门户网,2007),农业大省河南仅2.3%(李亚彪,2007)。[lidx7] 可见,探讨土流转动因及其制约因素,具有重要理论和实践意义。”
这种表达比较长,因为这是个研究课题。如果是一个几千字的简短分析报告的话,还可以精简。分析这段话包含三层意思:第一,土地流转是实现资源优化配置的一种重要方式;第二,国家是鼓励土地流转的;第三,实际上,土地流转率很低,而且地区差异较大。正是基于这三层意思,我们进行对土地流转影响因素的研究,以此来为政府制定政策进一步加快土地流转提供科学依据。
三、选定研究视角和方法
(一)明确研究视角
也即从哪一方面去看问题。好比爬山,你决定要从山的哪个方向上山,方向不同,花费的力气不同,看到的风景不同,爬山的感受也会有所不同。视角决定分析方法,决定你的分析结论,最终决定你的观点及提出的解决问题的思路,所以选择一个正确的观察视角,一个独特的观察视角很重要。同时,这种观察视角要在文章里面交代清楚,这样使人更好的理解你的文章。同时,这也方便别人把你的分析报告和别的就同一问题的分析报告相比较。分析经济问题就像盲人摸象,一个人只能看到一个侧面,高明的人至多是比别人多个角度,或者找到一个独特的视角,没有人能够观察到一个问题的所有方面。
在“农户土地流转”这个课题里,就强调了研究农户土地流转影响因素的三个不同于别人的视角。
再譬如研究农户收入差异,就有很多角度,如高中低收入组农户之间的收入差异,不同地区农户之间的收入差异,不同从业类型农户的收入差异等。
如何选择观察视角呢?
一是要瞄准你分析的问题。选择观察视角不能脱离你要实现的目标,譬如爬山,本来你是要爬A山,你却瞄准B山选择了一个方向,怎么实现目标?如要分析农户的收入差异,文章中却用更多的笔墨来分析城乡居民的收入差异,这就偏离目标了,这种偏离比较大,还容易区分,但偏离于分析农户收入增长问题的现象却是普遍存在的。二是基于可能得到的数据资源或经验事实,提出了一个很好的观察视角,也从来没有类似分析,但是你没有相关的数据和经验事实,也没有办法去分析,所以数据资源,或者是经验事实是基础,当然纯粹的理论分析是一回事情。三是要基于掌握的或经过一定努力可以掌握的分析方法,有数据有视角还得有分析方法,掌握不了相关分析方法仍然无法进行分析研究因而,我们在选定观察视角的时候一定要充分考虑到分析的问题、可获得的数据和方法。
(二)明确研究方法
研究方法总体上可分为定性和定量分析,一般情况下,我们都是定性和定量相结合,趋势是越来越偏重于定量分析,而且越来越偏重于用复杂的统计分析技术,譬如建立计量经济学模型,实验模拟等等。目前对于我们来说,重点是掌握一般的统计分析和简单的计量经济模型。
四、说明数据来源
经济分析类文章离不开数据,我们在进行正式分析之前,一定要把数据来源说清楚,这既是对数据收集者劳动成果的尊重,也是提高论文可信度的一种方式,如果数据来源于统计年鉴,我们说明使用的数据来源于哪些统计年鉴即可,如果来源于抽样调查或重点调查,要说明抽样方法、调查时间、样本分布、样本总体状况等。
以上四个部分,都是展开正式分析之前的内容,属于引言部分,尽管讲了那么多,但反映到写的分析报告上却是很少的一部分。但这一部分很重要。是你的文章给人的第一印象。对该部分的论述一定要简练、清晰。
五、问题分析——问题存在的状态
对问题本身的分析是分析问题成因的基础,只有认清了所研究问题的本质,才能够更好分析问题产生的原因。既然我们的分析是以定量为主,首先就要创建合适的指标体系来反映问题,我们对问题的分析也基于选择的指标体系,譬如分析农户收入差距,你选择是总收入还是纯收入,是收入的绝对水平,还是收入的增长率等等。反映问题的指标有单一指标也有综合指标,有原始指标也有计算后的指标,这里不谈指标的分类,关键问题是你选择的指标要能够充分表达你所研究的问题,并便于下面对问题成因的分析。其次,我们应分析问题的状态,指问题在一定时间、地点、条件下的规模、结构、水平、速度及各种关系。对问题状态的分析主要采用分组比较、不同背景条件下的比较、趋势描述的方法。
譬如研究农户土地流转的影响因素,该论文从土地流转的总体状况、处于不同地形农户的土地流转状况、土地流转的区域特征等方面来描述了目前河南农户土地流转是一种什么状态。这种对问题存在状态的分析也是为以后对问题成因的分析奠定基础,尤其是对于建立计量经济模型更为重要,建立计量经济模型首先要充分考虑问题产生的背景条件,尽量把问题产生的背景条件以自变量的形式纳入到模型中去,以提高模型的解释力。
譬如,研究不同从业类型农户收入差异形成的原因,首先,就要分析,从不同从业类型农户这个角度看,他们的收入差异是否存在差异,这种差异是如何表现的,是逐渐恶化,还是趋于收敛?收入的差异主要体现在哪方面的差异?是工资性收入差异还是家庭经营收入差异?从事什么行业的农户收入高,从事什么行业的农户收入低?
对问题的描述性分析,强调两点:一是要紧紧围绕问题本身进行分析,或是问题本身的变化趋势,或是问题产生的背景条件。二是要立足于观察视角,从你的观察视角看不到的问题的其他方面不要去论述。譬如对粮食主产区农户收入差异的研究,我立足的是不同从业类型农户的收入差异,这个时候你就不要去比较不同地区之间农户的收入差异,但是你可以去比较不同地区状态下不同从业类型农户的收入差异。
六、问题成因的描述性分析:问题与影响因素的相关性
社会经济现象是在错综复杂的相互联系中存在和发展的,要分析问题产生的原因,发现其中的规律,必须首先根据经济理论和实践经验找出与所研究问题有联系、可能对其产生影响的因素。然后构建指标来表达问题和影响问题的因素,在统计分析中这些指标统称为变量。搞清楚变量之间的关系,是我们分析问题产生的原因,发现其中规律的前提。
描述经济现象之间的关系,是建立计量经济模型,实证分析变量之间关系的基础。一方面,对变量之间的关系进行描述性分析能够使我们对问题产生的原因有一个直观的判断,另一方面也为我们选择变量建立计量经济模型提供依据。选定了表达问题及其影响因素的指标后,对问题及其影响因素进行描述性统计分析的关键就是采用什么方法来量化二者之间的关系了。
图示法:运用折线图的方法描绘变量的变化趋势。这种方法适合于观察单位较多,连续变化的变量。
相关性分析:计算变量的相关度,根据相关度的大小来判断变量之间的紧密程度。适合于各种类型的变量。
比较分析:对一个变量进行分组,比较在不同分组内另一个变量的状态,如绝对水平、相对水平、均值等。
七、问题成因的实证分析
实证分析就是通过计量经济模型进一步量化自变量对因变量的影响程度。
(一)为什么还要通过计量经济学模型进一步实证分析
描述性分析只是给出了变量之间的相关程度,但并没有给出影响的方向,也没有给出影响的程度。
(二)计量经济模型的基本知识
研究一个随机变量与一个(或几个)可控变量之间相关关系的统计方法成为回归分析,利用回归分析这种方法,可以从一个(或几个)可控变量的取值去估计作为因变量的一个随机变量的取值,也可以得到可控变量对因变量的影响程度。回归分析包括四个方面的内容:选择变量、确定模型、判别模型是否有有效,并识别影响显著的自变量、根据模型进行预测和分析。
1.变量选择
变量选择的依据是经济理论、经验常识和变量之间关系的描述性分析
2.模型形式选择
模型形式选择依据在很大程度上是一种经验性的东西。如果说有依据,也就是你所重点关注的自变量和因变量之间的关系形式,以及比较不同模型形式的拟合度。
3.模型估计
一般采用最小二乘法(OLS)
4.模型检验——模型效果检验
R值、F值、自相关、异方差、共线性、t值
5.估计结果解释
八、如何写研究结论及解决问题思路
研究结论要和分析结果一致、政策建议要和研究结论一致,并注意解决问题思路的可行性
从展现研究成果的范式来讲应注意两点:
一是要有层次感,文章结构要层次分明,
二是要有逻辑性,文章结构的布局要遵循一定的逻辑
写分析报告应遵循的一般范式是:
文章标题:醒目、独特、体现论文特点
引言[lidx8] :简练、清楚
提出问题及阐述问题重要性;介绍研究视角、研究方法及数据来源。
一、问题现状[lidx9]
(一)
(二)
…
二、问题成因的描述性分析[lidx10]
(一)
(二)
…
三、问题成因的实证分析[lidx11]
(一)变量选择
(二)模型形式
(三)模型估计及检验
(四)模型结果分析
四、研究结论及启示
[lidx1]前面阐述农民收入持续增长,这里,话锋一转就跳到了农户收入差距扩大这一问题上
[lidx2]问题存在的依据,数据分析
[lidx3]问题的重要性
[lidx4],土地本身是一种重要的生产要素,土地流转是一件能够实现资源优化配置,利国利民的好事情
[lidx5]国家允许土地流转,也不存在法律上的障碍
[lidx6]转折,引起注意
[lidx7]土地流转率仍然很低,这里就给出我们一个概念,土地流转是一件于国于民都很好的事情,但是这么好的事情,为什么做的人少呢,该课题研究的正是这个问题
[lidx8]可以不明确标出“引言”,只用一段话或两段话把这些内容表现出来,具体表现方法可以参考前面讲的二、三、四部分
[lidx9]参见前面第五部分的第(一)部分
[lidx10]参见前面第五部分的第(二)部分
[lidx11]参见前面的第六部分