20xx-20xx赛季NBA球队战绩影响因素的统计建模分析

时间:2024.5.13

20##-2009赛季NBA球队战绩

影响因素的统计建模分析

许世杰  林炳灿  肖林

20##级统计学专业本科生

厦门大学经济学院计划统计系,厦门361005

摘要: 作为全球最具影响力的篮球俱乐部赛事,NBA每个赛季的比赛都吸引了全球众多球迷的眼球,在世界范围内产生了巨大的影响。特别是自姚明入选状元以来,其对中国球迷的影响更是难以估量。作为每一支参赛球队而言,最大的目标就是获得比赛的最终胜利。众所周知,决定每一场比赛结果的因素很多,既有偶然性,但更多的是其必然性。那么是哪些主要的影响因素主导着一个赛季每支参赛球队的最终战绩呢?为此,本文运用一系列统计分析方法(包括主成分分析、聚类分析、非参数检验和回归分析等)对2008-2009赛季NBA参赛球队战绩进行影响因素研究。通过对常规赛的研究发现:(a)尽管篮球是一项集体项目,但球队核心球员对比赛结果的正面影响显著,显示了核心球星在球队中的作用;(b) 球队的常规赛战绩主要受到平均得分、平均犯规数、球队价值、核心球员能力和教练能力等五大因素的显著影响;(c) 通过对主客场比赛引入虚拟变量后建立的回归模型能很好地拟合各种统计数据,验证了确实存在主场优势的结论。通过对季后赛的研究发现:(d) 在(c)中建立的模型中加入替补球员能力和常规赛战绩两种影响因素后拟合的模型才较理想。进一步,我们对常规赛和季后赛的异同点进行了比较分析。最后,论文在总结研究结果的基础上,从NBA的角度对我国CBA的发展和球队建设提出了一些有针对性的建议。

    关键词:NBA;战绩;影响因素;统计建模分析

一、引言

NBA的全称是全美职业篮球大联盟,创办于1946年,已有60多年的历史,现已成为全球领域最职业化、最市场化的大联盟之一。NBA于1987年首次由中央电视台录播进入中国,并且随着姚明、易建联等的相继加入,使得这个世界上最高水平的篮球职业联赛也越来越为中国人所了解和喜爱。近年来,NBA在中国的发展受到众多人们越来越多的关注,其体育文化价值、商业价值等得到了充分的显现。

NBA比赛的看点不仅在于其速度、力量、对抗、激情和联赛中球员高超娴熟的技术、良好的意识、过人的身体素质,还在于NBA科学细致的选秀制度、转会制度、限薪制度等制衡体系保障各球队的实力平均分布,球队与球队间的实力相差不大,没有哪一支球队有绝对的把握一定能战胜另一支球队,比赛的胜负不到哨响难以分出,真如NBA的口号一样“Where Amazing Happen”,奇迹在此发生,NBA魅力无处不在。另外,NBA对规则的一些修改使得比赛的激烈程度有了很大的提高,如其最先实行的24秒、3分线的拉远、3秒区域的扩大、鼓励比赛扣篮、对个人被罚下场的犯规次数增加、以及完全的球员数据统计等都使得其比赛的激烈程度大大提高,进一步增加比赛结果的不确定性。NBA的发展为篮球运动在全球的普及和推广做出了突出的贡献。

球赛越是激烈,结果悬念越大,球迷就越想预测球赛的结果。然而,球迷对球赛结果的预测基本上都基于主观推断,有时还受个人对球队或球员偏好的影响,预测的科学性、准确性往往较差。球队核心球员的作用如何?人们常说的主场优势是否显著存在?究竟是那些因素主要影响球队的战绩?季后赛与常规赛的影响因素是否有所不同?这些都是体育界专业人士和广大球迷关心的热门话题。为此本文在参考了前人研究的基础上,试图充分利用各种统计分析方法对他们进行了较深入的研究。其目的在于通过对NBA的球队战绩影响因素的统计建模分析,发现我国CBA存在的不足,借鉴NBA在这几个方面发展的优势,从而针对当前CBA所存在的不足提出意见和建议,推动CBA更加健康长久地发展。

二、研究现状总结

以笔者所查阅的文献资料来看,目前国内众多外学者对NBA赛事进行过较深入、较全面的研究。

在国外,Chatterjee,Campbell 和Wiseman(1994)对NBA所有球队一个赛季的数据建立统计模型,对球队胜率进行回归分析,发现比赛得分、罚球、篮板和失误在统计上是显著的并且回归系数在各年数据之间都是相对稳定的。Hausman 和Leonard(1997)使用计量经济学方法对NBA赛事明星出场率与其电视收视率、门票收入等进行了相关性研究,得出了正相关的结论。Gandar, Zuber 和 Lamb(2001)等人对NBA博彩市场的主客场优势进行了分析。Leeds和Allmen(2003)在其著作《体育经济学》中对美国职业体育联盟的制衡机制(在书中其称为竞争性平衡)进行了较深入的探讨。Mizak,Stair 和 Rossi(2004)使用胜率标准差、HHI 等指标衡量了各大联盟的竞争性平衡,说明了所使用指标的优缺点,并指出:指标的缺陷不是重要的,重要的是用同一指标观察联盟竞争性平衡的趋势。此外,国外学者还对NBA球员、裁判是否存在种族歧视,工资是否存在差异等各方面进行了研究。

在国内,由于NBA进入中国时间不长,国内的研究并不多。通过对国内NBA比赛问题研究的相关文献的回顾和整理,笔者发现国内有关NBA赛事的研究除了借鉴国外研究成果外,其研究特色归纳起来可分为三类:(a)从市场营销的角度对NBA的市场价值、品牌文化传播和在中国的市场营销等方面对NBA的品牌建设进行剖析;(b) 从制度经济学角度,对NBA的人力制衡、收益制衡及权力制衡三项机制的功能及相关制度的运行原理展开深入研究;(c) 从NBA比赛本身的技术角度,如球赛中冲抢技术、不同位置的球员、球员的攻防能力、球赛赛程安排等方面进行分析研究。参考文献包括:刘素蓉等(2009)考虑背靠背程度、对手强弱度和球队赛程时间安排的间隔度这三个因素建立数学模型对NBA赛程的合理性与有效性进行了研究。吴福珍和王晓军(2009)则是选取其他三个因素,通过Matlab软件对NBA20##——20##年常规赛的1230场赛事的数据进行编程实现,进而对NBA赛程的安排做出科学评价。

尽管这些研究文献较多,但绝大多数是使用文献资料、比较分析、录像观察等方法进行的理论研究,部分也使用了一些较简单的描述性统计方法进行分析,仅有少数使用统计建模方法进行实证分析。由于分析的手段不同、角度不同,尚有许多问题没有涉足,尤其是基于统计建模方法对于NBA比赛胜负的影响因素进行较全面的分析,有待进一步深入。为此本文综合采用定性结合多种统计定量的分析方法,试图较全面地考察NBA比赛胜负的影响因素,从而为我国体育专业人士,特别是CBA的健康发展提供有价值的参考建议。

三、数据来源和指标选择

(一)数据来源

本文涉及20##-2009赛季NBA的以下指标数据:30支球队各自的核心球员的统计评价指标;30支球队的各项平均统计指标;30支球队每队82场比赛的各项统计指标。有关数据分别来自网站:http://www.hoopchina.com/teams/(20##年7月20日);http://www.nba.com/statistics/sortable_team_statistics/sortable1.html(20##年7月23日);http://data.sports.sohu.com/nba/nba_team_warring_total.php?teamid=27(20##年7月24日);http://data.sports.sohu.com/nba/nba_team_info.php?teamid=17(20##年7月26日)。

(二)指标选择

1.30支球队各自的核心球员和统计评价指标选择

球员选择标准主要是综合考虑得分、首发率、上场时间等综合指标;但是,有些球员尽管综合实力很强,由于伤病等原因,出场次数并不是很多,对整个球队的战绩影响不大,因此,此时选择该队出场次数较多的次佳球员进行分析,本文所选择的30支球队各自的核心球员见表1。

表1 30支球队各自的核心球员

由于不同球队的核心球员在场上的角色不同,各类指标之间差异较大,为综合考虑不同角色球员的不同能力,我们选取了能衡量球员各方面能力的12个指标,见表2, 所有指标(出场数除外)均取场均值。其中除了失误和犯规是负指标外,其他指标均是正指标。

表2 衡量球员各方面能力的12个指标

2.30支球队20##-2009赛季的各项平均统计指标

30支球队20##-2009赛季平均指标包括12个正指标和2个负指标。其中正指标分别为:得分(ppg)、篮板(rpg)、抢断(spg)、盖帽(bpg)、助攻(apg)、投篮命中率(fg)、3分球命中率(threeft)、罚球命中率(ft)、球队价值(values)、工资总额(pay)、教练执教能力(coach)和核心球员价值(player);负指标分别为:失误(to)和犯规(foul)。

3.30支球队20##-2009赛季每队82场比赛的各项统计指标

30支球队20##-2009赛季每队82场常规赛的指标与上面的赛季平均指标的指标类型基本一样,增加了主场和客场指标以及净胜分指标,其中主场取2,客场取1,净胜分用所研究队伍的得分减对手得分得到。

由于研究的是每场比赛,因此不取平均值。分析时我们考虑全部可能对比赛结果产生影响的指标,否则可能会出现模型设定误差,使得估计结果出现较大偏差,对于分析过程中得出的不显著变量在分析过程中逐步剔除。

4.进入20##-2009季后赛的16支球队替补球员各项统计指标

替补球员主要指在季后赛中的大部分比赛以替补球员身份出场的球员,每个

球队大概有3-5名替补球员。描述替补球员能力的指标见表3。

表3衡量替补球员各方面能力的14个指标

鉴于季后赛的指标波动性较大的特点,此时使用常规赛指标,数据更稳定。

每支球队替补球员各项指标由各球队所有替补球员各项指标分别累加算得。

5.进入20##-2009季后赛的16支球队季后赛所有比赛各项统计指标

进入20##-2009季后赛的16支球队的季后赛指标包括每场净胜分(result)、福布斯价值(values)、球队的赛季总工资(pay)、教练的执教能力(coach)、球队中核心球员的综合得分(player)、本队常规赛胜率(bsl)、对手常规赛胜率(rival)、替补球员能力(tb)、球队得分(ppg)、助攻数(apg)、篮板数(rpg)、抢断次数(spg)、盖帽次数(bpg)、失误次数(to)和犯规次数(foul)共15个指标。

四、核心球员作用分析

(一)主成分分析

核心球员对各自球队的作用不可忽视,因此在进行球队胜率因素分析之前,先对各队核心球员进行分析,然而衡量球员的指标有很多,各指标之间有可能存在交互影响,故主要采用主成分分析方法对球员进行打分。之后,将对球员的分析结果作为影响球队胜率的变量进行考察,从而得到影响球队胜率的较全面客观的因素。

从各个队伍择一名核心球员,对表1中选定的核心球员的各项统计指标如篮板、得分等12个指标进行主成分分析,用SPSS软件计算每个球员的各类主成分得分,其结果见表4。

表4 核心球员的各项统计指标进行主成分分析的结果

分析表4,我们发现:在第一个特征向量中,出场数、场均时间、投篮、三分球、罚球、助攻、抢断、失误、得分为正指标,总篮板、封盖、犯规为负指标,其中以助攻(0.384)、抢断(0.377)、三分球(0.362)最为显著,可见第一主成分是对后卫、小前锋能力的描述;

在第二个特征向量中,出场数、场均时间、投篮、罚球、总篮板、封盖、抢断、失误、犯规、得分为正指标,三分球、助攻为负指标,其中以投篮(0.453)、封盖(0.409)、罚球(0.365)、总篮板(0.406)最为显著,可见第二主成分是对中锋和大前锋能力的描述;

在第三个特征向量中,出场数、场均时间、投篮、三分球、得分为负指标,其他指标为正指标,其中以失误和出场最为显著,可见第三主成分为各类球员的反向指标,与球员位置关系不大。

由于第三主成分分析价值较低,此时主要分析第一和第二主成分。根据原始指标和特征向量计算各个核心球员的第一、二主成分的得分,结果见下页表5。

由表5可以看出,描述后卫的指标(第一主成分)以克里斯-保罗的得分最多,德维恩-韦德和勒布朗-詹姆斯紧跟其后,而作为中锋的蒂姆-邓肯、德怀特-霍华德、姚明等在这方面则不占优势,排在靠后的位置。描述前锋和中锋的指标(第二主成分)以德维恩-韦德的得分最多,两个主成分得分均很高,说明德维恩-韦德的数据较全面,紧跟其后的是德怀特-霍华德等中锋和大前锋,而数据天王勒布朗-詹姆斯也居于第三位,名副其实。其中作为08-09赛季最抢眼的球星——科比-布莱恩特的两项指标均名列第八,表现算是较全面,但相对德维恩-韦德和勒布朗-詹姆斯并不是很突出,此时一方面是指标的局限性,另一方面也说明球队取得好的战绩核心球员并不一定要表现极其优秀。

作为中国球迷最为关注的球星姚明,在第一主成分排名中排30名,在描述前锋和中锋的指标(第二主成分)的指标中也排名第10位。这些数据显示,一方面,姚明还不是联盟最好的中锋,还需要继续在各方面加强训练;另一方面,有些指标在这里可能没能得到体现,比如尽管姚明封盖能力不是很好,但其凭借其NBA第一高度,给进攻球员于极大的进攻压力,这点也是其防守能力的一大体现。

表5 核心球员的第一和第二主成分的得分

我们发现12个技术指标可以用两个综合指标代替,而综合指标的信息没有损失多少。在此基础上,我们不仅可以算出各球员的主成分得分,而且可以利用线性加权方法,以各主成分的方差贡献率为权数,即按公式:

                                    (1)

其中:为各主成分的方差,各主成分前的权数为主成分的方差贡献率。计算各核心球员的综合得分并据此排名,见表6。

表6 球队核心球员总的得分和排名

主成分得分是综合考虑各个变量和主成分计算而得,从表中可见:第一、二主成分指标最靠前的德维恩-韦德、克里斯-保罗、勒布朗-詹姆斯的综合得分仍然很高而相对来说比较靠后的科比-布莱恩特此时排第四名,可见综合考虑各个因素之后,主成分得分较能体现球员的全面能力。姚明仍然排在22名,较靠后,主要是因为姚明的各项指标还不是很强,需要继续努力。

(二)聚类分析

核心球员的个人能力越强就越能带领球队取得胜利?针对这一问题,根据2008-2009赛季NBA各队的各项技术统计,我们主要考虑的是球队的战绩和核心球员的能力之间的关系,本文采用系统聚类法进行分析。

系统聚类法的基本思想是:距离相近的样本先聚成类,距离相远的后聚成类,过程一直进行下去,每个样本总能聚到合适的类中。原理可在一般教科书中发现,不再详述。通过聚类分析我们想了解各个球队与其核心球员个人能力之间的影响程度。

图1是聚类树状图,图形结构清晰。图形上面是类间距离,下面数字是球队代号,整个聚类过程用虚线连接。图形最终所有球队聚成一类,但这不是聚类的主要目的,根据我们聚类研究的目的和差异的显著性,我们可以将其聚成以下四类:

类别1:湖人(13)、魔术(22)、骑士(5)和凯尔特人(2)。此类球队核心球员表现好,而且球队战绩也很好,均排在各自所在赛区的前列,球员价值在这类球队得到体现。

类别2:热火(15)和黄蜂(19)。此类球队核心球员表现好,德维恩-韦德、克里斯-保罗在两个主成分中均排在最前列,但是球队战绩不好,其中热火排在东部第5,胜率仅有52.4%,黄蜂排在西部第七,球员价值在这类球队没能完全体现。

类别3:活塞(8)、尼克斯(20)、快船(12)、灰熊(14)、奇才(30)、山猫(3)、雄鹿(16)、和森林狼(17)。此类球队核心球员表现不好,在主成分得分中均排在较靠后的位置,球队战绩也不是特别好,均排在联盟的靠后位置。

类别4:掘金(7)、火箭(10)和开拓者(25)等其余球队。此类球队核心球员表现一般,在主成分得分中均排在较中间的位置,球队战绩较好,当仍有一定的前进空间。此类球队核心球员表现和球队战绩与类别一的球队相比较差,但与其他类别的球队相比则较优。

图1 球队的战绩和核心球员能力之间关系的聚类结果

 (三)相关分析

聚类分析的结果显示,不同球队中球队战绩和和核心球员能力之间的相关程度不一样,但究竟关系如何,还应计算二者的相关系数。本文主要通过计算两个指标之间的Pearson相关系数和Spearman秩相关系数来分析。

球队战绩使用常规赛胜场数,核心球员指标使用主成分分析得到的核心球员综合得分指标,分别计算Pearson相关系数和Spearman秩相关系数,结果见表7。

表7 球队常规赛战绩与球队核心球员的相关系数结果

从表7可知,在6%的显著水平下均拒绝原假设,两种相关系数算得的球员得分和球队战绩之间都是显著正相关,只是相关程度都不是很高,这是因为部分球队相关性较高,而部分球队较低,但基本都存在一定的正相关关系,从而使得总体相关程度不是特别高。

五、球队战绩的影响因素回归建模分析

根据聚类分析结果,我们知道球队的战绩会受到球队中明星球员的能力以及临场发挥的影响,但球队毕竟不是一个人的队伍,是一个整体,它的战绩同样会受到球队的总得分、篮板等技术统计指标的影响。下面我们用2008-2009赛季30支NBA球队的常规赛战绩及其各种统计指标进行回归分析,得出影响球队战绩的主要因素。

我们以球队胜率(胜负比wl)作为模型的因变量,以球队赛季平均每场得分(ppg)、平均每场篮板次数(rpg)、平均每场助攻次数(apg)、平均每场抢断次数(spg)、平均每场盖帽次数(bpg)、平均每场失误次数(to)、平均每场犯规数(foul)、平均投篮命中率(fg)、平均三分球命中率(threeft)、平均罚球命中率(ft)、球队的福布斯价值(values)、球队的赛季总工资(pay)、教练的历史执教战绩(coach)和球队中核心球员的综合得分(player)为自变量进行回归分析。回归结果为:

 (2)

其有关参数的显著性检验结果见表8。

表8 球队胜率与其影响变量的回归关系结果

回归方程的,调整的。上述回归结果显示,在显著性水平α=0.1的情况下,有很多自变量是不显著的。可以认为有不少自变量对球队的战绩影响不大,我们接着使用SAS软件中向后回归的方法,将不显著的因素剔除出模型之后剩下教练的历史执教战绩(coach)、球队中核心球员的综合得分(player)、球队赛季平均每场得分(ppg)、球队的福布斯价值(values)、平均每场犯规数(foul)进入模型得到回归结果,并将不显著的常数项去除之后得到如下回归方程:

    (3)

参数的显著性检验结果见表9,回归方程的,调整的,p值=0.000014。

表9球队胜率与其显著影响变量的回归关系结果

由于模型的系数的P值均明显小于0.05,因此我们可以认为在显著水平为0.05时,模型的各个系数都是显著不为0。对于残差,我们通过Shapiro-Wilk正态性检验发现其检验统计量W= 0.9611,检验的P值为0.3311,因此可以认为模型的残差符合正态分布。进一步,我们还通过残差图、White异方差和条件数等相关统计检验进行考察,并未发现模型存在残差异方差和多重共线性(在此不再赘述)。表明模型拟合效果较好。

根据上述回归结果我们可以看出:一个球队战绩的好坏主要取决于队伍的平均每场得分、平均每场犯规数、球队的福布斯价值、核心球员能力以及教练执教能力。其中,得分是负指标,这与NBA目前越来越注重防守有关,一般来说,防守实力强的队伍在比赛中较为有利,虽然得分较低,但往往可以把对手的得分限制在一个更低的水平,因此比较容易获得比赛胜利;而犯规次数与球队战绩成正相关关系同样与防守是分不开的,防守强度大的队伍犯规一般都会比较多,这是不可避免的问题;球队价值是衡量一个球队综合实力的标准,球队价值越高的,一般情况下其发挥就越好,就能赢得更多的胜利;虽然球队不是一个球员的球队,但是球队中的核心球员往往是决定比赛胜负的因素,核心球员的能力越强,越能带动起队友的发挥,关键时刻比赛的胜负往往取决于球队的核心球员,因此有一个好的核心球员的球队往往能够取得更多的胜利;球队的教练也是一个不容忽视的因素,一名好的教练能够带来符合球队的战术,指挥作战能力强,能够带领球队获得好成绩。总之,一个球队如果要取得很好的成绩,要有一名优秀的教练,一名能力全面的核心球员,球队的总能力也要强以及要注重防守的提高。

六、主客场差异分析

(一)主客场胜场数差异检验

使用SAS统计软件针对NBA30支球队主客场胜场数进行差异检验。检验步骤:首先对数据进行正态性检验,若服从正态分布,则使用配对样本的t检验,若不服从正态分布,则使用非参数的Wilcoxon秩和检验。

球队在主客场的战绩有所不同,一般情况下均为主场优势,主场胜场数较高。然而这种差异是否显著,我们却不得而知。此处,对30支球队的主客场胜场数差异进行检验。由于30支球队的主客场胜场数的分布不知,故先对其主客场胜场数分别进行正态性检验。结果如正态概率图2和图3,可以看出:主客场胜场数的概率图均近似线性,AD统计量都比较小,分别为0.466、0.375,P值较大分别为0.235、0.395,在5%的显著水平下,无法拒绝原假设,故认为30支球队的主客场胜场数服从正态分布,并对其主客场差异使用配对样本的t检验。计算得的t检验值 = 8.34, P 值 = 0.000。P值几乎为0,说明主客场胜场数存在着显著的差异,确实存在明显的主场优势。

  

图2 主场胜场数正态概率图                图3 客场胜场数正态概率图

 (二)主客场差异原因分析

使用配对样本t检验主客场胜场均值存在差异,但究竟差异具体表现在哪些因素上呢?故对30支球队主客场的各项指标采用非参数检验中的Mann-Whitney 检验进行分析。

Mann-Whitney 检验原理是将所有两组变量的所有观察值混合后进行排列,比较小的变量的观察值倾向于排在前面,比较大的变量的观察值倾向于排在后面,从而计算所有观察值的秩,并算出U统计量,当两组变量的U统计量较大时,就存在差异,否则不存在。分析的因素主要包括得分、助攻、篮板、抢断、盖帽、失误、犯规。其中前五个指标为正指标,失误和犯规为逆指标。设原假设为H0:考察指标主客场不存在差异,备择假设为H1:正指标变量主场大于客场(负指标变量主场小于客场),利用 Mann-Whitney 检验,在显著水平为1%的单侧检验下,检验结果见表10。

表10 主客场差异原因分析的Mann-Whitney 检验结果

由表10可知,研究的所有因素均严格体现主客场差异,主场的各项正指标显著大于客场,负指标显著小于客场,可见球队主客场战绩差异显著地表现在球队的各个方面。

(三)主客场差异的回归分析

鉴于主客场各项指标的差异,利用常规赛所有比赛作为样本并加入主客场因素等虚拟变量进行回归分析。以比赛净胜分(result)为因变量,以球队的福布斯价值(values)、球队的赛季总工资(pay)、教练的历史执教战绩(coach)和球队中核心球员的综合得分(player)为自变量并加入主客场因素(field)作为虚拟变量(主场值为2,客场值为1),虚拟变量与前面非参检验中主客场存在差异的指标[球队得分(ppg)、助攻数(apg)、篮板数(rpg)、抢断次数(spg)、盖帽次数(bpg)、失误次数(to)、犯规次数(foul)]进行乘积的变量也作为自变量进入模型。回归结果方程为:

  (4)

参数的显著性检验结果见表11。

表11 比赛净胜分与其影响变量的回归结果

   

    由上述回归结果显示,在显著性水平α=0.05的情况下,有两个自变量是不显著的。

从上述回归结果认为在考虑了主客场的虚拟变量因素之后的模型中有少数自变量对比赛的胜负影响不大,我们接着采用SAS软件中向后回归的方法,将检验不显著的变量依次剔除出模型,所得的拟合方程如下:

   (5)

其相应参数检验结果见表12。

表12 比赛净胜分与其显著影响变量的回归结果

回归方程的,调整的,F=183.4976,p值=0.0000。采用与上节相同的统计诊断方法进行考察,我们并未发现模型存在残差异方差和多重共线性,残差与自变量也不存在相关关系。因此,可以认为模型的拟合效果是较好的。

模型中的正指标为:得分、篮板、抢断、盖帽、助攻、教练执教能力和核心球员能力,它们的系数均是正的;而模型中失误和犯规两项负指标的系数为负值,这与理论一致。大部分变量的系数都不超过1,而教练的历史执教战绩的系数达到16.035,可见教练执教能力对一个球队影响很大。

在不考虑主客场因素时,模型中部分理论上对胜率有影响的变量不显著,但在考虑主客场因素之后,这些变量都显著,说明主客场差异对球队胜率有影响。   

在考虑的所有交互影响中,助攻、得分、篮板、抢断、盖帽、失误、犯规均是显著的,存在差别斜率,且系数与理论上一致,可见主客场差异对各个变量的影响很大,正指标在主场倾向于较大,负指标在主场倾向于较小,说明的确存在着主场优势这一因素,而虚拟变量项系数为负说明在主场,球迷的加油、球队期望值更高等因素同样会给主队造成一定的压力,所以主队的初始值会比较小。因此我们认为主场既存在主场优势,也存在主场压力,但是主场优势大于主场压力,即相对于客场球队在主场更容易取得胜利。

回归的结果也证实了非参数检验的正确性,从而更加确定主客场对球队胜率影响很大,这些影响主要是通过球队各个指标体现。

七、季后赛分析

在NBA常规赛之后紧接着就是决定总冠军归属的更加激烈的季后赛,在季后赛中,我们采用了与考虑了主客场差异的常规赛回归模型(4)中同样的变量,发现助攻、篮板、教练、工资总额、核心球员能力、球队价值这些因素均不显著,因此,我们可以认为影响季后赛比赛胜负的因素与常规赛的有所不同。季后赛采取的是两个队相互交战直至一个队获得四场比赛胜利晋级下一轮的形式,而常规赛的球队排名将会影响到球队遇到的队伍的强弱情况,显然,本队的常规赛战绩和对手的常规赛战绩也会在一定程度上影响到比赛的胜负和球队晋级下一轮的可能性。季后赛连续多天的比赛对球队主力队员体能的消耗也不可忽视。主力球员平均上场时间明显减少,此时需要替补队员的支持才能打好比赛。因此,球队板凳球员的能力也将会影响球队的战绩。

(一)相关分析

从近几年NBA的发展可以看出其越来越重视防守,20##-2009赛季进入东西部总决赛的湖人队和魔术队就是防守中的典范。但究竟球队的防守能力与球队战绩之间的关系如何?为此,我们从20##-2009赛季季后赛每场比赛的相关技术指标中选出代表防守的3指标(篮板数、抢断次数、盖帽次数)和每场比赛的失分来衡量球队的防守能力,计算其与每场比赛结果(用净胜分衡量)之间的相关系数。相关分析结果如表13:

表13 净胜分与4种防守指标的相关关系结果

从上表我们可以看出,4个指标都与比赛结果净胜分显著相关,但相关程度都不很高。其中每场失分与球赛结果相关程度最大,其Pearson相关系数将近-0.6。可见防守能力对球赛战绩影响相当显著,之后我们使用多元分析方法将4个防守指标综合成一个体现防守能力的指标,并计算其与净胜分之间的相关系数为0.5289,并在5%显著水平下通过统计检验。球队防守能力与球队比赛结果之间的相关程度超过了50%,说明球队的防守能力在季后赛中得到充分的体现,球队的防守能力在很大程度上影响球队的战绩。

(二)主成分分析

季后赛中替补球员对各自球队的作用不可忽视,因此在进行球队胜率因素分析之前,先对各队替补球员进行分析。替补球员指在季后赛的大部分比赛中以替补球员身份出场的球员。对替补球员分析的14项指标与核心球员类同(见数据表述),每支队伍将各自所有替补球员的各项指标分别加总,得到每支球队替补球员总贡献指标。

由于本文在前面部分做过核心球员的主成分分析,因此方法不再赘述,直接得出替补球员主成分得分,见表14。

表14 球队替补球员主成分得分结果

(三)回归分析

通过上述的分析,我们将以比赛净胜分(result)为因变量,以球队的福布斯价值(values)、球队的赛季总工资(pay)、教练的历史执教战绩(coach)、球队中核心球员的综合得分(player)、本队常规赛胜率(bsl)、对手常规赛胜率(rival)和替补球员能力(tb)为自变量并加入主客场因素(field)作为虚拟变量(主场值为2,客场值为1),虚拟变量与球队常规技术统计[球队得分(ppg)、助攻数(apg)、篮板数(rpg)、抢断次数(spg)、盖帽次数(bpg)、失误次数(to)、犯规次数(foul)]进行乘积的变量也作为自变量进入模型。回归模型结果为:

     (6)

参数显著性检验见表15。

表15 季后赛比赛净胜分与其影响变量的回归结果

上述回归结果显示,在显著性水平α=0.05的情况下,有多个自变量是不显著的。

从上述回归结果认为在考虑了季后赛所有可能影响比赛结果的因素的模型中有不少自变量对比赛的胜负影响不大,我们将检验不显著的变量剔除出模型,所得的拟合方程如下:

  (7)

参数显著性检验见表16。

表16 季后赛比赛净胜分与其影响变量的回归结果

回归方程的,调整的。采用上节同样的统计诊断进行考察,我们并未发现模型存在残差异方差和多重共线性,残差与自变量也不存在相关关系。因此,可以认为模型的拟合效果是较好的。

根据上述回归结果,我们可以看出影响球队季后赛战绩的关键因素为主客场因素、球队得分、球队篮板次数、球队抢断次数、失误次数、犯规次数、替补球员能力以及对手的常规赛战绩。其中,球队得分、球队篮板次数、球队抢断次数、失误次数、犯规次数均受到主客场因素的影响。替补球员能力指标的系数为正,说明季后赛中,替补球员能力越好的球队获得比赛胜利从而晋级下一轮的可能性越高;对手常规赛战绩指标的系数为负,说明遇到的球队常规赛战绩越差,越有希望晋级;得分、篮板、抢断指标为正,说明这些指标越高,获胜可能性也越高;失误指标为负说明失误次数越少,越可能获胜。这些均与实际情况相符合。

八、常规赛和季后赛影响比赛胜负因素异同分析

(一)相同点

1.常规指标影响

在对影响常规赛和季后赛战绩因素进行回归分析发现,球队得分、失误次数、抢断次数、篮板数、犯规次数这五项指标在常规赛和季后赛中对比赛的胜负均有重要的影响。其中球队得分、抢断、篮板在两个模型中均为正指标,在一般情况下,这三项指标越高,球队就越有可能获胜;失误次数、犯规次数则为负指标,在一般情况下,这两项指标越低,球队获胜的可能性越大。

2.主客场因素

在考虑了主客场因素的两个模型中,主客场因素和其与各项指标的交叉乘积项,在模型中大部分都显著,说明不论在常规赛还是在季后赛,主客场差异均是显著存在的,这不仅球队的各项技术指标上,还体现在比赛的最终结果上。

3.防守因素

常规赛和季后赛的分析结果显示,体现球队防守能力的失分、篮板、抢断、盖帽四项指标均对比赛结果有显著影响。球队失分越少,篮板、抢断、盖帽数越多,球队获胜的能力越强。可见,球队的防守能力是决定比赛胜负的一个关键因素。

(二)不同点

1.替补球员能力

季后赛的赛制与常规赛不同,季后赛赛程安排更为紧凑,对队员体能的消耗很大,为了保持良好的状态,各队主力球员每场上场时间都会减少,此时就需要替补队员的支持。因此在季后赛中替补球员的作用比常规赛的重要。对比两个模型,常规赛替补球员更换比较频繁,上场时间也较不稳定,对战绩影响有限;而考虑了替补球员能力的季后赛模型拟合效果更好,可见替补球员能力对季后赛战绩影响不可忽视。

2.战略战术的调整

季后赛赛制不同也决定了季后赛所使用的战略战术与常规赛不一样。季后赛中一个球员与同一支球队连续比赛4到7场,所以双方对各自对手的特点会随着比赛的进行慢慢熟悉和适应,每队的缺点也会暴露给对手,因此需要一些针对对手优势和劣势的战术来及时应对。而且季后赛中对于如何保持和扩大领先优势、如何缩短差距也是与常规赛不一样的。

3.主客场差异更显著

季后赛主客场安排是2-3-2(总决赛是2-2-1-1-1),即常规赛战绩较好的球队先在主场打两场,接下去三场在战绩较差的球队的主场,最后两场再回到战绩较好球队的主场。可见主客场因素影响极其显著。占有前两个主场的球队有很大的优势,如果一开始连续赢两场,接下去赢得系列赛的可能性将很大。而且即使一直持续到第七场,对常规赛战绩较好的球队也比较有利。NBA季后赛历史上一个系列赛的最后一场比赛基本都是主队球队获胜。

(三)常规赛对季后赛的影响

季后赛在常规赛之后进行,由于每个球队在赛季前和赛季中都会有不同的球员的交换,鉴于季后赛的特殊性,不可能在季后赛中去磨合新阵容,所以在常规赛中可以充分利用比赛来磨合阵容和使新队员融合到球队中,为季后赛打下基础。常规赛的排名是决定季后赛分区对阵形式的因素,常规赛排名靠前的球队在季后赛中不仅可以遇到实力相对较弱的球队,而且在系列赛会有多一个主场的优势,当比赛拖入到最关键的第七场的时候会在自己的主场进行比赛,更有可能取得比赛的胜利而晋级下一轮。

九、总结及对CBA的启示

(一)总结

本文使用主成分分析、聚类分析、回归分析、非参数检验等方法对影响NBA胜率的因素进行了研究。鉴于影响NBA胜率的因素比较分散,常规赛部分主要从核心球员能力、球队胜率影响因素和主客场差异三个方面进行建模分析。季后赛部分则从防守指标、替补球员能力和影响季后赛的因素等方面进行建模分析。

从核心球员能力方面考察,我们得出:后卫方面克里-斯保罗、德维恩-韦德和勒布朗-詹姆斯得分最高,中锋方面德维恩-韦德、德怀特-霍华德和勒布-朗詹姆斯的得分较高;而在综合能力得分方面,德维恩-韦德、克里斯-保罗和勒布朗詹姆斯分列前三,这与球员实际能力相符。

从球队胜率影响因素方面考察,发现核心球员能力高低与球队战绩好坏并不完全一致。进一步分析得出,二者尽管存在一定的正相关关系,但相关程度不高,可见一个核心球员虽然很重要,但并非仅仅考虑这个因素就能决定一个球队战绩的好坏。随后的回归分析得出得分、犯规、核心球员能力、球队价值和教练执教能力是统计显著的。在考虑的10个场均技术指标中,只有球队赛季平均每场得分、平均每场犯规数2个场均指标显著,说明场均指标对一个球队的胜率影响程度有限,而所考虑的4个宏观指标中,有3个宏观指标显著,说明球队价值、核心球员能力和教练执教能力对球队胜率的影响较大。

从主客场差异方面考察,发现NBA主客场差异确实存在,并从各个方面(得分、助攻、篮板、抢断、失误、盖帽、犯规)对比赛结果一起产生影响。在充分考虑主客场和其他技术指标的交叉影响之后,我们得出显著影响因素包括所有交互影响变量以及球员价值和教练执教能力。前面分析平均指标时没考虑主客场因素,绝大多数技术指标都不显著,但考虑主客场因素之后,所有技术指标和主客场的交互影响变量均显著,这既表明技术指标对球队胜率存在影响,也表明主客场差异凸显了各项技术指标的差异。其中教练执教能力的回归系数明显高于其他变量回归系数,说明教练执教能力对一个球队胜率影响巨大。模型的虚拟变量的系数为负数,这是由于球迷的加油、球队期望值更高等因素同样会给主队造成一定的压力,主队的初始值会比较小,所以主场给球队带来一定的压力,但总体上主场优势大于主场压力,即相对于客场球队在主场更容易取得胜利。

季后赛部分,通过对防守指标与净胜分相关分析,发现尽管每个防守指标与净胜分的相关系数不高,但体现防守能力的综合指标与净胜分的相关系数较高,说明防守强度对季后赛胜率有一定影响。季后赛比赛较频繁,考虑到球员体力上的因素,季后赛中替补球员对球队作用不可忽视。本文对各支球队的替补球员进行综合打分,并将其纳入季后赛胜率因素的回归模型,得出影响季后赛胜率的因素有主客场因素、球队得分、球队篮板次数、球队抢断次数、失误次数、犯规次数、替补球员能力以及对手的常规赛战绩。其中替补球员能力指标的系数为正,说明季后赛中,替补球员能力越好越有助于球队取得比赛的胜利;对手常规赛战绩指标系数为负,说明遇到的球队常规赛战绩越差,越有希望晋级。

在常规赛和季后赛中,比赛的各项常规指标、主客场以及防守这三个因素对其比赛的胜率影响类似;而季后赛赛制与常规赛的差异,主要体现在替补球员能力、特定的战略战术以及差异更显著的主客场等方面。同时,由于常规赛事季后赛的前奏,球队在常规赛的排名将是决定季后赛分区对阵形式以及主客场分布的唯一因素。球队常规赛的胜率必然会对球队季后赛产生影响。

纵观全文,分析影响NBA球队胜率因素时应该将主客场因素纳入分析,各类技术指标的分析才会比较显著,同时应该考虑球员价值、教练执教能力等宏观指标,才能从整体上把握影响NBA球队发展的因素,得出的结论才能比较有价值。季后赛中应该考虑到替补球员能力因素以及季后赛赛制特点制定出有针对性的战术战略。

 (二)对CBA的启示

NBA创办于1946年,已有60多年的历史,是目前世界上最顶级的篮球赛事,在运营管理、球队建设等方面有很多值得其他联赛借鉴的经验。作为中国篮球联赛的CBA则创办于1956年,运营管理经验和球队建设等方面与NBA相比有很多不足。虽然坐落于两个不同的地方,CBA与NBA有一些差异,但两个赛事均是篮球运动,仍然存在共同点。因此,NBA在运营管理、球队建设等方面都值得CBA借鉴学习。

1.主场文化。NBA球队主场优势特别明显,主要得益于其健全的主场文化。主场观众的有组织的加油助威对主队各方面指标影响显著,直接影响到球队战绩。而CBA由于发展得较晚,主场文化尚未形成,各球队打球时主客场差异较不显著,这样将直接影响比赛的观赏性,尤其难以调动当地球迷观看比赛的热情。为了能够建立健全的主场文化,充分发挥主场优势,各球队在各自赛场应该组织当地球迷和工作人员有秩序地为主队加油,形成一股激励主队球员并且给客队球员施压的气氛,充分发挥主场优势。这样不仅有助于主场文化的形成,更有利于整个CBA的发展。

2.教练执教能力。NBA球队胜率跟教练执教能力关系显著,而这点可能没有得到CBA球队足够的重视。在选择教练的时候,CBA不仅应注重教练的执教经验,同时要兼顾教练对球队的了解程度,可以鼓励从球队退役的优秀球员留在教练组中,同时,当教练组中的教练有一定的执教经验后尽量派其到国外参加培训,学习世界上比较先进的战术、策略,并且将优秀的教练在适当的时期提拔为球队的主教练,或者聘请一些国外知名的教练到球队任教,让球员接触新的培训方式和新的战略战术。

3.核心球员能力。CBA核心球员尽管没有NBA核心球员能力那么强,但一个球队的核心球员的作用并不在能力多强,重点在于引进或培养高水平球员来带动整个球队打好比赛,鼓舞球队士气。CBA的优秀球员分布较不合理,大部分优秀球员都分布在广东、上海、北京等大城市,造成一些省份缺少高水平球员,使得球队间实力相差较大,造成整个CBA病态发展。鉴于NBA中核心球员的对球队取得胜利影响显著,CBA各球队应该尽量保证拥有一位具有一定影响力的核心球员,在球队里面能起到领衔作用,更好地组织球队打球;同时依靠核心球员的知名度也能得到观众更多的关注,增加整个CBA联赛的观赏性。

4.球队防守。在NBA中,战绩较好的球队都是防守能力强的(如湖人和魔术),而且NBA观赏性很高的原因之一也在于其高强度的防守。然而在目前的CBA比赛中,各队都过于注重进攻,追求比分而忽视了球队防守,使得比赛看起来得分很高,但观赏性不高。可见,为了提高球队的整体实力以及比赛观赏性,各队应该增强防守力度,让观众真正感受到比赛的紧张激烈。

5.年轻球员。NBA球队都比较重视年轻球员的培养和选拔,从NBA选秀制度和其年轻球员上场时间都可以体现,这是NBA联盟长期保持高水平的源泉。建议CBA各队要注重对年轻球员的培养和选拔,尽管CBA的选秀制度短期内没法达到NBA的水平,但较完善制度总能选到一些较优秀的年轻球员,这将有利于球队以及整个CBA的健康发展。

相信CBA队伍建设时若能参考NBA在这几个方面的成功经验,并针对球队自身存在的问题给予改进,将极大地促进球队的发展,而且能推动整个CBA联赛的长久健康发展。

致谢:本文是在厦门大学经济学院计划统计系陈建宝教授指导下完成的,在此表示衷心的感谢!

参考文献

[1] M. Leeds, P. Ahmen. 体育经济学[M].北京:清华大学出版社,2003.

[2] D. Mizak,A. Stair and A. Rossi. Assessing Alternative Competitive Balance Measures for Sports Leagues: A Theoretical Examination of Standard Deviations, Gini Coefficients, the Index of Dissimilarity[J]. Journal of Physical Education , 2005, vol. 12, No. 5. pp.367-373.

[3] J. A. Hausman and G. K. Leonard. Superstars in the National Basketball Association:Economic Value and Policy[J]. Journal of Labor Economics, 1997, vol. 15, No. 4.pp.586-624.

[4] J. M. Gandar, R. A. Zuber and R. P. Lamb. The Home Field Advantage Revisited: A Search for the Bias in Other Sports Betting Markets[J]. Journal of Economics and Business, 2001(Jul.-Aug.),vol.35, No. 4, pp.345-453.

[5] S. Chatterjee, M. R. Campbell and F. Wiseman. Take that Jam! An Analysis of Winning Percentage for NBA Teams[J]. Managerial and Decision Economics, 1994,vol. 15, No. 5, Special Issue: The Economics of Sports Enterprises , pp. 521-535. 

[6] 刘素蓉、廖双双、黎智勇、邓昭锦. NBA赛程模型的建立与评价[J].大众科技,2009(3):55-57.

[7] 吴福珍、王晓军.应用Matlab软件对NBA赛程进行利弊分析[J].电脑开发与应用,2009(3):14-17.

[8] 王建国. NBA制衡机制的研究[D].北京:北京体育大学,2005.

[9] 张芳娟.NBA常规赛赛程的评价与规划模型[J].民办教育研究,2009(6):84-87.

[10] 李媛. NBA品牌传播探析[J].东南传播,2008(8):119-120.

[11] 薛岚. NBA主场文化探析[J].体育科学,2005(4):20-24.

[12] 张志谦.浅谈20##-2007赛季NBA总决赛各项技术统计对比赛胜负的影响[J].内蒙古体育科技,2008(2):93-94.

[13] 米勤、李可可、张辉、冯杰.NBA替补队员攻防能力对比赛结果影响的研究[J].首都体育学院学报,2008(4):106-107.

[14] 孙军.中美篮球后卫队员技术能力的对比分析[J].教学研究,2008(26):280-281.

Statistical modeling Analysis on Influence Factors for the Outcome of NBA Games in 20##-2009 Season

    Abstract: As the most influential basketball club tournament in the world, NBA games have caught many fans’ eyes and produce great impact around the world. Its effects to Chinese fans are hard to assess, especially, since Yao Ming was a top pick in NBA draft. The most important target of the teams is to win the games. It is well known that there are many factors affecting the final result of a game. Among them, some are fortuitous, but more is inevitable. Therefore, what are the main factors dominating the outcomes of each team in a season? For this reason, this paper applied a series of statistical methods (including principal component analysis, cluster analysis, non-parametric test and regression analysis etc.) to study the influence factors for the outcomes of NBA games in 20##-2009 season. The conclusions of regular season are summarized as follows :a) Although basketball is a collective project, the core player of a team has the positive impact on the results significantly, this indicates the effect of the core player; b) The outcomes of teams are mainly affected by five variables which included points per team, fouls, values of the team, the core player's ability and the coach ability, these variables are found to be statistically significant;  c) Focused on the differences of home and field courts, we introduced the dummy variable to build a regression model. The model fits the statistical data well and verifies the existence of home advantage. Through the study of playoff games we found :d) After adding two other factors, the ability of bench player and regular season record, to the model which was built in the (c) ,the new  model become more credible. Furthermore, we discussed the differences and similarities between regular and playoff season. Finally, we proposed some useful suggestions for the development and construction of CBA from NBA’s altitude.

    Key words: NBA; Outcome; Influence factors; Statistical modeling analysis

更多相关推荐:
中国建筑业协会_20xx年建筑业发展统计分析

(建筑时报20xx年x月x日)20xx年建筑业发展统计分析住房和城乡建设部计划财务与外事司中国建筑业协会一、20xx年建筑业基本情况20xx年,在国家积极财政政策的推动下,建设领域投资规模不断扩大,建筑业呈现良…

朔黄铁路机车监控统计分析系统的功能及应用-张朝辉

朔黄铁路机车监控统计分析系统的功能及应用张朝辉朔黄铁路机辆分公司河北省肃宁县062350摘要:利用机车监控记录装置的原始数据、做为统计数据采集发展的方向,实现资源共享。为此,“机车监控统计分析系统”的开发及使用…

关于做好“质检科技资源管理与统计分析系统”数据录入上报工作的通知

关于开展“质检科技资源管理与统计分析系统”数据录入上报工作的通知各县市区质量技术监督局,市局各直属技术机构:为贯彻落实支树平局长在福建信息化工作会议上的讲话精神,进一步加强质检科技信息化管理,国家质检总局科技司…

小学20xx教育技术装备统计分析报告

20xx年教育技术装备统计分析报告一、学校基本概况我校位于新疆乌鲁木齐市火车西站西园街186号,有学生1172名,23个班级,教职工60人。二、装备配备情况1、实验教学人员基本情况我校有3名实验教学人员,其中1…

党内统计分析报告

####煤矿委员会20##年度党内统计分析报告根据##煤公司组织部要求,##煤矿党委于20##年x月对矿党组织和党员的基本情况进行了统计汇总。20##年我矿党建工作在发展党员工作力度、结构布局和积极分子培养等方…

20xx年1-8月永定县金腾大酒店生产安全事故统计分析 文档

20xx年1-8月永定县金腾大酒店生产安全事故统计分析一、8月份事故情况截至8月x日,全店共发生各类生产安全事故5起,主要是:(一)、三楼消防管道跑水事件,无人员伤亡;(二)、停电事件,因县城区域停电,店内发电…

[A] 20xx年临床路径统计分析与改进措施

20xx年临床路径实施情况统计分析和改进措施自20xx年x月起我院重新开展了临床路径实践工作,通过1年的实践,取得了一些成绩和经验,现总结汇报如下:一、工作开展情况及成效1.建立临床路径管理小组,健全工作制度。…

spss 统计分析报告

Spss统计分析实验报告一实验目的通过统计分析检验贫血患儿在接受新药物与常规药物之后血红蛋白增加量的情况得出两者疗效是否存在差异并且可以判断那种药物疗效好二实验步骤例题某医院用某种新药与常规药物治疗婴幼儿贫血将...

风险行为统计分析报告 (1)

风险行为统计分析报告20xx年第二季度设备维护部锅炉本体班20xx0630一本季度行为观察统计表二本季度个月风险行为趋势图三行为观察分析本季度行为观察共12次其中未发现风险1次占总数的833风险行为11次占总数...

资产统计分析报告

资产统计分析报告市财政局根据贵局关于转发省财政厅lt关于编报20xx年度行政事业单位资产统计报表的通知gt的通知X市财资20xx10号要求我单位认真对截至20xx年12月31日的单位资产情况进行统计和分析统计数...

XX单位20xx年度能源资源消耗情况统计分析报告

XX单位20xx年度能源资源消耗情况统计分析报告按照国管局公共机构能源资源消耗统计制度的要求在XX的直接领导下在XX的关心指导下我XX通过认真学习中华人民共和国节约能源法和公共机构节能条例围绕意识节能管理节能技...

交通运输业统计分析

年季度交通运输情况分析今年以来单位统筹推进交通基础设施重大项目建设各工程项目如期开工农业发展良好稳定工业生产秩序井然客货运输协调稳步发展在此态势下单位经济和社会发展对交通运输的需求拉动保持强劲年月份单位公路运输...

统计分析(78篇)