中美体育的差距可能就是一个数字化的NBA
2019-01-08
意见
反馈
回到
顶部
Werner Chao 2017-12-01
随着金州勇士和斯蒂芬-库里在球场大杀四方,“三分球”成了这两年篮球界最火热的名词。如今,到处充斥着关于三分球重要性的报道。库里被捧上了天,评论员们都在强调球队应当围绕三分球战术来建队,而整个NBA也都开始疯狂地投三分,三分球数量不断刷新着历史纪录。
作为一名数据科学家,我们希望找到这些流行说法背后的真相。我们为此提出了几个有趣的研究问题:
球队的强弱和三分球究竟有什么关系?
三分球战术真的比两分更有效么?
在接下来的这个数据挖掘项目里,我将用从数据中得出的事实来回答这些问题,并用统计学和数学的方法来验证我的结论。
在准备数据阶段,我从NBA官方网站和Nbaminer网站上爬取了2004-2015十二个赛季的NBA系统官方统计数据和投篮距离数据。然后将两组数据表按照“赛季”和“球队名称”进行了对应整合、清理,最后得出的一张包含各类信息的数据大表。
我首先将球队被分为季后赛的球队与非季后赛的球队。一般认为,季后赛球队就是所谓的“强队”啦。两种类型球队每个赛季的不同距离投篮占比如下所示(DT君注:每个赛季所有距离种类的投篮比例加总应为100%):
从以上4张图可以明显看出:首先,强队更爱投三分。对于距离小于8英尺及16到24英尺的两类投篮,非季后赛球队投的更多;而大于24英尺(NBA的三分线为23.78英尺)的投篮,季后赛球队投的更多。
其次,虽然强队三分投得更多,但是自从2012年以来,整个联盟都在扔更多的三分球。在大于24英尺的投篮趋势线上来看,所有球队都在牺牲16-24英尺的中距离投篮,来投更多的三分球。
下面这张曲线图也让我再次确认,表现较好的球队投了更多的远距离投篮。
回到我们开头提出的前几个问题,我们基本可以大声说出答案并且确定:季后赛球队的三分球数量的确比短距离投篮多。另一个有趣发现是,整个联盟的确都在向三分球战术倾斜,而不仅仅是金州勇士一个队伍。
现在我们还剩下一个问题,等待证明:
三分球和两分球相比,真的更有用么?
要论证这组问题,我们需要引入一个较复杂的概念——“进攻评分”(Offence Rating)。进攻评分由统计学家Dean Oliver所设计,下图为它的定义公式。
可以看出,它的公式比较复杂,所以我们设计了一个简化后更便于理解的版本。简化版的进攻评分为所有进攻回合中(Total Possession)创造的得分(Points Produced)。其中,创造的得分包括:投篮数(FGA),罚球数(FTA),进攻篮板(ORB),失误(TOV)。
有了进攻评分,我们就可以测一下三分球与其他类型投篮相比,对进攻的影响力究竟如何。因此,我们以不同类型投篮的使用率数值为x轴,进攻评分为y轴,制作了对比图表。具体情况如下。
从这四组图中可以看出,只有三分球(大于24英尺的投篮)的投篮比率值与进攻评分是正相关,即斜率为正,由上图可知,斜率为0.23。因此可以得出结论:投越多三分球,进攻评分越高。
但是,0.23的数值明显还是很小,这意味着单独“大于24英尺”这一个变量并不足以成为衡量球队进攻表现的指标。我们需要一些新的指标来判断投篮距离上的偏好与进攻表现的关系。
一个有用的维度就是各类距离的投篮彼此之间的比值。在比赛中,教练总是会在阵容中同时安排射手和突破能手,后者可以撕破防守带球接近篮筐。因此,三分球与其他距离投篮的比值,可能是衡量进攻评分的一个好的指标。我们设计了3个新的变量:
三分球/16-24英尺距离的投篮
三分球/8-16英尺距离的投篮
三分球/小于8英尺距离的投篮
三组变量各自与进攻评分的关系如下:
可以看到,进攻评分与“三分球/小于8英尺距离的投篮”的关系曲线中,斜率最大,为8.8。这意味着,“三分球/小于8英尺距离的投篮”的比值每增加1,进攻评分就会增涨8分。如果使用投篮距离作为变量,放入一个线性模型中来预测进攻评分的值,则得出如下的数据:
图中最后一列标记有两个星号的数值为0.00718——由于0.00718远小于0.05,这个线性模型的置信水平为95%,所以“三分球/小于8英尺距离的投篮”这一比值,可以被看作是衡量进攻表现的一个合适指标。
而这也让我们再次想到开头发现的一个现象:NBA所有球队都在牺牲16-24英尺的中距离投篮,来换取更多的三分球投篮机会。其实,根据我们以上的分析,把距离小于8英尺的投篮机会换成投三分球,可能对进攻来说更有利。
因为在“三分球/小于8英尺距离的投篮”的比值增加1时,进攻评分会增加8.8,而其他几种距离投篮对应的进攻评分增加度则在2到3之间。看到这个数据,可能教练们会重新思考一下了:到底要减少哪一种距离的投篮,来换更多的三分球机会。
现在,我们基本可以得出答案:三分球的确是最有效的投篮类型,而联盟以前的确低估了它的威力。教练们可以重新评估下战术里的投篮组合构成,想一想究竟哪种投篮可以为三分球让路。
所以,那些“吹捧”三分球的人是对的,三分球获得的赞誉并非名不副实。而且,所有NBA球队已经在前所未有地投着更多的三分球。季后赛球队比其他队伍投了更多远距离投篮,而联盟此前对三分球的重要性则低估了。我们同样发现,投篮组合也是很重要的变量,可以从中判断一支球队的进攻表现。
在这个项目中,我们仅仅是触碰了NBA海量数据的皮毛,诸如篮板数、失误数、防守评分等等数据其实都在等待被挖掘,感兴趣的人可以利用它们来预判一支球队在整个赛季的表现。
(本文编译自 NBA Data Exploratory – Is 3-Point Shooting Just a Hype? 文中图片均来自作者)
本文数据来源有两个:NBA官方网站,使用了官网数据统计板块提供的的高级选项功能;Nbaminer网站,里面提供的投篮距离数据。
在所有投篮的数据中,进和没进都算,但没有包括本方半场投出的投篮。
本文只使用了球队的常规赛数据,没有涉及季后赛数据。球队数据均为常规赛平均数据。
本文数据侠Werner Chao曾先后在一家在线健康咨询公司及一家跨国工程公司担任数据分析师,负责分析流量、客户行为、市场细分、用户行为预测等工作;以及负责对一个跨国矿产项目的财务状况进行数据预测的项目。同时,Werner还在多家研究机构和大学担任研究科学家职位。现在Werner在Dimensional Strategies担任数据科学咨询师。
DT财经与纽约数据科学学院是战略合作伙伴。DT×NYCDSA 系合作开设的专栏系列。
关于纽约数据科学学院:
纽约数据科学学院(NYC Data Science Academy)成立于2014年,是美国行业领先的数据科学教学机构。学院提供最高质量的数据科学和数据工程培训,致力于推进全球数据科学和大数据应用进程、以及向企业界输送数据分析人才。
数据侠计划是由第一财经旗下DT财经发起的数据社群,包含数据侠专栏、数据侠实验室系列活动和数据侠联盟,旨在聚集大数据领域精英,共同挖掘数据价值。申请入群请添加微信公号dtcaijing002并备注“数据社群”,合作请联系datahero@dtcj.com。
(了解更多有趣又有料的商业数据分析,欢迎关注DT财经微信公众号“DTcaijing”,下载“DT·一财”APP)
分享这篇文章到
2019-01-08
2019-01-17
2018-12-29
2019-01-04