NBA球員場上位置的預測分析
追夢赤子心
追夢痴子心
GALA
00:00/05:17
■【第一部分】引子:球員身體數據與位置關係探索分析
首先來看NBA官網的一則新聞爆料:小托馬斯豪取52分生涯新高 綠軍險勝熱火
但是他只有175cm!那麼問題來了:
問題1、究竟身高會不會限制NBA球員在場上的位置?
問題2、為什麼NBA球員後衛閃耀,中鋒卻鳳毛麟角?
(1)NBA小常識:聯盟對球員的身高要求沒有明確的規定和限制,不過要是身高太矮在球場上會很吃虧,在進攻時很容易被蓋帽,在防守時容易被對手用身高和力量強打,會成為球隊的防守漏洞。所以一般更偏愛身高在183cm以上。183cm(約6英尺)是俗稱的能否打NBA的生死線。不過,如果技術足夠好,或者其他方面的身體素質優異也可以,比如蒂尼博格斯身高只160cm,是NBA歷史上最矮的球員,內特羅賓遜只有168cm。
(2)分析思路及過程
NBA中國官方網站上有球員的詳細身體數據,可結合聚類方法分析該問題:
第一步:數據獲取
從NBA中國官方網站獲取474名現役球員的身體數據,欄位包含位置、身高、體重、國籍等,數據樣例如下:
第二步:數據分析過程
1、現役球員的身高分布
NBA中鋒球員明顯少於後衛,中鋒的數量不及後衛和前鋒的三分之一。
還有兩個有趣的發現:兩名身高175cm(5.9Ft)的現役球員,為熱愛籃球而身高不夠的少年們帶來希望。
三名身高同時達到221cm的現役球員,而且都不是美國人。
2、現役球員的國籍分布
NBA現役隊員包含來自45個國家的頂級球員,有4名球員國籍不詳。
75.7%的球員來自美國,6.7%來自法國,加拿大和巴西。
3、各球隊中鋒配置情況
在中鋒匱乏的NBA,有6支球隊只配備了一名中鋒,黃蜂隊卻配有5名中鋒,以快攻見長的勇士隊也配有4名中鋒,根據市場供給原則,黃蜂隊必有中鋒被交易。
將NBA隊員的7個位置(後衛, 後衛-前鋒, 前鋒, 前鋒-後衛, 前鋒-中鋒,中鋒,中鋒-前鋒)下的身高看成對應水平下的觀測值。使用方差分析檢驗身高(因素)對位置(指標POS)是否有顯著影響,P值
4、按身高體重對球員進行聚類分析,利用k-means聚成三類。
聚類效果明顯,:第1類純中鋒,第2類鋒衛搖擺人,第3類後衛。
第三步:分析結論
解答1:身高確實會限制NBA球員的位置;黃蜂隊會有中鋒被交易。相關交易信息及報道鏈接如下:NBA中期交易結束:湖人火箭互換控衛博古特赴費城。
黃蜂雄鹿完成3人交易 5000萬中鋒換黑塔+白人高炮
解答2:NBA本質上是個商業聯盟,各球隊老闆是以賺錢為最終目的。
如同電影《點球成金》一樣,球隊老闆想要賺觀眾、球迷、電視台和廣告商的錢,唯有比賽打得精彩才有賣點。相比動作速率慢半拍、樸實無花哨的內線大個子,電光火石、閃轉騰挪的後衛呈現出的視覺效果更好,他們在場上攻防回合更多、場面更激烈。因此,儘管沒有明確規定,但聯盟近年的趨勢規則愈來愈傾向於小個子突破型後衛,大環境使得後衛的生存環境更多元化、更寬鬆,從而出現了一批又一批攻擊型的非典型核心後衛。
■【第二部分】正題:基於球員比賽數據的位置預測分析
首先來看兩個體育賽事數據的應用實例:
1、棒球電影點球成金
在體育統計分析領域,電影《點球成金》風靡一時,轟動棒球界、新聞媒體、甚至金融精英也津津樂道。在電影中,棒球運動、經營管理、統計學、經濟學、精算、概率論共同搭建出一個完美的數據模型。
影片看了兩遍,全劇塑造出一位特立獨行的棒球職業經理人,落魄的他聯合耶魯大學經濟學碩士,憑藉一組組球員評估數據模型,以一個小成本球隊創造了一連串勝利,吸收一批具有特質的被聯盟低估的三流球員,用數據理論指導他們在最合適的位置上發揮出最大潛力,顛覆傳統管理理念,使一支「爛隊」橫空出世,比肩聯盟全明星級別球隊,紅極一時。
2、足球版點球成金
百度預測2014年世界盃,從淘汰賽到決賽全部預測正確。
3、NBA版點球成金
本次嘗試通過比賽數據建模,分析預測球員場上位置歸屬。
NBA全明星入選機制:全明星隊員共24人,東部聯盟、西部聯盟各12名,其中5名先發球員由球迷投票決定,7名替補名單由各隊的主教練選出,若遇傷病,候補名單則由NBA總裁宣布。
4、分析建模過程
第一步:數據採集
從NBA官網NBA.com/Stats | All Time Leaders抓取2015-16年常規賽季、全部167名現役球員的比賽數據,數據集NBA共包含167條數據樣本,21個變數。
如下圖所示:
第二步:數據分析及處理-補充欄位和建模因素說明
補充TEAM球隊和POS位置(即球員在場上的位置,包含中鋒C、前鋒F和後衛G)兩項指標(欄位);考慮到針對球員在場上打位產生影響的指標主要可歸為3類因子:防守能力,得分能力和失誤犯規。經過數據探索,最終選取13個指標(變數)作為預測建模考慮的主要因素。
如下圖所示
第三步:模型構建過程及預測結果
第四步:預測分析結果
通過建模分析得到NBA球員的場上位置預測結果表如下,發現預判正確0.826087,即模型正確分類率在82.6%以上,這一點上看算是比較理想。但實際上中鋒僅預測對了一半。
下面分析可能產生這樣的預測結果的原因:
1、建模分類本身可能對結果產生一定影響:經過數據探索最終將NBA隊員的7個位置水平分成了3類(前鋒F、中鋒C和後衛G)進行建模,這種分類本身就可能對預測結果的準確性產生一定影響;
2、隨著時代變化,球員在場上的位置愈加模糊,無法精確判定其歸屬:十年前球員位置相對固定,特別飄逸的就是身高兩米左右的鋒衛搖擺人,比如T-Mac(Tracy McGrady)、Kobe Bryant等。現在的NBA,控衛更像雙能衛,小前鋒和大前鋒搖擺,大前鋒和中鋒搖擺。純中鋒和純後衛都成了稀缺貨,更不要說鋒衛搖擺人。(實例如下)
數據顯示:被用於建模的167名球員平均的三分球命中率30.27%,而以上兩位球員的三分球命中率都明顯高於平均值,且接近最大值(43.7%),說明這兩名典型的
鋒位搖擺型球員除了主打位置之外,還有著相當不錯的三分球能力。
由於在分類建模時對鋒衛搖擺人採用了隨機的方式進行分類,這就意味著將Boris歸為前鋒球員分類也屬合理範疇,而本次分析樣本中鋒衛搖擺人不在少數,從而導致了儘管本次建模預判正確分類率較高,但實際中鋒球員僅預測對了一半。
關於IDEADATA
IDEADATA專註於從數據到信息的有效管理與應用,是領先的商業信息服務技術提供商,是數據倉庫及大數據技術和應用的先行實踐者。
TAG:IDEADATA大數據 |