趙益鑫
研究機構 GARTNER認為:大數據是需要新處理模式才能具有更強的決策力、洞察發(fā)現力和流程優(yōu)化能力的流量、高增長率和多樣化的信息資產,大數據通常用來形容大型的非結構化和半結構化數據。大數據有數據體量巨大、數據多樣化、數據處理速度快和價值密度低特點[1]。大數據開啟了一次重大的時代轉型,它把一切“量化”,利用其優(yōu)勢影響了商業(yè)和企業(yè)的發(fā)展,引起了生活、工作與思維的大變革。大數據時代處理全體數據不再是隨機樣本,在追求數據精確性的同時,也將數據的混雜性考慮進去,從而得出不一樣的結果,數據與數據之間不再變得是因果關系,而是相關關系,大數據已經影響了社會的各行各業(yè),推動了社會的進步和發(fā)展[2]。
近幾年,大數據越來越得到體育賽事領域的親睞,它給職業(yè)體育賽事帶來了革命性的變化,球隊通過大數據的分析,能夠精確地掌握對手的技戰(zhàn)術打法,提高自身訓練質量,規(guī)避球員傷病,彌補自身的弱點,從而在賽事上擊敗對手。美國男子籃球職業(yè)聯盟(以下簡稱NBA)運用大數據技術建立多樣化的數據模型,將賽場產生的海量數據進行分析,為提高球隊競技能力、精確評價球員價值和更好地為球迷服務做出了巨大貢獻。大數據的強大分析和預測能力對NBA經營策略,發(fā)展方向和比賽方式都產生了較大的影響。本文基于大數據背景,對NBA從傳統(tǒng)聯盟向數字化聯盟轉變進行了研究,并分析了大數據對NBA聯賽的影響,揭示了NBA運用大數據技術的先進理念和最新成果,從而為我國籃球聯賽數據分析和處理工作提供借鑒。
1995—1996賽季,NBA的年收入達到31億美元,而到了2016—2017賽季,整個聯盟年收入已經達到約80億美元。借助大數據技術優(yōu)勢,NBA聯賽已經發(fā)生了翻天覆地的變化,現代大數據科技正在重塑著NBA聯賽,對NBA聯賽的傳播渠道,經營策略和比賽風格產生了重大的影響,NBA聯賽也在朝著數字化聯盟方向發(fā)展。
NBA聯賽之所以取得如此成功,電視轉播功不可沒。NBA前任總裁斯特恩借助電視轉播媒體優(yōu)勢,成功地將NBA比賽送到千家萬戶,積累了大量的客戶,NBA聯盟商業(yè)價值不斷攀升,影響力推向世界。在日新月異的現代社會,傳統(tǒng)的傳播渠道和方式已經無法滿足球迷的多元化需求,借助現代科技手段實現NBA聯盟的再次飛躍迫在眉睫。在NBA第二位總裁蕭華時代,其更加重視互聯網傳播渠道以及數據科技的運用,工作重心也逐漸轉向新媒體。2014年,NBA聯盟與ESPN、TNT和ABC等電視轉播公司簽訂9年240億美元轉播合同[3]。與以往斯特恩時代簽訂的電視轉播合同不同,蕭華簽訂的電視轉播合同更加數字化,其中包括網絡直播、數字商品對外授權等內容。NBA聯盟借助現代科技手段,轉向互聯網傳播渠道,這是一次質的改變,迎合了已有客戶更加多元化的需求。移動互聯網技術的成熟運用保證了網絡傳播的有效性和便捷性,使更多的球迷通過互聯網接觸NBA。同時,傳播渠道轉變?yōu)槁撁舜蜷_新的業(yè)績增長空間,NBA通過互聯網推出更多的觀賽服務以及娛樂項目,幫助球迷更及時、更近距離地接觸球星,各種數據資訊服務也得以推出,聯盟獲得更多的收入。
隨著聯盟的發(fā)展和技術手段的升級,經過幾十年的發(fā)展和積累,NBA聯盟數據庫中記錄的數據種類越來越多,相關數據記錄越來越準確,已經建立起龐大的數據庫。但是,傳統(tǒng)的海量數據雖然豐富,但是數據之間關系復雜,對經營管理的指導意義有限,并且很難直接推送給球迷,海量數據仍然停留在表面上。近年來,NBA聯盟與Stats公司合作,引進大數據SportVu球員追蹤系統(tǒng),記錄并追蹤籃球和球員的運動。這一系統(tǒng)將提供持續(xù)的數據流和創(chuàng)新的統(tǒng)計數據,包括速度、距離、球員之間間隔以及控球情況等,從而實現目標性更強的分析。同時,NBA聯盟與SAP合作推出HANA平臺,一方面將復雜的海量數據重新組織,創(chuàng)新數據呈現方式,增強數據與球迷的交互性,自1947—1948賽季以來的NBA共計超過4 500萬億個數據段全都可以在NBA官網上用一種直觀、簡便的方式檢索得到;另一方面針對基礎數據進行分析,構建新指標,以此衡量球員和球隊的表現。
近些年來,越來越多的NBA球隊引進大數據技術,對比賽數據和球員能力進行科學地分析,NBA比賽節(jié)奏和攻防轉換也隨之越來越快,傳球、跑位、擋拆、空切非常頻繁,比賽風格越來越向“小球”時代發(fā)展。小球代表比賽節(jié)奏快,攻防轉換快,外線投射多,球員的技術越來越全面,回合數越來越多,更具有觀賞性。2012—2013賽季,兩次奪冠的熱火,以及近三年來兩次奪冠的勇士都是小球的代表。小球最明顯的特征就是三分球出手次數和命中次數越來越多。自1979—1980賽季開始,NBA聯賽開始設置三分線,此后,NBA球隊使用三分球的頻率越來越高,1980—1981賽季,NBA球隊三分球出手比重只占2.3%,到了2015—2016賽季,NBA球隊三分球出手比重已經提高到28.5%,幾乎提升了12倍。進入21世紀,NBA球隊各個賽季三分命中數第一球隊三分球使用頻率也逐年提高,并且提高幅度有明顯擴大趨勢。
表1 NBA三分球出手及命中情況統(tǒng)計
注:數據來源-NBA官網(2011-2012賽季是NBA縮水賽季,少打了16場比賽)
NBA聯盟現采用SportVU大數據分析系統(tǒng),該系統(tǒng)由6個聯通計算機的攝像頭組成,每秒可以抓取25幅圖片,它能夠追蹤賽場上所有球員進行的投籃,傳球,觸球,掩護和跑動距離等相關籃球技術動作,經過復雜的計算公式,在90s內通過數據形式生成比賽報告。SportVU系統(tǒng)于2005年以色列科學家麥基—塔米爾發(fā)明,起初用于導彈追蹤和高端光學識別,該技術在以色列足球比賽中追蹤賽場球員運動軌跡的成功,為它日后進入NBA球隊奠定了基礎。
近年來,“小球”打法盛行,籃球技戰(zhàn)術越來越豐富。NBA球隊基于大數據對搶籃板球策略變化和球員技術特點數據分析結果,有效地幫助球隊打造科學地場上陣容,做出高效的技戰(zhàn)術選擇和應用,從而提高競技水平。
2.1.1 高效搶奪籃板球 在籃球比賽中,籃板球是獲得球權的重要手段,是球員個人實力和全隊實力的體現,也是比賽勝負的關鍵。利用大數據分析方法,將球員的籃板球統(tǒng)計數和其所處位置建立模型,更加科學地衡量球員爭搶籃板球的能力,并給出不同位置球員不同的爭搶策略。南加州大學(USC)的兩位教授Rajiv Maheswaran和Yu-Han Chang通過對大數據的分析,印證了搶奪籃板球成功率與球員所處位置緊密相關,并得出結論:在籃球比賽中,投籃地點和拿下前場籃板的幾率存在著一個固定的關系:球員每遠離籃板一英尺,拿下前場籃板的幾率就會降低1%,但到三分線時,幾率又突然變大;此外,90%投丟的球都可以在距離籃板11英尺的范圍內拿下[4]。
2.1.2 掌握球員技術特點 在球場上,每個球員都有著鮮明的技術特點,利用過往經驗和現代數據分析能夠更好地掌握球員技術特點,針對不同的球員技術特點,制定相應的防守和進攻策略,在球場上掌握比賽主動權,從而更大概率地贏得比賽。通過大數據的統(tǒng)計和分析,能夠得到球員的運球特點、進攻習慣和投籃位置等量化數據,根據球員這些習慣,防守者可以進行針對性的防守。通過大數據分析發(fā)現,勒布朗·詹姆斯是一名右手將,他在籃筐左側時,多數情況下,會選擇投籃,當他在籃筐右側時,更喜歡持球突破上籃。這樣的數據統(tǒng)計給防守者一定的啟示,當勒布朗·詹姆斯在籃筐左側運球時,采用貼身防守,他左手突破能力能限,封住投籃角度即可;當勒布朗·詹姆斯在籃筐右側時,要給他兩步,防止他突破上籃,因為他在這個位置投籃的機率不高,只有小概率的進行跳投[5]。
隨著科學技術的進步,大數據對醫(yī)療行業(yè)發(fā)展起著促進作用,健康醫(yī)療領域進入“大數據”時代。NBA醫(yī)療團隊利用大數據提供的醫(yī)療數據分析,實現智能化可視化分析,為球員在臨床診斷、基因測序、藥品研發(fā)、治療方案選型、遠程診斷與監(jiān)控等方面改善健康,預測疾病提供數據依據,幫助醫(yī)療團隊找到某類疾病更好的治療方案,為球員減少治療痛苦并節(jié)省診斷成本,同時還能提高治愈率。NBA勇士隊球員在訓練時,配戴移動傳感設備,采用Catapult Sports微型監(jiān)測器追蹤訓練時的運動情況,以實時記錄球員身體的基本狀況。球員身著抗壓衣監(jiān)測膝蓋和腳踝的承壓情況,并且穿上Athos智能服裝收集球員呼吸、肌肉活動信息。所有球員的身體狀況都將以數據形式呈現在球隊面前,以便更好地監(jiān)測球員身體狀況。醫(yī)療團隊將每名球員的數據進行匯總分析,在監(jiān)測數據對球員身體預警的時候,醫(yī)療團隊會為為教練提供一個醫(yī)學的建議,球隊就會盡快安排輪休,最大程度降低球員傷病風險。
在球員選秀方面,大數據技術成為評估球員能力的重要工具。一方面,大數據分析NBA選秀球員在體測訓練營里的各項數據,如身高、臂展、垂直起跳高度、力量測試成績、速度以及球場各處投籃命中率,預測選秀球員的排名;另一方面,通過對球員過去比賽資料、數據的收集,分析球員特點,判斷球員未來發(fā)展?jié)摿?,這會給聯盟里的球隊提供巨大的幫助。2011年NBA選秀大會之前,現馬刺球員萊昂納德的球探報告顯示,他擁有著在一對一和擋拆中的防守迫使有球球員失誤的能力,有著出色的搶籃板的能力,但大學時期三分命中率僅有25%( 164投41中),接球投籃命中率為32%。萊昂納德被馬刺選中之后,馬刺投籃訓練師為其佩戴大數據投籃裝備,裝備中的芯片與籃網的感應器連在一起,萊昂納德每次投籃時,裝備就會自動顯示出其投籃的角度和力度等相關投籃數據,通過電腦將這些數據量化,不斷提高萊昂納德投籃準度。經過3年的訓練,2014年,萊昂納德在季后賽投籃命中率為51.0%,三分命中率為41.9%,力助馬刺奪冠[6]。針對球員自身技術弱點,建立球員各項數據模型,大數據重新定義了選秀球員的潛力和未來價值。
傳統(tǒng)的數據記錄方式就是記錄球員的得分、助攻、籃板等數據,看重最后的結果,忽略過程,這顯然不能最好地衡量球員作用。為了更好地衡量球員在場上發(fā)揮的作用,瑟沃尼和德阿莫爾提出“預期球權得分”(expected possession value,EPV),即在比賽某一次配合或傳球過程中,隨著比賽時間變化,持球隊員的預球權期望得分會得到相應的分數,如果球員的舉動增加了EPV,他就為本次進攻做出了貢獻,相反則阻礙了本次進攻,通過“預期球權得分增加”(EPV-added, EPVA)指標,就可以衡量一個球員在場上發(fā)揮的作用。2013年2月13日,馬刺隊員萊昂納德準絕殺騎士,但通過大數據的分析,帕克起到了關鍵的作用。比賽最后9秒時,帕克持球,此次預期球權得分為0.97分,當面對防守時,預球權分降低到0.86分,在6.3s時,帕克的突破使預期球權達到了1.36分,進入籃下的帕克發(fā)現了空位底角的萊昂納德,后者命中3分球,帕克的預期權分在5.9s時達到了1.75的峰值,鑒于萊昂納德投籃時,對方隊員防守,使帕克的預期權分下降到1.58,但已無關緊要。通過大數據分析,雖然帕克并沒有投進反敗為勝的一球,但在此次進攻中,帕克的突破和吸引防守以及傳球都為最后制勝一球打下基礎,這些都是無法用傳統(tǒng)數據表達出來的,顯然通過大數據的分析,帕克在這次進攻中起到了決定性的作用[6]。
表2 預球權分模型和時間的關系表
如今,隨著體育娛樂化的盛行,簡單的短視頻和文字報道難以滿足球迷的要求,NBA利用大數據技術很好地解決了這個問題,為球迷提供前所未有的觀賽體驗,增強球迷的參與感。2015年,騰訊正式成為NBA中國數字媒體獨家官方合作伙伴,騰訊利用大數據技術,為球迷提供“上帝視角”,球迷可以選擇不同視角去觀看比賽。球迷在觀看比賽的同時,通過現場數據采集設備和大數據分析系統(tǒng),球迷可以直接在直播中看到比賽背后的深度數據。與此同時,大數據為球迷提供可視化數據。NBA在2012年與SAP合作之后,就將自身的數據庫徹底升級,并將視頻資料也納入數據庫,NBA官網可以同時支持上萬人同時搜索,并盡量給予球迷可視化的反饋結果。據統(tǒng)計,在使用SAP的HANA平臺之后,NBA.com/stats瀏覽量超過270億,訪問量增加了66%,停留時間增加了近60%[7]。同時,根據球迷登陸NBA官網所留下的瀏覽痕跡,利用大數據技術,記錄球迷的偏好選擇,以及與球迷的互動,大數據系統(tǒng)能夠將球迷貼上不同標簽,方便將同類球迷放置在一個“社區(qū)”,定向推送他們感興趣的服務和產品,并且可以通過球迷偏好的變化趨勢調整市場策略,給球迷最好的消費體驗。
NBA除了將大數據引入比賽之外,還用于游戲開發(fā),《NBA 2K》系列游戲無疑是成功的一款。NBA利用其海量的球員數據庫,加之通過大數據分析產生的額外的數據,這為游戲開發(fā)奠定了基礎。以《NBA 2K》系列游戲為例,大數據分析對游戲本身和未來營銷都起到至關重要的作用。一方面,為了使玩家追求最真實的游戲體驗,2K系列游戲全部采用NBA真實球員作為模板,基于球員原始的數據,利用大數據分析技術,量化球員在球場上各項基本技術的數據,高度還原現實球員的能力;另一方面,大數據對游戲本身產生的運營和廣告數據進行預測和分析,識別客戶群體并對其進行分類,最后進行精準營銷。
大數據只是輔助工具,本身無法生成海量的數據,借助優(yōu)質的體育資源才能發(fā)揮更好的效果。NBA聯賽自身就是優(yōu)質的體育資源,它是世界上全球化和影響力最大的職業(yè)體育組織之一,每年收入超過40億美元,用42種語言向212個國家直播賽事,7.5億個家庭在觀看NBA比賽??茖W完善的現代化管理制度體系,成熟的商業(yè)運作推廣擴大其全球影響力,2017年NBA總決賽第五場的最后時刻,比賽的收視率達到了18.8%,這一數據比2015年和2016年的總決賽的第五場高出了13%。因此,NBA大數據之所以成功,是其本身擁有優(yōu)質的體育資源,且球迷人數眾多,賽事組織穩(wěn)定、運營管理有效,相關經營管理者大都是資深的體育專家。
數據科技和互聯網技術是體育大數據成功的技術保障,高端的科學技術確保對NBA聯賽原始數據和以后產生的各種數據進行采集、處理、存儲和管理、分析和挖掘以及展現和應用。人才是科學技術的創(chuàng)造者和使用者,NBA大數據成功恰恰依靠的是既懂籃球知識又懂數據分析的人才。他們利用自身的數學統(tǒng)計學科知識,基于比賽數據,通過大數據技術建立數據分析模型,從而生成了更多的數據類型,即有關運動員指標、球隊指標和球指標的進階數據,他們?yōu)榛@球領域數據分析做出巨大貢獻。約翰·霍林格發(fā)明了球員效率值(PER),即衡量球員在比賽場上每分鐘的表現。迪恩·奧利弗發(fā)明了球員有效投籃命中率、失誤率、進攻籃板率、罰球率等數據類型??瓶恕じ叩撬关惱飳@球事進行CourtVision分析,記錄比賽場上發(fā)生的每一次投籃軌跡、投籃趨勢以及投籃選擇,將數據分析結果通過圖像清晰地發(fā)達出來,以此來評價運動員的效率和傾向[8]。
在現代快速發(fā)展的時代,合作產生更好地發(fā)展,合作才能共贏。為了提高球隊成績,達拉斯小牛隊是第一個將大數據引入NBA籃球賽場的NBA球隊,隨后第二年,球隊便殺入了總決賽。隨后,聯盟如馬刺、火箭、凱爾特人、勇士等球隊與大數據公司合作,引入SportVU系統(tǒng),進一步增強球隊實力。事實上,大數據產生之初,NBA聯盟采取觀望的態(tài)度,并沒有將大數據引進NBA聯賽,但允許球隊與外部合作引進大數據,直到2009年NBA總決賽,NBA聯盟第一次將大數據SportVU系統(tǒng)安裝在場館中,其正式開始了與SportVU合作。NBA聯盟借助自身優(yōu)質體育資源的優(yōu)勢,不斷地尋求與外部合作機會,與游戲開發(fā)公司共同研發(fā)《NBA 2K》系列游戲,與ESPN和TNT傳播媒體開展大數據數字業(yè)務,同時,積極參與每年舉行的麻省理工斯隆體育分析大會,借鑒最新的科學技術成果,將其引入籃球賽場,增強NBA聯盟的價值。
大數據時代來臨,引發(fā)了社會各行業(yè)的深刻變革,改變了人們生活和工作方式,為體育賽事解析帶來新的角度和思維方式。借助大數據的技術優(yōu)勢,融合本身的優(yōu)質體育資源,NBA聯賽的賽事傳播方式、經營管理策略以及比賽風格朝向數字化發(fā)展,提高了NBA聯盟的商業(yè)價值,進一步擴大了全球影響力。球隊利用大數據提高了成績,重新審視傳統(tǒng)數據帶來的觀念誤區(qū)。同時,NBA聯賽借助大數據,在球迷服務和游戲開發(fā)方面都取得了良好效果。優(yōu)質的體育賽事是核心競爭力,大數據賽事技術人才是保障,兩者的有機融合,才會發(fā)揮出體育大數據的最大作用。