陳源源 徐校飛
(北京體育大學(xué) 北京 100084)
當(dāng)前,大數(shù)據(jù)的興起與各類(lèi)行業(yè)間都產(chǎn)生了聯(lián)系,學(xué)術(shù)界會(huì)將“體育大數(shù)據(jù)”理解為在體育場(chǎng)景中數(shù)據(jù)分析的應(yīng)用,但是所對(duì)應(yīng)的數(shù)據(jù)并不一定全部符合“大數(shù)據(jù)特點(diǎn)”,并且當(dāng)前概念較為模糊,其研究的實(shí)質(zhì)是屬于“體育分析”的一部分[1]?!绑w育分析”在英文中叫“Sports Analytics”,或者“Statistics in Sports”,與體育統(tǒng)計(jì)學(xué)有一定的聯(lián)系。體育分析有兩個(gè)關(guān)鍵方面:一方面屬于競(jìng)技體育領(lǐng)域分析,主要是對(duì)球員、球隊(duì)以及教練員維度的分析應(yīng)用,深入挖掘運(yùn)動(dòng)員場(chǎng)上表現(xiàn)、幫助教練員制定決策以及預(yù)測(cè)運(yùn)動(dòng)員健康等方面的數(shù)據(jù)信息,提高運(yùn)動(dòng)員在比賽中的競(jìng)技能力表現(xiàn);另一方面是指體育競(jìng)技體育商業(yè)領(lǐng)域分析,側(cè)重于通過(guò)數(shù)據(jù)的復(fù)雜算法來(lái)量化觀眾行為,并預(yù)測(cè)未來(lái)的場(chǎng)景和事件,幫助體育組織更好地經(jīng)營(yíng)體育產(chǎn)業(yè),直接增加門(mén)票和商品銷(xiāo)售,提高球迷的參與程度,從而帶來(lái)更高的盈利[2]。
“體育分析”所研究的數(shù)據(jù)類(lèi)型包含“大數(shù)據(jù)”,也包含“小數(shù)據(jù)”。有研究認(rèn)為體育分析是包括數(shù)據(jù)收集和管理,預(yù)測(cè)建模和計(jì)算方法等部分,以便為與體育有關(guān)的決策制定找到有價(jià)值的信息[3]。具體來(lái)說(shuō),體育分析是指對(duì)結(jié)構(gòu)化的歷史數(shù)據(jù)的管理,將這些數(shù)據(jù)應(yīng)用到預(yù)測(cè)性模型分析以及信息系統(tǒng)中,為決策者提供制定決策的信息,使他們能夠幫助自己的運(yùn)動(dòng)隊(duì)在競(jìng)爭(zhēng)領(lǐng)域獲得優(yōu)勢(shì)[4]。
籃球比賽中所涉及的數(shù)據(jù)可以是定量的,也可以是定性的,通常是與籃球相關(guān)的資源中收集的,如球員的場(chǎng)均數(shù)據(jù)、比賽錄像和醫(yī)療報(bào)告等,收集的數(shù)據(jù)應(yīng)進(jìn)行標(biāo)準(zhǔn)化、集中化處理,使用不同的度量標(biāo)準(zhǔn)分析,并將有價(jià)值特征的信息,通過(guò)報(bào)告、圖形等形式傳達(dá)給教練員、運(yùn)動(dòng)員和管理者,使之能夠做出關(guān)鍵的決策[5]。到21 世紀(jì),體育分析利用現(xiàn)代的數(shù)據(jù)收集技術(shù),從實(shí)時(shí)視頻數(shù)據(jù)捕捉到強(qiáng)大的算法,它可以幫助解釋數(shù)據(jù),為備戰(zhàn)重要比賽制定比賽策略,在訓(xùn)練過(guò)程中進(jìn)行對(duì)手的比賽模擬。隨著競(jìng)技比賽利害關(guān)系越來(lái)越大,這種做法需要數(shù)字的推動(dòng),以提供可預(yù)見(jiàn)的影響,并將其轉(zhuǎn)變?yōu)樗囆g(shù)和科學(xué)的結(jié)合,這就是人們現(xiàn)在所處的時(shí)代。
體育分析是基于“運(yùn)動(dòng)計(jì)數(shù)分析”而產(chǎn)生的,運(yùn)動(dòng)計(jì)數(shù)分析是指對(duì)體育比賽中關(guān)鍵事件、行為和技戰(zhàn)術(shù)變量進(jìn)行記錄,其歷史來(lái)源可追溯到19世紀(jì)中后期存在的體育考試方法,體育記者是19世紀(jì)末和20世紀(jì)初的體育符號(hào)系統(tǒng)發(fā)展的基礎(chǔ)[6]。計(jì)數(shù)分析是記錄運(yùn)動(dòng)表現(xiàn)的客觀方式,可以以一致且可靠的方式量化關(guān)鍵的運(yùn)動(dòng)表現(xiàn),使教練能夠客觀地評(píng)估運(yùn)動(dòng)員的競(jìng)技表現(xiàn)[7]。20 世紀(jì)50 年代,由美國(guó)耶魯大學(xué)男籃主教練哈沃德·霍布森(Howard Hobson)出版的Scientific Basketball中指出:20 世紀(jì)30 年代,籃球比賽中就開(kāi)始通過(guò)觀察、分析和記錄比賽過(guò)程中兩個(gè)球隊(duì)、運(yùn)動(dòng)員個(gè)人以及裁判的所有表現(xiàn)。學(xué)術(shù)界認(rèn)為,體育分析的普及最早是可以追溯到20 世紀(jì)70 年代在棒球方面的運(yùn)用。比爾·詹姆斯(Bill James)于1977 年自行出版了一本名為《比爾·詹姆斯棒球摘要》的年度書(shū)籍,他是賽伯計(jì)量學(xué)的創(chuàng)始人,并創(chuàng)設(shè)了美國(guó)棒球研究協(xié)會(huì)(Society for American Baseball Research,SABR)。1997 年比利·比恩(Billy Beane)在美國(guó)職業(yè)棒球隊(duì)大聯(lián)盟奧克蘭運(yùn)動(dòng)家隊(duì)使用的高級(jí)棒球統(tǒng)計(jì)數(shù)據(jù)和賽伯計(jì)量學(xué),利用一套統(tǒng)計(jì)學(xué)的公式將運(yùn)動(dòng)員的運(yùn)動(dòng)表現(xiàn)進(jìn)行量化,以最經(jīng)濟(jì)的成本挑選那些被低估的球員。20世紀(jì)八九十年代,隨著科學(xué)技術(shù)的發(fā)展,數(shù)據(jù)收集和分析過(guò)程逐漸計(jì)算機(jī)化,實(shí)現(xiàn)了應(yīng)用于網(wǎng)球和壘球計(jì)數(shù)分析的計(jì)算機(jī)化版本[8]。
自從2003年邁克爾·劉易斯(Michael Lewis)的《魔球:逆境中致勝的智慧》出版以來(lái),在美國(guó)體育界激起一股數(shù)據(jù)分析的熱潮。在等一批研究者先驅(qū)的努力下,各個(gè)職業(yè)體育聯(lián)盟出現(xiàn)了面向公眾的比賽數(shù)據(jù)網(wǎng)站[9]。2010 年,全美最受歡迎的體育聯(lián)盟開(kāi)始認(rèn)識(shí)到數(shù)據(jù)的力量,如最初基于以色列導(dǎo)彈跟蹤技術(shù)的攝像系統(tǒng)(Sport VU)被應(yīng)用到NBA 球場(chǎng)上,從實(shí)時(shí)視頻數(shù)據(jù)捕捉到強(qiáng)大的算法,使視頻數(shù)據(jù)分析成為可能。隨著現(xiàn)代數(shù)據(jù)科學(xué)以及信息技術(shù)的發(fā)展,數(shù)據(jù)的數(shù)量顯然大于從中提取到的有價(jià)值的信息量[10],數(shù)據(jù)的不斷積累和豐富同樣也伴隨著數(shù)據(jù)分析方法以及數(shù)據(jù)運(yùn)算能力的不斷發(fā)展,體育分析所帶來(lái)的價(jià)值正不斷被正視,這也標(biāo)志著體育分析領(lǐng)域的思考模式正在發(fā)生轉(zhuǎn)變。
如今,體育分析作為一門(mén)新興的交叉學(xué)科,受到更多的關(guān)注。國(guó)際與之相關(guān)的體育分析研討會(huì)不斷增加,并面向世界的不同群體討論體育相關(guān)的數(shù)據(jù)統(tǒng)計(jì)問(wèn)題,該文將列舉主要的國(guó)際體育分析會(huì)議(見(jiàn)表1)。
表1 國(guó)際體育分析研討會(huì)
對(duì)于體育分析的研究,在國(guó)外主流期刊上有不少相應(yīng)的文章研究運(yùn)動(dòng)場(chǎng)上的動(dòng)態(tài)過(guò)程以及球員評(píng)價(jià)。例如,Journal of Quantitative Analysis in Sports是美國(guó)高質(zhì)量的體育研究期刊,文章來(lái)自廣泛的體育項(xiàng)目和不同的視角,涉及的主題包括比賽結(jié)果模型、球員表現(xiàn)的測(cè)量和評(píng)估、比賽結(jié)構(gòu)、規(guī)則和裁決分析、比賽內(nèi)策略、體育技術(shù)分析以及球員和團(tuán)隊(duì)排名方法。
體育分析的潛力是巨大的。一方面,這歸功于分析技術(shù)的進(jìn)步,這些技術(shù)能夠?qū)崿F(xiàn)更快、更精確和更強(qiáng)大的數(shù)字運(yùn)算,嘗試更深入地研究數(shù)據(jù)驅(qū)動(dòng)型決策的實(shí)施,深入挖掘運(yùn)動(dòng)員場(chǎng)上表現(xiàn)、幫助教練員決策制定以及預(yù)測(cè)運(yùn)動(dòng)員健康等方面的數(shù)據(jù)信息。另一方面,歸功于視頻分析技術(shù)和可穿戴設(shè)備等高科技技術(shù)的發(fā)展。視頻分析技術(shù)可以用來(lái)幫助運(yùn)動(dòng)員和教練員更好地解決個(gè)人技術(shù)和團(tuán)隊(duì)?wèi)?zhàn)術(shù)中的優(yōu)劣點(diǎn),如運(yùn)動(dòng)員在比賽中暴露出的技術(shù)短板,可以及時(shí)得到提高,并且可以在賽前幫助球隊(duì)了解對(duì)手的技戰(zhàn)術(shù)特點(diǎn),從而做到知己知彼??纱┐髟O(shè)備是體育分析不可或缺的一部分,通過(guò)監(jiān)測(cè)運(yùn)動(dòng)員在訓(xùn)練或比賽期間的生命體征,教練員可以準(zhǔn)確地把握訓(xùn)練、比賽的負(fù)荷,了解運(yùn)動(dòng)員的速度、耐力及力量的強(qiáng)弱點(diǎn),及時(shí)調(diào)整和設(shè)計(jì)相符的訓(xùn)練方法和負(fù)荷強(qiáng)度,最終達(dá)到提高運(yùn)動(dòng)員比賽表現(xiàn)的目的。
在籃球比賽過(guò)程中,數(shù)據(jù)分析團(tuán)隊(duì)可以利用場(chǎng)上球員產(chǎn)生的數(shù)據(jù)進(jìn)行跟蹤、做出預(yù)測(cè)并在現(xiàn)場(chǎng)發(fā)揮決定性作用;比賽后利用歷史數(shù)據(jù)對(duì)運(yùn)動(dòng)員評(píng)估、訓(xùn)練反饋、戰(zhàn)術(shù)制定等有助于團(tuán)隊(duì)或個(gè)人提升競(jìng)技水平。
籃球是一項(xiàng)需要全面枚舉參數(shù)的運(yùn)動(dòng),為更好地評(píng)估球員以及球隊(duì)的績(jī)效表現(xiàn)以幫助教練員制定更好決策,基于籃球場(chǎng)上的球員、教練員和球隊(duì)表現(xiàn)的綜合數(shù)據(jù)集,相關(guān)專(zhuān)業(yè)分析人員利用復(fù)雜公式開(kāi)發(fā)出與之相關(guān)的高階數(shù)據(jù)指標(biāo)[11]。通過(guò)這些指標(biāo)可以比較首發(fā)球員和替補(bǔ)球員在上場(chǎng)時(shí)間內(nèi)攻防效率差異;在決定引進(jìn)不同聯(lián)賽運(yùn)動(dòng)員時(shí),區(qū)分不同位置運(yùn)動(dòng)員的投籃準(zhǔn)確度[12],以優(yōu)化運(yùn)動(dòng)員的選擇和發(fā)展。根據(jù)球員的不同風(fēng)格,制定球隊(duì)及對(duì)手策略時(shí),優(yōu)化球隊(duì)的陣容評(píng)估和最終選擇是至關(guān)重要的。
教練員利用體育分析可以幫助團(tuán)隊(duì)的組成、比賽中戰(zhàn)術(shù)的制定、運(yùn)動(dòng)員的職業(yè)發(fā)展并評(píng)估如何將其實(shí)現(xiàn),以用來(lái)對(duì)未來(lái)的預(yù)測(cè),專(zhuān)業(yè)球探利用現(xiàn)代的統(tǒng)計(jì)預(yù)測(cè)知識(shí),可以更專(zhuān)業(yè)地評(píng)估運(yùn)動(dòng)員的發(fā)展前景。體育分析對(duì)籃球運(yùn)動(dòng)發(fā)展的一個(gè)顯著影響體現(xiàn)在三分球風(fēng)格趨勢(shì)的轉(zhuǎn)變,數(shù)據(jù)分析專(zhuān)家根據(jù)投籃位置的數(shù)據(jù)開(kāi)發(fā)出了球場(chǎng)上每個(gè)位置的每次投籃預(yù)期得分模型,該模型表明相比較遠(yuǎn)距離的兩分球投籃遠(yuǎn)遠(yuǎn)不如選擇三分球投籃[13],有了這些知識(shí),教練就會(huì)指導(dǎo)球員專(zhuān)注于三分線后更有價(jià)值的三分球投籃,而兩分跳投的相對(duì)減少。
通過(guò)將運(yùn)動(dòng)員傷病史、運(yùn)動(dòng)習(xí)慣和歷史其他數(shù)據(jù)進(jìn)行建模分析并最終預(yù)判和預(yù)防損傷的發(fā)生。通過(guò)教練員的執(zhí)教經(jīng)驗(yàn)評(píng)估訓(xùn)練量和預(yù)測(cè)運(yùn)動(dòng)員損傷是有一定的價(jià)值,但是這帶有主觀局限性。數(shù)據(jù)科學(xué)和體育分析在支持團(tuán)隊(duì)和球員提高競(jìng)技表現(xiàn)方面發(fā)揮著關(guān)鍵作用,國(guó)外研究中認(rèn)為受傷和病理對(duì)競(jìng)技表現(xiàn)有很大的影響,肌肉骨骼損傷是最常見(jiàn)的導(dǎo)致競(jìng)技表現(xiàn)下降的原因,基于描述球員和團(tuán)隊(duì)績(jī)效表現(xiàn)的整體多變量模型,發(fā)現(xiàn)競(jìng)技表現(xiàn)與運(yùn)動(dòng)損傷之間存在正相關(guān)關(guān)系[14]。
國(guó)內(nèi)學(xué)者提出從宏觀角度出發(fā),將運(yùn)動(dòng)訓(xùn)練負(fù)荷監(jiān)控分為內(nèi)部負(fù)荷監(jiān)控和外部負(fù)荷監(jiān)控。其中內(nèi)部負(fù)荷監(jiān)控領(lǐng)域中的可穿戴設(shè)備分為心肺指標(biāo)、體液指標(biāo)以及神經(jīng)肌肉指標(biāo),外部負(fù)荷監(jiān)控領(lǐng)域的可穿戴設(shè)備通常以GPS、陀螺儀和加速度計(jì)3種傳感器為主[15]。不同的運(yùn)動(dòng)所需要收集的數(shù)據(jù)是不同的,因此在制訂運(yùn)動(dòng)員訓(xùn)練計(jì)劃時(shí),為確保運(yùn)動(dòng)員能夠適應(yīng)訓(xùn)練負(fù)荷,應(yīng)將可穿戴技術(shù)設(shè)備與數(shù)據(jù)分析技術(shù)相結(jié)合,識(shí)別受傷風(fēng)險(xiǎn)因素較高的球員,并有針對(duì)性地進(jìn)行干預(yù)。
(1)今后的體育分析應(yīng)該具備多元化視角,應(yīng)集中在教練員、運(yùn)動(dòng)員、數(shù)據(jù)分析師等體育競(jìng)賽相關(guān)人群最關(guān)注的核心問(wèn)題上。體育分析可以幫助教練員閱讀比賽,以了解運(yùn)動(dòng)隊(duì)和對(duì)手的優(yōu)勢(shì)和弱勢(shì)。此外,還可以從不同角度收集與訓(xùn)練表現(xiàn)有關(guān)的心理、身體和受傷等相關(guān)的數(shù)據(jù),以及運(yùn)動(dòng)員的社交網(wǎng)絡(luò)活動(dòng),來(lái)了解運(yùn)動(dòng)員的想法和行為。
(2)更先進(jìn)的數(shù)據(jù)收集方法和敏捷高效的存儲(chǔ)方式。科學(xué)技術(shù)的發(fā)展帶來(lái)更多的新設(shè)備、新軟件和新的數(shù)據(jù)收集手段。如EPTS 數(shù)字化表現(xiàn)和跟蹤系統(tǒng)、OPTA 技戰(zhàn)術(shù)數(shù)據(jù)、Sport code 視頻采集及分析軟件、Catapult可穿戴設(shè)備以及視頻采集分析軟件等,都是目前被廣泛應(yīng)用的技術(shù)手段。在不久的將來(lái),基于這些高科技設(shè)備和技術(shù)手段的革新,都會(huì)給該領(lǐng)域帶來(lái)新的機(jī)遇和挑戰(zhàn)。
(3)豐富的數(shù)據(jù)分析模型和可視化方式:機(jī)器學(xué)習(xí)是關(guān)鍵的核心技術(shù),因?yàn)榍騿T和球的移動(dòng)數(shù)據(jù)是完全不規(guī)則和非結(jié)構(gòu)化的。例如,“Gohosting”的模型能夠分析足球運(yùn)動(dòng)員在進(jìn)攻和防守時(shí)的表現(xiàn),并且還具備可視化數(shù)據(jù)信息手段,幫助教練員和運(yùn)動(dòng)員觀看特定比賽的直播?;旌暇€性模型、支持向量機(jī)回歸模型、決策樹(shù)預(yù)測(cè)模型、神經(jīng)網(wǎng)絡(luò)模型等都已經(jīng)逐漸被引入到體育分析中來(lái),但是當(dāng)前集合所有定量和定性的數(shù)據(jù)是一項(xiàng)艱巨的任務(wù),這對(duì)未來(lái)教練員的領(lǐng)導(dǎo)力也提出了要求。