體育運(yùn)動(dòng)動(dòng)作識(shí)別是通過(guò)在時(shí)域上跟蹤一些關(guān)鍵點(diǎn)的運(yùn)動(dòng)以記錄人體運(yùn)動(dòng),并轉(zhuǎn)換為可用的數(shù)學(xué)方式表達(dá)運(yùn)動(dòng)的過(guò)程,對(duì)于競(jìng)技訓(xùn)練和全民健身均具有重要意義。傳統(tǒng)的動(dòng)作識(shí)別技術(shù)有機(jī)械式、聲學(xué)式、電磁式、光學(xué)式等。機(jī)械式技術(shù)采用外置傳感器和剛性支架,會(huì)影響肢體活動(dòng)。聲學(xué)式和電磁式技術(shù)則存在易受外界環(huán)境干擾、有較大時(shí)間延遲、測(cè)試精度不高等問(wèn)題。傳統(tǒng)的光學(xué)式技術(shù)較為精準(zhǔn),但也存在價(jià)格昂貴、數(shù)據(jù)處理耗時(shí)較長(zhǎng)等不足。近年來(lái),基于加速度計(jì)、陀螺儀、磁力計(jì)等慣性測(cè)量技術(shù)和基于肌電圖的可穿戴技術(shù)發(fā)展迅速,但也存在設(shè)備可能影響運(yùn)動(dòng)表現(xiàn)、無(wú)法在比賽環(huán)境中使用等局限。
計(jì)算機(jī)視覺(jué)利用攝像機(jī)和計(jì)算機(jī)對(duì)目標(biāo)進(jìn)行捕捉、跟蹤、測(cè)量,并通過(guò)人工智能算法實(shí)現(xiàn)動(dòng)作自動(dòng)識(shí)別,突破了傳統(tǒng)動(dòng)作識(shí)別技術(shù)的諸多局限。2019年,澳大利亞學(xué)者Cust等總結(jié)了機(jī)器學(xué)習(xí)在動(dòng)作識(shí)別中的應(yīng)用,系統(tǒng)匯總了支持向量機(jī)SVM、卷積神經(jīng)網(wǎng)絡(luò)CNN等算法在計(jì)算機(jī)視覺(jué)中的應(yīng)用。值得關(guān)注的是,一些新的姿態(tài)估計(jì)算法不斷涌現(xiàn)。OpenPose是當(dāng)前最常用的多人人體姿態(tài)估計(jì)算法之一,采用自底向上的方法,首先檢測(cè)出圖像中所有人的關(guān)鍵點(diǎn),然后將檢出的關(guān)鍵點(diǎn)分配給每個(gè)對(duì)應(yīng)的人。RMPEAlphaPose是一種自頂向下的姿態(tài)估計(jì)算法,通過(guò)使用對(duì)稱空間變換網(wǎng)絡(luò)SSTN從不準(zhǔn)確的候選框中抽取高質(zhì)量的單人區(qū)域。MaskRCNN作為一個(gè)流行的語(yǔ)義和實(shí)例分割架構(gòu),可同時(shí)預(yù)測(cè)圖像中多個(gè)物體的候選框位置,并分割其語(yǔ)義信息的掩碼,從而確定每個(gè)人的位置,再通過(guò)位置信息和特征點(diǎn)集合識(shí)別人體運(yùn)動(dòng)姿態(tài)。
從普通相機(jī)到深度相機(jī),從固定區(qū)域到無(wú)限區(qū)域,從固定視角到自由視角,從單人捕捉到多人識(shí)別,從單一技術(shù)到計(jì)算機(jī)視覺(jué)、慣性傳感器、肌電圖、虛擬現(xiàn)實(shí)等技術(shù)的交叉融合,技術(shù)在不斷革新。計(jì)算機(jī)視覺(jué)在體育中的應(yīng)用也有望從動(dòng)作識(shí)別逐漸向運(yùn)動(dòng)效果智能評(píng)估、技戰(zhàn)術(shù)智能分析、運(yùn)動(dòng)損傷智能預(yù)測(cè)等領(lǐng)域拓展和深入,推動(dòng)體育運(yùn)動(dòng)的智能化發(fā)展。
浙江大學(xué)溫煦,王軼凡