面向體育測(cè)試的人體運(yùn)動(dòng)姿勢(shì)實(shí)時(shí)識(shí)別研究

2024-01-02 08:35:28毛小薇文佳洛王張車兒

軟件導(dǎo)刊 2023年12期

關(guān)鍵詞：關(guān)節(jié)點(diǎn)關(guān)鍵點(diǎn)骨骼

周川，秦蕾，毛小薇，文佳洛，王張車兒，李聰

（1.國(guó)網(wǎng)湖北省電力有限公司中超建設(shè)管理公司，湖北武漢 430015；2.武漢城市學(xué)院信息工程學(xué)部，湖北武漢 430083）

0 引言

隨著科技的不斷發(fā)展，越來(lái)越多的任務(wù)被機(jī)器代替，其中傳統(tǒng)的體育測(cè)試方式也不例外。目前，傳統(tǒng)的體育測(cè)試主要依靠人工記錄，這導(dǎo)致測(cè)試時(shí)間較長(zhǎng)且需要大量人力資源。因此，迫切需要建立一套智能、高效的體育測(cè)試系統(tǒng)，以幫助高校減輕體育教學(xué)負(fù)擔(dān)，并減少體育測(cè)試開(kāi)銷。

目前，體育測(cè)試檢測(cè)方法可以分為兩種。一種是基于外部傳感器（如智能穿戴設(shè)備）的方法，這種方法的主要原理是將傳感器放置在體育測(cè)試對(duì)應(yīng)的環(huán)境中，采集人體的運(yùn)動(dòng)數(shù)據(jù)，通過(guò)對(duì)采集到的數(shù)據(jù)進(jìn)行機(jī)器學(xué)習(xí)等分析，可以實(shí)現(xiàn)對(duì)體育測(cè)試所需各項(xiàng)指標(biāo)的檢測(cè)和評(píng)估；另一種是基于計(jì)算機(jī)視覺(jué)的體育測(cè)試的人體運(yùn)動(dòng)姿態(tài)檢測(cè)，通過(guò)對(duì)視頻或圖片進(jìn)行特征提?。?］、骨骼綁定、目標(biāo)跟蹤、深度學(xué)習(xí)［2］等以獲取人體運(yùn)動(dòng)姿勢(shì)，通過(guò)姿勢(shì)判斷是否符合相關(guān)體育測(cè)試運(yùn)動(dòng)，以完成體育測(cè)試的成績(jī)記錄等。

傳感器方法和計(jì)算機(jī)視覺(jué)方法是兩種常用的體育測(cè)試方法。傳感器方法需要外部設(shè)備，使用范圍較窄，針對(duì)不同的體育測(cè)試項(xiàng)目需要不同的傳感器，而且硬件成本較高。針對(duì)計(jì)算機(jī)視覺(jué)方法具有檢測(cè)精度低和計(jì)量準(zhǔn)確度不高的問(wèn)題，本文提出了一種基于OpenPose［3］改進(jìn)的人體運(yùn)動(dòng)空間融合姿態(tài)識(shí)別分析模型（Posture Recognition of Spatial Fusion，Pos-RSF），并將它與以前的SOTA 方法進(jìn)行比較。

目前，已有不少相關(guān)研究，F(xiàn)ang 等［4］提出Part-Guided Proposal Generator（PGPG）和多領(lǐng)域知識(shí)蒸餾以進(jìn)一步提高精度，解決了在不準(zhǔn)確的邊界框和冗余檢測(cè)情況下同時(shí)跟蹤人體的問(wèn)題，但對(duì)場(chǎng)景適應(yīng)性不強(qiáng)且需要較高的硬件條件。William 等［5］提出一種新的體重轉(zhuǎn)移方案，能夠以靈活的方式加速神經(jīng)進(jìn)化，生成的網(wǎng)絡(luò)可用更少的計(jì)算得到更高的分辨率處理圖像。但由于深度可分離卷積的內(nèi)存訪問(wèn)量較高，受到內(nèi)存帶寬和數(shù)據(jù)IO 的限制，故在GPU 上的運(yùn)行速度較慢。Wang 等［6］提出從一個(gè)高分辨率卷積流開(kāi)始，逐步逐個(gè)添加高低分辨率卷積流，并將多分辨率流并行連接。它保留了高分辨率支路，對(duì)小目標(biāo)比較友好，但網(wǎng)絡(luò)結(jié)構(gòu)相對(duì)復(fù)雜，不適用于對(duì)計(jì)算資源受限的場(chǎng)景。Feng 等［7］提出一種新的分布感知坐標(biāo)表示關(guān)鍵點(diǎn)（DARK）方法。通過(guò)生成精確的熱圖分布以改進(jìn)標(biāo)準(zhǔn)坐標(biāo)編碼過(guò)程，以進(jìn)行無(wú)偏模型訓(xùn)練，顯著提高了最先進(jìn)的人體姿勢(shì)估計(jì)模型的性能。

綜上所述，當(dāng)前研究多集中于多人姿態(tài)識(shí)別準(zhǔn)確度檢測(cè)，而針對(duì)體育測(cè)試中的體育測(cè)試識(shí)別，準(zhǔn)確度不高且實(shí)時(shí)性有待提升。鑒于此，本文提出在體育測(cè)試中的人體運(yùn)動(dòng)空間融合姿態(tài)識(shí)別的分析模型Pos-RSF。根據(jù)PAFs 方法，通過(guò)編碼肢體位置和運(yùn)動(dòng)圖像檢測(cè)向量，以解決面向體育測(cè)試人體姿勢(shì)識(shí)別時(shí)檢測(cè)準(zhǔn)確度不高、實(shí)時(shí)性較差等問(wèn)題。實(shí)驗(yàn)結(jié)果表明，將該模型運(yùn)用于體育測(cè)試的人體姿態(tài)檢測(cè)具有良好表現(xiàn)。

1 人體運(yùn)動(dòng)姿勢(shì)圖像采樣與姿勢(shì)特征提取

1.1 人體運(yùn)動(dòng)姿勢(shì)圖像采樣

對(duì)于體育測(cè)試中的人體運(yùn)動(dòng)姿態(tài)識(shí)別，本文主要以圖像處理與大數(shù)據(jù)分析相結(jié)合的方法為基礎(chǔ)，結(jié)合人體運(yùn)動(dòng)特征和特征數(shù)據(jù)提取，構(gòu)建高校體育測(cè)試的人體運(yùn)動(dòng)姿勢(shì)圖像和數(shù)據(jù)分析模型，根據(jù)相關(guān)特征挖掘方法，對(duì)體育測(cè)試中的人體進(jìn)行運(yùn)動(dòng)姿態(tài)數(shù)據(jù)信息的模糊度聚類分析，并對(duì)體育測(cè)試中的人體運(yùn)動(dòng)姿態(tài)數(shù)據(jù)進(jìn)行建模，構(gòu)建Pos-RSF 模型，從而實(shí)現(xiàn)對(duì)體育測(cè)試中的人體運(yùn)動(dòng)姿勢(shì)圖像識(shí)別。在該過(guò)程中，進(jìn)行體育測(cè)試的人體運(yùn)動(dòng)姿勢(shì)圖像采集流程如圖1所示。

Fig.1 Flow of sports posture image acquisition in sports test圖1 體育測(cè)試中運(yùn)動(dòng)姿勢(shì)圖像采集流程

1.2 人體運(yùn)動(dòng)骨骼信息提取算法

對(duì)于人體骨骼信息的研究，目前主流的兩種思路是自頂向下（Top-Down）和自底向上（Bottom-Up）。自頂向下的人體骨骼信息檢測(cè)算法一般流程是：先檢測(cè)出圖片中人體的頭部，再根據(jù)頭部位置單獨(dú)對(duì)每一個(gè)人體骨骼的關(guān)鍵點(diǎn)進(jìn)行預(yù)測(cè)。該方法的計(jì)算量會(huì)隨著人數(shù)的增多而上升，但對(duì)不同尺寸的人體精度更高，通俗而言，該方法更準(zhǔn)確。AlphaPose、RMPE［8］和Mask-RCNN［9］都屬于自頂向下檢測(cè)。自底向上（Bottom-Up）的人體骨骼信息檢測(cè)算法是先檢測(cè)到所有關(guān)鍵點(diǎn)，再進(jìn)行關(guān)鍵點(diǎn)聚類，組合成人體。該方法的計(jì)算量不會(huì)隨著人數(shù)的增多而上升，通俗而言，該方法更快（人越多的時(shí)候越明顯）。常見(jiàn)算法有Deep Cut、Part Segmentation 等。為了能夠更好地對(duì)體育測(cè)試人員的人體運(yùn)動(dòng)姿勢(shì)圖像進(jìn)行實(shí)時(shí)識(shí)別，本文對(duì)OpenPose 算法加以改進(jìn)，提出了更適合體育測(cè)試中人體運(yùn)動(dòng)姿態(tài)識(shí)別的Pos-RSF 模型。

OpenPose 的主要網(wǎng)絡(luò)架構(gòu)如圖2 所示，它主要以卷積神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)，檢測(cè)準(zhǔn)確度很高，但所需要時(shí)間較長(zhǎng)，不能滿足于體育測(cè)試中的人體運(yùn)動(dòng)姿態(tài)識(shí)別。鑒于此，本文在Open Pose 的網(wǎng)絡(luò)結(jié)構(gòu)上加以改進(jìn)，提出了Pos-RSF 模型，其主要網(wǎng)絡(luò)架構(gòu)如圖3所示。

Fig.2 Main architecture of OpenPose network圖2 OpenPose網(wǎng)絡(luò)主要架構(gòu)

Fig.3 Main architecture of Pos-RSF network圖3 Pos-RSF網(wǎng)絡(luò)主要架構(gòu)

OpenPose 通過(guò)傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)VGG19［10］進(jìn)行特征提取得到特征圖F，但對(duì)于VGG19 而言，深度的增加將影響網(wǎng)絡(luò)收斂速度，反而會(huì)影響檢測(cè)效果。因此，本文Pos-RSF 模型用ResNet18［11］結(jié)構(gòu)代替VGG19 結(jié)構(gòu)，得到特征圖F。ResNet18 網(wǎng)絡(luò)結(jié)構(gòu)如圖4 所示，它與VGG19 相比，本身參數(shù)量更少，在結(jié)構(gòu)上也不再是簡(jiǎn)單的卷積核堆疊，而是利用殘差結(jié)構(gòu)的理念解決了深層網(wǎng)絡(luò)中梯度消失和梯度爆炸的退化問(wèn)題。

Fig.4 ResNet18 network structure圖4 ResNet18網(wǎng)絡(luò)結(jié)構(gòu)

ResNet18網(wǎng)絡(luò)通過(guò)4個(gè)殘差層從不同尺度對(duì)特征進(jìn)行提取，每個(gè)殘差層由兩個(gè)Basicblock 殘差塊構(gòu)成，如圖5 所示。隨著網(wǎng)絡(luò)深度的增加，使用跳級(jí)連接的方式創(chuàng)建了兩條捷徑，并在卷積核之間添加了ReLU 激活函數(shù)以保證網(wǎng)絡(luò)的非線性。在訓(xùn)練過(guò)程中，主路徑和卷積路徑的特征不斷融合。

Fig.5 ResNet18 residual structure圖5 ResNet18殘差結(jié)構(gòu)

對(duì)于OpenPose 原本雙分支神經(jīng)網(wǎng)絡(luò)的第t階段的7×7的卷積核，本文Pos-RSF 模型換成了3 個(gè)連續(xù)的3×3 卷積核。這樣的替換可以減少計(jì)算量，同時(shí)保留了接收域。具體而言，原先的操作數(shù)為2 x 7 x 7 -1=97，而替換后的操作數(shù)僅為51，速度更快。

如圖6 所示，在雙分支卷積神經(jīng)網(wǎng)絡(luò)中，第一個(gè)分支（S1至St部分）用于預(yù)測(cè)人體關(guān)節(jié)點(diǎn)位置的置信相關(guān)度熱力圖（Confidence Map）。該熱力圖可以表示出每個(gè)像素點(diǎn)上某個(gè)關(guān)節(jié)點(diǎn)存在的概率，從而幫助定位人體關(guān)節(jié)點(diǎn)的位置。

Fig.6 Prediction network structure of confidence and affinity of key points圖6 關(guān)鍵點(diǎn)置信度與親和度預(yù)測(cè)網(wǎng)絡(luò)結(jié)構(gòu)

而第二個(gè)分支（L1至Lt部分）則用于檢測(cè)人體部分相關(guān)度字段在骨骼中的位置走向，并將其表示為像素點(diǎn)。這個(gè)分支可以幫助建立起人體骨骼的連接關(guān)系，從而獲取到更加完整的姿態(tài)信息。

設(shè)S表示關(guān)節(jié)點(diǎn)置信相關(guān)度熱力圖，S=(s1，s2，…，sj)，它由j個(gè)子圖組成，其中Sj∈Rw×h，j∈(1，2，…，J)，其中j表示圖像中人體關(guān)節(jié)點(diǎn)的個(gè)數(shù)；設(shè)L為人體部分相關(guān)度字段，L=(L1，L2，…，LC)，Lc∈Rm×xh×2，c∈(1，2，…，C)，C是骨骼連接數(shù)，L由C個(gè)向量圖組成，每個(gè)向量圖都記錄了骨骼連接的方向，這些方向都在二維空間中。

由卷積神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的關(guān)節(jié)點(diǎn)2D 置信相關(guān)度熱力圖S1如式（1）所示，人體部分相關(guān)度字段L1如式（2）所示。

對(duì)Stage1 進(jìn)行前向計(jì)算，得到兩個(gè)預(yù)測(cè)結(jié)果S1和L1。將這兩個(gè)預(yù)測(cè)結(jié)果與原始特征F進(jìn)行整合，形成一個(gè)新的輸入值。這個(gè)新的輸入值將被用于下一步分析和預(yù)測(cè)。其公式分別如式（3）、式（4）所示。

卷積神經(jīng)網(wǎng)絡(luò)中的兩個(gè)分支都是迭代級(jí)聯(lián)結(jié)構(gòu)，各階段都要通過(guò)L2 范式進(jìn)行Loss 計(jì)算，再對(duì)關(guān)鍵點(diǎn)2D 置信相關(guān)度熱力圖和人體相關(guān)度部分字段進(jìn)行迭代預(yù)測(cè)，其公式如式（5）和式（6）所示。

其中，是標(biāo)注的人體部分相關(guān)度字段。在該式中，對(duì)于每個(gè)像素點(diǎn)p，其權(quán)重W(p)表示該點(diǎn)是否被標(biāo)注，如果未被標(biāo)注，則權(quán)重為0。第t個(gè)回歸輸出中第j個(gè)部位的置信相關(guān)度熱力圖在點(diǎn)p上的響應(yīng)結(jié)果表示為W(p)。同時(shí)，第j個(gè)部位的相關(guān)度向量場(chǎng)在點(diǎn)p上的向量表示為(p)。最終，整個(gè)網(wǎng)絡(luò)的損失函數(shù)由各階段的損失項(xiàng)組成，其公式如式（7）所示。

Pos-RSF 模型使用關(guān)節(jié)點(diǎn)2D 置信相關(guān)度熱力圖以檢測(cè)人體骨骼關(guān)節(jié)點(diǎn)，這些置信相關(guān)度熱力圖表示每個(gè)像素位置上出現(xiàn)特定身體關(guān)節(jié)的可能性。在單人檢測(cè)時(shí)，置信相關(guān)度熱力圖中會(huì)有一個(gè)響應(yīng)值；而在多人檢測(cè)時(shí)，對(duì)于每個(gè)關(guān)節(jié)點(diǎn)，會(huì)計(jì)算其對(duì)應(yīng)p點(diǎn)在置信相關(guān)度熱力圖中的響應(yīng)值。對(duì)應(yīng)p點(diǎn)的置信相關(guān)度熱力圖，其公式如式（8）所示。

其中，k是圖像中序號(hào)為k的人，它的身體部分記作j，對(duì)于每個(gè)人的身體部位，使用置信相關(guān)度熱力圖(p)表示該部位在圖像中每個(gè)像素位置出現(xiàn)的可能性。同時(shí)，使用標(biāo)定位置xj，k和σ調(diào)整置信相關(guān)度熱力圖的峰值范圍。最終，所有人的(p)最大值決定了該位置的置信值，其公式如式（9）所示。

式（5）—式（9）計(jì)算了p點(diǎn)的置信值。

對(duì)關(guān)鍵點(diǎn)進(jìn)行分析和處理得到熱力圖標(biāo)簽（見(jiàn)圖7），它們反映了關(guān)鍵點(diǎn)的位置信息。接下來(lái)，可以通過(guò)計(jì)算這些關(guān)鍵點(diǎn)之間的關(guān)聯(lián)性，將它們連接起來(lái)形成骨骼結(jié)構(gòu)。

Fig.7 Key point thermogram label圖7 關(guān)鍵點(diǎn)熱力圖標(biāo)簽

圖8 的研究對(duì)象是肢體c，坐標(biāo)分別用來(lái)表示在第k個(gè)人肢體上的兩個(gè)骨骼關(guān)節(jié)點(diǎn)，p是圖像上任意一點(diǎn)。當(dāng)p在肢體上時(shí)，人體相關(guān)度字段在p點(diǎn)的向量(p)是單位向量v，表示p點(diǎn)與肢體c的相關(guān)度程度。當(dāng)p不在肢體c上時(shí)，Lc，k(p)的值是0，表示p點(diǎn)與肢體c沒(méi)有相關(guān)度關(guān)系。在計(jì)算第k個(gè)人肢體c上的相關(guān)度向量場(chǎng)L時(shí)，其公式如式（10）和式（11）所示。

Fig.8 Schematic diagram of limb movement圖8 肢體運(yùn)動(dòng)示意圖

其中，xj，k表示肢體方向上的單位向量，該向量表示第j個(gè)關(guān)鍵點(diǎn)在第k個(gè)人身上的位置。當(dāng)判斷點(diǎn)p是否存在于肢體c上時(shí)，需要設(shè)定該點(diǎn)的范圍。具體而言，可以使用式（12）確定點(diǎn)p在肢體c上的范圍。

其中，μ1用來(lái)表示肢體寬度，肢體長(zhǎng)度則是用lc，k=(xj2，k-xj，k)2加以表示，p點(diǎn)的真實(shí)值為所有人在p點(diǎn)的部分相關(guān)度力向量場(chǎng)的平均值，其公式如式（13）所示。

其中，非零向量的個(gè)數(shù)是nc(p)，在獲得二維坐標(biāo)中的關(guān)鍵點(diǎn)后，需要對(duì)它們之間的關(guān)系進(jìn)行評(píng)估。這可以通過(guò)計(jì)算連接這些關(guān)鍵點(diǎn)的線的權(quán)重值加以實(shí)現(xiàn)。其公式如式（14）和式（15）所示。

由于視頻圖像會(huì)有多人的情況，就會(huì)檢測(cè)出多個(gè)關(guān)節(jié)j在一個(gè)關(guān)節(jié)點(diǎn)置信相關(guān)度熱力圖的情況，j∈{1，…，J}。設(shè)關(guān)節(jié)集合為中分別是檢測(cè)出的關(guān)節(jié)類型是j1和j2的集合，m和n分別是和中的點(diǎn)。j1中的第m個(gè)點(diǎn)和j2中的第n個(gè)點(diǎn)的連接狀態(tài)用表示，其公式如式（16）所示。

多維匹配問(wèn)題是關(guān)于關(guān)節(jié)點(diǎn)之間的最優(yōu)匹配問(wèn)題，可以通過(guò)匈牙利算法對(duì)上式求解，其中Pos-RSF 模型使用上式獨(dú)立地求解子問(wèn)題為最優(yōu)解。其公式如式（17）所示。

最終通過(guò)Pos-RSF 模型輸出得到的人體骨骼信息通過(guò)骨骼坐標(biāo)點(diǎn)加以表示，其中每個(gè)關(guān)鍵點(diǎn)對(duì)應(yīng)于人體的18個(gè)部位，如鼻子、脖子、肩膀、手腕等，它們分別對(duì)應(yīng)的映射點(diǎn)如圖9所示。

Fig.9 Location map of eighteen key points of human body圖9 人體18個(gè)關(guān)鍵點(diǎn)位置圖

2 仿真實(shí)驗(yàn)

2.1 仰臥起坐狀態(tài)機(jī)

仰臥起坐是一項(xiàng)非常重要的運(yùn)動(dòng)，可幫助人們強(qiáng)身健體。在這項(xiàng)運(yùn)動(dòng)中，測(cè)試人員需要平躺在地上，膝蓋彎曲成90°，雙腳放在地上。同伴可以用雙手按住腳踝，但不能使用器械固定腳步，否則會(huì)減少腹部肌肉的訓(xùn)練效果。測(cè)試人員需要利用腹部肌肉的力量將雙手放在腦后，并且雙手越貼近后腦勺，動(dòng)作就越難做。通過(guò)腹部肌肉的收縮，測(cè)試人員可以將上半身向前抬起，然后回到躺姿，不斷重復(fù)這個(gè)動(dòng)作。仰臥起坐運(yùn)動(dòng)狀態(tài)機(jī)流程如圖10所示。

Fig.10 Flow of sit-up motion state machine圖10 仰臥起坐運(yùn)動(dòng)狀態(tài)機(jī)流程

2.2 仰臥起坐識(shí)別原理

該系統(tǒng)的首要難點(diǎn)是特征值的樣品采集和提取，它有兩個(gè)非常重要的組成部分：①骨骼特征序列；②運(yùn)動(dòng)特征序列。

人體的骨骼點(diǎn)分布可以用角度加以描述，這些角度表示骨骼點(diǎn)之間的相對(duì)位置和關(guān)系，其人體的骨骼點(diǎn)分布在二維平面的相對(duì)應(yīng)角度如圖11 所示。為了更直觀地理解和分析姿勢(shì)數(shù)據(jù)，可以將這些數(shù)據(jù)映射到直角坐標(biāo)系中，（見(jiàn)圖12），以更好地觀察和分析骨骼位置。在直角坐標(biāo)系中，每個(gè)骨骼點(diǎn)都可以用一個(gè)坐標(biāo)點(diǎn)表示，連接起來(lái)就形成骨骼。

Fig.11 Feature extraction action圖11 特征提取動(dòng)作

Fig.12 Action coordinate map圖 12 動(dòng)作坐標(biāo)映射圖

XOY 平面的法向量如式（22）所示

由此可得旋轉(zhuǎn)角α，如式（23）所示。

在運(yùn)動(dòng)姿勢(shì)識(shí)別中，針對(duì)每個(gè)關(guān)鍵時(shí)間點(diǎn)的每個(gè)關(guān)鍵姿勢(shì)特征，會(huì)提取與之對(duì)應(yīng)的角度所組成的骨骼特征序列，這是通過(guò)上面描述的骨骼角度方法計(jì)算得到。為了更準(zhǔn)確和全面地識(shí)別運(yùn)動(dòng)姿勢(shì)，分別對(duì)運(yùn)動(dòng)特征和骨骼特征進(jìn)行同步分類提取，以提高其準(zhǔn)確性和完整性。這意味著針對(duì)運(yùn)動(dòng)特征和骨骼特征，將會(huì)分別進(jìn)行分類和提取，以提高識(shí)別準(zhǔn)確性和完整性。

2.3 運(yùn)動(dòng)特征提取

仰臥起坐人體運(yùn)動(dòng)關(guān)鍵姿勢(shì)轉(zhuǎn)化如圖13所示。

Fig.13 Motion posture transformation圖13 運(yùn)動(dòng)姿勢(shì)轉(zhuǎn)化

不同姿勢(shì)轉(zhuǎn)換是仰臥起坐運(yùn)動(dòng)識(shí)別的關(guān)鍵，其中仰臥狀態(tài)和起坐狀態(tài)所占比例為c1：c2。假設(shè)一個(gè)仰臥起坐的周期滿分為m，那么在實(shí)際情況下m為100 分。仰臥起坐狀態(tài)的相似度為k，根據(jù)公式得到最終成績(jī)?nèi)缡剑?4）所示。

2.4 功能展示

在進(jìn)行仰臥起坐運(yùn)動(dòng)時(shí)，正確的動(dòng)作要求非常嚴(yán)格。根據(jù)《國(guó)家學(xué)生體質(zhì)健康標(biāo)準(zhǔn)》可知，測(cè)試人員必須先平躺在墊子上，雙腿稍微分開(kāi)，膝蓋彎曲呈90°夾角，雙手緊貼在腦袋后面。在仰臥起坐測(cè)試中，每次超過(guò)膝蓋算作一次完成。運(yùn)動(dòng)過(guò)程實(shí)測(cè)情況如圖14所示。

Fig.14 Actual measurement of movement process圖14 運(yùn)動(dòng)過(guò)程實(shí)測(cè)

3 實(shí)驗(yàn)結(jié)果與分析

3.1 實(shí)驗(yàn)數(shù)據(jù)集

本文將提出的Pos-RSF 模型在兩個(gè)人體姿態(tài)估計(jì)數(shù)據(jù)集（MS COCO［12］數(shù)據(jù)集和MPII 數(shù)據(jù)集）上進(jìn)行了實(shí)驗(yàn)。MS COCO 的全稱是Microsoft Common Objects in Context，它是一個(gè)數(shù)據(jù)集，其大部分?jǐn)?shù)據(jù)來(lái)自于各種復(fù)雜的生活場(chǎng)景，并包含了91 類不同的目標(biāo)物。在將MS COCO 用作數(shù)據(jù)集進(jìn)行預(yù)處理操作時(shí)，可以提高實(shí)驗(yàn)數(shù)據(jù)的可靠性，從而獲得更好的目標(biāo)識(shí)別效果。數(shù)據(jù)預(yù)處理部分主要對(duì)數(shù)據(jù)進(jìn)行歸一化處理和數(shù)據(jù)增強(qiáng)處理。通過(guò)這些預(yù)處理操作，可以使得網(wǎng)絡(luò)訓(xùn)練過(guò)程更加穩(wěn)定和有效。MPII［13］數(shù)據(jù)集包含了410 種不同的人類活動(dòng)，并且每個(gè)圖像都附帶有對(duì)應(yīng)的活動(dòng)標(biāo)簽。這些圖像是從YouTube 視頻中提取，并且還提供了每個(gè)圖像之前和之后的未注釋幀。對(duì)于測(cè)試集，MPII 數(shù)據(jù)集提供了更豐富的注釋，包括身體部位的遮擋情況以及3D 軀干和頭部的方向信息。這些注釋對(duì)于進(jìn)行人體姿態(tài)估計(jì)和行為識(shí)別等任務(wù)非常有幫助，并且能夠提供更準(zhǔn)確的結(jié)果。

3.2 評(píng)估指標(biāo)

本文模型框架在高分辨率網(wǎng)絡(luò)的基礎(chǔ)上進(jìn)行構(gòu)建。模型訓(xùn)練數(shù)據(jù)集為2020MS COCO 數(shù)據(jù)集，評(píng)估指標(biāo)為目標(biāo)關(guān)節(jié)點(diǎn)相似性（Object Keypoint Similarity，OKS），其公式如式（25）所示。

其中：dpj表示任意一個(gè)人的實(shí)際關(guān)節(jié)點(diǎn)和預(yù)測(cè)點(diǎn)之間的歐式距離；表示目標(biāo)尺度因子，用于校正不同人體目標(biāo)之間的尺度差異表示對(duì)所在目標(biāo)的第i個(gè)關(guān)節(jié)點(diǎn)的歸一化因子，用于歸一化關(guān)節(jié)點(diǎn)的坐標(biāo)；δ是一個(gè)函數(shù)，用于計(jì)算和篩選可見(jiàn)的點(diǎn)；vpi即第k個(gè)人的第p個(gè)關(guān)節(jié)點(diǎn)是否可見(jiàn)的結(jié)果；i為關(guān)節(jié)點(diǎn)的id；p為人體目標(biāo)實(shí)例的id。

3.3 模型比較

3.3.1 基線模型

（1）AlphaPose。自上而下的算法，也即先檢測(cè)到人體，再得到關(guān)鍵點(diǎn)和骨架，因而其準(zhǔn)確率、Ap 值比OpenPose高。但缺點(diǎn)是隨著圖片上人數(shù)的增加，計(jì)算量增大，速度也相應(yīng)變慢。

（2）DarkPose。通過(guò)生成精確的熱圖分布改進(jìn)標(biāo)準(zhǔn)坐標(biāo)編碼過(guò)程（將地真坐標(biāo)轉(zhuǎn)換為熱圖），以進(jìn)行無(wú)偏模型訓(xùn)練。將此與分布感知解碼方法結(jié)合起來(lái)，提出一種新的分布感知坐標(biāo)表示關(guān)鍵點(diǎn)（DARK）方法。

（3）EvoPose2D。提出一種新的權(quán)重轉(zhuǎn)移機(jī)制，該方案可以放松保留函數(shù)的突變，從而能夠靈活地加速神經(jīng)進(jìn)化。該方法產(chǎn)生的2D 人體姿態(tài)網(wǎng)絡(luò)設(shè)計(jì)比最新的手工設(shè)計(jì)網(wǎng)絡(luò)更有效、更準(zhǔn)確。實(shí)際上，產(chǎn)生的網(wǎng)絡(luò)可以使用較少的計(jì)算以處理高分辨率的圖像，這使得2D 人體姿態(tài)估計(jì)界限得以突破。

（4）HRNet。采用一個(gè)多階段的網(wǎng)絡(luò)結(jié)構(gòu)，其中從一個(gè)高分辨率子網(wǎng)開(kāi)始，逐步增加由高到低分辨率的子網(wǎng)，并將它們并行連接在一起。在多尺度融合過(guò)程中，重復(fù)地讓每個(gè)高分辨率表示從其他并行表示中接收信息，以產(chǎn)生豐富的高分辨率表示。這種設(shè)計(jì)可以使得預(yù)測(cè)的關(guān)鍵點(diǎn)熱圖［14］更準(zhǔn)確，并在空間上更精確。通過(guò)這種方式，HRNet 能夠有效地處理不同尺度的特征信息，提供更優(yōu)秀的關(guān)鍵點(diǎn)預(yù)測(cè)性能。

3.3.2 與基線模型比較

本文將Pos-RSF 與其他方法進(jìn)行了比較，如表1 所示。Pos-RSF 的總體得分PCKh@0.2 為91.2%，與最先進(jìn)的技術(shù)相比有顯著提高。值得注意的是，Pos-RSF 在所有個(gè)體關(guān)節(jié)組的姿勢(shì)估計(jì)中都比以前的SOTA 方法有所改進(jìn)，證明了框架的魯棒性和準(zhǔn)確性，特別是在更難檢測(cè)的關(guān)節(jié)，比如腳踝和手腕都有明顯提升。

Table 1 Comparison of Pos-RSF and other SOAT methods on MPII data sets表1 Pos-RSF與其他SOAT方法在MPII數(shù)據(jù)集上的比較（%）

進(jìn)一步評(píng)估不同對(duì)象、不同大小的精度如表2 所示。結(jié)果顯示，Pos-RSF 在AP50、AP75 不同閾值精確度上相較于AlphaPose 分別提高7.18%和47.63%；Pos-RSF 在APM、APL 的指標(biāo)下對(duì)AlphaPose 分別提高10.37%和22.72%；Pos-RSF 在AP50、AP75 不同閾值精確度上相較于Dark-Pose 分別提高1.10%和13.22%；Pos-RSF 在APM 的指標(biāo)下對(duì)DarkPose 分別提高2.33%；Pos-RSF 在AP50、AP75 不同閾值精確度上相較于HRNet 分別提高0.88%和1.68%；Pos-RSF 在APM、APL 的指標(biāo)下對(duì)HRNet 分別提高3.04%和0.36%；Pos-RSF 在AP50、AP75 不同閾值精確度上相較于EvoPose2D 分別提高2.69%和6.57%；Pos-RSF 在APM、APL 的指標(biāo)下對(duì)HRNet分別提高9.55%和6.49%。

Table 2 Comparison and validation of Pos-RSF and SOTA methods on COCO dataset表2 Pos-RSF與SOTA方法對(duì)COCO數(shù)據(jù)集的比較驗(yàn)證（%）

結(jié)果表明，面向體育測(cè)試的人體運(yùn)動(dòng)空間融合姿態(tài)識(shí)別分析模型（Pos-RSF）在測(cè)試數(shù)據(jù)集上優(yōu)于其他傳統(tǒng)或基于CNN 的預(yù)測(cè)模型。改進(jìn)主要體現(xiàn)在以下方面：①Pos-RSF 提出了使用部分相關(guān)度字段表示關(guān)節(jié)點(diǎn)間關(guān)聯(lián)度，提高了聚類準(zhǔn)確性和效率；②采用了融合邊緣輪廓特征分解的方法處理體育測(cè)試人體運(yùn)動(dòng)姿態(tài)特征表達(dá)，并且在其基礎(chǔ)之上建立了人體運(yùn)動(dòng)空間融合的姿態(tài)識(shí)別分析模型，利用梯度下降方法實(shí)現(xiàn)體育測(cè)試中人體運(yùn)動(dòng)姿態(tài)圖像的區(qū)域分塊分割，使得體育測(cè)試中人體運(yùn)動(dòng)姿態(tài)圖像滿足稀疏特征值要求。

3.4 模型應(yīng)用測(cè)試結(jié)果

系統(tǒng)測(cè)試過(guò)程中，對(duì)不同的人進(jìn)行了多次測(cè)試。對(duì)測(cè)試樣本進(jìn)行結(jié)果分析，得出運(yùn)動(dòng)次數(shù)和運(yùn)動(dòng)識(shí)別率如表3所示。

Table 3 Statistics of test results表3 測(cè)試結(jié)果統(tǒng)計(jì)

結(jié)果表明，仰臥起坐的運(yùn)動(dòng)辨識(shí)度非常好，運(yùn)動(dòng)姿勢(shì)識(shí)別功能很強(qiáng)。由此可以看出，這種技術(shù)方法有著相當(dāng)高的辨識(shí)能力，同時(shí)能夠?qū)顒?dòng)過(guò)程作出較為準(zhǔn)確的認(rèn)識(shí)判斷。這樣的技術(shù)曾試用在部分學(xué)?；顒?dòng)中，而且受到了校方和教師的充分肯定。

4 結(jié)語(yǔ)

為了將姿勢(shì)識(shí)別更好地應(yīng)用于體育測(cè)試，本文提出了Pos-RSF 模型，通過(guò)估計(jì)的姿勢(shì)判斷相關(guān)體育測(cè)試項(xiàng)目，并獲取相關(guān)項(xiàng)目的體育測(cè)試成績(jī)。同時(shí)，可根據(jù)測(cè)試者的運(yùn)動(dòng)姿態(tài)，判斷其運(yùn)動(dòng)姿勢(shì)是否標(biāo)準(zhǔn)等。實(shí)驗(yàn)結(jié)果顯示，采用本文模型進(jìn)行人體運(yùn)動(dòng)姿勢(shì)圖像識(shí)別準(zhǔn)確性和實(shí)時(shí)性較好，滿足體育測(cè)試基本要求。同時(shí)，該方法在體育活動(dòng)中的人體運(yùn)動(dòng)姿勢(shì)糾正方面具有一定實(shí)際應(yīng)用意義。