• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      手語識別研究熱點與趨勢分析*
      ——基于CiteSpace的可視化分析

      2022-08-31 12:36:44張艷瓊
      現(xiàn)代特殊教育 2022年6期
      關鍵詞:手勢識別手語手勢

      張艷瓊 周 奕

      (南京特殊教育師范學院 數(shù)學與信息科學學院 南京 210038)

      一、前言

      手語是一種視覺語言,其借助手的手形、運動、位置、朝向,配合面部表情和身體姿態(tài),按照一定的語法規(guī)則來表達特定含義[1],是聽障人群生活、工作、交流的重要語言。根據世界聾人聯(lián)合會和世界衛(wèi)生組織的統(tǒng)計數(shù)據,目前全球大約有4.66億聽力損失的人,已經占到世界總人口的5%以上。到2050年,預計將有近25億人患有一定程度的聽力損失[2]。手語識別通過利用算法和技術來識別所產生的手勢序列,并以文本或語音的形式闡述其意義[3],為聽障人群更好地融入社會架起了一座橋梁。手語識別涉及視頻數(shù)據的采集、特征提取、模式識別、自然語言處理等多個研究領域,是一項具有極大挑戰(zhàn)性的研究任務。手語識別研究可以追溯到20世紀90年代。隨著計算機視覺、人工智能等技術的發(fā)展,手語識別得到了極大的發(fā)展,成為社會各界關注的焦點。鑒于此,本文將利用信息可視化工具CiteSpace軟件,對2000—2021年手語識別研究相關的國際文獻進行系統(tǒng)而全面的梳理,探究國際手語識別領域的現(xiàn)狀、研究熱點及發(fā)展趨勢,進而為相關研究者提供更加直觀、有效的參考依據。

      二、研究工具與數(shù)據來源

      (一)研究工具

      本文選用信息可視化軟件CiteSpace對文獻進行分析。該軟件是美國Drexel大學陳超美教授基于JAVA平臺開發(fā)的,適用于多元、分時、動態(tài)的復雜網絡分析的可視化軟件[4]。此軟件通過可視化手段來呈現(xiàn)科學知識的分布、結構和規(guī)律,其得到的可視化圖形稱為“科學知識圖譜”,擁有圖和譜的雙重特性。CiteSpace的突出特征體現(xiàn)在:(1)采用時間切片技術,對連續(xù)的每個時間片進行“抓拍”,構建一個時序型網絡模型,并將這些單獨網絡連接成一個綜合的、全景的網絡圖譜,以此展現(xiàn)出該知識領域的演化歷程[5];(2)能自動識別出圖譜上作為知識基礎的引文節(jié)點文獻和共引聚類所表征的研究前沿。劉則淵教授將CiteSpace知識圖譜概括為“一圖展春秋,一覽無余;一圖勝萬言,一目了然”[6]。

      (二)數(shù)據來源

      Web of science是全球最大、覆蓋學科最多的綜合性數(shù)據庫之一。本文以Web of science核心合集為檢索數(shù)據庫,以“sign Language recognition”“the recognition of sign language”“sign Language identification”“the identification of sign language”“sign Language interpretation system”“finger Language recognition”“finger Language Identification”“finger spelling recognition”等為主題詞,文獻類型為article 或 Proceedings Paper,檢索時間跨度選擇2000-01-01至2021-12-31,語種選擇英文。通過人工剔除與本研究不相關的文獻及重復文獻,共得到有效文獻1564篇。

      三、研究結果與分析

      (一)手語識別領域發(fā)文量分析

      發(fā)文量可以從側面反映出某一領域的研究熱度,并在一定程度上反映該領域學術研究的發(fā)展狀況。通過對國際上手語識別領域各年度發(fā)文量進行統(tǒng)計并以折線圖的形式對這部分數(shù)據加以呈現(xiàn),見圖 1。

      圖1 年度發(fā)文量及發(fā)文趨勢圖

      根據圖1可以看出,手語識別研究發(fā)文量總體呈現(xiàn)出穩(wěn)步增長的趨勢,但是各年度的增長幅度各異。2000—2011年發(fā)文量總體增長比較緩慢,呈現(xiàn)低增長的態(tài)勢,每年的發(fā)文量均在50篇以內,12年間共發(fā)表文獻325篇,占總體發(fā)文量的20.78%,處于手語識別發(fā)展的第一個階段,也就是緩慢增長的初始階段。而2012—2021年手語識別領域的發(fā)文量呈現(xiàn)高增長的趨勢,處于發(fā)展的第二個階段,即指數(shù)增長階段。其中2014—2015年文獻發(fā)表量呈直線增長,這主要與計算機視覺、人工智能的快速發(fā)展有很大關系,學者們逐漸向計算機視覺、人工智能方向等最新出現(xiàn)的新方法、新技術尋求新的思路。

      (二)研究熱點分析

      關鍵詞代表的是一篇文章的核心。通過關鍵詞分析,可以了解某一領域的研究熱點與重要研究主題。利用CiteSpace軟件,Node Type(節(jié)點)選擇“Keyword(關鍵詞)”,時間切片選擇1,選擇適當閾值,計算方式選擇Minimum Spanning Tree與Pruning Sliced networks,對切片網絡進行精剪合并。為了解決關鍵詞中含義相近及表述相近詞等問題,如Convolution neturalnetwork與Convolution natural network,需要在Project文件夾中以文本格式打開citespace.alias,在其中輸入內容@PHRASE1#@PHRASE2,表示將兩者合并。同時隱藏相關度不大的關鍵詞如“recognition”“system”等,得到手語識別關鍵詞共現(xiàn)圖譜,見圖 2。

      圖2 關鍵詞共現(xiàn)圖譜

      對國際手語識別領域的關鍵詞數(shù)據進一步統(tǒng)計分析,可以發(fā)現(xiàn)2000—2021年國際手語識別領域關鍵詞頻次大于20的主題詞有26個。提取頻次排名前10的關鍵詞相關信息(排除檢索詞及相關性小的關鍵詞,如手語識別、手語、手勢識別、手勢、美國手語等),見表1。

      通過分析關鍵詞共現(xiàn)圖譜圖2和表1可以看出,Deep learning(深度學習)、Convolution neural network(卷積神經網絡,以下簡稱CNN)、Netural network(神經網絡)、Feature extraction(特征提取)、HMM(隱馬爾科夫模型)等節(jié)點較大,也就是說這部分主題出現(xiàn)的頻次比較高,即這些主題詞代表了國際手語識別領域采用的熱點技術和方式。Freeman于1977年提出中介中心性(Betweenness Centrality)的概念,用于衡量網絡圖譜中每個關鍵詞的地位,在關鍵詞共現(xiàn)網絡圖譜中,關鍵詞聯(lián)系緊密程度越高則中介中心性越大[7]。由表1可知,HMM(隱馬爾科夫模型)、Netural network(神經網絡)、Support vector machine(支持向量機)、Machinelearning(機器學習)等主題詞節(jié)點的中心性相對比較高,說明這部分主題在國際手語識別領域中處于重要地位,起到了橋梁的作用,為之后許許多多的研究起到了支撐的作用。從圖2可以發(fā)現(xiàn),Deep learning(深度學習)、Machine learning(機器學習)等節(jié)點呈深色環(huán)狀,說明這兩個主題在某個時間段出現(xiàn)激增現(xiàn)象。

      表1 高頻關鍵詞統(tǒng)計表(TOP10)

      (三)國際上手語識別領域研究的知識基礎

      文獻共被引是指兩篇(或多篇)文獻同時被另一篇文獻所引用,則這兩篇論文構成共被引關系。被引頻次和中心性高低可在一定程度上反映文獻的學術影響力和經典程度,相關研究者往往將這些高被引文獻內所包含的觀點、知識作為開展下一步研究的知識基礎[8]。在科學知識圖譜中,共引文獻包含了大量的科學知識。通過這部分文獻,可以有效展開對國際手語識別研究領域知識結構等方面的研究。文獻被引數(shù)量是衡量學術影響力的一個重要指標,能夠通過文獻追溯學科領域的研究演變進程[9]。如果一篇文獻同時被多篇文章引用,那么就說明這幾篇文章之間有著比較大的相關性。為了更好地對這部分參考文獻進行分析,本文運用CiteSpace 中的Cited-Reference功能對之前檢索所得到的文獻數(shù)據進行共被引分析,g-index中K值設置為5,計算方式選擇Minimum Spanning Tree(最小生成樹)與Pruning Sliced networks(修建切片網絡)以減少計算量,其他參數(shù)保持默認值,得到國際手語識別領域文獻共被引圖譜,見圖 3。

      圖3 文獻共被引知識圖譜

      在圖譜中,網絡中的連線代表了文獻之間的共同引用關系,節(jié)點半徑越大代表該文獻被引用得越多,即為該知識領域的重要文獻。圖3下方,半徑最大的節(jié)點是Ong SCW等人在IEEE T Pattern Anal期刊上發(fā)表的文獻AutomaticSignLanguageAnalysis:ASurveyandtheFutureBeyondLexicalMeaning。該文對自動手語識別技術進行分析與總結,為不同的研究提供了理論和技術的支撐[10]。通過對CiteSpace中得到的共被引文獻的數(shù)據進行進一步統(tǒng)計,得到2000—2021年與手語識別相關的10篇最高引用文章,見表 2。

      從圖 3和表 2中可以看到,核心被引文獻發(fā)表時間主要集中于2011—2019年,這10篇高被引文獻基本都發(fā)表于2014年之后,可以說明2014之后手語識別技術有了新的突破,出現(xiàn)了新的研究方向和技術。其中,被引頻次最高的是Koller O等人發(fā)表在ComputVisImageUnd上的文章。該文提出了一種統(tǒng)計識別方法,針對不同的手語者進行大詞匯量的連續(xù)手語識別,為許多新加入該領域的研究者提供了一個新的起點[11]。被引頻次排第二的是Pigou L等人發(fā)表在LectNotesComputSc上的文章。該文章提出了使用Kinect、CNN和CPU加速器的識別系統(tǒng),能夠高度準確地識別20種意大利手勢,在交叉驗證中的準確率達到了91.7%[12]。排名第四的文章是Cheok M J等人在IntJMachLearnCyb上發(fā)表的文獻。該文對手勢和手語研究中使用的最新技術進行了全面的回顧[13],可以為后續(xù)研究者提供新的思路和方向。排名第五的文章是Koller O等人于2016年在ProcCvprIEEE上發(fā)表的文獻。該文提出了一種新的方法,通過在迭代EM算法中嵌入CNN,在弱標記的序列數(shù)據上學習基于幀的分類器[14]。

      表2 文獻共被引頻次(Top10)

      通過對表中這部分高被引文獻的閱讀,發(fā)現(xiàn)這些文獻的主要研究對象為基于視覺的連續(xù)手語,且多篇文章對傳感器如3D運動傳感器、Leap motion、 Kinect等進行了研究,彌補了Cyblerglove(數(shù)據手套)的不足。也有作者提出了多傳感器融合的框架,這些傳感器和框架的出現(xiàn)無疑為人機交互這一領域提供了新的機會。近年來手語識別采用的主要研究方法為CNN以及多種混合的模型,這些新的方法成為了許多學者探索的研究方向,這也就奠定了它們高被引的基礎。因此,手語識別在未來一段時間的研究方向是基于深度學習技術、人機交互技術、計算機視覺的連續(xù)手語識別方面的研究與探索。

      (四)國際手語識別領域演進趨勢分析

      1.2000—2011年(緩慢增長階段)時序圖分析

      對第一階段2000—2011年數(shù)據進行Timezone分析,得到2000—2011年國際手語識別領域研究的熱點時區(qū)圖譜,隱藏比較明顯且相關度不大的節(jié)點,見圖 4。

      圖4 2000—2011年關鍵詞時序圖

      第一階段(2000—2011年)研究主要集中在基于傳統(tǒng)技術的手語識別,如HMM(隱馬爾科夫模型)、Support vector machine(支持向量機)、Netural network(神經網絡)、DTW(動態(tài)時間歸整算法)等。其中HMM最早被應用于語音識別和手寫字體的識別,識別效果良好。由于這兩者與手語識別具有一定的共通性,所以在較早的時候便有學者將它應用于手語識別領域,主要用于對手語進行時序建模。識別對象主要是針對手指語識別、孤立靜態(tài)手語識別方向,數(shù)據提取方面主要采用1990年興起的Cyblerglove(數(shù)據手套),其主要用于手部3D運動捕捉,這一技術有助于實現(xiàn)用戶在虛擬現(xiàn)實環(huán)境中與數(shù)字物體的互動,因而在虛擬現(xiàn)實領域應用較多。同時,在這一階段,人機交互領域得到了一定的發(fā)展,越來越多手語識別領域研究者的研究方向朝著人機交互的方向發(fā)展。

      2.2012—2021年(指數(shù)增長階段)時序圖分析

      以同樣方法對第二階段2012—2021年數(shù)據進行Timeline分析,得到2012—2021年國際手語識別領域研究的熱點時區(qū)圖譜,隱藏部分比較明顯且相關度不大的節(jié)點,見圖 5。

      圖5 2012—2021年關鍵詞時序圖

      從圖 5中我們可以發(fā)現(xiàn),相比第一個階段(緩慢增長階段),第二個階段(指數(shù)增長階段)的主題詞的數(shù)量有了大幅的增長。在這一階段,多種數(shù)據傳感器的出現(xiàn),逐漸代替了數(shù)據手套,提高了數(shù)據采集的質量。2010年出現(xiàn)Kinect傳感器之后,便有學者基于該傳感器進行數(shù)據集的開發(fā),如中國手語數(shù)據集CSL[20]就是由Kinect采集的。在之后出現(xiàn)的Deep learning(深度學習),在手語識別領域產生了較大的影響,使得手語識別正確率得到極大提升,受到相關專家的追捧。CNN依托于其強大的特征提取能力,目前許多算法都是利用其來進行特征提取。早期運用廣泛的HMM、SVM等,在之后大多被應用于混合模型進行識別。如,Koller等人進行了德國連續(xù)手語識別的研究,并在2016提出了一種基于CNN和HMM的混合模型,在兩個公開的大規(guī)模基準手語數(shù)據集上取得了很好的識別效果[21]。同時,在這一階段,更多研究是基于實時、連續(xù)、大規(guī)模手語識別進行的,同時3D手語識別、復雜背景的引入以及其他非手性特征的識別如面部識別受到部分學者青睞。

      通過分析手語識別時序圖發(fā)現(xiàn),手語識別的研究從早期的靜態(tài)手語識別逐漸轉向動態(tài)實時的識別,由傳統(tǒng)的識別方式逐漸轉向基于計算機視覺的深度學習方向,從單一模型逐漸轉向混合模型。

      (五)手語識別研究前沿分析

      研究前沿的演進趨勢常常依據突現(xiàn)詞來進行判定。Burst Term(突現(xiàn)詞)是指頻次出現(xiàn)突增。由于突現(xiàn)詞的詞頻時間分布和動態(tài)變化特征,突現(xiàn)詞比關鍵詞更能準確地揭示研究前沿領域[22]。在CiteSpace中通過對主題詞進行突現(xiàn)分析,共檢測出14個主題詞發(fā)生了突現(xiàn),見圖 6。

      圖6 國際手語識別研究前沿

      在圖 6中,“Strength”表示的是突現(xiàn)的強度,它的數(shù)值越大代表突現(xiàn)強度越高,那么該關鍵詞就有更大的可能性成為該領域的研究前沿?;疑€段部分對應的是該關鍵詞發(fā)生突現(xiàn)的持續(xù)時間,黑色線段則為不發(fā)生突現(xiàn)的時間段。通過對關鍵詞突現(xiàn)率進行進一步排序,刪除與檢索詞相關的和沒有實際意義的關鍵詞如“hand gesture”“system”“motion”等,對剩余突現(xiàn)詞進行排序,取突現(xiàn)詞排名前四的關鍵詞,見表 3。

      表3 高突現(xiàn)率關鍵詞(Top4)

      從表3中的信息可以看出,突現(xiàn)率排名前四的關鍵詞均屬于高頻關鍵詞,突現(xiàn)強度最高的主題詞可以代表手語識別領域內較新的研究方向,即研究前沿。表3中,突現(xiàn)率最高的關鍵詞是CNN,其突現(xiàn)強度達到13.87。CNN是常用的深度學習模型之一,結合之前的分析可知,與CNN相關的手語識別研究自2015年起就有人開始涉足,但其突現(xiàn)時間體現(xiàn)在2019—2021年。也就是說,自2019年起突然出現(xiàn)很多學者運用CNN來進行手語識別的相關研究。

      其次為Deep learning(深度學習)和Machine learning(機器學習),它們的突現(xiàn)時間均為2018—2021年,突現(xiàn)強度分別是13.71和6.28。深度學習是機器學習的一個分支,未來將成為國際手語識別領域未來很長一段時間的研究熱點。2006年Hinton等人首次提出了深度學習的方法,它的提出與發(fā)展無疑為手語識別的發(fā)展注入了新的血液。

      突現(xiàn)率排名第四的是Leap Motion(體感傳感器),其突現(xiàn)率為5.00,突現(xiàn)范圍為2015—2017年。Leap motion是由2013年發(fā)布的一種深度傳感器,它將信號轉換成計算機指令。作為一種基于手勢的人機交互輸入設備,它能夠準確地檢測手和手指,使用紅外線成像技術實時確定有限空間內預定義目標的位置[23]。正是因為這一優(yōu)勢,它得到了不少學者的關注,并將其應用于手語識別研究中關鍵特征的提取上。雖然Leap motion有能力捕捉手和手指的三維位置,但是必須在靠近被試的地方操作。同時,由于這種基于體感設備進行手語識別的方式,需要利用輔助設備進行捕捉,精度容易受環(huán)境影響。所以僅在兩年內突現(xiàn),之后則逐漸削弱。

      四、研究結論

      本文通過對Web of science 核心合集中2000—2021年手語識別領域相關文獻數(shù)據,從發(fā)文量、研究熱點及研究前沿等各項指標進行分析與總結,得出以下結論。

      從發(fā)文量方面來看,國際上手語識別領域相關研究載文量總體呈現(xiàn)出一個穩(wěn)步增長的趨勢,但是各年度的增長態(tài)勢并不平均。2000—2011年處于研究的第一個階段,即緩慢增長的初始階段;2012—2021年處于該研究的第二個階段,即呈指數(shù)型增長的階段。

      從研究熱點、研究趨勢以及技術手段方面來看,研究早期主要是基于非視覺的識別系統(tǒng)來對手語特征進行采集,如數(shù)據手套等,運用較多的是HMM,SVM、DTW等算法。隨著技術的不斷迭代更新,機器學習、人機交互、計算視覺領域得到了發(fā)展,近幾年來的研究更多的是基于視覺(圖像)的識別系統(tǒng)。由于基于深度學習的手語識別利用深度學習強大的學習能力和擬合能力獲取更全面、更抽象的特征,突破了傳統(tǒng)手語識別方法的局限性[24],成為手語識別領域的研究熱點和研究前沿。

      深度學習技術極大地提高了手語識別的精度和速度,但是距離走出實驗室,達到在實時、精準的真實場景下進行手語識別的應用目標,還有很長的一段路要走。隨著不同領域的交叉融合,未來手語識別將得到更大的發(fā)展,期待更多的專家學者加入手語識別研究工作中來,共同促進手語識別水平的提高。

      猜你喜歡
      手勢識別手語手勢
      挑戰(zhàn)!神秘手勢
      自然手語在聾人大學生手語中的使用調查研究——以南京特殊教育師范學院為例
      活力(2019年15期)2019-09-25 07:23:06
      V字手勢的由來
      勝利的手勢
      基于手勢識別的工業(yè)機器人操作控制方法
      基于紅外的非接觸式手勢識別系統(tǒng)設計
      基于嵌入式的智能手表設計
      復雜背景下的手勢識別方法
      奇怪的手語圖
      奇怪的手語圖
      雅安市| 双桥区| 柳州市| 刚察县| 石棉县| 辉县市| 江山市| 稻城县| 广南县| 基隆市| 克东县| 连平县| 屏南县| 中卫市| 栖霞市| 临沧市| 淄博市| 德阳市| 连南| 三门县| 普格县| 台南县| 赤水市| 闽侯县| 兴化市| 萍乡市| 延川县| 石河子市| 丰镇市| 德令哈市| 蛟河市| 沛县| 鄂伦春自治旗| 蒙山县| 株洲县| 临澧县| 卢湾区| 读书| 彭州市| 湖州市| 柯坪县|