宋嘉文 吳群
關(guān)鍵詞:人機交互 知識圖譜 可視化 CiteSpace 前沿趨勢
引言
人機交互(“HCI”)是多個學科交叉的研究領(lǐng)域,包括計算機科學、設(shè)計學、行為學等其他學科。其由約瑟夫·利克萊德(J. C.Licklider)于1960年在“人機共生”(Man-Computer Symbiosis)文章[1]中首次提出,在工業(yè)設(shè)計領(lǐng)域被稱為“人因工程學(HumanFactor Engineering)”[2]。近年來,隨著自然人機交互(NUI)概念的提出,其相關(guān)文獻的出版速度迅猛增長,但對于人機交互發(fā)展的階段、學科研究方向、研究主題、趨勢等熱點問題總結(jié)得不夠全面。因此,文章在廣泛征引人機交互相關(guān)研究的基礎(chǔ)上,利用可視化分析軟件,對人機交互的前沿發(fā)展與熱點問題進行研究與分析。
一、數(shù)據(jù)來源與研究方法
本文選用的數(shù)據(jù)來源于科學核心數(shù)據(jù)庫——Web of Science核心合集數(shù)據(jù)庫。以“Human–Computer Interaction”為關(guān)鍵詞進行主題檢索,檢索年份為2015-2020年,檢索時間為2020年5月7日,共得到原始樣本數(shù)據(jù)文獻4727篇。
本文利用CiteSpaceV軟件。通過研究數(shù)據(jù)庫的文獻相關(guān)信息:作者單位、關(guān)鍵詞共現(xiàn)、合作網(wǎng)絡(luò)、共被引等內(nèi)容,以了解現(xiàn)有研究現(xiàn)狀與知識結(jié)構(gòu),從而幫助研究人員找到該領(lǐng)域內(nèi)的關(guān)鍵文獻和主要研究學者團隊,清晰地展示出該領(lǐng)域的研究前沿和發(fā)展趨勢[3]。
二、人機交互研究時空特征分析
(一)時間分布特征
時序的變化在一定程度上反映了該研究領(lǐng)域的發(fā)展速度與發(fā)展的階段性變化,同時也預(yù)測了未來發(fā)展的趨勢與研究領(lǐng)域動態(tài)[4]。通過觀察近五年內(nèi)論文發(fā)表數(shù)量的變化趨勢,可以直觀且明顯地發(fā)現(xiàn)近五年人機交互研究領(lǐng)域的整體發(fā)展狀況及熱度。其趨勢圖如圖表1所示。
從表1可以看出,自2015始,發(fā)文數(shù)量整體呈現(xiàn)逐漸遞增的趨勢,說明該領(lǐng)域研究的態(tài)勢一直比較良好,熱度不減。近年來隨著計算機運算能力持續(xù)提升,多維度、多類型、多環(huán)境的數(shù)據(jù)的產(chǎn)生,及大型互聯(lián)網(wǎng)公司的開源研究成果增多,使得人工智能熱潮的興起,也進一步促進了人機交互領(lǐng)域的研究。
(二)空間分布特征
1. 國家/地區(qū)分布
表2顯示了2015-2020人機交互領(lǐng)域發(fā)文數(shù)量前10的國家,其中發(fā)文量前3的國家分別為美國、中國、英國,均超過了400篇,一共有五個國家的中介中間性超過0.1,分別為美國、英國、加拿大、西班牙、澳大利亞,這說明美國、英國、加拿大與其他歐洲的一些國家之間合作較為密切,關(guān)聯(lián)性較強。中國雖然在人機交互領(lǐng)域內(nèi)近五年來發(fā)文數(shù)量排名第二,但其中介中間性(0.05)較低,排名第8,這從一定程度上反映了中國在人機交互領(lǐng)域研究熱度較高,學者研究積極性較強,但從整體的合作關(guān)系來看,中國與國際其他各國之間的合作研究與交流不算緊密,還有待加強。
2. 機構(gòu)分布
在CiteSpace軟件中,將網(wǎng)絡(luò)節(jié)點選擇為“institution”[5],設(shè)置TOP-N%=10%。各個節(jié)點代表不同的機構(gòu),不同節(jié)點的直線連線表示機構(gòu)之間的合作,圖1顯示出國內(nèi)外知名高校在人機交互領(lǐng)域研究的合作較為集中,尤其是國際間高校合作交流多,中國高校發(fā)文量總數(shù)較多且研究開始時間較早。
表3列出了近五年發(fā)文量排名前10名的機構(gòu),其中中國科學院(Chinese Acad Sci)、清華大學(Tsinghua Univ)、美國卡耐基梅隆大學(Carnegie Mellon Univ)排在前3,其中中國科學院發(fā)文量最多,總計60篇,其中美國與中國的機構(gòu)在人機交互領(lǐng)域占據(jù)主導(dǎo)地位,共占據(jù)7所。
從研究機構(gòu)性質(zhì)來看,當前進行人機交互研究的機構(gòu)主要以各大院校為主,如表3所示的卡耐基梅隆大學、英國倫敦大學學院(University College London),簡稱UCL、清華大學、浙江大學(Zhejiang Univ)等。導(dǎo)致這種現(xiàn)狀的原因大致可以分為兩點:一是人機交互在于研究人與計算機之間的交互行為,其中技術(shù)是基礎(chǔ)性因素,高校對計算機學科的研究與重視,是技術(shù)進步的重要保證,也是人機交互不斷深入發(fā)展的助推器;二是隨著人機交互對用戶信息接受的心理、生理研究,對界面視覺感知的體悟等多方面因素的要求,涉及到多種學科知識交叉與融合,高校提供了多種學科背景共同協(xié)同交流的平臺,因此,國內(nèi)外各大名校成為了人機交互領(lǐng)域研究的中堅力量。在中介中間性方面,英國倫敦大學學院最高,緊接著是美國卡內(nèi)基梅隆大學,說明這兩所高校積極充當了學術(shù)交流的橋梁作用,為人機交互領(lǐng)域的信息交流、意見溝通、行動協(xié)調(diào)做出較大貢獻。此外,我國浙江大學、中國科學院和清華大學分別排在并列第6位和第8位。國內(nèi)雖中國科學院發(fā)文數(shù)量較為可觀,但中介中間性較低,合作交流僅局限于校內(nèi)學者或其他固定機構(gòu),未成為有影響力的引領(lǐng)機構(gòu)來帶動整個領(lǐng)域的學術(shù)研討與溝通,因此國內(nèi)各機構(gòu)有關(guān)人機交互的探索合作還有待深入。
3. 作者合作共現(xiàn)圖譜如圖所示,共得出383個節(jié)點,295 條連線,網(wǎng)絡(luò)密度為 0.004,這個密度也說明,人機交互領(lǐng)域內(nèi)相關(guān)作者之間雖有合作,但合作的程度較低,形成“散狀式”分布。目前形成的研究群體有:INGOSIEGERT-ANDREAS WENDEMUTH、HAOYI ZHAO-GUOZHANGJIANG-SONGFA LI-DISI CHEN、HIDENOBU SUMIOKA-HIROSHIISHIGURO-RYUJI YAMAZAKI-SOHEIL KESHMIRI。研究發(fā)現(xiàn):大多形成合作團體的成員都來自同一機構(gòu),如INGO SIEGERT與ANDREAS WENDEMUTH同屬馬格德堡大學,HIDENOBU SUMIOKA與HIROSHI ISHIGURO同屬大阪大學,學緣關(guān)系密切。由此可見,該領(lǐng)域跨機構(gòu)間的作者之間的互動較少,未形成一定規(guī)模與著名的合作團體,這不利于人機交互總體性、系統(tǒng)性、全面性地發(fā)展。
三、人機交互研究內(nèi)容圖譜及其分析
(一)學科研究方向分析
人機交互領(lǐng)域發(fā)文數(shù)量排名前10的集中那個于計算機科學學科、工程科學學科、人因工程學科、心理學學科,他們都是該類研究的主要學科。其中涉及到計算機類的學科2015-2020發(fā)文量總數(shù)超過3890篇。由此可見,人機交互領(lǐng)域研究參與學科種類多樣,是一門綜合性交叉學科。
(二)關(guān)鍵詞共現(xiàn)分析
在文獻計量學中,關(guān)鍵詞是對文獻中核心的詞匯進行高度概括[3],對關(guān)鍵詞的分析可以得出各個時期的研究熱點。
本文使用CiteSpace對2015-2020年Web of Science核心合集數(shù)據(jù)庫中關(guān)鍵詞進行分析,將節(jié)點類型選擇為“Keyword”,一個時間切片為一年,其他屬性不變,運行CiteSpace獲得圖2的人機交互關(guān)鍵詞共現(xiàn)知識圖譜。圖譜其中最大的關(guān)鍵節(jié)點是“Human–ComputerInteraction(人機交互)”“information(信息)”“recognition(認知)”“system(系統(tǒng))”“mode(l 模型)”等關(guān)鍵詞節(jié)點較大,從圖譜的各關(guān)鍵詞的關(guān)聯(lián)網(wǎng)絡(luò)來看,呈現(xiàn)以“Human–ComputerInteraction(人機交互)” 、“system(系統(tǒng))”主要關(guān)鍵詞為中心,相互交叉的狀況。各主要關(guān)鍵詞與其他關(guān)鍵詞的關(guān)聯(lián)性較大,如“information(信息)”和“decision making(決策)”“experience(體驗)”、 “automation(自動化)”有一定聯(lián)系。
突變詞(bursts)可以了解到該時期內(nèi)某一個主題詞、關(guān)鍵詞的衰落或興起的情況,可以更好地預(yù)測該領(lǐng)域未來的發(fā)展熱點與趨勢。將Burstnes中γ值設(shè)置為2,得出表4。表4呈現(xiàn)了2015-2020年人機交互領(lǐng)域引文爆發(fā)強度前20的關(guān)鍵詞,其中突現(xiàn)強度的最大值為8.82 ,最小值為4.05,分別為“deep learning(深度學習)”“braincomputerinterface(腦機接口)”,“convolutional neural network(卷積神經(jīng)網(wǎng)絡(luò))”成為僅次于“deep learning(深度學習)”的突現(xiàn)詞,從圖中發(fā)現(xiàn)研究熱度居于一二位的關(guān)鍵詞都是和人工智能技術(shù)相關(guān),開始時間在2019年左右,可以推斷近年來在人機交互領(lǐng)域,關(guān)于智能技術(shù)的研究與人機交融模式的探索是一大熱點,且推測其在未來兩年也將一直是熱點。其他新的研究方向雖然數(shù)量較多,但持續(xù)時間不久,都還未達到一定強度。
(三)關(guān)鍵詞聚類分析
對高頻關(guān)鍵詞進行聚類分析,得到了人機交互領(lǐng)域文獻高頻關(guān)鍵詞聚類圖譜。如圖3所示,顯示了人機交互領(lǐng)域研究關(guān)鍵詞最大的7個聚類,分別是:#0 virtual reality(虛擬現(xiàn)實)、#1 human-computerinteraction(人機交互)、#2 user experience(用戶體驗)、#3 trust(信任)、#4 emotional recognition(情感識別)、#5 computervision(計算機視覺)、#6 gesture recognition(姿態(tài)識別)。得出Modularity Q=0.7978,Silhouette=0.9454,說明聚類結(jié)構(gòu)顯著且聚類結(jié)果是令人信服的。
借助關(guān)鍵詞共現(xiàn)圖譜節(jié)點的查詢功能,梳理相關(guān)文獻,得到如下3個主要的研究主題:
1.有關(guān)人機交互與文化關(guān)系的理論研究熱點關(guān)鍵詞主要包括“ c u l t u r e ”( 文化)“ i n d i v i d u a ld i f f e r e n c e ”(個體差異)“ a c c e s s i b i l i t y ”( 可用性)“crowdsourcing”(眾包)等。Honold[6]等人闡述了在跨文化人機交互設(shè)計中需考慮根植于文化之中人們不同心態(tài)、思維模式和解決問題的策略等因素。Bidwell[7]等人提出設(shè)計師必須根據(jù)自己的所處文化情境需要調(diào)整通用的設(shè)計方法。多元文化環(huán)境中的交流已成為一種需要,因此在人機交互領(lǐng)域研究人機交互設(shè)計的文化維度和變量之間的關(guān)系成為一大熱點。
2.有關(guān)人機交互與智能技術(shù)與系統(tǒng)關(guān)系的理論研究熱點關(guān)鍵詞主要包括“multimodal interaction”(多模態(tài)交互)“recognition(認知)”“deep learning”(深度學習)“machinel ear ni ng”(機器學習)“eeg”(腦電信號)“r obot ”(機器人)等。在信息交互方面,H.Wu[8]等人提出了一種方法,可以使得用戶自定義手勢,同時解決了在實際場景中,用戶不同手勢習慣和表示偏差導(dǎo)致的機器認知問題。在認知交互方面,更多學著傾向用生理信號數(shù)據(jù)來改善人機交互。M. Hamaya[9]等人提出一種模型強化學習的框架,這個框架間接地賦予了外骨骼理解人類行為和進行反饋操作的能力。研究者從認知人機交互的多通道感知、人機系統(tǒng)與優(yōu)化等方面進行了探討,旨在優(yōu)化流程與體驗。
3.有關(guān)人機交互與混合現(xiàn)實的研究熱點關(guān)鍵詞主要包括“ v i r t u a l r e a l i t y ”( 虛擬現(xiàn)實)“augmented reality”(增強現(xiàn)實)等。Pavel[10]等人提出了應(yīng)用手勢識別技術(shù)發(fā)明的一種新穎的解決方案——TeleAdvisor,旨在將它應(yīng)用于許多實際場景中支持遠程協(xié)助任務(wù)。多年來,混合現(xiàn)實中的人機交互研究領(lǐng)域已經(jīng)構(gòu)建出較為完整的設(shè)計原則和可用性評估及設(shè)計方法,但很多尚不具備通用性,因此如何建立通用性的設(shè)計原則及解決方案是該研究方向亟待考慮的事。
(四)人機交互知識基礎(chǔ)的參考文獻分析論文是否具有一定的學術(shù)與參考價值可以從其引用頻次上來衡量。研究者通過文獻引用軌跡的可視化呈現(xiàn),繼而判斷出研究領(lǐng)域的基礎(chǔ)理論參考來源。節(jié)點類型設(shè)置為“Reference”,時間切片設(shè)置為一年,設(shè)置“TOPN ”為50,生成2015-2020年人機交互研究文獻共被引知識圖譜。如圖4所示,從圖譜左上角數(shù)據(jù)可以看出,其節(jié)點個數(shù)為283個,連接線個數(shù)為424條,密度為0.0106。本文選取人機交互領(lǐng)域被引頻次超過30次的8篇引文獻進行分析,如表5所示。
圖中的節(jié)點越大,代表引用頻率越高,表明文獻價值越高。研究發(fā)現(xiàn):被引頻次最高的文獻來自學者CHANG[11]。CHANG[11]等人提出LIBSVM作為支持向量機(SVM)的庫,在機器學習和許多其他領(lǐng)域中已獲得廣泛普及文中討論了諸如解決SVM優(yōu)化問題,理論收斂性,多分類概率估計和參數(shù)選擇等問題。HE[12]等人針對深層神經(jīng)網(wǎng)絡(luò)訓(xùn)練困難的問題,提出了一種殘差的學習框架。計算機領(lǐng)域機器學習技術(shù)極大地提高了語音識別、目標檢測以及視覺識別任務(wù)甚至是藥物檢測等許多領(lǐng)域的研究水平,再次說明在人機交互領(lǐng)域?qū)χ悄芗夹g(shù)的研究處于研究熱點。
中間中介性較高的文章來自Zeng、Koelstra等人,他們對自然交互方式進行了探索。Zeng[13]等人研究解決人類情感行為的機器理解問題的可行方法,并討論了訓(xùn)練和測試數(shù)據(jù)的收集和可用性,概述了推進人類情感感知技術(shù)所面臨的一些科學和工程挑戰(zhàn)。Koelstra[14]等人提出了一種用于分析人類情感狀態(tài)的多模態(tài)數(shù)據(jù)集,其使用腦電,周圍生理信號和多媒體內(nèi)容分析的方法對不同模式的分類結(jié)果進行決策融合。Rautaray[15]等人旨在將人機交互融入一種自然的制度中。其分析了不同關(guān)鍵參數(shù)下的人機交互手勢識別系統(tǒng)。
(五)研究演進與前沿發(fā)展趨勢分析時區(qū)視圖如圖5所示,其反映了人機交互研究領(lǐng)域文獻關(guān)鍵詞演進,通過前沿時區(qū)圖可以梳理2015-2020近5年以來的人機交互領(lǐng)域發(fā)展趨勢,將其分為3個階段。
第一,2015年人機交互領(lǐng)域研究處于高速發(fā)展階段,研究主題較為多樣,包括對于信息、體驗、技術(shù)等主題的關(guān)注,也符合當時互聯(lián)網(wǎng)快速發(fā)展、信息技術(shù)的顯著進步的研究背景;第二,2016-2018年,研究進入了一個相對平穩(wěn)發(fā)展的階段,這一時期“emotion recognition(情緒識別)”“neural network(神經(jīng)網(wǎng)絡(luò))”“support vectormachine(支持向量機)”等關(guān)鍵詞的出現(xiàn),說明該階段研究熱點聚焦在如何運用先進的算法技術(shù)、結(jié)合心理學認知工具等創(chuàng)造出更好的人機交互體驗,與此同時,隨著虛擬現(xiàn)實、增強現(xiàn)實技術(shù)的出現(xiàn)與發(fā)展,對這兩個主題的關(guān)注也在增加;第三,2019-2020年為人機交互研究的最新階段。文獻研究熱點為“facial expression recognition(面部表情識別)”“cnn(卷積神經(jīng)網(wǎng)絡(luò))”,有些主題仍與2015-2016年的研究熱點息息相關(guān),此時的熱點較為集中于對計算機的機器學習技術(shù)的研究及對于人機之間信任感及其他情感方面的探索。
結(jié)語
本文基于Web of Science核心合集數(shù)據(jù)庫中2015-2020年間收錄的4727篇人機交互的相關(guān)文獻,采用CiteSpace對文獻進行了可視化分析。了解到人機交互領(lǐng)域相關(guān)研究的熱點和未來發(fā)展趨勢,同時對今后的研究趨勢進行預(yù)測。
研究發(fā)現(xiàn):(一)時間分布研究顯示年度發(fā)文量趨于穩(wěn)定,具有階段性特征,總體呈上升趨勢。(二)空間分布研究顯示研究成果較多集中于國內(nèi)外各大名校與相同機構(gòu)之間,機構(gòu)之間、地區(qū)之間持續(xù)穩(wěn)定的交流不足,發(fā)展不均衡,需要該領(lǐng)域的學者進行廣泛且深入的研究交流,持續(xù)高質(zhì)量成果。(三)從文獻學科分布情況看,有70%以上的文獻所屬為計算機技術(shù)學科,工程科技和心理學科占20%,由此可見,計算機技術(shù)學科研究熱度較高,同時還囊括文化、社會學、心理學等多方面的知識背景。(四)從研究熱點與趨勢上來看,隨著計算機運算能力的增強,豐富數(shù)據(jù)的產(chǎn)生及人工智能熱潮的掀起,使得關(guān)于智能技術(shù)的研究與人機交融模式的探索成為這領(lǐng)域研究的一大熱點,并在當下及未來的發(fā)展中更為注重結(jié)合人的內(nèi)在情緒、文化語境、用戶體驗等人文、心理因素。
本文對人機交互研究領(lǐng)域的未來研究趨勢預(yù)判具有一定意義,但仍然存在如下不足:第一,由于選擇時間段較短,本文所選4727篇文獻得出的分析結(jié)果未涵蓋本領(lǐng)域2015年之前的研究成果。第二,本文研究使用的方法尚不能完全全面、客觀地展現(xiàn)該領(lǐng)域研究的全貌,今后需結(jié)合其他計量方法與可視化工具,在實踐的基礎(chǔ)上,更加綜合地分析領(lǐng)域研究發(fā)展態(tài)勢。