劉孚平
摘要:目的:可用性測試能幫助設(shè)計師發(fā)現(xiàn)諸多可用性問題,為了更好地發(fā)現(xiàn)康復(fù)類軟件界面設(shè)計中出現(xiàn)的各種可用性問題,優(yōu)化產(chǎn)品用戶體驗。方法:界面設(shè)計前期通過啟發(fā)式評估方法完善產(chǎn)品功能,后期通過眼動測試實驗找出諸多可用性問題。結(jié)論:設(shè)計出了可用性較高的界面,并通過眼動測試找出六方面可用性問題。
關(guān)鍵詞:康復(fù)類軟件界面設(shè)計 可用性測試 啟發(fā)式評估 眼動測試
中圖分類號:TB47 文獻標(biāo)識碼:A
文章編號:1003-0069(2017)01-0116-02
引言
Hartson(1998)認(rèn)為可用性為產(chǎn)品的有用性,易用性。1997年國際標(biāo)準(zhǔn)化組織將可用性定義為:產(chǎn)品在特定使用環(huán)境下,為特定用戶用于特定用途時所具有的有效性、效率和用戶滿意度。不同的學(xué)者對可用性的觀點見解不同,但其核心均為:用戶能否很好地使用系統(tǒng)(產(chǎn)品)功能??捎眯栽u估的方法主要包括可用性測試(Usability Testing)、啟發(fā)式評估(Heuristic Evaluation)、認(rèn)知過程瀏覽(cognitive Walkthrough)和行為分析(Action Analysis)。
在本研究中,主要使用主觀的啟發(fā)式評估和客觀的眼動可用性測試方式來研究界面的可用性。
上肢康復(fù)評估系統(tǒng)主要用戶人群為腦卒中上肢偏癱患者,從綜合方面評估腦卒中患者的上肢康復(fù)狀況,為后期康復(fù)訓(xùn)練提供可指導(dǎo)的訓(xùn)練計劃。傳統(tǒng)的臨床評估方法有諸多劣勢:①專業(yè)醫(yī)師數(shù)量受限,評價整個過程非常耗時,評價成本高;②其評價帶有主觀性,其評價結(jié)果的準(zhǔn)確性也會因醫(yī)師的經(jīng)驗和能力的不同而有所差異,缺乏定量化的評價標(biāo)準(zhǔn)?!N新型的基于軟件和硬件結(jié)合的康復(fù)模式,其能定量化提供評估數(shù)據(jù)結(jié)果,并根據(jù)評估結(jié)果,提供個性化的康復(fù)訓(xùn)練指導(dǎo)。這種基于硬件和軟件設(shè)備的面向社區(qū)的康復(fù)模式將成為未來發(fā)展的趨勢。
康復(fù)軟件設(shè)計是學(xué)校研究項目,該項目主要內(nèi)容為:針對社區(qū)腦卒中患者設(shè)計一套能快速評估上肢康復(fù)狀態(tài)的系統(tǒng)(軟件加硬件)。評估內(nèi)容主要為三大塊:上肢關(guān)節(jié)活動度,手部力量,上肢肌張力。筆者的主要負(fù)責(zé)軟件界面設(shè)計具體為:交互設(shè)計、視覺設(shè)計。
一、啟發(fā)式評估
啟發(fā)式評估(Heuristic Evaluation)又叫經(jīng)驗性評估,是專家根據(jù)可用性指南(準(zhǔn)則)對產(chǎn)品進行可用性評估的方法。啟發(fā)式評估是一種常見的可用性評估方法,一般安排在項目開發(fā)早期,界面有了初步的設(shè)計稿時進行。
筆者根據(jù)產(chǎn)品的功能架構(gòu),設(shè)計出軟件的第一版主要界面(圖2-1上部)。并邀請三位界面設(shè)計師進行了兩次啟發(fā)式評估,找出了諸多可用性問題(表1),并根據(jù)可用性問題進行軟件界面版本的迭代設(shè)計得出最終軟件主要界面(圖1下部)。
二、可用性測試
(一)實驗方法
可用性測試是測試者邀請用戶使用設(shè)計原型或產(chǎn)品完成操作任務(wù)并通過觀察、記錄和分析用戶行為和相關(guān)數(shù)據(jù)對界面可用性進行評估的一種方法??捎眯詼y試能夠?qū)缑娴目捎眯赃M行全面的評估,是最為常用的方法之一。本次研究中應(yīng)用了眼動技術(shù)、RTA回訪、滿意度問卷相結(jié)合的方法,更加全面地測評軟件界面的可用性,即被試參與基于典型任務(wù)的眼動實驗,實驗完成后及時進行RTA回訪,同時分發(fā)滿意度問卷。通過最后的綜合指標(biāo),發(fā)現(xiàn)更多的可用性問題,優(yōu)化用戶體驗。
(二)實驗設(shè)備和環(huán)境
實驗中應(yīng)用到的設(shè)備為Tobii X2-30眼動儀,為支架式眼動儀,能應(yīng)用于平板和手機的眼動測試,具有眼動追蹤精確可靠的優(yōu)勢。其他實驗設(shè)備還有一個安卓平板和一個surface電腦,以及一些問卷和筆等。其中平板用來播放典型任務(wù),surface用來運行軟件原型。實驗的環(huán)境為一間單獨的實驗室,相對較安靜,室內(nèi)采光條件良好,能較好地還原真實使用場景。
(三)實驗過程
總共邀請了6名被試參加實驗,年齡在24-30歲之間,其中三名為在讀研究生,三名為事業(yè)單位從業(yè)者。實驗開始前主持人首先給被試講解實驗注意事項、實驗流程,然后才開始實驗,實驗要求被試根據(jù)文字提示完成20個典型任務(wù),實驗過程中主持人盡可能保持安靜,被試遇到困難可以舉手示意,主持人給盡量少的提示來幫助被試完成整個測試。測試完成及時找被試進行ATR回訪,并讓其填寫滿意度問卷。
(四)實驗典型任務(wù)
用戶需要模擬的情境:
你是一名社區(qū)醫(yī)療服務(wù)中心的工作人員。今天接到的患者是王某,男,55歲,腦卒中后右上肢功能障礙,現(xiàn)患者已經(jīng)進行了兩個月的右上肢偏癱康復(fù)訓(xùn)練,今天來社區(qū)醫(yī)療服務(wù)中心的目的是對自己的右上肢康復(fù)狀況做一個等級評測。需要你根據(jù)列表中的任務(wù)進行操作,協(xié)助王某完成整個評測過程。
三、數(shù)據(jù)分析
完成實驗后,在Tobii studio中進行數(shù)據(jù)分析。眼動數(shù)據(jù)采樣率良好:最高91%,最低71%平均采樣率83%。根據(jù)任務(wù)將每個被試數(shù)據(jù)截取成20個單獨場景,不同被試間作對比分析。主要通過熱力圖、任務(wù)完成時間、任務(wù)錯誤率等來分析界面的可用性問題。
(一)任務(wù)分析
實驗完成后,12項任務(wù)完成較好,有8項任務(wù)中部分完成程度較差,問題列舉如下:
任務(wù)1:此任務(wù)完成用時最少16s最多65.9s,從熱力圖中可以看出,部分用戶在首頁的內(nèi)容區(qū)中找藍牙開關(guān),說明藍牙位置的可發(fā)現(xiàn)性對部分用戶仍然較低。
任務(wù)2:此任務(wù)完成平均時間為13.4s,總體操作時間較少,但是錯誤率為33.3%,說明大部分用戶將頂部導(dǎo)航欄中用戶顯示狀態(tài)圖標(biāo)誤認(rèn)為操作按鍵,導(dǎo)致了錯誤操作,說明該圖標(biāo)設(shè)計及標(biāo)注和操作按鍵區(qū)分度太差,容易引起誤操作。
任務(wù)5:此任務(wù)完成最多用時92s最少用時7.1s,相差許多,出錯率也高達50%說明設(shè)置,對于部分新手用戶來說可理解性不高,可發(fā)現(xiàn)性較低。從熱力圖也可以看出,用戶的注視部分主要集中在肩部、肘部、腕部按鍵部分,經(jīng)過多次試錯以后才找到設(shè)置,說明設(shè)置和動作歸為一類容易造成概念混淆。endprint
任務(wù)7:此任務(wù)整體完成度較好,但搜索時間差距較大,任務(wù)最長時間為53s,從熱力圖來看,大部分用戶注視按鍵區(qū)域仍停留在按鍵區(qū)域,說明部分用戶對于問號圖標(biāo)仍不理解,該圖標(biāo)的可理解性較差。
任務(wù)9:此任務(wù)出錯率較高為33.3%,從熱力圖可以看出大部分用戶在信息顯示區(qū)域搜索,大部分用戶誤把實時角度信息看成了最大角度信息,仍有部分用戶在角度曲線圖中尋找最大角度信息。說明最大角度信息放置在測試數(shù)據(jù)二級頁面中和用戶的心智模型不相符,可發(fā)現(xiàn)性較低。
任務(wù)13:任務(wù)完成時間較短,但任務(wù)錯誤操作率較高為33.3%,部分用戶沒有再次選擇肘屈曲動作,直接點擊了重新測試此動作按鈕,說明任務(wù)完成狀態(tài)和選擇狀態(tài)相似度較高,導(dǎo)致用戶誤以為選中狀態(tài),主要問題在于按鍵狀態(tài)標(biāo)識不明確。
任務(wù)14:此任務(wù)仍有一人操作錯誤,從熱力圖也可以看出該用戶在肩部、肘部、和腕部中尋找握力測試動作,說明動作太多,界面可學(xué)習(xí)性較差,握力和關(guān)節(jié)角度中其他詞語容易造成概念混淆。
任務(wù)16:盡管此任務(wù)和任務(wù)9類似,但仍有一位用戶操作錯誤,說明最大握力數(shù)據(jù)在二級頁面中可發(fā)現(xiàn)性較低。
(二)RTA回訪總結(jié)
RTA問題:你剛才操作的時候碰到了什么問題?你有什么修改建議?
(三)滿意度問卷總結(jié)
滿意度問卷結(jié)果顯示界面綜合滿意度為81.1%,說明其有較高的可用性,但在信息條理性和清晰性滿意度較差為73.3%,說明信息排布方面還有較大優(yōu)化空間;操作錯誤率方面滿意度為70%,說明在防錯性方面仍需改進;系統(tǒng)引導(dǎo)性方面滿意度最差僅為63.3%,說明應(yīng)當(dāng)增加適當(dāng)?shù)囊龑?dǎo)操作,優(yōu)化用戶體驗。
結(jié)論
結(jié)合數(shù)據(jù)分析,軟件界面具有較高的可用性,但實驗過程中仍發(fā)現(xiàn)有部分可用性問題,綜合數(shù)據(jù)分析總結(jié)了界面存在的六方面的可用性問題列舉如下:
可理解性:關(guān)節(jié)活動度幫助按鍵用問號圖標(biāo),大部分用戶表示不好理解;界面導(dǎo)航欄用戶選擇狀態(tài)被大部分用戶誤認(rèn)為可點擊按鍵。
可發(fā)現(xiàn)性:藍牙位置對少部分用戶發(fā)現(xiàn)性較低;測試項目中的設(shè)置按鍵,大部分用戶需要不停試錯才能找到;測試結(jié)果信息放置在關(guān)節(jié)活動度頁面的二級頁面下面,不易被發(fā)現(xiàn)。
狀態(tài)標(biāo)識:藍牙沒有狀態(tài)標(biāo)識;肩、肘、腕動作按鍵選擇和非選擇狀態(tài)標(biāo)識混亂。
操作性:選為被試操作需要兩步,過程較累贅。
可學(xué)習(xí)性:重復(fù)的任務(wù)操作也產(chǎn)生了錯誤,界面的可學(xué)習(xí)性不高。
防鍇性:缺少能引導(dǎo)用戶操作的提示,用戶誤操作時沒有錯誤提示。
本文主要研究了可用性方法在界面設(shè)計整個過程中的應(yīng)用,前中期通過多輪啟發(fā)式評估方法解決大部分可用性問題并設(shè)計和完善界面;后期運用可用性測試方法,綜合眼動數(shù)據(jù)、滿意度問卷、RTA訪談?wù)业搅私缑嬖O(shè)計存在的諸多可用性問題,為界面優(yōu)化提供了意見參考。endprint