袁紅 黃燕
摘 要:[目的/意義]查詢式搜索適用于目標(biāo)明確的提問應(yīng)答式信息問題,探索式搜索更注重搜索過程的人機(jī)交互性、動(dòng)態(tài)性與多面性,兩者表現(xiàn)出不同的行為特征。作為搜索行為研究的基本問題之一,相關(guān)研究還比較缺乏。論文旨在探究查詢式搜索與探索式搜索行為特征的差異,這對于信息搜索系統(tǒng)的功能優(yōu)化以及指導(dǎo)用戶高效獲取信息都具有重要的實(shí)踐意義。[方法/過程]論文以健康信息搜索為例,采用搜索行為實(shí)驗(yàn)的方法,通過對錄屏數(shù)據(jù)的分析,從檢索策略、學(xué)習(xí)行為、深度搜索和搜索績效4個(gè)維度對兩種搜索行為進(jìn)行比較。[結(jié)果/結(jié)論]查詢式搜索與探索式搜索在關(guān)鍵詞變換數(shù)、訪問網(wǎng)頁數(shù)目等6個(gè)指標(biāo)上存在顯著性差異,在檢索工具選擇、查詢串長度、搜索結(jié)果集的翻頁和相關(guān)鏈接搜索4個(gè)指標(biāo)上不存在顯著性差異。
關(guān)鍵詞:查詢式搜索;探索式搜索;搜索行為;搜索過程
DOI:10.3969/j.issn.1008-0821.2019.05.007
〔中圖分類號〕G254.9 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2019)05-0048-09
Abstract:[Purpose/Significance]Lookup is suitable for Q&A search queries,and exploratory search pays more attention to human-computer interaction,dynamics and versatility in the search process.They have different behavioral characteristics.As one of the basic issues in search behavior research,there is still a lack of relevant research.The purpose of this paper was to explore the difference between lookup and exploratory search,which is of great practical significance to the function optimization of information search system and guide users to search efficiently.[Method/Process]Taking health information search as the research object,by using the method of search behavior experiment and video data analyzing,this paper compared the two search behaviors from four dimensions:search strategy,learning behavior,depth search and search performance.[Result/Conclusion]It showed that there were significant differences between lookup and exploratory search in numbers of keyword transformation,numbers of visited webpages,etc.There was no significant difference in the search tool selection,length of query strings,jump options and related link search.
Key words:lookup;exploratory search;search behavior;search process
第41次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》[1]顯示,截至2017年12月,我國網(wǎng)民規(guī)模達(dá)7.72億,普及率達(dá)到55.8%。隨著互聯(lián)網(wǎng)的發(fā)展,人們越來越多地利用搜索引擎獲取信息??焖侔l(fā)展的搜索引擎技術(shù)能越來越有效地識別用戶需求,但當(dāng)搜索者對搜索的領(lǐng)域不熟悉,不能確定搜索目標(biāo)的實(shí)現(xiàn)路徑,甚至不能確定搜索目標(biāo)時(shí),搜索如何進(jìn)行成為搜索引擎亟待解決的問題。
搜索行為被劃分為“提問—應(yīng)答”式搜索,又稱查詢式搜索(Lookup)和探索式搜索(Exploratory Search)。探索式搜索作為一個(gè)獨(dú)立的研究領(lǐng)域開始于2005年在美國馬里蘭大學(xué)召開的“探索式搜索界面”專題研討會(huì)[2-3],2006年Marchionini G[2]提出探索式搜索的定義,探索式搜索用來描述一種開放的、持續(xù)的、多方面的信息搜尋的問題情境和具有機(jī)會(huì)性、反復(fù)性、多策略的信息搜尋過程。這一新概念的提出使得學(xué)術(shù)界將焦點(diǎn)轉(zhuǎn)向網(wǎng)絡(luò)環(huán)境下的復(fù)雜搜索。盡管國內(nèi)外學(xué)者在探索式搜索的影響因素、行為特征等方面已經(jīng)取得大量的研究成果,但查詢式搜索與探索式搜索的比較研究作為探索式搜索研究的基本問題,探索得還不夠充分。
美國醫(yī)學(xué)圖書館網(wǎng)絡(luò)(NNLM)將健康信息定義為與大眾、患者及其家屬有一定關(guān)系的健康和醫(yī)學(xué)方面的資訊[3]。最新的《中國網(wǎng)民科普需求搜索行為報(bào)告》[4]顯示,8個(gè)科普主題增長排名中“健康與醫(yī)療”位居第二。同時(shí),國內(nèi)外研究發(fā)現(xiàn),使用互聯(lián)網(wǎng)和移動(dòng)電話搜索健康信息的行為日益普及,成為人們尋求健康信息、進(jìn)行健康管理的主要途徑之一[5-8]。毋庸置疑,健康信息已經(jīng)成為現(xiàn)代人們信息搜索的焦點(diǎn)。
1 相關(guān)研究
近年來,越來越多來自信息檢索、人機(jī)交互、信息組織、信息行為等領(lǐng)域的研究人員進(jìn)入了探索式搜索的領(lǐng)域,并產(chǎn)生了大量研究成果。該領(lǐng)域的研究大多是在實(shí)驗(yàn)環(huán)境下展開的,研究內(nèi)容主要有兩個(gè)方面:一是從用戶角度出發(fā),研究用戶探索式搜索過程中體現(xiàn)出的行為特征。Kang R等[9]通過分析領(lǐng)域?qū)<液托率值奶剿魇剿阉餍袨椋C明了領(lǐng)域?qū)I(yè)知識對于查找和評估信息的重要作用;張?jiān)魄锏萚10]以在校的醫(yī)學(xué)專業(yè)高年級大學(xué)生為實(shí)驗(yàn)對象,采用概念圖分析、日志分析以及調(diào)查問卷相結(jié)合的方法,發(fā)現(xiàn)在探索式信息搜索過程中,搜索者的認(rèn)知和搜索行為都呈現(xiàn)出階段性改變的特點(diǎn),即搜索者表現(xiàn)出從快速瀏覽到細(xì)致瀏覽再到集中搜索的行為變化過程;二是探索式搜索行為的影響因素研究。王宇等[11]運(yùn)用眼動(dòng)記錄、問卷調(diào)查與訪談的方法,探討了搜索能力和任務(wù)特征對探索式搜索行為的影響;李月琳等[12]采用視頻錄制和問卷調(diào)查相結(jié)合的方法,從檢索詞、全文下載等7項(xiàng)行為指標(biāo)出發(fā),研究分析了高任務(wù)復(fù)雜度和高任務(wù)困難度與探索式搜索行為之間的關(guān)系;Chu P等[13]通過研究使用不同語言的網(wǎng)絡(luò)搜索行為,發(fā)現(xiàn)第一語言與第二語言在任務(wù)完成時(shí)間、提問重構(gòu)次數(shù)和網(wǎng)站瀏覽個(gè)數(shù)上的差異。
對于查詢式搜索與探索式搜索的比較,現(xiàn)有研究多從理論探討的角度開展。首先是兩種搜索類型在實(shí)際上的搜索行為中密不可分,Pang C I等[14]指出兩種類型的搜索會(huì)在一段時(shí)間并存和交替。White R等[15]認(rèn)為查詢式搜索與探索式搜索存在連續(xù)性。同時(shí),也有研究指出了兩種搜索類型之間的區(qū)別。Marchionini G[2]界定了查詢式搜索與探索式搜索的本質(zhì)特征,他認(rèn)為查詢式搜索只需最少的結(jié)果集檢查和項(xiàng)目比較就能得到精確的結(jié)果,而探索式搜索與學(xué)習(xí)和調(diào)查活動(dòng)特別相關(guān)。隨著研究的深入,出現(xiàn)了一些實(shí)證研究成果。魏麗等[16]通過設(shè)計(jì)查詢式搜索與探索式搜索任務(wù),利用屏幕錄像和瀏覽器日志,從搜索動(dòng)作、網(wǎng)頁瀏覽、檢索式等角度,分析任務(wù)復(fù)雜度對受試者搜索行為的影響;Athukorala K等[17]利用眼球追蹤器來記錄注視數(shù)據(jù),從查詢串長度、第一次迭代持續(xù)的時(shí)間等指標(biāo)對比查詢式搜索與探索式搜索任務(wù),以確定能夠區(qū)分兩種搜索的指標(biāo)。
綜觀現(xiàn)有研究可知,探索式搜索行為的研究主題和研究視角逐漸豐富,相當(dāng)多的研究都基于實(shí)驗(yàn)環(huán)境,主要采用問卷分析、日志分析、眼動(dòng)分析等方法開展。但隨著搜索引擎性能優(yōu)化需求日益迫切,查詢式與探索式搜索的比較研究也逐漸發(fā)展起來。但目前仍缺少從系統(tǒng)角度出發(fā),通過構(gòu)建完善的比較體系開展的細(xì)粒度研究。
2 理論框架
信息搜索始于信息需求,搜索者根據(jù)自己的需求并結(jié)合自身所具備的知識開始搜索,首先要確定的就是搜索策略,包括使用何種搜索平臺(tái)、如何構(gòu)建檢索式等等。在第一次搜索結(jié)束后得到的一系列內(nèi)容中選擇瀏覽,或是得到自己需要的結(jié)果,結(jié)束本次搜索,或是受到相應(yīng)的啟發(fā)進(jìn)行進(jìn)一步搜索,這就表現(xiàn)為用戶的學(xué)習(xí)行為。經(jīng)過一定的深度搜索后,搜索者會(huì)結(jié)束此次搜索并產(chǎn)生對此次搜索效果的評估。本文將上述搜索過程的提煉出搜索策略、學(xué)習(xí)行為、深度搜索和搜索績效4個(gè)要素,基于此,構(gòu)建研究的理論框架如圖1所示。在相關(guān)研究的基礎(chǔ)上,從理論框架的4個(gè)模塊出發(fā),選取搜索行為的具體指標(biāo)比較兩類搜索行為的差異。
選取檢索工具選擇、查詢串長度和關(guān)鍵詞變換數(shù)3個(gè)指標(biāo)刻畫搜索策略。檢索工具選擇揭示用戶對于信息檢索平臺(tái)的使用情況,查詢串長度記錄每次查詢發(fā)生時(shí)的具體情況,而關(guān)鍵詞變換數(shù)則是從整個(gè)檢索過程來看的全局變量。
信息需求來源于未知,任何搜索的過程都是學(xué)習(xí)的過程。選取訪問網(wǎng)頁數(shù)目、精讀次數(shù)和瀏覽有效結(jié)果時(shí)間3個(gè)指標(biāo)表示搜索中的學(xué)習(xí)行為。訪問網(wǎng)頁數(shù)目反映了搜索者廣泛閱讀的數(shù)量,精讀次數(shù)則反映了搜索者詳細(xì)閱讀的數(shù)量,而瀏覽有效結(jié)果時(shí)間具體地顯示了實(shí)驗(yàn)者在其認(rèn)為能獲得滿意回答的網(wǎng)頁的學(xué)習(xí)時(shí)間。
深度搜索表示獲得一定的搜索結(jié)果后的進(jìn)一步搜索,本文將深度搜索劃分為相關(guān)鏈接搜索和搜索結(jié)果集的翻頁這2個(gè)指標(biāo)。搜索結(jié)果集的翻頁是在同一搜索結(jié)果下的后續(xù)閱讀,相關(guān)鏈接搜索是與該搜索結(jié)果相關(guān)的內(nèi)容的閱讀。
搜索績效揭示的是搜索者對于整個(gè)搜索過程的評估,本文將搜索績效分為任務(wù)完成時(shí)間和被采用的網(wǎng)頁數(shù)2個(gè)指標(biāo)。任務(wù)完成時(shí)間是檢索到滿意結(jié)果所花費(fèi)的時(shí)間,被采用的網(wǎng)頁數(shù)目則表示搜素結(jié)果的采納情況,這2個(gè)指標(biāo)分別從時(shí)間和數(shù)量上揭示了搜索績效。
綜上,指標(biāo)及其釋義見表1。
3 研究設(shè)計(jì)
3.1 研究方法
隨著探索式搜索研究的不斷深入,越來越多的研究采用了搜索實(shí)驗(yàn)的方法。實(shí)驗(yàn)法的優(yōu)點(diǎn)在于可以根據(jù)研究需求控制研究對象、研究環(huán)境、研究條件等,模擬真實(shí)情境,發(fā)現(xiàn)隱藏規(guī)律。本研究以健康信息為主題,通過設(shè)定不同類型的任務(wù)情境,從搜索策略、學(xué)習(xí)行為、深度搜索、搜索績效4個(gè)模塊對2種搜索行為進(jìn)行比較研究。使用錄屏軟件WebEx Recorder客觀全面地記錄實(shí)驗(yàn)者具體的搜索行為。
3.2 實(shí)驗(yàn)對象
探索式搜索屬于較高層次的搜索行為,具備一定學(xué)歷背景的人群能夠更好地完成實(shí)驗(yàn)。由于搜索實(shí)驗(yàn)的開展具有較大難度,后期實(shí)驗(yàn)數(shù)據(jù)的處理也需要大量的時(shí)間和人力,因此實(shí)驗(yàn)者數(shù)量很難達(dá)到大樣本的要求。如張?jiān)魄锏萚19]在研究探索式醫(yī)學(xué)搜索行為時(shí)選取了20位高年級本科生和10位碩士研究生;Pang C I等[14]在研究健康信息搜索行為中的探索式搜索時(shí)選取了20名實(shí)驗(yàn)參與者。由此可見,國內(nèi)外在以搜索實(shí)驗(yàn)為主要研究方法的現(xiàn)有成果中,實(shí)驗(yàn)人數(shù)多為二三十人。同時(shí)由于探索式搜索的特征,需要實(shí)驗(yàn)者對于健康領(lǐng)域不熟悉。綜上,本研究計(jì)劃招募在校非醫(yī)學(xué)專業(yè)的大二及以上的本科生25名左右。
3.3 搜索任務(wù)
根據(jù)Marchionini G[2]的框架,查詢式搜索分為導(dǎo)航型搜索(Navigational)、事實(shí)型搜索(Fact-finding/Information)和問題回答型搜索(Question Answering),且前兩者為核心查詢式搜索(Core Lookup Tasks);探索式搜索分為知識獲取型搜索(Knowledge Acquisition)、計(jì)劃型搜索(Planning)和比較型搜索(Comparison),且前兩者為核心探索式搜索(Core Exploratory Tasks)。考慮到實(shí)驗(yàn)者任務(wù)量的承受程度和實(shí)驗(yàn)數(shù)據(jù)收集的工作量,本研究選用核心查詢式搜索和核心探索式搜索,并設(shè)定相應(yīng)的搜索任務(wù)。各類型任務(wù)的含義見表2。
我國網(wǎng)絡(luò)用戶健康信息檢索關(guān)注的熱點(diǎn)領(lǐng)域?yàn)榧膊?、保健、母嬰、醫(yī)療機(jī)構(gòu)與美容整形[26]。本研究圍繞上述熱點(diǎn)設(shè)定如下實(shí)驗(yàn)任務(wù):
事實(shí)型:定義“吸脂手術(shù)”。
導(dǎo)航型:找到介紹母嬰產(chǎn)品最多的網(wǎng)站。
知識獲取型:攻克癌癥是醫(yī)學(xué)界的終極目標(biāo),假設(shè)你是一位學(xué)者,將撰寫一篇關(guān)于癌癥疫苗的文章,您需要盡可能多地了解有關(guān)此主題的信息,包括研究情況、具體應(yīng)用、需要攻克的難題、已有成果以及最新的研究成果等。
計(jì)劃型:韓梅梅今年24歲,身高160cm,體重60kg,身體健康,她希望減掉腰間、腿部的贅肉,目標(biāo)體重50kg,為了能夠健康減肥,請你為她設(shè)計(jì)一套健康的減肥計(jì)劃,包括運(yùn)動(dòng)計(jì)劃和飲食計(jì)劃(健康減肥的公式是:營養(yǎng)均衡+低熱量+不降低人體的新陳代謝+1周體重下降不超過4斤)。
3.4 指標(biāo)評判標(biāo)準(zhǔn)
為了保證從視頻數(shù)據(jù)編碼的一致性與可靠性,制定了如表3所示的指標(biāo)數(shù)據(jù)評判標(biāo)準(zhǔn):
3.5 實(shí)驗(yàn)流程
實(shí)驗(yàn)準(zhǔn)備階段,在實(shí)驗(yàn)計(jì)算機(jī)上安裝WebEX Recorder,發(fā)放實(shí)驗(yàn)手冊,實(shí)驗(yàn)手冊包括實(shí)驗(yàn)者流程、注意事項(xiàng)以及實(shí)驗(yàn)任務(wù)介紹。實(shí)驗(yàn)者坐到標(biāo)有編號的機(jī)位,閱讀實(shí)驗(yàn)手冊并熟悉實(shí)驗(yàn)工具。實(shí)驗(yàn)實(shí)施階段,實(shí)驗(yàn)者開啟WebEx Recorder,開始搜索任務(wù),4個(gè)搜索任務(wù)估計(jì)用時(shí)半個(gè)小時(shí)。搜索完成后,實(shí)驗(yàn)者暫停視頻錄制,等待工作人員確認(rèn)驗(yàn)收視頻數(shù)據(jù)后實(shí)驗(yàn)結(jié)束。
搜索實(shí)驗(yàn)于2018年3月16日進(jìn)行,實(shí)際招募30位實(shí)驗(yàn)者。由于操作不當(dāng)?shù)纫蛩兀?位實(shí)驗(yàn)者的數(shù)據(jù)不完整或者丟失,因此有效數(shù)據(jù)樣本為25份。為了減少主觀誤差,視頻數(shù)據(jù)由1位工作人員識別整理,2位工作人員復(fù)查。
4 查詢式搜索與探索式搜索行為的比較
4.1 搜索策略的比較
4.1.1 檢索工具選擇
統(tǒng)計(jì)顯示,25名參與者共點(diǎn)擊了447個(gè)頁面,運(yùn)用的搜索工具主要有百度類搜索工具、知網(wǎng)等學(xué)術(shù)數(shù)據(jù)庫以及其他信息平臺(tái)。百度類指百度百科、百度文庫、百度學(xué)術(shù)等;知網(wǎng)等學(xué)術(shù)數(shù)據(jù)庫包括知網(wǎng)、維普、萬方等;其他信息平臺(tái)包括搜狗、必應(yīng)、谷歌等。4種搜索任務(wù)在不同搜索工具上選擇上的對比見圖2。
從搜索工具的種類來看,無論是哪一種任務(wù)類型,百度類搜索工具都是最多被使用的且在不同任務(wù)類型不存在顯著性差異,這與百度強(qiáng)大的搜索性能及大眾的搜索習(xí)慣密切相關(guān);知識獲取型任務(wù)較多使用知網(wǎng)等學(xué)術(shù)數(shù)據(jù)庫,其余3類任務(wù)很少使用,筆者認(rèn)為這與任務(wù)設(shè)定、信息素養(yǎng)有關(guān);對于其他信息平臺(tái),導(dǎo)航型任務(wù)使用較多,其余任務(wù)類型相差不大。任務(wù)設(shè)定的背景和個(gè)人習(xí)慣是產(chǎn)生不同搜索任務(wù)檢索工具選擇差異性的原因。從搜索工具使用數(shù)量上看,事實(shí)型、導(dǎo)航型以及計(jì)劃型任務(wù)平均使用一種搜索工具,知識獲取型任務(wù)平均使用兩種搜索工具,查詢式搜索與探索式搜索在搜索工具使用數(shù)量上不存在顯著差異。這與實(shí)驗(yàn)者的信息素養(yǎng)有很大的關(guān)系,信息素養(yǎng)較高的人不僅知道在哪里可能找到自己需要的信息,還善于利用各種信息搜索平臺(tái)來多角度接近相關(guān)內(nèi)容。
4.1.2 查詢串長度
查詢串反映用戶的信息需求,分析查詢串長度可以了解用戶在檢索過程中的思維過程和搜索意向。表4為4類搜索任務(wù)平均查詢串長度的統(tǒng)計(jì)結(jié)果??梢钥闯?,事實(shí)型任務(wù)平均輸入查詢串長度最短,為4個(gè)漢字,知識獲取型任務(wù)平均輸入查詢串長度最長,為7.172個(gè)漢字;導(dǎo)航型與計(jì)劃型任務(wù)均值相近。
4類搜索任務(wù)平均查詢串長度單因素方差分析和多重比較分析結(jié)果(表略)顯示,事實(shí)型任務(wù)與其他3類搜索任務(wù)之間存在顯著性差異,但導(dǎo)航型任務(wù)與計(jì)劃型任務(wù)之間差異不顯著,因此查詢式搜索與探索式搜索在查詢串長度這一指標(biāo)上不能進(jìn)行嚴(yán)格區(qū)分。為了進(jìn)一步理解這個(gè)結(jié)果產(chǎn)生的原因,筆者分析了實(shí)驗(yàn)者的第一個(gè)查詢,發(fā)現(xiàn)不管對搜索主題是否清楚,實(shí)驗(yàn)者都會(huì)選擇從任務(wù)中找到關(guān)鍵詞作為第一次查詢的查詢串,如4類搜索任務(wù)中最常見的第一個(gè)查詢分別是“吸脂手術(shù)”、“母嬰產(chǎn)品的網(wǎng)站”、“癌癥疫苗”和“減肥計(jì)劃”。由此可知,查詢串長度與特定的任務(wù)有一定的關(guān)聯(lián),無論是查詢式搜索還是探索式搜索,當(dāng)對不熟悉的領(lǐng)域進(jìn)行檢索時(shí),第一次查詢都表現(xiàn)為對該概念的探索過程。對實(shí)驗(yàn)者在后續(xù)搜索中使用的查詢詞進(jìn)行同樣的比較,發(fā)現(xiàn)上述規(guī)律依舊存在。
4.1.3 關(guān)鍵詞變換數(shù)
關(guān)鍵詞變換數(shù)是評價(jià)用戶檢索過程的代表性指標(biāo)之一[23]。從平均值可以看出,知識獲取型任務(wù)關(guān)鍵詞變換數(shù)最多,約5次,計(jì)劃型任務(wù)次之,約3次,而事實(shí)型和導(dǎo)航型任務(wù)基本不更換檢索詞。在查詢式搜索中,實(shí)驗(yàn)者能很快鑒別整個(gè)任務(wù)的核心,并且在一次檢索后就能找到自己滿意的結(jié)果,幾乎不進(jìn)行關(guān)鍵詞的更換。如事實(shí)型任務(wù)要求對“吸脂手術(shù)”這一醫(yī)學(xué)概念進(jìn)行定義,實(shí)驗(yàn)者幾乎都選擇“吸脂手術(shù)”作為首次檢索詞,并相對容易快速地找到了結(jié)果。而在探索式搜索任務(wù)中,由于結(jié)果集的開放性和寬泛性,實(shí)驗(yàn)者在一次搜索過后僅能找到一部分滿意的結(jié)果,更多的信息需要更換搜索策略才能獲得。由此可見,查詢式搜索與探索式搜索在關(guān)鍵詞變換數(shù)上存在顯著差異。
4.2 學(xué)習(xí)行為的比較
4.2.1 訪問網(wǎng)頁數(shù)目
網(wǎng)頁數(shù)是評價(jià)用戶檢索過程的又一代表性指標(biāo)[23]。統(tǒng)計(jì)可知,4類搜索任務(wù)分別訪問了36、69、220和122個(gè)網(wǎng)頁??梢姡L問網(wǎng)頁數(shù)是一個(gè)區(qū)分查詢式搜索與探索式搜索的有效指標(biāo)。探索式搜索由于目標(biāo)的不明確性以及對搜索對象的不熟悉,導(dǎo)致實(shí)驗(yàn)者在搜索過程中訪問大量的網(wǎng)頁去增強(qiáng)對目標(biāo)的認(rèn)識,以達(dá)到檢索到自身滿意結(jié)果的目的,這在知識獲取型任務(wù)中表現(xiàn)得尤為明顯。
4.2.2 精讀次數(shù)
精讀時(shí)間的分割點(diǎn)為8秒,當(dāng)網(wǎng)頁閱讀時(shí)間超過8秒就記1次精讀,反映了實(shí)驗(yàn)者的學(xué)習(xí)次數(shù)。從圖3可以看出,知識獲取型任務(wù)有很高的精度次數(shù),其次是計(jì)劃型任務(wù),而事實(shí)型任務(wù)和導(dǎo)航型任務(wù)的精度次數(shù)平均為1~2次,可見在查詢式搜索中,由于有較為明確的目標(biāo),實(shí)驗(yàn)者在頁面瀏覽時(shí)不會(huì)選擇逐字逐句的閱讀,而是緊盯關(guān)鍵詞,快速查找關(guān)鍵詞出現(xiàn)的位置,從而獲取目標(biāo)信息,這就導(dǎo)致了查詢式搜索的精度次數(shù)較少。相反,探索式搜索更加注重實(shí)驗(yàn)者的閱讀、理解、信息編碼能力。因此,精讀次數(shù)能夠較好地區(qū)分查詢式搜索與探索式搜索。
4.2.3 瀏覽有效結(jié)果頁時(shí)間
從整體來看,整個(gè)搜索過程的總時(shí)長近乎可以被劃分為輸入查詢串的時(shí)間和瀏覽網(wǎng)頁內(nèi)容的時(shí)間,而瀏覽有效結(jié)果頁時(shí)間是總體瀏覽時(shí)間的一部分,表現(xiàn)的是用戶在搜索過程中的學(xué)習(xí)過程。通過視頻數(shù)據(jù)的分析量化,可以發(fā)現(xiàn)實(shí)驗(yàn)者在進(jìn)行計(jì)劃型任務(wù)時(shí)平均花費(fèi)173.9s閱讀有效結(jié)果頁,平均用時(shí)最長,其次是知識獲取型任務(wù),平均61.8s,而事實(shí)型任務(wù)與導(dǎo)航型任務(wù)均值相近且較少,分別為26.2s和21.8s。可以認(rèn)為,查詢式搜索與探索式搜索在平均瀏覽有效結(jié)果頁時(shí)間的指標(biāo)上存在顯著差異,查詢式搜索時(shí),由于目標(biāo)的明確性和任務(wù)復(fù)雜度較低,雖然搜索的內(nèi)容不熟悉的,也能在短時(shí)間內(nèi)獲取到有用的信息從而結(jié)束此次搜索;而在進(jìn)行探索式搜索時(shí),同樣缺乏相關(guān)目標(biāo)知識,但需求的寬泛性,需要不斷探索、不斷學(xué)習(xí)而逐漸落實(shí)到細(xì)節(jié)上以獲取滿意的信息,因此探索式搜索的學(xué)習(xí)行為表現(xiàn)更充分,瀏覽有效結(jié)果頁時(shí)間即是個(gè)學(xué)習(xí)過程在時(shí)間上的反映。
4.3 深度搜索的比較
4.3.1 搜索結(jié)果集的翻頁
統(tǒng)計(jì)4類搜索任務(wù)中搜索結(jié)果集的翻頁次數(shù),結(jié)果顯示,所有搜索任務(wù)的翻頁次數(shù)都很少,除知識獲取型任務(wù)的翻頁次數(shù)相對較多外,其余3個(gè)搜索任務(wù)的翻頁次數(shù)差異不明顯。筆者認(rèn)為這是由于不管是何種搜索平臺(tái),一般都遵循一定的搜索結(jié)果排列算法,比如谷歌使用的算法——PageRank,在所有結(jié)果集中,相關(guān)性和重要性最高的結(jié)果會(huì)排在最上面。實(shí)驗(yàn)者根據(jù)自身經(jīng)驗(yàn)一般只會(huì)閱讀第一頁的內(nèi)容,偶爾會(huì)選擇翻頁。而對于搜索內(nèi)容的翻頁來說,實(shí)驗(yàn)者會(huì)選擇有些閱讀類似摘要的內(nèi)容,當(dāng)發(fā)現(xiàn)與自己的需求關(guān)聯(lián)不大時(shí)就會(huì)放棄繼續(xù)閱讀。尤其像具體的癌癥疫苗這類醫(yī)學(xué)信息,實(shí)驗(yàn)者一旦發(fā)現(xiàn)內(nèi)容似乎并不滿意就會(huì)失去繼續(xù)深入閱讀的動(dòng)力。因此導(dǎo)致了翻頁次數(shù)較少這個(gè)情況。接著進(jìn)行4類搜索任務(wù)在搜索結(jié)果集的翻頁次數(shù)上的差異性分析和多重比較,結(jié)果顯示搜索結(jié)果集的翻頁可以將知識獲取型任務(wù)從4個(gè)搜索任務(wù)中區(qū)別出來,它與事實(shí)型、導(dǎo)航型和計(jì)劃型任務(wù)之間的顯著性水平分別為0.000、0.000和0.001,但計(jì)劃型任務(wù)與導(dǎo)航型任務(wù)之間差異不顯著,為0.457。因此,從搜索結(jié)果集的翻頁這個(gè)指標(biāo)來看,查詢式搜索與探索式搜索之間不存在顯著性差異。
4.3.2 相關(guān)鏈接搜索
觀察4類搜索任務(wù)的相關(guān)鏈接搜索次數(shù)的平均值,發(fā)現(xiàn)平均值皆在1~2次之間,差異不明顯。筆者認(rèn)為這種情況可能是兩方面的原因綜合導(dǎo)致的,一是實(shí)驗(yàn)任務(wù)的設(shè)定,查詢式任務(wù)較為簡單直接,基本一次檢索就能獲得需要的信息,因此不需要相關(guān)鏈接搜索,而探索式任務(wù)的設(shè)定,比如癌癥疫苗,搜索結(jié)果中較多的相關(guān)搜索是關(guān)于具體某個(gè)疫苗的,在實(shí)驗(yàn)者對其了解很少的情況下,很少有人會(huì)選擇深入了解。二是個(gè)人習(xí)慣所致,通過對視頻的分析可以發(fā)現(xiàn),有些實(shí)驗(yàn)者會(huì)忽視相關(guān)鏈接,主要關(guān)注搜索平臺(tái)返回的搜索結(jié)果,有些實(shí)驗(yàn)者則是受到相關(guān)鏈接的啟發(fā),將相關(guān)鏈接的內(nèi)容輸入檢索框進(jìn)行再次檢索,而非點(diǎn)擊相關(guān)鏈接。進(jìn)一步進(jìn)行多重比較,可以發(fā)現(xiàn)事實(shí)型任務(wù)與導(dǎo)航型、知識獲取型和計(jì)劃型任務(wù)之間的顯著性分別為0.007、0.000和0.000,都存在顯著性差異,而導(dǎo)航型任務(wù)與計(jì)劃型任務(wù)之間的顯著性水平為0.056,大于0.05,兩者差異不顯著。因此,相關(guān)鏈接搜索不是區(qū)分查詢式搜索與探索式搜索的良好指標(biāo)。
4.4 搜索績效的比較
4.4.1 任務(wù)完成時(shí)間
任務(wù)完成時(shí)間表征了搜索努力。從圖4可以看出,完成探索式搜索所花的時(shí)間要遠(yuǎn)遠(yuǎn)高于完成查詢式搜索所需的時(shí)間,因而,任務(wù)完成時(shí)間是一個(gè)很好可以明確區(qū)分查詢式搜索與探索式搜索的指標(biāo)。
4.4.2 被采用的網(wǎng)頁數(shù)目
被采用的網(wǎng)頁是實(shí)驗(yàn)者在瀏覽的所有網(wǎng)頁中選擇的滿足其信息需求的頁面。從圖5可以看出知識獲取型任務(wù)被采用的網(wǎng)頁最多,其次是計(jì)劃型任務(wù),事實(shí)型與導(dǎo)航型任務(wù)數(shù)量相近且較少。這是由于探索式搜索目標(biāo)的不明確性以及搜索完成的界限的不明確性,當(dāng)需求等較為模糊時(shí),用戶會(huì)選擇用較多的內(nèi)容來表述其需求目標(biāo)。因此,查詢式搜索與探索式搜索在被采用的網(wǎng)頁數(shù)目這一指標(biāo)上存在顯著性差異。
5 結(jié)論與分析
首先,查詢式搜索與探索式搜索行為特征具有顯著差異,具體表現(xiàn)為關(guān)鍵詞變換數(shù)、訪問網(wǎng)頁數(shù)目、瀏覽有效結(jié)果時(shí)間、精讀次數(shù)、任務(wù)完成時(shí)間和被采用的網(wǎng)頁數(shù)目上的顯著差異。
關(guān)鍵詞變換數(shù)屬于搜索策略維度,搜索策略是貫穿于整個(gè)搜索過程的部分,表現(xiàn)為用戶自身的搜索習(xí)慣、搜索能力以及面對搜索目標(biāo)時(shí)所表現(xiàn)出來的搜索邏輯。查詢式搜索的典型特征是搜索目標(biāo)明確、搜索路徑清晰、任務(wù)復(fù)雜度低,這些特征使得用戶在進(jìn)行信息檢索時(shí)幾乎能在一次檢索后就獲得有用信息,而探索式搜索恰恰相反,需要經(jīng)過不斷地探索、學(xué)習(xí),逐漸獲得對目標(biāo)的認(rèn)識,才能最后獲取滿意的回答,檢索詞的多變性就是這個(gè)過程的具體表現(xiàn)。
訪問網(wǎng)頁數(shù)目、精讀次數(shù)、瀏覽有效結(jié)果時(shí)間構(gòu)成了學(xué)習(xí)行為維度。學(xué)習(xí)是區(qū)分查詢式搜索與探索式搜索的一個(gè)很重要的因素。查詢式搜索更接近于一問一答式,結(jié)果一般精確且唯一,用戶在判斷搜索到的內(nèi)容就是正確結(jié)果后就會(huì)結(jié)束搜索,并不需要對該主題的相關(guān)內(nèi)容進(jìn)行更深地學(xué)習(xí)與研究,而探索式搜索具有更為顯著的學(xué)習(xí)特征,學(xué)習(xí)使得用戶對原本不熟悉的領(lǐng)域逐漸有了一定的認(rèn)識,形成了自己的看法,用戶逐漸理清自己的思路,越來越接近自己想要獲取的信息。
任務(wù)完成時(shí)間和被采用的網(wǎng)頁數(shù)目構(gòu)成了本文中的搜索績效維度。搜索績效是基于整個(gè)搜索任務(wù)完成的情況下進(jìn)行評價(jià)的,作為全局性的指標(biāo),搜索績效可以從整體的角度區(qū)分兩類搜索行為。
其次,查詢式搜索和探索式搜索行為表現(xiàn)出相近的特征,兩者在檢索工具的選擇、查詢串長度、相關(guān)鏈接搜索和搜索結(jié)果集的翻頁上不存在顯著性差異。
檢索工具選擇和查詢串長度比較容易受到主客觀因素的影響。檢索工具選擇與個(gè)人的搜索習(xí)慣以及信息素養(yǎng)有很大關(guān)系,由于長期的搜索體驗(yàn),用戶已經(jīng)形成信息搜索平臺(tái)選擇的偏好。檢索工具選擇反映出用戶的信息素養(yǎng),信息素養(yǎng)高的用戶能夠根據(jù)搜索需求來選擇最有效的信息檢索工具,并且在搜索過程中善于在信息平臺(tái)間切換以獲得更為豐富的結(jié)果。查詢串長度與具體的搜索任務(wù)有很大的關(guān)聯(lián),不管是查詢式搜索還是探索式搜索,當(dāng)搜索任務(wù)不能明確地提取關(guān)鍵詞或者提取的關(guān)鍵詞較長時(shí),就會(huì)導(dǎo)致查詢串長度相應(yīng)變長,這與搜索任務(wù)類型無關(guān)。
搜索結(jié)果集的翻頁和相關(guān)鏈接搜索構(gòu)成了深度搜索維度,這兩個(gè)指標(biāo)不存在顯著性差異的原因在于實(shí)驗(yàn)者自身的搜索習(xí)慣。譬如相關(guān)鏈接搜索,相關(guān)鏈接搜索是瀏覽器基于用戶提交的搜索內(nèi)容所給出的相關(guān)鏈接,是否點(diǎn)擊很大程度上取決于用戶個(gè)人的習(xí)慣,雖然有時(shí)相關(guān)內(nèi)容可以給用戶很好的啟發(fā),但實(shí)驗(yàn)者會(huì)從相關(guān)內(nèi)容中獲得的啟發(fā)變成新的檢索詞繼續(xù)檢索。
6 結(jié) 語
本研究揭示了查詢式搜索與探索式搜索行為差異的具體體現(xiàn),有助于進(jìn)一步深入復(fù)雜信息搜索行為的研究。同時(shí),對于信息檢索系統(tǒng)針對查詢式搜索與探索式搜索的不同需求加強(qiáng)功能建設(shè)提供一定的指導(dǎo)。由于本研究是在實(shí)驗(yàn)環(huán)境下進(jìn)行的,這就難以避免搜索任務(wù)設(shè)定和實(shí)驗(yàn)樣本的局限性。后續(xù)研究將真實(shí)情境與大數(shù)據(jù)分析方向發(fā)展,以挖掘更深入的規(guī)律。
參考文獻(xiàn)
[1]中國互聯(lián)網(wǎng)絡(luò)信息中心.第41次中國互聯(lián)網(wǎng)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[R/OL].http://www.cnnic.net.cn/hlwfzyj/hlwxzbg/hlwtjbg/201803/P020180305409870339136.pdf,2018-03-05.
[2]Marchionini G.Exploratory Search:From Finding to Understanding[J].Communications of the ACM,2006,49(4):41-46.
[3]National Network/Library of Medicine.Consumer Health Information:A Workshop for Librarians Providing Health Information to the Public[EB/OL].http://nnlm.gov/train/chi/mws.htm,2018-03-28.
[4]科普中國.中國網(wǎng)民科普需求搜索行為報(bào)告(2017年第2季度)[R/OL].http://www.crsp.org.cn/uploads/soft/171204/5-1G204101928.pdf,2018-05-12.
[5]聶麗麗,王沅.基于移動(dòng)互聯(lián)網(wǎng)的健康信息搜索行為研究[J].現(xiàn)代醫(yī)院管理,2017,15(1):64-67.
[6]Smith D.Health Care Consumers Use and Trust of Health Information Sources[J].Journal of Communication in Healthcare,2015,4(3):200-210.
[7]Rooks R N,Wiltshire J C,Elder K,et al.Health Information Seeking and Use Outside of the Medical Encounter:Is it Associated with Race and Ethnicity?[J].Social Science & Medicine,2012,74(2):176-84.
[8]Powell J,Inglis N,Ronnie J,et al.The Characteristics and Motivations of Online Health Information Seekers:Cross-Sectional Survey and Qualitative Interview Study[J].Journal of Medical Internet Research,2011,13(1):e20.
[9]Kang R,F(xiàn)u W T.Exploratory Information Search By Domain Experts and Novices[C]//International Conference on Intelligent User Interfaces.ACM,2010:329-332.
[10]張?jiān)魄?,安文秀,馮佳.探索式信息搜索行為研究[J].圖書情報(bào)工作,2012,56(14):67-72.
[11]王宇,張?jiān)魄?探索式搜索行為的眼動(dòng)研究[J].圖書情報(bào)工作,2014,58(11):29-35.
[12]李月琳,樊振佳,孫星明.探索式搜索任務(wù)屬性與信息搜索行為的關(guān)系研究[J].情報(bào)資料工作,2017,(1):54-61.
[13]Chu P,Jozsa E,Komlodi A,et al.An Exploratory Study on Search Behavior in Different Languages[J].2012:318-321.
[14]Pang C I,Verspoor K,Chang S,et al.Conceptualising Health Information Seeking Behaviours and Exploratory Search:Result of a Qualitative Study[J].Health & Technology,2015,5(1):1-11.
[15]White R,Roth R.Exploratory Search:Beyond the Query-Response Paradigm[J].Synthesis Lectures on Information Concepts Retrieval & Services,2009,1(1).
[16]魏麗,張?jiān)魄?探索式搜索行為的日志挖掘研究[J].圖書情報(bào)工作,2014,58(11):21-28.
[17]Athukorala K,Jacucci G,Oulasvirta A,et al.Is Exploratory Search Different?A Comparison of Information Search Behavior for Exploratory and Lookup Tasks[J].Journal of the Association for Information Science & Technology,2016,67(11):2635-2651.
[18]王宇,張?jiān)魄?探索式搜索行為的眼動(dòng)研究[J].圖書情報(bào)工作,2014,58(11):29-35.
[19]張?jiān)魄铮钣窳?,王洪?基于日志與認(rèn)知分析的探索式醫(yī)學(xué)搜索行為研究[J].圖書情報(bào)工作,2014,58(11):36-42.
[20]譚金波.網(wǎng)絡(luò)音頻信息檢索的用戶行為研究[J].情報(bào)資料工作,2013,(5):77-80.
[21]譚金波.學(xué)生信息搜索的內(nèi)隱與外顯策略對網(wǎng)絡(luò)學(xué)習(xí)績效的影響[J].中國電化教育,2014,(9):67-71.
[22]馮佳,張?jiān)魄?基于瀏覽器日志分析的探索式搜索行為研究[J].圖書情報(bào)工作,2014,58(11):13-20.
[23]張敏,聶瑞,羅梅芬.基于需求類型與性別差異的網(wǎng)絡(luò)健康信息檢索行為特點(diǎn)分析[J].情報(bào)資料工作,2017,(2):63-69.
[24]張敏,聶瑞,羅梅芬.健康素養(yǎng)對用戶健康信息在線搜索行為的影響分析[J].圖書情報(bào)工作,2016,(7):103-109.
[25]張悅,張?jiān)魄?基于認(rèn)知風(fēng)格的網(wǎng)絡(luò)健康信息搜索行為研究[J].情報(bào)理論與實(shí)踐,2017,40(7):103-107.
[26]王若佳,李培.基于日志挖掘的用戶健康信息檢索行為研究[J].圖書情報(bào)工作,2015,(11):111-118.
[27]Gredler M E.Learning and Instruction:Theory Into Practice[M].Macmillan,1992.
(責(zé)任編輯:孫國雷)