王曰芬,周玜宇,李 塽
大數(shù)據(jù)驅(qū)動(dòng)下,技術(shù)發(fā)展和外界環(huán)境的改變使得科學(xué)研究由經(jīng)驗(yàn)范式、理論范式、模擬范式逐漸向數(shù)據(jù)密集型范式轉(zhuǎn)變。新的研究范式以數(shù)據(jù)作為科研的對(duì)象和工具,進(jìn)而開展研究活動(dòng),包括數(shù)據(jù)的收集或模擬產(chǎn)生、處理、存儲(chǔ)、分析等內(nèi)容[1]。密集型數(shù)據(jù)逐漸成為科學(xué)研究活動(dòng)的基礎(chǔ),研究過程中所涉及的數(shù)據(jù)和信息既是研究創(chuàng)新活動(dòng)的對(duì)象或知識(shí)工具,也是新的研究起點(diǎn)。隨著科研流程與新興技術(shù)的緊密結(jié)合,科研活動(dòng)的開放協(xié)作趨勢(shì)越發(fā)顯著,科研人員之間數(shù)據(jù)、信息、成果等內(nèi)容的共享利用越發(fā)普遍,科研人員需要洞悉海量數(shù)據(jù)中蘊(yùn)含的知識(shí),以掌握科學(xué)發(fā)展的特點(diǎn)與規(guī)律。同時(shí),隨著研究環(huán)境與支撐條件的轉(zhuǎn)化,科學(xué)研究的難度更大,研究任務(wù)的維度與范圍更加復(fù)雜??茖W(xué)研究是一個(gè)系統(tǒng)過程,知識(shí)創(chuàng)新是科學(xué)研究的前提并貫穿于整個(gè)科學(xué)研究中,因此科研過程中的用戶知識(shí)需求受到多方因素的影響,呈現(xiàn)的動(dòng)態(tài)性和層次性更加顯著,并且不同階段中科研用戶對(duì)數(shù)據(jù)源、數(shù)據(jù)分析的廣度和深度、知識(shí)呈現(xiàn)與傳遞的方式等的需求也表現(xiàn)出多樣化和個(gè)性化的特點(diǎn)。與此同時(shí),知識(shí)服務(wù)在新環(huán)境下受到大數(shù)據(jù)等新技術(shù)發(fā)展的沖擊,面臨數(shù)據(jù)源多樣易變、數(shù)據(jù)量浩繁、數(shù)據(jù)供給過載、知識(shí)碎片化等問題。如何為用戶提供具有較高知識(shí)價(jià)值的服務(wù)產(chǎn)品,成為相關(guān)機(jī)構(gòu)及研究者迫切需要突破的難點(diǎn)。因此,以知識(shí)創(chuàng)新為驅(qū)動(dòng),針對(duì)用戶在科研過程中的需求為其提供深度知識(shí)支持服務(wù),即開展知識(shí)創(chuàng)新服務(wù),既是傳統(tǒng)知識(shí)服務(wù)變革與重構(gòu)的發(fā)展方向,也是滿足科研知識(shí)創(chuàng)新需求的重要支撐。而了解與掌握科研過程中的用戶需求,是知識(shí)創(chuàng)新服務(wù)開展的前提和基礎(chǔ)。
在新科研模式推動(dòng)下,科學(xué)研究范式、知識(shí)形態(tài)、知識(shí)獲取、知識(shí)交流及處理機(jī)制面臨巨大挑戰(zhàn),知識(shí)創(chuàng)新對(duì)知識(shí)服務(wù)提出了更高要求,并引發(fā)出新的研究關(guān)注。從已有研究看,有學(xué)者認(rèn)為知識(shí)服務(wù)是知識(shí)管理的發(fā)展和延伸,如Clair等認(rèn)為知識(shí)服務(wù)是一種管理方法,它將信息管理、知識(shí)管理和戰(zhàn)略學(xué)習(xí)(以績(jī)效為中心)結(jié)合在一起,形成一個(gè)企業(yè)范圍內(nèi)整體和廣泛的運(yùn)作功能[2];也有學(xué)者認(rèn)為知識(shí)服務(wù)應(yīng)當(dāng)與知識(shí)創(chuàng)新聯(lián)系起來,如Ebersberger認(rèn)為知識(shí)密集型服務(wù)是在公司或組織的內(nèi)部或外部提供的創(chuàng)新服務(wù),而創(chuàng)新服務(wù)被理解為針對(duì)組織發(fā)展的服務(wù)及其創(chuàng)新的模式和目標(biāo),包括公共和非營(yíng)利機(jī)構(gòu)[3]。隨著大數(shù)據(jù)與知識(shí)創(chuàng)新驅(qū)動(dòng)需要的增長(zhǎng),知識(shí)創(chuàng)新服務(wù)受到學(xué)者們的青睞。姚遠(yuǎn)等結(jié)合大數(shù)據(jù)時(shí)代的背景,將知識(shí)創(chuàng)新服務(wù)定義為綜合利用大數(shù)據(jù)、語義網(wǎng)等技術(shù),重新組織各類信息資源,建立關(guān)聯(lián)網(wǎng)絡(luò)、語義網(wǎng)絡(luò)等,并進(jìn)行可視化呈現(xiàn)的服務(wù)[4]。陶麗等借鑒智庫(kù)知識(shí)管理模式和知識(shí)創(chuàng)新的經(jīng)驗(yàn),提出知識(shí)創(chuàng)新服務(wù)可依托智庫(kù)管理的核心要素構(gòu)建高質(zhì)量的知識(shí)資源技術(shù)輔助平臺(tái),提供舒適的空間互動(dòng)環(huán)境以及豐富的可參與式服務(wù),以幫助用戶優(yōu)化知識(shí)結(jié)構(gòu),實(shí)現(xiàn)知識(shí)創(chuàng)新[5]。
筆者結(jié)合前人研究成果,將知識(shí)創(chuàng)新服務(wù)定義為以知識(shí)創(chuàng)新為目標(biāo)的知識(shí)服務(wù),即面向創(chuàng)新的知識(shí)服務(wù),其核心內(nèi)容包括信息需求分析、信息采集與知識(shí)抽取、知識(shí)融合與知識(shí)發(fā)現(xiàn)、知識(shí)創(chuàng)新服務(wù)機(jī)制構(gòu)建、知識(shí)創(chuàng)新服務(wù)應(yīng)用[6]。因此,本文在上述概念界定的基礎(chǔ)上,聚焦科研過程中的知識(shí)創(chuàng)新支持,進(jìn)一步明確知識(shí)創(chuàng)新服務(wù)的目的是:將相關(guān)信息資源集成整合、形成增值的知識(shí)產(chǎn)品,以促進(jìn)知識(shí)創(chuàng)新和滿足科研過程中創(chuàng)新活動(dòng)的需求。
(1)用戶信息需求及其相關(guān)研究。Maurice認(rèn)為信息需求就是人們工作、研究和構(gòu)思所需要的事實(shí)和數(shù)據(jù)等[7]。Shih等依據(jù)用戶的行為來確定用戶需求,提出一種信息需求雷達(dá)模型,由用戶、內(nèi)容和概念來描述信息需求,且建立基于該模型的信息搜索框架以獲取并評(píng)估信息需求,并通過實(shí)驗(yàn)證明該模型結(jié)構(gòu)的適用性和有效性[8]。Abdullah調(diào)查發(fā)現(xiàn),信息資源的可獲取性、數(shù)據(jù)的質(zhì)量和易用性是影響數(shù)字信息資源使用的主要因素[9]。Dehghani等利用扎根理論,結(jié)合半結(jié)構(gòu)化用戶訪談,探尋影響數(shù)字圖書館知識(shí)推薦服務(wù)的用戶情境因素模型,包括用戶基本情況、目的或意圖、用戶的期望值等[10]??偟膩碚f,用戶信息需求是指用戶針對(duì)內(nèi)在認(rèn)知與外界環(huán)境接觸后所感覺到的差異、不足和不確定,試圖找尋消除差異和不足,判斷不確定事物的一種要求。而用戶知識(shí)需求是信息需求的深化,是隨著知識(shí)服務(wù)的興起而逐漸產(chǎn)生與發(fā)展的。
(2)科研生命周期及其相關(guān)研究??蒲腥藛T需要借助于一定的工具進(jìn)行資料收集及處理以完成特定研究任務(wù),在此過程中會(huì)有多種需求以及為滿足需求而進(jìn)行的行為。許多學(xué)者從信息行為視角解析科研流程,構(gòu)建了科研活動(dòng)框架模型,比較典型的有Microsoft Research Connections建立的包含知識(shí)生產(chǎn)各個(gè)階段的學(xué)術(shù)交流生命周期,即:“‘?dāng)?shù)據(jù)收集、研究和分析→寫作→出版和傳播→歸檔和保存’,而‘合作、查找和發(fā)現(xiàn)’則完善了整個(gè)過程。”[11]JISC(Joint Information Systems Committee,英國(guó)聯(lián)合信息系統(tǒng)委員會(huì))將科學(xué)研究生命周期劃分為Ideas→Partners→Proposal writing→Research process→Publication[12](見圖1),其中Ideas主要指通過文獻(xiàn)檢索、背景閱讀等發(fā)現(xiàn)的新問題或新觀點(diǎn);Partners 主要指通過網(wǎng)絡(luò)工具尋找合作伙伴;Proposal writing主要指研究者需要撰寫一份研究計(jì)劃;Publication主要指在開放獲取期刊或存儲(chǔ)庫(kù)中發(fā)布研究信息或成果等,以提高研究的可見性;Research process主要包括模擬、實(shí)驗(yàn)、觀察(Simulate,experiment,observe),管理數(shù)據(jù)(Manage the data),分析數(shù)據(jù)(Analyse data)與分享數(shù)據(jù)(Share data)。在模擬、實(shí)驗(yàn)、觀察環(huán)節(jié)中,不同學(xué)科的研究過程差別較大;而管理數(shù)據(jù)主要指研究人員需要制定數(shù)據(jù)管理計(jì)劃;分析數(shù)據(jù)環(huán)節(jié)涉及對(duì)社會(huì)調(diào)查數(shù)據(jù)的分析等;分享數(shù)據(jù)即策劃或保留原始數(shù)據(jù)(或已處理數(shù)據(jù))以便他人訪問和使用。該框架模型能夠揭示科研人員在研究中對(duì)信息/知識(shí)的獲取、吸收、創(chuàng)造與傳播活動(dòng),展現(xiàn)了科研情境下完整、系統(tǒng)的知識(shí)創(chuàng)新與利用行為。
圖1 JISC科研生命周期模型
用戶需求是知識(shí)創(chuàng)新服務(wù)的出發(fā)點(diǎn)。在科學(xué)研究范式遷移與知識(shí)服務(wù)轉(zhuǎn)變的驅(qū)使下,科研用戶知識(shí)需求發(fā)生了很多變化,進(jìn)而帶來了知識(shí)創(chuàng)新服務(wù)的新需求。因此,科研用戶知識(shí)創(chuàng)新服務(wù)的需求調(diào)查,對(duì)知識(shí)服務(wù)的理論與實(shí)踐具有重大意義。結(jié)合已有的研究成果與實(shí)踐,本文將研究問題確定為兩個(gè)方面:(1)在科研生命周期各個(gè)階段,科研用戶知識(shí)創(chuàng)新服務(wù)需求的內(nèi)容與行為具有哪些特點(diǎn)?(2)科研用戶的知識(shí)創(chuàng)新服務(wù)需求與行為是否隨人口統(tǒng)計(jì)特征發(fā)生變化?為解決上述問題,借鑒相關(guān)理論與方法,本文設(shè)計(jì)的研究思路為:以知識(shí)創(chuàng)新服務(wù)為基礎(chǔ),以用戶信息需求理論與JISC 科研生命周期模型為支撐,嵌入知識(shí)創(chuàng)新,將科研生命周期劃分為選題構(gòu)思、組建團(tuán)隊(duì)、確定課題(項(xiàng)目申請(qǐng))、研究探索、成果產(chǎn)出、關(guān)注與交流6個(gè)階段,并從全過程出發(fā)對(duì)科研用戶的知識(shí)創(chuàng)新服務(wù)需求展開調(diào)查與分析。
基于研究問題與思路,本文設(shè)計(jì)的問卷主要包括兩個(gè)部分:(1)用戶的基本信息,如年齡段、性別、學(xué)科領(lǐng)域、學(xué)歷等;(2)科研用戶知識(shí)服務(wù)需求與行為調(diào)查,主要針對(duì)用戶在不同科研階段的具體服務(wù)需求和行為習(xí)慣。在正式調(diào)查前隨機(jī)進(jìn)行小范圍的問卷預(yù)調(diào)研,以便發(fā)現(xiàn)問卷設(shè)置的細(xì)節(jié)問題,如題項(xiàng)表述存在的歧義等,從而保證問卷的科學(xué)性及合理性。問卷主要借助問卷星平臺(tái)正式發(fā)放,要求答卷者具有科研經(jīng)驗(yàn),且在科研活動(dòng)中使用過相關(guān)的知識(shí)創(chuàng)新服務(wù)。因此,在研究中將樣本對(duì)象鎖定為有科研經(jīng)歷的高校及科研院所師生。問卷采用便利抽樣,通過微信朋友圈、學(xué)術(shù)社交論壇等多種途徑邀請(qǐng)目標(biāo)用戶進(jìn)行填寫。為保證樣本數(shù)量達(dá)標(biāo),將問卷調(diào)研的時(shí)間范圍設(shè)置為2019年8月15日至9月10日。在該期間通過問卷星平臺(tái)共回收問卷388份,對(duì)邏輯不符、填寫不完整等無效問卷進(jìn)行篩選后得到332份有效問卷,問卷合格率約為86%。
參與本次調(diào)研的用戶人口(學(xué))基本特征如表1所示。被調(diào)查者性別分布較均衡,在學(xué)科領(lǐng)域(類別)上人文社科所占比例稍高于自科科學(xué),在科研經(jīng)驗(yàn)上除了工作年限小于4年的,其他類別的分布相差不大。由于選定的樣本要求具有科研經(jīng)驗(yàn),主要為科研院所及高校的學(xué)生和老師,故年齡基本在22歲以上,學(xué)歷集中為碩士、博士。
表1 人口統(tǒng)計(jì)特征描述性統(tǒng)計(jì)
在廣泛的文獻(xiàn)調(diào)查與實(shí)地調(diào)查基礎(chǔ)上,針對(duì)選題構(gòu)思、組建團(tuán)隊(duì)、確定課題、研究探索、成果產(chǎn)出、關(guān)注與交流等不同階段,提出有關(guān)用戶知識(shí)創(chuàng)新服務(wù)需求與行為的問題并展開調(diào)查。具體地,選題構(gòu)思階段包括:科研選題方式、期望能得到的知識(shí)服務(wù)(基礎(chǔ)資源層次、知識(shí)產(chǎn)品層次、服務(wù)層次)、希望抽取的知識(shí)維度及關(guān)系特征;組建團(tuán)隊(duì)階段包括:尋找合作者時(shí)的單位傾向、領(lǐng)域傾向和服務(wù)支持途徑;確定課題(項(xiàng)目申請(qǐng))階段包括:協(xié)助文獻(xiàn)綜述、科研查新等服務(wù);研究探索階段包括:工具培訓(xùn)服務(wù)、科研數(shù)據(jù)服務(wù)、數(shù)據(jù)共享意愿與原因分析等;成果產(chǎn)出階段包括:學(xué)術(shù)寫作服務(wù)、期刊投稿服務(wù)、學(xué)術(shù)會(huì)議信息及科研成果發(fā)布途徑推介、成果轉(zhuǎn)化服務(wù)、科研評(píng)價(jià)服務(wù)等;關(guān)注與交流階段包括:交流方式、交流內(nèi)容的選擇等。限于篇幅限制,下面以選題構(gòu)思階段為例,對(duì)調(diào)查結(jié)果數(shù)據(jù)進(jìn)行闡釋。同時(shí)將總體的調(diào)查研究結(jié)果在結(jié)論中給予闡述。
3.2.1 用戶需求與行為分析:以選題構(gòu)思階段為例
(1)科研選題方式。選題構(gòu)思是科研活動(dòng)的起點(diǎn),決定著相應(yīng)的研究方向、問題、任務(wù)以及研究的意義和價(jià)值。科研用戶的選題方式往往各有不同,針對(duì)其選題習(xí)慣進(jìn)行調(diào)查的結(jié)果見圖2。
圖2 科研選題方式
由圖2可知,“從熱點(diǎn)趨勢(shì)中選題”占比最高。學(xué)科熱點(diǎn)往往代表當(dāng)前研究的聚焦問題,圍繞熱點(diǎn)進(jìn)行選題往往能獲取較大關(guān)注度,引發(fā)更廣泛的討論?!皬呐龅絾栴}中選題”的占比位居第二。從認(rèn)知角度看,認(rèn)知總是從已知向未知領(lǐng)域逐漸拓展,拓展的外在形式就是問題。科研人員在實(shí)踐活動(dòng)中可能會(huì)面臨諸多問題,這些問題在一定程度上會(huì)激發(fā)創(chuàng)新性思維,給予其相應(yīng)的創(chuàng)新靈感。“從學(xué)科帶頭人、導(dǎo)師推薦中選題”位居第三,學(xué)科帶頭人或?qū)煹葘?duì)相應(yīng)學(xué)科領(lǐng)域有較深刻的理解,能夠給出建設(shè)性意見。“從交叉學(xué)科中選題”位居第四,科學(xué)研究的復(fù)雜化程度越來越大,學(xué)科交叉融合中也碰撞出更多的問題與研究點(diǎn),成為科研人員的選題來源之一。此外,從基金項(xiàng)目、期刊或會(huì)議主題中選題的也有不少。“從基金項(xiàng)目中選題”的優(yōu)勢(shì)在于,項(xiàng)目往往已具有相對(duì)完整的研究框架和較強(qiáng)的可操作性,能夠在一定程度上保障選題的高質(zhì)量?!皬钠诳驎?huì)議主題中選題”可使主題更具有針對(duì)性,也有益于后期的論文投稿。整體來說,不同選題方式的優(yōu)劣勢(shì)不盡相同。偏自主性的選題方式能使科研人員自由發(fā)揮其的特長(zhǎng),但對(duì)經(jīng)驗(yàn)不足的科研人員來說,由于自身研究水平的限制,選題可能會(huì)出現(xiàn)不合理之處。而根據(jù)學(xué)科帶頭人、導(dǎo)師的推薦選題,可以站在較高的層次去理解題目,進(jìn)而避免可能出現(xiàn)的選題重復(fù)等問題。
(2)所需的服務(wù)支持。用戶在選題構(gòu)思時(shí)往往需要知識(shí)服務(wù)的支持,本研究主要從3個(gè)層次對(duì)其進(jìn)行調(diào)研,即基礎(chǔ)資源、知識(shí)產(chǎn)品和服務(wù)。在基礎(chǔ)資源層次上,用戶期望使用的資源類型見圖3。其中,學(xué)術(shù)期刊、博碩論文及會(huì)議論文是用戶慣常使用的資源。值得注意的是,用戶對(duì)科學(xué)數(shù)據(jù)集、非公開出版的灰色文獻(xiàn)也表現(xiàn)出較強(qiáng)烈的需求意愿。
圖3 基礎(chǔ)資源層次的服務(wù)需求
從知識(shí)產(chǎn)品層次看(見圖4),前沿動(dòng)態(tài)和歷史文獻(xiàn)分析占比較高。學(xué)科領(lǐng)域的前沿動(dòng)態(tài)是科研人員把握的焦點(diǎn),及時(shí)了解相關(guān)內(nèi)容及其特征對(duì)于探索知識(shí)體系的新趨勢(shì)十分重要。歷史文獻(xiàn)分析是幫助用戶了解研究領(lǐng)域背景及相關(guān)知識(shí)點(diǎn)的關(guān)鍵環(huán)節(jié),能讓用戶在面對(duì)大量文獻(xiàn)時(shí)較快掌握領(lǐng)域知識(shí)脈絡(luò)和發(fā)展?fàn)顩r,加深對(duì)學(xué)科知識(shí)體系的認(rèn)識(shí)。研究領(lǐng)域的學(xué)者資訊、時(shí)政熱點(diǎn)與政策方針占比也不低。學(xué)者資訊信息能幫助科研用戶了解領(lǐng)域權(quán)威學(xué)者或?qū)W科帶頭人的相關(guān)學(xué)術(shù)活動(dòng),如科研方向、項(xiàng)目成果狀況等,有助于跟蹤掌握領(lǐng)域新理論、技術(shù)方法和行業(yè)動(dòng)態(tài)。及時(shí)掌握時(shí)政熱點(diǎn)與政策方針有助于科研人員對(duì)研究方向和活動(dòng)規(guī)范的把握,使科研工作符合相應(yīng)的政策且能夠順利開展,從而創(chuàng)造出更大的社會(huì)效益及經(jīng)濟(jì)效益。歷年基金項(xiàng)目統(tǒng)計(jì)、標(biāo)準(zhǔn)信息分析和歷史專利分析三者占比相近,分別基于3種不同的信息源進(jìn)行統(tǒng)計(jì)分析。歷年基金項(xiàng)目統(tǒng)計(jì)分析可在一定程度上揭示學(xué)科領(lǐng)域的資助方向和重點(diǎn)及其進(jìn)展,能起到參考評(píng)估的作用。諸如國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)等的信息分析對(duì)于科研人員規(guī)避科研活動(dòng)中可能存在的風(fēng)險(xiǎn),提高科研工作的規(guī)范化程度具有積極作用。歷史專利分析能夠幫助科研人員掌握相應(yīng)的技術(shù)態(tài)勢(shì),了解行業(yè)專利技術(shù)的構(gòu)成及分布情況,從而進(jìn)一步加深對(duì)技術(shù)發(fā)展規(guī)律及熱點(diǎn)趨勢(shì)的認(rèn)識(shí)。
圖4 知識(shí)產(chǎn)品層次的服務(wù)需求
從服務(wù)層次看(見圖5),占比最高的是一站式知識(shí)檢索服務(wù),其次是動(dòng)態(tài)知識(shí)推薦及可視化知識(shí)導(dǎo)航。數(shù)據(jù)館藏的分布式儲(chǔ)存,致使用戶在獲取不同類型知識(shí)資源時(shí)需要分別訪問相應(yīng)的數(shù)據(jù)庫(kù),而不同數(shù)據(jù)庫(kù)的檢索規(guī)則有所差異,對(duì)用戶的檢索技能水平要求較高,因此用戶對(duì)一站式的知識(shí)檢索服務(wù)期望較高。一站式知識(shí)檢索服務(wù)能夠?qū)⒍喾N資源類型以不同的知識(shí)粒度進(jìn)行組合,降低用戶的檢索成本。隨著可視化技術(shù)的發(fā)展,用戶對(duì)檢索結(jié)果的呈現(xiàn)也提出較高要求;以圖表形式展現(xiàn)各類知識(shí),讓用戶從點(diǎn)線關(guān)聯(lián)之間加深對(duì)知識(shí)層次關(guān)系的理解,既直觀,又有利于對(duì)學(xué)科隱性知識(shí)的發(fā)現(xiàn)??蒲谢顒?dòng)是一個(gè)階段性的過程,相應(yīng)地,科研用戶需求也呈現(xiàn)出多元化特征。隨著研究階段的推進(jìn),用戶需求也隨著階段任務(wù)情境的變換而發(fā)生變化。因此,用戶對(duì)基于其項(xiàng)目階段、行為興趣等的動(dòng)態(tài)知識(shí)推薦服務(wù)期望較大。
圖5 服務(wù)層次的服務(wù)需求
(3)基于文獻(xiàn)知識(shí)單元的需求。文獻(xiàn)是科研活動(dòng)的重要資源支撐。本文進(jìn)一步調(diào)查用戶期望獲取的基于文獻(xiàn)抽取的知識(shí)維度及關(guān)系特征,如圖6所示。
圖6 服務(wù)需求的知識(shí)維度及關(guān)系特征
從基礎(chǔ)知識(shí)項(xiàng)(知識(shí)維度)看,關(guān)鍵詞、發(fā)表年度、學(xué)科類別、作者、文獻(xiàn)來源等占比較高,均在50%以上,機(jī)構(gòu)和所屬基金項(xiàng)等占比相對(duì)較低。從關(guān)系特征看,相似關(guān)聯(lián)分析占比最高,為58%;其次是引證分析,占54%;文獻(xiàn)主題挖掘占比51%,共現(xiàn)分析占42%。相似關(guān)聯(lián)關(guān)系反映知識(shí)單元的同質(zhì)性,用戶往往希望就自身所感興趣的問題進(jìn)行散發(fā)性思考,為此需吸收關(guān)聯(lián)信息,以便在較短時(shí)間內(nèi)迅速掌握更充足的知識(shí);而且,在信息過載的情況下,相似關(guān)系的呈現(xiàn)能幫助用戶減小認(rèn)知負(fù)荷。與之類似的有文獻(xiàn)主題挖掘,其優(yōu)勢(shì)在于將文獻(xiàn)的重點(diǎn)主題內(nèi)容以相對(duì)簡(jiǎn)潔的方式呈現(xiàn)出來,幫助科研人員快速理解主題脈絡(luò),提高科研效率。引證(關(guān)系)分析展現(xiàn)了文獻(xiàn)的知識(shí)來源以及知識(shí)輸出情況,是加深用戶對(duì)領(lǐng)域知識(shí)點(diǎn)研究積累以及動(dòng)態(tài)發(fā)展的有效途徑,有一定的參考借鑒價(jià)值。共現(xiàn)分析也在一定程度上反映了知識(shí)單元的關(guān)聯(lián)特征,不同知識(shí)單元的組合從不同維度反映其強(qiáng)弱關(guān)系,從而幫助科研人員更深入地了解知識(shí)的脈絡(luò)結(jié)構(gòu)。
3.2.2 交叉分析
為探究年齡、性別、學(xué)歷、職稱、學(xué)科類別、科研經(jīng)驗(yàn)6個(gè)人口統(tǒng)計(jì)特征對(duì)科研用戶知識(shí)創(chuàng)新服務(wù)需求的影響,本研究對(duì)調(diào)研對(duì)象的人口統(tǒng)計(jì)特征及其服務(wù)需求進(jìn)行了卡方檢驗(yàn)與交叉統(tǒng)計(jì)分析,仍以選題構(gòu)思階段為例加以分析與闡釋。表2為選題構(gòu)思階段用戶服務(wù)需求的卡方檢驗(yàn)結(jié)果,當(dāng)對(duì)應(yīng)的P 值小于0.05時(shí),說明不同特征項(xiàng)樣本在對(duì)應(yīng)題項(xiàng)上存在顯著性差異。
表2 選題構(gòu)思階段的用戶服務(wù)需求卡方檢驗(yàn)結(jié)果
(1)科研選題方式。年齡、性別、學(xué)歷、職稱、學(xué)科類別、科研經(jīng)驗(yàn)對(duì)科研選題方式均有顯著性影響。通過交叉統(tǒng)計(jì)可知:年齡上,28歲及以上的科研用戶選擇“從熱點(diǎn)趨勢(shì)中選題”的占比較高,而18~27 歲的用戶選擇“從學(xué)科帶頭人、導(dǎo)師推薦中選題”的占比較高,其他4種選題方式中也以33歲及以上的用戶為主;從學(xué)歷維度看,碩士學(xué)歷的用戶中“從學(xué)科帶頭人、導(dǎo)師推薦中選題”“從熱點(diǎn)趨勢(shì)中選題”比例較高;從職稱看,初級(jí)、中級(jí)和副高職稱的用戶選擇“從熱點(diǎn)趨勢(shì)中選題”的占比較高,正高職稱用戶選擇“從碰到問題中選題”的比例較高,而學(xué)生用戶“從學(xué)科帶頭人、導(dǎo)師推薦中選題”的較多;從學(xué)科類別看,自然科學(xué)用戶“從交叉學(xué)科中選題”的占比高于人文社科;從科研經(jīng)驗(yàn)來看,具有5~10年科研經(jīng)驗(yàn)的用戶中,“從交叉學(xué)科中選題”和“從基金項(xiàng)目中選題”占比較其他用戶高;科研經(jīng)驗(yàn)在4年及以下的用戶主要“從學(xué)科帶頭人、導(dǎo)師推薦中選題”??傮w來看,“從熱點(diǎn)趨勢(shì)中選題”和“從碰到問題中選題”是應(yīng)用較廣的兩種選題方式,在不同維度上二者的占比均較高。相較而言,28歲以下、科研經(jīng)驗(yàn)較少的用戶更傾向于選擇“從學(xué)科帶頭人、導(dǎo)師推薦中選題”,而科研經(jīng)驗(yàn)較為豐富的用戶則更傾向于“從交叉學(xué)科中選題”和“從基金項(xiàng)目中選題”。
(2)對(duì)基礎(chǔ)資源的需求。6個(gè)人口統(tǒng)計(jì)特征對(duì)基礎(chǔ)資源的選擇均有顯著性影響。從交叉統(tǒng)計(jì)看,學(xué)術(shù)期刊、博碩論文、會(huì)議論文在不同維度下的占比均較高,報(bào)紙、年鑒、專利、工具書在18~22歲用戶中的占比高于其他年齡段,圖書、標(biāo)準(zhǔn)、圖片、視頻在28~32歲用戶中的占比高于其他年齡段,科學(xué)數(shù)據(jù)集和灰色文獻(xiàn)在33歲及以上用戶中的占比高于其他年齡段。此外,本科學(xué)歷用戶對(duì)年鑒、圖書、工具書的需求高于其他學(xué)歷,專利、標(biāo)準(zhǔn)、科技成果、圖片、視頻在自然科學(xué)用戶中的占比高于人文社科,科技成果、灰色文獻(xiàn)在科研經(jīng)驗(yàn)為23年及以上的用戶中占比較高。
(3)對(duì)知識(shí)產(chǎn)品的需求。本研究中的各個(gè)人口統(tǒng)計(jì)特征對(duì)知識(shí)產(chǎn)品的選擇有顯著性影響。前沿動(dòng)態(tài)、歷史文獻(xiàn)分析在不同特征維度下的占比均比較高。研究領(lǐng)域的學(xué)者資訊、時(shí)政熱點(diǎn)與政策方針在28歲及以上用戶中占比較高。歷史專利分析在自然科學(xué)中的占比高于人文社科,時(shí)政熱點(diǎn)和政策方針在人文社科中的占比高于自然科學(xué)。
(4)對(duì)服務(wù)種類的需求。年齡、性別、職稱和科研經(jīng)驗(yàn)對(duì)服務(wù)種類的選擇有顯著性影響。相較于其他年齡段,33歲及以上的用戶較少選擇“可視化知識(shí)導(dǎo)航服務(wù)”,而18~22歲用戶選擇該服務(wù)的占比較高,選擇“動(dòng)態(tài)知識(shí)推薦服務(wù)”的較少。
(5)希望抽取的知識(shí)維度及關(guān)系特征。性別、學(xué)歷、學(xué)科類別對(duì)知識(shí)維度及關(guān)系特征的選擇有顯著性影響。其中,文獻(xiàn)主題挖掘、引證分析、共現(xiàn)分析、相似關(guān)聯(lián)分析在人文社科用戶中的需求占比高于自然科學(xué)。
本文以科研生命周期為基礎(chǔ),以科研用戶為研究對(duì)象,通過實(shí)證調(diào)查與統(tǒng)計(jì)分析探尋科研用戶的知識(shí)創(chuàng)新服務(wù)需求,并基于年齡、性別、學(xué)歷、職稱、學(xué)科類別及科研經(jīng)驗(yàn)6 個(gè)人口統(tǒng)計(jì)項(xiàng),對(duì)科研用戶的需求行為進(jìn)行交叉檢驗(yàn),研究不同階段中的差異性特征。研究發(fā)現(xiàn):
(1)選題構(gòu)思階段。用戶的選題方式有所差異,主要與其自身的學(xué)科屬性、科研經(jīng)驗(yàn)有關(guān)。除了基礎(chǔ)資源的使用,科研用戶對(duì)科研數(shù)據(jù)集、灰色文獻(xiàn)的需求較大。在知識(shí)產(chǎn)品的選擇上,用戶較多選擇前沿動(dòng)態(tài)、歷史文獻(xiàn)分析、研究領(lǐng)域的學(xué)者資訊、時(shí)政熱點(diǎn)與政策方針等;同時(shí),由于自然科學(xué)用戶的研究應(yīng)用性較強(qiáng),對(duì)專利分析的需求也較大。從服務(wù)層次看,一站式知識(shí)檢索是用戶較為青睞的服務(wù),其次是動(dòng)態(tài)知識(shí)推薦及可視化知識(shí)導(dǎo)航。
(2)組建團(tuán)隊(duì)階段。用戶的合作者主要為同單位、同領(lǐng)域的學(xué)者,并且對(duì)獲取相似用戶的定位服務(wù)表現(xiàn)出較強(qiáng)的需求意愿。
(3)確定課題(項(xiàng)目申請(qǐng))階段。用戶的需求集中在課題的申請(qǐng)指導(dǎo)方面,如協(xié)助文獻(xiàn)綜述寫作、申請(qǐng)格式規(guī)定咨詢、申請(qǐng)經(jīng)驗(yàn)交流等。
(4)研究探索階段。服務(wù)主要圍繞研究的具體實(shí)施而展開,主要包括科研數(shù)據(jù)管理、文獻(xiàn)資料管理、學(xué)術(shù)信息追蹤等。大部分用戶對(duì)數(shù)據(jù)共享持積極態(tài)度,認(rèn)為這樣可提高研究的重現(xiàn)性,促進(jìn)研究成果的交流傳播。用戶不愿意共享數(shù)據(jù)的原因主要是擔(dān)心他人會(huì)不正當(dāng)及不正確地使用數(shù)據(jù)。
(5)成果產(chǎn)出階段。科研活動(dòng)主要涉及研究成果的撰寫、發(fā)布以及轉(zhuǎn)化等,相應(yīng)地也產(chǎn)生了學(xué)術(shù)寫作規(guī)范指導(dǎo)、出版服務(wù)、成果轉(zhuǎn)化與評(píng)價(jià)服務(wù)等需求。
(6)關(guān)注與交流階段。整個(gè)科研生命周期各階段的科研活動(dòng)都需要溝通與交流,資料分享、科研經(jīng)驗(yàn)交流、文獻(xiàn)評(píng)論等內(nèi)容。此外,不同特征科研用戶的某些需求行為存在顯著性差異。
受資源、渠道等因素限制,本研究的科研用戶主要來自高校、科研機(jī)構(gòu)等;而且,只對(duì)用戶特征與服務(wù)需求做差異性分析,未進(jìn)一步對(duì)細(xì)分的科研用戶進(jìn)行服務(wù)內(nèi)容的劃分,未來的研究可相應(yīng)擴(kuò)大調(diào)研范圍,將企業(yè)科研用戶納入其中。另外,可進(jìn)一步細(xì)化研究?jī)?nèi)容,對(duì)科研用戶進(jìn)行特征劃分,分析對(duì)應(yīng)的需求內(nèi)容,設(shè)計(jì)更為具體的服務(wù)方案,從而為創(chuàng)建更全面精細(xì)的知識(shí)創(chuàng)新服務(wù)模式提供更多的支持。