曹文振 周慶山 鄺偉文
摘 要:[目的/意義]全新的社會(huì)情境、信息場(chǎng)景與技術(shù)環(huán)境成為再次推動(dòng)情報(bào)學(xué)學(xué)科變革的力量。從困惑中發(fā)展,在創(chuàng)新中前行,是情報(bào)學(xué)學(xué)科演進(jìn)的現(xiàn)實(shí)需要與時(shí)代使命,也亟待對(duì)情報(bào)學(xué)學(xué)科前沿的探索并以此指引情報(bào)理論與實(shí)踐的方向。[方法/過(guò)程]通過(guò)一種改進(jìn)的樣本期刊選擇方法,遴選10種國(guó)際優(yōu)秀綜合性情報(bào)學(xué)核心期刊,共獲得2 196篇2016-2018年期間樣本期刊所發(fā)表的研究文獻(xiàn),以標(biāo)準(zhǔn)化年均被引頻次為指標(biāo)選取得到201篇高被引文獻(xiàn),進(jìn)而通過(guò)以文獻(xiàn)計(jì)量學(xué)與質(zhì)化分析為基礎(chǔ)的方法探尋情報(bào)學(xué)研究的前沿領(lǐng)域。[結(jié)果/結(jié)論]從研究話題、研究情境、研究方法3個(gè)方面對(duì)情報(bào)學(xué)前沿研究領(lǐng)域進(jìn)行總結(jié)與討論,為新時(shí)期我國(guó)情報(bào)學(xué)研究提供一定的指引性參考。
關(guān)鍵詞:情報(bào)學(xué);前沿;核心期刊;文獻(xiàn)計(jì)量學(xué);扎根理論;高被引文獻(xiàn)
DOI:10.3969/j.issn.1008-0821.2019.05.001
〔中圖分類號(hào)〕G250.2 〔文獻(xiàn)標(biāo)識(shí)碼〕A 〔文章編號(hào)〕1008-0821(2019)05-0003-14
Abstract:[Purpose/Significance]The new social situation,information context and technological environment have become the transforming forces to promote the development of information science.It is the realistic needs and the mission of the times to explore the frontiers of information science and guide the development of this academic discipline.[Method/Process]Through an improved sample journal selection method,the research selected 10 international excellent core journals of comprehensive information science,obtained 2196 research literatures published in the sample journals from 2016 to 2018,and chose 201 highly cited literatures using the standardized annual citation frequency as the index.The frontiers of information science research were explored by methods based on bibliometrics and qualitative analysis.[Result/Conclusion]The frontiers were summarized in three fields of research topics,research contexts and research methods and discussed for certain directional references of Chinas information science research in the new era.
Key words:information science;frontier;core journal;bibliometrics;grounded theory;highly cited literature
1 研究背景與意義
當(dāng)前我國(guó)的情報(bào)學(xué)學(xué)科發(fā)展仍然在一定程度上處于爭(zhēng)論之中,情報(bào)學(xué)學(xué)科的研究體系和研究領(lǐng)域究竟應(yīng)如何構(gòu)建,不同的學(xué)者存在不同的看法,學(xué)科邊界的模糊性、學(xué)科定位的不確定性成為學(xué)科發(fā)展中一個(gè)尚待厘清的問(wèn)題。從近來(lái)對(duì)情報(bào)學(xué)學(xué)科發(fā)展的討論中,也可以看到這種認(rèn)識(shí)上存在的混亂現(xiàn)象,時(shí)而以Intelligence為導(dǎo)向[1],時(shí)而以數(shù)據(jù)科學(xué)推動(dòng)范式轉(zhuǎn)型[2],時(shí)而以知識(shí)理論為核心論題[3],甚至對(duì)“情報(bào)學(xué)”這一學(xué)科定名之批判思考也未曾終結(jié)[4]。然而,若從另一視角審視之,可以發(fā)現(xiàn)以上諸多思考的不竭動(dòng)力源于學(xué)界對(duì)情報(bào)學(xué)學(xué)科發(fā)展的關(guān)心和重視。如何推動(dòng)學(xué)科發(fā)展始終是擺在情報(bào)學(xué)界眼前的問(wèn)題,關(guān)注具有挑戰(zhàn)性的前沿問(wèn)題,以學(xué)科前沿為導(dǎo)向指導(dǎo)選稿與選題,并創(chuàng)造出能解決這些問(wèn)題的有效工具[5],這是學(xué)界幾無(wú)爭(zhēng)議的看法。因而,撇去這些爭(zhēng)議不論,發(fā)現(xiàn)學(xué)科前沿是推進(jìn)學(xué)科演進(jìn)關(guān)鍵路徑上的重要工作,也是學(xué)科研究人員進(jìn)行學(xué)術(shù)探尋方向選擇的重要指導(dǎo)。
隨著近年來(lái)大數(shù)據(jù)、云計(jì)算、人工智能等信息環(huán)境和信息技術(shù)的持續(xù)變革,情報(bào)學(xué)學(xué)科研究正逐漸發(fā)生著轉(zhuǎn)向,在繼承傳統(tǒng)研究領(lǐng)域的基礎(chǔ)上不斷引入新的研究話題,開(kāi)拓出新的研究疆土。然而,當(dāng)前國(guó)內(nèi)情報(bào)學(xué)界就整體而言存在這樣的問(wèn)題,研究方向百花齊放缺少聚焦,研究水平參差不齊缺少標(biāo)桿。面對(duì)當(dāng)下的現(xiàn)狀,如何在全新的社會(huì)情境、信息場(chǎng)景與技術(shù)環(huán)境之下對(duì)情報(bào)學(xué)前沿領(lǐng)域進(jìn)行挖掘,并用以指導(dǎo)研究工作開(kāi)展和研究成果遴選,成為情報(bào)學(xué)研究人員的重要課題。本研究希望為上述問(wèn)題提供一條有價(jià)值的解決路徑:采用以文獻(xiàn)計(jì)量學(xué)為基礎(chǔ)的實(shí)證方法,遴選國(guó)外高水平綜合性情報(bào)學(xué)核心期刊,通過(guò)分析國(guó)際情報(bào)學(xué)期刊的研究趨勢(shì),探尋新時(shí)期我國(guó)情報(bào)學(xué)研究的選題前沿,以為我國(guó)情報(bào)學(xué)研究人員提供一定的選題指引與研究建議。
2 樣本選擇與獲取
2.1 樣本期刊選擇:一種改進(jìn)方法
就情報(bào)學(xué)研究的前沿進(jìn)展論題,國(guó)內(nèi)已有研究人員開(kāi)展過(guò)探索并發(fā)表了成果。選題前沿必然基于一定的分析樣本而得出,就情報(bào)學(xué)學(xué)科視野下的研究前沿問(wèn)題而言,既往研究通常采用兩種樣本選擇方法:一是通過(guò)研究者主觀判別或期刊評(píng)價(jià)指標(biāo)遴選部分期刊;二是以數(shù)據(jù)庫(kù)中文獻(xiàn)的歸屬類別(一般選擇Library & Information Science)或分類號(hào)進(jìn)行文獻(xiàn)獲取。由于國(guó)際高水平期刊往往發(fā)表的文章更具質(zhì)量、創(chuàng)新性更好,適合成為我國(guó)情報(bào)學(xué)研究選擇的對(duì)標(biāo)方向,因而本研究在獲取樣本文獻(xiàn)時(shí)不采用全面獲取學(xué)科文獻(xiàn)的做法。同時(shí),前者所采用的對(duì)期刊進(jìn)行遴選的方式,也有利于我國(guó)的情報(bào)學(xué)期刊從同樣的整體選題角度進(jìn)行相互比較,實(shí)現(xiàn)標(biāo)桿管理(Benchmarking)。
綜觀既有研究的樣本期刊選擇,主要存在兩大影響分析結(jié)果的不足之處:對(duì)樣本期刊的簡(jiǎn)單入選或不合理抽樣造成分析結(jié)果無(wú)法展現(xiàn)學(xué)科成果的真實(shí)面貌,對(duì)綜合性與專門性期刊不加區(qū)分或不分列權(quán)重使得分析結(jié)果產(chǎn)生偏誤(Bias)。在本研究中,我們力圖通過(guò)對(duì)遴選方法的改進(jìn)嘗試解決這兩項(xiàng)問(wèn)題。
對(duì)于研究的樣本期刊選擇,既往研究往往采用單一期刊評(píng)價(jià)源,依當(dāng)年的影響因子報(bào)告選取一定比例的期刊入選,如趙蓉英等[6]利用2015年的JCR(Journal Citation Reports)數(shù)據(jù),選取情報(bào)學(xué)與圖書館學(xué)(Information Science & Library Science)類目下前20%的期刊為樣本期刊。然而,由于各類期刊評(píng)價(jià)成果倚重的指標(biāo)體系和操作方法不同,同一刊物經(jīng)由不同的評(píng)價(jià)指標(biāo)體系得出的結(jié)果可能存在差別,且目前并沒(méi)有一個(gè)得到公認(rèn)的、通用的期刊評(píng)價(jià)方法。例如Springer Nature旗下的《Knowledge Management Research and Practice》或Emerald旗下的《Program:Electronic Library and Information Systems》在不同指標(biāo)體系中的排名就分屬于Q1(依Scopus CiteScore)、Q2(依SJR Score)、Q3(依JCR IF Score)3個(gè)分區(qū)。另一方面,同一期刊在相同指標(biāo)體系中的排名結(jié)果也處于變化狀態(tài),因而不能以位次的高低來(lái)簡(jiǎn)單判定一個(gè)期刊的質(zhì)量好壞。比如《Journal of Documentation》在Clarivate Analytics(原Thomson Reuters)的評(píng)價(jià)體系中,2006年為Q1區(qū)刊物,2011年屬于Q2區(qū),2016年屬于Q3區(qū),雖然從Q1區(qū)下降到了Q3區(qū),但依然入選了第四輪教育部學(xué)科評(píng)估的A類期刊目錄。
由于期刊評(píng)價(jià)需要詳盡的指標(biāo)體系與支撐數(shù)據(jù),研究本身仍藉由國(guó)際知名且較受認(rèn)可的期刊評(píng)價(jià)體系進(jìn)行樣本刊物遴選。但在本研究中,筆者較全面地選取了多類國(guó)際知名且為文獻(xiàn)計(jì)量學(xué)研究所通用的期刊評(píng)價(jià)指標(biāo)來(lái)進(jìn)行樣本集的第一步構(gòu)建,包括來(lái)自JCR的IF Score(剔除自引后)、來(lái)自Scopus的CiteScore、來(lái)自SJR的SJR Score、來(lái)自Google的Google Scholar Metrics(GSM)。研究所采用的基本評(píng)價(jià)觀點(diǎn)是,好的刊物在不同的多種評(píng)價(jià)體系中,總會(huì)入選其中至少1個(gè)Q1區(qū),即使它在其他評(píng)價(jià)標(biāo)準(zhǔn)中獲得的結(jié)果不佳。因而研究以任意入選JCR、Scopus、SJR其中1個(gè)指標(biāo)的Q1區(qū),或者進(jìn)入GSM榜單(因?yàn)長(zhǎng)ibrary & Information Science作為該指標(biāo)的二級(jí)類目,總共僅有20家刊物入選)為篩選標(biāo)準(zhǔn),并從中排除視作期刊的連續(xù)出版物(連年出版的會(huì)議論文集、集刊),在第一步共獲得81種樣本期刊。通過(guò)多種指標(biāo)體系的相互補(bǔ)充、交叉印證,研究在很大程度上規(guī)避了期刊在不同指標(biāo)體系和同一指標(biāo)體系中的排名波動(dòng),并且也避免了重要期刊在某個(gè)指標(biāo)體系中的排名不佳而產(chǎn)生遺漏。
對(duì)于綜合性與專門性期刊不加區(qū)分或不分列權(quán)重是當(dāng)前研究中第二個(gè)方面的不足。鑒于文獻(xiàn)計(jì)量方法是基于所選擇文獻(xiàn)樣本而得出結(jié)論,樣本的部分變化就有可能引起結(jié)果的較大變動(dòng)。既有的研究往往在期刊樣本的選擇上對(duì)綜合性與專門性期刊不加以區(qū)分,造成分析結(jié)果可能缺少具有全局代表性的說(shuō)服力。以劉志輝等[7]的研究為例,由人工所判定的重點(diǎn)期刊中首本刊物是《Scientometrics》,這是一本專門發(fā)表文獻(xiàn)計(jì)量學(xué)研究的期刊,它與其他期刊的共同入選必然造成分析結(jié)果中文獻(xiàn)計(jì)量學(xué)相關(guān)結(jié)果的顯著增加、相關(guān)類群的明顯突出,在主題分布圖譜中較大的節(jié)點(diǎn)上出現(xiàn)了Research Assessment、Knowledge Map、Patent Analysis、H-index、Webometrics等文獻(xiàn)計(jì)量學(xué)領(lǐng)域的詞匯。這種不區(qū)分綜合性與專門性期刊的做法,既使得一些專門研究領(lǐng)域在情報(bào)學(xué)的整體研究視域中被不合理放大,又使得情報(bào)學(xué)研究中比較重要的其他領(lǐng)域被相對(duì)弱化甚至埋沒(méi),造成對(duì)學(xué)科整體全貌產(chǎn)生一定程度的失察以及失誤性的概觀。
在本研究中筆者對(duì)上一步工作產(chǎn)生的81種期刊進(jìn)行了人工判別,根據(jù)期刊官網(wǎng)的刊物介紹、出版范圍、選題要求和近幾期發(fā)表的作品判斷其刊物定位和載文集中度,從中選取能反映情報(bào)學(xué)研究整體性特征的綜合性期刊,排除聚焦于某一特定領(lǐng)域的專門期刊。我們發(fā)現(xiàn)國(guó)外的絕大多數(shù)情報(bào)學(xué)期刊都是關(guān)注特定領(lǐng)域的專門期刊,如《Government Information Quarterly》、《International Journal of Geographical Information Science》、《Journal of Chemical Information and Modeling》、《Journal of Informetrics》、《Knowledge Management Research and Practice》等等,這與我國(guó)情報(bào)學(xué)學(xué)術(shù)期刊多為綜合性期刊的辦刊情況不符,且對(duì)于學(xué)科研究進(jìn)行整體性考察時(shí)很容易產(chǎn)生結(jié)果上的不當(dāng)解釋,因而研究均未將該部分期刊入選,并同時(shí)剔除了圖書館學(xué)、檔案學(xué)的專門性刊物,如《Library Quarterly》、《Archival Science》。經(jīng)過(guò)本階段的工作,研究的樣本來(lái)源期刊得以確定,一共有10種國(guó)際情報(bào)學(xué)綜合性期刊進(jìn)入樣本期刊集(見(jiàn)表1)。
在綜合性要求以外,研究進(jìn)一步對(duì)最終入選的樣本期刊的合理性進(jìn)行了驗(yàn)證。10種樣本期刊均屬于SSCI入選刊物,為通常所認(rèn)為的國(guó)際核心刊物;其中有8種期刊進(jìn)入了基于h5-index篩選的Google Scholar Metrics排行榜,證實(shí)了樣本期刊總體具有較高的文章質(zhì)量。同時(shí),10種刊物分別屬于Elsevier、Emerald、SAGE、Wiley-Blackwell、Swets & Zeitlinger、University of Bors 6家出版機(jī)構(gòu),其編輯和出版方式有所差異,但均為同行評(píng)議刊物。與國(guó)內(nèi)最常用于科研管理和科研評(píng)價(jià)的基于Web of Science(WoS)數(shù)據(jù)的JCR IF Score對(duì)比,有3家期刊屬于Q1區(qū),4家期刊屬于Q2區(qū),3家期刊屬于Q3區(qū);換而言之,若簡(jiǎn)單采用JCR的評(píng)價(jià)指標(biāo)來(lái)對(duì)期刊進(jìn)行篩選,樣本期刊中將有7種刊物被排除在外,因而研究采用的期刊遴選方法對(duì)于彌補(bǔ)傳統(tǒng)期刊樣本選擇過(guò)程的不足是有益且有效的。綜合來(lái)看,本研究采用的期刊遴選方法是合理的,入選樣本具有較高質(zhì)量且分布多元,并在很大程度上平抑了評(píng)價(jià)指標(biāo)波動(dòng)性對(duì)確認(rèn)樣本來(lái)源的影響。
2.2 文獻(xiàn)數(shù)據(jù)獲取
由于近年來(lái)信息技術(shù)與信息環(huán)境發(fā)生巨大變革,情報(bào)學(xué)研究的導(dǎo)向、視角、話題和方法都發(fā)生了很大變化,因而本研究將所獲取的文獻(xiàn)時(shí)間限定在近3年(2016-2018年)發(fā)表,以更好地追蹤近期國(guó)際情報(bào)學(xué)研究的前沿方向。需要指出的是,本研究中對(duì)文獻(xiàn)發(fā)表時(shí)間的具體界定是正式刊印時(shí)間,而非在線發(fā)表時(shí)間,因?yàn)橛行┪墨I(xiàn)以預(yù)發(fā)表形式提前數(shù)月甚至1年以上已經(jīng)在線發(fā)表,有的文獻(xiàn)則在出版后才數(shù)字化上線,規(guī)范性不及正式刊印時(shí)間。在該種限定方式之下,文獻(xiàn)集中也并不包括2018年在線預(yù)出版,實(shí)際上是2019年及以后進(jìn)行刊發(fā)的作品。同時(shí),樣本文獻(xiàn)集僅納入研究論文和綜述類型的文章,排除了所有非學(xué)術(shù)論文,排除文章類型的具體情況參見(jiàn)表2。經(jīng)過(guò)本階段的工作,研究一共獲得了2 196篇樣本期刊近3年發(fā)表的研究文獻(xiàn)。
本研究采用的文獻(xiàn)數(shù)據(jù)主要包括文獻(xiàn)外部特征和被引用情況兩個(gè)方面。為了保障樣本期刊所發(fā)表文獻(xiàn)的數(shù)據(jù)質(zhì)量,對(duì)于非開(kāi)放存取期刊,通過(guò)收錄該期刊文獻(xiàn)的原始數(shù)據(jù)庫(kù)獲取有關(guān)信息;對(duì)于開(kāi)放存取期刊則通過(guò)期刊官網(wǎng)取得有關(guān)信息。不同數(shù)據(jù)庫(kù)平臺(tái)及開(kāi)放存取網(wǎng)站的操作差異較大,在數(shù)據(jù)庫(kù)提供數(shù)據(jù)導(dǎo)出或下載功能時(shí),直接采用系統(tǒng)功能導(dǎo)出所需信息;若無(wú)法直接從數(shù)據(jù)庫(kù)下載所需信息,則通過(guò)文本提取的工具軟件或自編爬蟲(chóng)等多種方式下載并整理信息。
本研究涉及的文獻(xiàn)外部特征主要有題名、刊名、正式出版年份、公開(kāi)發(fā)表時(shí)間、關(guān)鍵詞,并保留了作為基本字段的作者數(shù)據(jù)以及匹配引文數(shù)據(jù)所需的DOI編號(hào)。需要說(shuō)明的是,公開(kāi)發(fā)表時(shí)間指的是第一次面向讀者公開(kāi)的時(shí)間,即在線出版時(shí)間早于印刷版出版時(shí)間的選用前者,否則則與印刷版出版時(shí)間一致,因而其公開(kāi)發(fā)表年份可能與正式出版年份不同;對(duì)于缺少在線發(fā)表日期的文獻(xiàn)(如EPI、IR上的文獻(xiàn)),則直接采用印刷版發(fā)表時(shí)間。對(duì)10種刊物以不同方式獲取的上述數(shù)據(jù)進(jìn)行規(guī)范化處理,如文獻(xiàn)關(guān)鍵詞統(tǒng)一以逗號(hào)分隔進(jìn)行保存;對(duì)原始數(shù)據(jù)中的缺失值進(jìn)行了填充,如對(duì)于只有年份和月份的在線發(fā)表日期數(shù)據(jù),采用01對(duì)日期進(jìn)行插補(bǔ);又如對(duì)于原文中未提供作者關(guān)鍵詞的文獻(xiàn),或者采用機(jī)器自動(dòng)索引關(guān)鍵詞進(jìn)行補(bǔ)充(如JASIST、IR上的文獻(xiàn)),或者結(jié)合題名和摘要對(duì)關(guān)鍵詞進(jìn)行人工標(biāo)引(如LISR上的文獻(xiàn))。對(duì)于10種樣本期刊文獻(xiàn)不同字段進(jìn)行處理和轉(zhuǎn)換的技術(shù)細(xì)節(jié),由于篇幅所限,此處不再一一贅述。對(duì)于被引用情況的數(shù)據(jù)獲取過(guò)程,將在下一節(jié)進(jìn)行說(shuō)明。
經(jīng)過(guò)一系列的數(shù)據(jù)處理過(guò)程,不同平臺(tái)、不同期刊的來(lái)源文獻(xiàn)數(shù)據(jù)以相同的形式得以規(guī)范化表示,為后續(xù)分析工作的開(kāi)展奠定了堅(jiān)實(shí)的基礎(chǔ)。在上述工作完成后,隨機(jī)抽取了50條數(shù)據(jù),與來(lái)源數(shù)據(jù)庫(kù)或來(lái)源網(wǎng)站的原始信息進(jìn)行比對(duì),確認(rèn)數(shù)據(jù)規(guī)范性和完整性均無(wú)誤,從而保證文獻(xiàn)信息獲取結(jié)果正確且可靠。
2.3 高被引論文選取
由于10種期刊收錄于多種數(shù)據(jù)庫(kù)中,每種數(shù)據(jù)庫(kù)的后臺(tái)文獻(xiàn)量與收錄范圍差異較大,對(duì)文獻(xiàn)被引用次數(shù)的統(tǒng)計(jì)結(jié)果也存在很大差異;且有部分為開(kāi)放存取期刊,官網(wǎng)數(shù)據(jù)并未提供被引用次數(shù),因而文獻(xiàn)被引用情況的統(tǒng)計(jì)數(shù)據(jù)難以通過(guò)直接采集原始數(shù)據(jù)的方式獲得。經(jīng)過(guò)對(duì)比分析WoS、Scopus、Google Scholar、Microsoft Academic等文摘或索引數(shù)據(jù)庫(kù)的文獻(xiàn)被引用數(shù)據(jù),研究最終選擇Google Scholar的被引用頻次作為文獻(xiàn)被引用數(shù)據(jù)的統(tǒng)一來(lái)源,使之基于相同標(biāo)準(zhǔn)和文獻(xiàn)集進(jìn)行統(tǒng)計(jì),便于不同刊物文獻(xiàn)之間的對(duì)比。具體而言,采用DOI號(hào)匹配文獻(xiàn)與對(duì)應(yīng)的Google Scholar被引用頻次;對(duì)于沒(méi)有DOI編號(hào)的文獻(xiàn)(如IR上的文獻(xiàn)),采用題名進(jìn)行匹配,并手動(dòng)修正由于符號(hào)和空格差異造成的數(shù)據(jù)匹配不成功問(wèn)題。
當(dāng)前的許多研究在平衡不同發(fā)表周期文獻(xiàn)的被引數(shù)據(jù)時(shí),采用的是一種簡(jiǎn)單的年度平均法,即根據(jù)文獻(xiàn)所屬刊期的印刷版發(fā)表年份到評(píng)價(jià)年份的距離進(jìn)行平均,如在2019年評(píng)價(jià)2016年發(fā)表的某篇文獻(xiàn)時(shí),將該文獻(xiàn)的被引用頻次除以3。這種做法的粗糙之處在于同年份不同時(shí)間發(fā)表的文獻(xiàn)在被引用概率上被視作是相同的,然而事實(shí)上他們是不同的,例如某年1月發(fā)表的文獻(xiàn)被其他研究人員關(guān)注、閱讀和引用的概率顯然大于同年12月發(fā)表的文獻(xiàn);同時(shí),即使同一期刊相同卷期上所刊載的文章也可能在不同時(shí)間向讀者公開(kāi),以JLIS 49卷1期的文章為例,正式出版時(shí)間統(tǒng)一為2017年3月,但各篇文章的在線預(yù)出版時(shí)間卻有很大差別,最早的上線時(shí)間為2015年6月17日,最晚為2016年3月14日。因而在本研究中,采用到“日”的細(xì)粒度的公開(kāi)發(fā)表時(shí)間(其詳細(xì)說(shuō)明參見(jiàn)上一部分)作為計(jì)算指標(biāo),將所有樣本文獻(xiàn)的被引用頻次轉(zhuǎn)換為標(biāo)準(zhǔn)化的年均被引頻次,從而使得所有文獻(xiàn)不受其公開(kāi)發(fā)表時(shí)間先后的影響。其轉(zhuǎn)換公式如下:
標(biāo)準(zhǔn)化年均被引頻次=被引用頻次數(shù)據(jù)獲取日期-公開(kāi)發(fā)表日期×365[8]
其中,數(shù)據(jù)獲取日期根據(jù)實(shí)際情況定為2019年1月1日。
經(jīng)過(guò)轉(zhuǎn)換,2 196篇文獻(xiàn)年均被引用頻次的最大值為330.98,最小值為0??疾煳墨I(xiàn)之間的被引用頻次情況,平均每篇文獻(xiàn)每年被引用3.83次,但中位數(shù)僅為2.00,標(biāo)準(zhǔn)差達(dá)到9.31,有17.49%(384篇)的文獻(xiàn)被引用次數(shù)為0,可見(jiàn)文獻(xiàn)之間的被引用情況存在很大差異。
考慮到樣本文獻(xiàn)的數(shù)量級(jí),首先根據(jù)“帕累托法則”選取年均被引用頻次居于前20%的文獻(xiàn)為高被引文獻(xiàn),得到約440篇高被引文獻(xiàn),年均被引用頻次的下限值為5.40。然而,筆者認(rèn)為以5.4次作為年被引次數(shù)的下限來(lái)確定高被引文獻(xiàn)事實(shí)上是一個(gè)不夠嚴(yán)格的“高被引”標(biāo)準(zhǔn),降低了對(duì)入選高被引文獻(xiàn)的要求。研究進(jìn)而綜合考察入選文獻(xiàn)年均被引用頻次的最低值與高被引文獻(xiàn)集占全體文獻(xiàn)總集的比例,經(jīng)過(guò)反復(fù)測(cè)試,最終將年均被引用頻次的最低值定為9次,以此作為進(jìn)入高被引文獻(xiàn)集的標(biāo)準(zhǔn),即年均被引用頻次在9次及以上的文獻(xiàn)才能夠進(jìn)入高被引文獻(xiàn)的樣本集。最終獲得由201篇高被引文獻(xiàn)組成的樣本集合,占全部2 196篇文獻(xiàn)的9.15%。
3 研究方法與作用
3.1 歸一化共詞分析
為了提供有效的文獻(xiàn)檢索點(diǎn)以及快速發(fā)現(xiàn)文章涵蓋的主題,大部分文獻(xiàn)都會(huì)由作者標(biāo)注關(guān)鍵詞。在數(shù)據(jù)庫(kù)式的文獻(xiàn)檢索系統(tǒng)中,通常也會(huì)為不提供作者關(guān)鍵詞的作品采用機(jī)器索引等方式生成文章關(guān)鍵詞。每篇文獻(xiàn)的關(guān)鍵詞通常由多個(gè)詞匯或詞組組合而成,共同反映出文章所關(guān)聯(lián)的多方面主題。共詞分析就是要通過(guò)聚類分析、多維尺度分析和網(wǎng)絡(luò)分析等方法,產(chǎn)生具有近似語(yǔ)義,且能夠揭示研究主題特征的詞匯簇。跟蹤詞匯簇在不同時(shí)期的發(fā)展變化,是揭示前沿研究領(lǐng)域的一類代表性方法[9]。同時(shí),與文獻(xiàn)共被引、作者共被引等方法相比,共被引分析的結(jié)果難以直接標(biāo)識(shí)出關(guān)于研究子領(lǐng)域?qū)嶋H內(nèi)容的詳細(xì)信息,但共詞分析提供了研究領(lǐng)域的內(nèi)容[10]。
就理論而言,通過(guò)計(jì)算共詞矩陣可以將關(guān)鍵詞間遠(yuǎn)近的共現(xiàn)關(guān)系進(jìn)行展現(xiàn),即詞匯簇內(nèi)的關(guān)鍵詞關(guān)系較近,詞匯簇間的關(guān)鍵詞關(guān)系較遠(yuǎn)。但是原始的關(guān)鍵詞共詞矩陣記錄的是詞匯出現(xiàn)的絕對(duì)頻次,所反映出的共現(xiàn)關(guān)系偏離真實(shí)情況,因而研究對(duì)絕對(duì)詞頻進(jìn)行了歸一化轉(zhuǎn)換,使得原始矩陣轉(zhuǎn)化為相關(guān)矩陣。這一過(guò)程沒(méi)有信息損失產(chǎn)生,同時(shí)便于之后的分析得出更可靠的結(jié)論。本研究中采用經(jīng)典的Salton余弦相似度(Cosine Similarity)或稱為Ochiai系數(shù)[11]來(lái)對(duì)絕對(duì)頻次進(jìn)行歸一化轉(zhuǎn)換,最終得到0~1之間的系數(shù)值。以O(shè)chiai系數(shù)為表達(dá)形式的計(jì)算公式如下,其中(x,y)表示任意一組詞匯對(duì),C表示相應(yīng)詞匯的原始絕對(duì)詞頻。
Ochiai(x,y)=CxyCxCy
3.2 爆發(fā)詞檢測(cè)
爆發(fā)詞(Burst Word)在本質(zhì)上也是關(guān)鍵詞,只不過(guò)他們的出現(xiàn)表明一些代表性主題在給定的時(shí)間段內(nèi)產(chǎn)生了更大的意義。爆發(fā)詞的發(fā)現(xiàn)基于對(duì)關(guān)鍵詞沿時(shí)間趨勢(shì)進(jìn)行變化的考察,因而其在監(jiān)測(cè)事件動(dòng)態(tài)變化的活動(dòng)中被廣泛采用。正確、有效地捕捉爆發(fā)詞對(duì)科學(xué)研究的趨勢(shì)預(yù)測(cè)、研究熱點(diǎn)和研發(fā)機(jī)會(huì)發(fā)現(xiàn)均有重要的研究意義和現(xiàn)實(shí)意義[12]。在本研究中,基于年份演化的爆發(fā)詞檢測(cè)提供了另一種探測(cè)選題前沿的方法。也就是說(shuō),研究在檢測(cè)歸一化詞頻高低之外,還通過(guò)發(fā)現(xiàn)詞頻數(shù)量或增加速度的變化趨勢(shì)來(lái)提取學(xué)科領(lǐng)域中的研究前沿。
3.3 關(guān)鍵詞詞頻統(tǒng)計(jì)
基于詞頻統(tǒng)計(jì)的關(guān)鍵詞分析有一個(gè)最大的優(yōu)勢(shì),就是實(shí)現(xiàn)過(guò)程簡(jiǎn)單,僅需要對(duì)詞頻進(jìn)行統(tǒng)計(jì)上的計(jì)數(shù)。當(dāng)然,直接對(duì)關(guān)鍵詞開(kāi)展詞頻統(tǒng)計(jì)也存在一系列的問(wèn)題,大多數(shù)情況下可能需要進(jìn)一步的人工干預(yù)。關(guān)鍵詞表中可能包含著一些不具有表征意義的詞,需要人工標(biāo)注為停用詞,即計(jì)算機(jī)在進(jìn)行統(tǒng)計(jì)時(shí)將會(huì)忽略掉的詞匯;統(tǒng)計(jì)結(jié)果也會(huì)與詞性和單復(fù)數(shù)形式有關(guān),需要對(duì)這部分異形詞匯進(jìn)行規(guī)范化處理。在本研究中,高被引文獻(xiàn)被視作一個(gè)整體集合,關(guān)鍵詞詞頻統(tǒng)計(jì)提供了對(duì)高被引文獻(xiàn)的一種前沿觀察方法,通過(guò)計(jì)數(shù)產(chǎn)生的高頻詞代表了之后的施引文獻(xiàn)更多關(guān)注的領(lǐng)域,能夠用以分析哪些領(lǐng)域被更多的后續(xù)研究所引用。
3.4 扎根理論
扎根理論分析是一種被社會(huì)科學(xué)領(lǐng)域所廣泛采用的定性研究方法,并逐漸在定性取向的研究中占據(jù)主導(dǎo)位置。由扎根理論提供的一系列抽象化的指導(dǎo)方針與具體化的操作方法,使得概念的重新融合成為一個(gè)自然過(guò)程,并伴隨著理論層次的逐步提高。編碼是經(jīng)典扎根理論方法的核心過(guò)程,包括了兩種類型的編碼:實(shí)質(zhì)編碼與理論編碼。本研究?jī)H涉及實(shí)質(zhì)編碼過(guò)程中的開(kāi)放編碼和選擇編碼技術(shù),通過(guò)實(shí)質(zhì)編碼直接對(duì)數(shù)據(jù)進(jìn)行提煉和分析。研究將文獻(xiàn)關(guān)鍵詞視作開(kāi)放編碼的核心概念,通過(guò)不斷比較核心概念間的關(guān)聯(lián)性繼續(xù)開(kāi)展主軸編碼。這是一個(gè)持續(xù)對(duì)比和概念融合的交叉循環(huán)過(guò)程,以形成內(nèi)部概念相互鏈接、外部命名可解釋的類別,從而將分析結(jié)論向更高層次的概念抽象推進(jìn)。
4 選題前沿的整體性趨勢(shì)
在本部分中,2 196篇文獻(xiàn)將依照年份演化趨勢(shì)進(jìn)行分析。全體文獻(xiàn)的原始數(shù)據(jù)依字段被轉(zhuǎn)換為以WoS格式表示的TXT文檔,從而便于進(jìn)入經(jīng)典的文獻(xiàn)可視化分析工具CiteSpace展開(kāi)進(jìn)一步研究。研究采用的CiteSpace版本號(hào)為5.3.R9。
4.1 基于共詞分析的整體性趨勢(shì)
采用CiteSpace軟件對(duì)文獻(xiàn)關(guān)鍵詞開(kāi)展共詞分析,按照正式出版年份(2016-2018年)進(jìn)行切片,并由算法自動(dòng)標(biāo)注聚類標(biāo)簽,得到2016年、2017年、2018年3幅共詞分析圖譜。
以2016年的結(jié)果為基準(zhǔn),2017年中信息檢索(Information Retrieval)、政治傳播(Political Communication)、出版(Publication)呈現(xiàn)出明顯的研究進(jìn)展趨勢(shì)。信息檢索一直以來(lái)都是一個(gè)活躍的研究領(lǐng)域,但在大規(guī)模(Large-scale)信息環(huán)境中,判斷文檔的相關(guān)性需要新的技術(shù)實(shí)現(xiàn)方法,這是該領(lǐng)域在2017年得到更多關(guān)注的主要原因;另外一些子領(lǐng)域在2017年的持續(xù)活躍也使得信息檢索更加活躍,這些領(lǐng)域主要是音樂(lè)信息檢索(Music Information Retrieval)和生物醫(yī)學(xué)信息檢索(Biomedical Information Retrieval),也值得我國(guó)情報(bào)學(xué)研究的更多關(guān)注與深入探討。
政治傳播(Political Communication)在2017年出現(xiàn)的原因,是由于美國(guó)特殊的政治背景:2016年下半年,美國(guó)舉行了第58屆總統(tǒng)選舉,新任總統(tǒng)唐納德·特朗普于2017年1月舉行了就職典禮。作為美國(guó)最重要政治事件之一的總統(tǒng)大選引發(fā)了研究人員的關(guān)注,考慮到合理的評(píng)議、修訂與編輯周期,政治傳播的研究文獻(xiàn)在2017年得以較多發(fā)表,其中又以新媒體為媒介的政治傳播受到更多研究人
員青睞。另一方面的原因也在于出版機(jī)構(gòu)的引導(dǎo),如EPI就適時(shí)地推出了政治傳播???,其中的“推特與政治傳播”[13]一文得到了較廣泛關(guān)注。
出版(Publication)這一研究領(lǐng)域,更準(zhǔn)確而言,指的是學(xué)術(shù)出版(Academic Publication或Scholarly Publication)。2017年AJIM上發(fā)表的關(guān)于中國(guó)科學(xué)出版激勵(lì)制度的研究“出版賺錢還是保持貧困:對(duì)中國(guó)科學(xué)界論文獎(jiǎng)勵(lì)制度的考察”[14]得到了廣泛的學(xué)術(shù)傳播,并被許多媒體進(jìn)行報(bào)道。開(kāi)放存取(Open-access)的學(xué)術(shù)出版形式、跨國(guó)合作(Transnational Collaboration)的學(xué)術(shù)出版以及學(xué)術(shù)出版的數(shù)字化保存(Digital Preservation)問(wèn)題是該領(lǐng)域在2017年的主要研究前沿。
基于2016-2017年的共詞分析聚類結(jié)果,大數(shù)據(jù)(Big Data)、內(nèi)容分析(Content Analysis)、主題建模(Topic Modeling)更多地出現(xiàn)在2018年的研究視野中,在分析時(shí)筆者結(jié)合了對(duì)每個(gè)領(lǐng)域典型文獻(xiàn)的考察。以大數(shù)據(jù)為主題的有關(guān)研究更多地關(guān)注大數(shù)據(jù)在各行業(yè)中能夠創(chuàng)造的價(jià)值(From Data to Value),特別是在組織(公司)管理、第三產(chǎn)業(yè)(服務(wù)業(yè))、新興產(chǎn)業(yè)(Emergent Industry)中發(fā)揮大數(shù)據(jù)的戰(zhàn)略作用與競(jìng)爭(zhēng)優(yōu)勢(shì),對(duì)于具體細(xì)分環(huán)節(jié)的技術(shù)實(shí)現(xiàn)探討則相對(duì)弱化。以內(nèi)容分析(Content Analysis)為代表的傳統(tǒng)研究方法也并未因?yàn)榇髷?shù)據(jù)技術(shù)的出現(xiàn)而得以式微,反而在2018年得到了較多關(guān)注,特別是用于研究領(lǐng)域的整體性評(píng)價(jià)、回顧與重新審查,比如JASIST上的“數(shù)據(jù)集說(shuō)明與引用:對(duì)全文出版物的內(nèi)容分析”[15]。作為機(jī)器學(xué)習(xí)與自然語(yǔ)言處理(NLP)中常用的文本挖掘工具,主題建模(Topic Modeling)越來(lái)越多地被用來(lái)發(fā)現(xiàn)各類數(shù)據(jù)源中非結(jié)構(gòu)化文本所隱藏的語(yǔ)義特征,且不斷改進(jìn)的算法已能在真實(shí)情景中取得具有分析意義的結(jié)果。在2018年的研究中,作為方法的主題建模(Topic Modeling)被應(yīng)用于分散的多領(lǐng)域研究中,但主要用于研究文本信息(特別是社會(huì)化媒體文本信息)的系統(tǒng)分類(Systematic Classification)和主題演變(Topic Evolution)。
4.2 基于爆發(fā)詞檢測(cè)的整體性趨勢(shì)
以2 196篇文獻(xiàn)總集為樣本,按照正式出版年份為切分范圍,采用CiteSpace軟件帶有的爆發(fā)詞檢測(cè)算法,選取其中對(duì)研究前沿進(jìn)展具有分析價(jià)值的爆發(fā)詞(即停用一些實(shí)際意義較小的爆發(fā)詞),并將爆發(fā)詞檢測(cè)結(jié)果投影到可視化圖譜上,得到最終的爆發(fā)詞檢測(cè)圖譜。
2017年出現(xiàn)的爆發(fā)詞包括信息行為(Information Behaviour)、政治傳播(Political Communication)、對(duì)照試驗(yàn)(Controlled Study)、在線社交網(wǎng)絡(luò)(Online Social Networking),其中政治傳播在上一部分中已經(jīng)進(jìn)行了解釋,在此不再贅述。
對(duì)信息行為(Information Behaviour)的研究主要關(guān)注了用戶的信息搜尋(Information Seeking)與在線交流(Online Communication)行為,在線交流行為中又包括了在線問(wèn)答(Online Q&A)行為這一細(xì)分領(lǐng)域。在研究?jī)?nèi)容上則主要關(guān)心用戶行為的影響因素、驅(qū)動(dòng)因素和持續(xù)使用因素。一篇經(jīng)典的文獻(xiàn)是2017年發(fā)表于JDoc的文章“人盡皆知:在深度休閑中體現(xiàn)的信息”[16],作者Cox A M等提出在信息行為研究中應(yīng)當(dāng)重視對(duì)“身體”(Body)這一因素的考察。
對(duì)照試驗(yàn)(Controlled Study)一方面出現(xiàn)在部分算法改進(jìn)和算法比較的研究中,但沒(méi)有發(fā)現(xiàn)比較明顯的集中研究領(lǐng)域,例如有的用于專利地圖的技術(shù)距離[17],有的用于文檔集合的主題表示[18],有的用于網(wǎng)絡(luò)搜索的人名消歧[19]。另一方面,對(duì)照試驗(yàn)常被用于用戶研究,特別是用戶行為研究。作為一種實(shí)證的可以人類為研究對(duì)象的研究方法,對(duì)照試驗(yàn)被用戶行為研究較為廣泛采用,可參見(jiàn)上一段的分析。
在線社交網(wǎng)絡(luò)(Online Social Networking)的研究與此前提到的多個(gè)研究領(lǐng)域存在交疊。事實(shí)上,與其將在線社交網(wǎng)絡(luò)看作是研究領(lǐng)域,不如將其視作一個(gè)研究情境(Context),或者說(shuō)許多研究領(lǐng)域都將自身的研究問(wèn)題置于在線社交網(wǎng)絡(luò)中而開(kāi)展。例如學(xué)術(shù)社交網(wǎng)絡(luò)的在線問(wèn)答[20]、社交媒體的政治傳播[21]、社交網(wǎng)絡(luò)的用戶行為意愿[22]、在線社區(qū)的內(nèi)容分類[23]等。唯一可被發(fā)現(xiàn)不同于上述研究領(lǐng)域的內(nèi)容是對(duì)在線社交網(wǎng)絡(luò)內(nèi)容的審查和規(guī)制,如JASIST上的“在線社交網(wǎng)絡(luò)中的新聞審查:對(duì)規(guī)避審查評(píng)論的研究”[24],但這方面的研究并不多見(jiàn)。
2018年的文獻(xiàn)中產(chǎn)生的爆發(fā)詞是案例研究(Case Study)、隱私(Privacy)、文本挖掘(Text Mining)、元數(shù)據(jù)(Metadata),更多的詞匯是來(lái)自研究方法或是技術(shù)方法,僅有隱私(Privacy)可在一定程度上代表研究領(lǐng)域。
隱私(Privacy)問(wèn)題在2018年受到研究人員關(guān)注,這與當(dāng)前大數(shù)據(jù)的信息化情境與信息共享背景下的倫理問(wèn)題存在著明顯關(guān)聯(lián),兩個(gè)重要的研究話題包括隱私如何影響人們對(duì)信息的接受和使用,如JASIST上的“大數(shù)據(jù)時(shí)代消費(fèi)者對(duì)個(gè)人信息的評(píng)估”[25];以及保護(hù)個(gè)人隱私的理論探討和實(shí)踐經(jīng)驗(yàn),如EPI上的“歐盟統(tǒng)一的個(gè)人數(shù)據(jù)保護(hù):挑戰(zhàn)和影響”[26]。
案例研究(Case Study)作為一種典型的質(zhì)性研究方法,應(yīng)用領(lǐng)域十分多元,但大多以項(xiàng)目為案例進(jìn)行研究,小部分則以國(guó)家或組織為案例,如發(fā)表在IJIM上的“通過(guò)知識(shí)管理實(shí)現(xiàn)軟件持續(xù)部署的案例分析”[27]以Meta4公司的DevOps實(shí)踐為案例,證實(shí)運(yùn)用知識(shí)管理工具可以有效幫助軟件的持續(xù)交付。
文本挖掘(Text Mining)通過(guò)對(duì)文本進(jìn)行一系列處理以推斷出給定任務(wù)所需的信息,其具體的應(yīng)用領(lǐng)域除了與同年度主題建模(Topic Modeling)相同的系統(tǒng)分類(Systematic Classification)、主題演變(Topic Evolution),還有質(zhì)量評(píng)估(Quality Assessment)、特征提?。‵eature Extraction)和知識(shí)提取(Knowledge Extraction)。
最后一個(gè)詞是元數(shù)據(jù)(Metadata),即描述其他數(shù)據(jù)的數(shù)據(jù)。伴隨著新的信息載體,特別是數(shù)字化信息載體的出現(xiàn),元數(shù)據(jù)研究仍然在一定程度上占據(jù)重要地位。這些在2018年被討論的信息載體主要來(lái)源于考古學(xué)、氣象學(xué)、網(wǎng)絡(luò)通信、游戲視覺(jué)風(fēng)格。
5 高被引論文的選題前沿趨勢(shì)
高被引文獻(xiàn)體現(xiàn)了后續(xù)開(kāi)展的研究對(duì)先前研究的關(guān)注和引用情況。由于本研究采用的是Google Scholar的文獻(xiàn)被引用數(shù)據(jù),不僅包括了期刊文獻(xiàn),還有不在本研究樣本內(nèi)的會(huì)議文獻(xiàn)、未正式見(jiàn)刊的預(yù)發(fā)表文獻(xiàn)、作者自存儲(chǔ)文獻(xiàn)等,可以認(rèn)為由這些高被引文獻(xiàn)所涵蓋的研究領(lǐng)域構(gòu)成了一個(gè)總的集合,能夠在一定程度上共同指明下一階段的研究趨勢(shì)。因而研究將201篇高被引文獻(xiàn)視作一個(gè)統(tǒng)一的整體,而不再按照年份進(jìn)行切分,進(jìn)而得出高被引論文的選題趨勢(shì)。
5.1 基于詞頻統(tǒng)計(jì)的高被引選題前沿趨勢(shì)
通過(guò)對(duì)高被引文獻(xiàn)關(guān)鍵詞詞形、詞態(tài)的規(guī)范化處理,刪去無(wú)意義的部分停用詞,并借助Python的自編程序?qū)υ~頻進(jìn)行統(tǒng)計(jì),研究得到詞頻在10次及以上的關(guān)鍵詞(組)共7個(gè)(見(jiàn)表3)。其中,大數(shù)據(jù)(Big Data)和社交網(wǎng)絡(luò)(Social Network/Social Networking)在前面的部分已經(jīng)談及。
社會(huì)化媒體(Social Media)的用戶數(shù)量不斷擴(kuò)大使得社會(huì)化媒體不僅越來(lái)越融入用戶的生活場(chǎng)景,也愈加受到研究人員的關(guān)注。這一研究領(lǐng)域目前仍處于比較活躍的文獻(xiàn)出版過(guò)程中,包括以下幾個(gè)主要的研究話題:一是社會(huì)化媒體在特定產(chǎn)業(yè)或行業(yè)中的作用,如研究企業(yè)社會(huì)化媒體的知識(shí)共享[28];二是以社會(huì)化媒體作為信息源進(jìn)行文本挖掘或意見(jiàn)挖掘,如研究YouTube上的多語(yǔ)言意見(jiàn)挖掘[29];三是社會(huì)化媒體使用對(duì)用戶產(chǎn)生的影響,如研究社會(huì)化媒體使用和心理健康的關(guān)系[30]。其余研究則是與在線社交網(wǎng)絡(luò)(Online Social Networking)一樣,只是將社會(huì)化媒體作為一個(gè)研究情境,但作為研究情境出現(xiàn)的社會(huì)化媒體,其涉及的研究?jī)?nèi)容并不聚焦,可參見(jiàn)前述在線社交網(wǎng)絡(luò)研究部分。而“推特”(Twitter)作為信息快速更新、用戶群體龐大的國(guó)外社會(huì)化媒體,又被最多研究所關(guān)注,因而在詞頻統(tǒng)計(jì)中居于前列。
情感分析(Sentiment Analysis)是伴隨著機(jī)器學(xué)習(xí)、文本挖掘、自然語(yǔ)言處理等技術(shù)的發(fā)展而日趨成熟的一個(gè)新興研究領(lǐng)域,其核心研究問(wèn)題就是如何量化文本中體現(xiàn)的情感狀態(tài)。這一研究領(lǐng)域的上升事實(shí)上也得益于社會(huì)化媒體的活躍,在許多文獻(xiàn)中都能看到社會(huì)化媒體的影子。情感分析可依據(jù)所分析的不同數(shù)據(jù)來(lái)源進(jìn)行劃分,但主要集中在微博客、在線評(píng)論、新聞以及其他特定文檔。
與以大數(shù)據(jù)為主題的有關(guān)研究相似,云計(jì)算(Cloud Computing)的有關(guān)研究也主要探討云計(jì)算所能創(chuàng)造的價(jià)值與帶來(lái)的變革,而非技術(shù)實(shí)現(xiàn)的具體方法,或許后者在計(jì)算機(jī)科學(xué)的期刊中會(huì)得到更多引用,但并沒(méi)有反映在情報(bào)學(xué)期刊的同行引用行為中。研究人員認(rèn)為云計(jì)算可能會(huì)改變的行業(yè)或產(chǎn)業(yè)中值得探討的有醫(yī)療行業(yè)、教育行業(yè)以及各類企業(yè),此外還需要注意云計(jì)算服務(wù)帶來(lái)的信息安全問(wèn)題[31]。
知識(shí)管理(Knowledge Management,KM)也是一個(gè)趨勢(shì)比較明顯的研究領(lǐng)域。除了最受關(guān)注的企業(yè)知識(shí)管理以外,還有知識(shí)管理對(duì)信息系統(tǒng)和軟件開(kāi)發(fā)的影響、個(gè)人知識(shí)共享意圖、知識(shí)轉(zhuǎn)移績(jī)效都是高被引文獻(xiàn)的主要研究問(wèn)題。
必須指出的是,許多研究領(lǐng)域都不是單一而具有明確邊界的,而是與其他研究領(lǐng)域存在交叉,共同產(chǎn)出優(yōu)質(zhì)論文,如IJIM上發(fā)表的“企業(yè)社交網(wǎng)絡(luò):一個(gè)知識(shí)管理的視角”[32]就是知識(shí)管理與社交網(wǎng)絡(luò)相結(jié)合的成果。
5.2 基于扎根理論的高被引選題前沿趨勢(shì)
研究把文獻(xiàn)關(guān)鍵詞視作開(kāi)放編碼形成的自由節(jié)點(diǎn),通過(guò)自由節(jié)點(diǎn)進(jìn)一步向上聚合的主軸編碼過(guò)程,并借助詞頻數(shù)據(jù),以每個(gè)范疇內(nèi)的關(guān)鍵詞詞頻不少于20次為篩選標(biāo)準(zhǔn),一共獲得8個(gè)范疇(見(jiàn)表4)。其中,用戶研究和真人試驗(yàn)(User Study & Human Experiment)、文獻(xiàn)計(jì)量學(xué)(Bibliometrics)、商業(yè)智能(Business Intelligence)是新出現(xiàn)的前沿領(lǐng)域。
在用戶研究(User Study)中,除了前面已經(jīng)提及的信息行為研究,還有兩個(gè)值得注意的領(lǐng)域:一是對(duì)用戶創(chuàng)新行為的研究,如IJIM上發(fā)表的“利用用戶創(chuàng)新的社會(huì)化媒體營(yíng)銷:‘眾包漢堡包的案例研究”[33];二是對(duì)用戶行為背后的用戶動(dòng)機(jī)和用戶意愿的研究,如同是IJIM發(fā)表的“用戶安裝移動(dòng)應(yīng)用程序意圖的影響因素”[34]。隨著情報(bào)學(xué)對(duì)用戶而非技術(shù)的關(guān)注度提升,以用戶為實(shí)驗(yàn)對(duì)象或在用戶的真實(shí)情境中開(kāi)展的研究也愈發(fā)受到關(guān)注,真人試驗(yàn)(Human Experiment)方法成為情報(bào)學(xué)研究的一個(gè)熱點(diǎn)趨勢(shì)。例如JASIST上發(fā)表的“超越‘意圖:將行為期望整合進(jìn)UTAUT模型”[35]就基于對(duì)321名真實(shí)用戶開(kāi)展的縱向田野研究。
文獻(xiàn)計(jì)量學(xué)(Bibliometrics)的前沿領(lǐng)域主要是科學(xué)計(jì)量學(xué)(Scientometrics),以探討科學(xué)文獻(xiàn)分布和科學(xué)產(chǎn)出評(píng)價(jià)為核心內(nèi)容;以及在社會(huì)化媒體和社交網(wǎng)絡(luò)的背景下如何改進(jìn)科學(xué)計(jì)量,即以補(bǔ)充計(jì)量學(xué)(Altmetrics)為代表的研究,如JASIST上的“Mendeley讀者數(shù)對(duì)醫(yī)學(xué)論文的補(bǔ)充計(jì)量:基于45個(gè)領(lǐng)域的分析”[36]。此外還有部分綜述型文章將文獻(xiàn)計(jì)量學(xué)作為方法所體現(xiàn)出的應(yīng)用價(jià)值,在此不做展開(kāi)。
商業(yè)智能(Business Intelligence)研究是一個(gè)與大數(shù)據(jù)、云計(jì)算、人工智能存在明顯交叉的領(lǐng)域,其主要關(guān)注的焦點(diǎn)一是從業(yè)務(wù)流程管理(Business Process Management)出發(fā)改進(jìn)信息系統(tǒng)來(lái)實(shí)現(xiàn)商業(yè)智能,比如IJIM上的“業(yè)務(wù)流程管理和信息技術(shù)管理:缺少的集成”[37];二是從組織中的“人”出發(fā),研究如何通過(guò)智能技術(shù)提高人力資本,比如同發(fā)表在IJIM上的“工作場(chǎng)所的社會(huì)幸福感和技能管理框架”[38]。
此外,社交網(wǎng)絡(luò)(Social Network)這一范疇中的社會(huì)網(wǎng)絡(luò)分析(Social Network Analysis,SNA)作為一種比較有前景的研究方法,可以產(chǎn)生一些有意思的研究成果,也值得研究人員和期刊編輯在選題時(shí)關(guān)注。如IJIM上發(fā)表的“社會(huì)網(wǎng)絡(luò)分析:災(zāi)難后在線社交網(wǎng)絡(luò)的特征”[39]已被引用近200次。
6 研究結(jié)論與建議
本研究以探尋國(guó)際情報(bào)學(xué)期刊的選題前沿為研究目的,遴選10種國(guó)外優(yōu)秀綜合性情報(bào)學(xué)刊物,綜合采用多種方法對(duì)這些期刊近3年來(lái)刊載的文獻(xiàn)展開(kāi)了較細(xì)粒度的分析。綜觀全文的分析結(jié)果,情報(bào)學(xué)期刊文獻(xiàn)與情報(bào)學(xué)研究中有較大潛力且有望被較多關(guān)注的研究領(lǐng)域可以從研究話題、研究情境、研究方法3個(gè)方面來(lái)進(jìn)行考察。
就研究話題而言,包括:1)大數(shù)據(jù)背景下與專門領(lǐng)域中的信息檢索方法探新研究;2)開(kāi)放存取等新形式學(xué)術(shù)出版研究與學(xué)術(shù)出版激勵(lì)制度研究;3)信息搜尋與在線社群的用戶行為研究,特別是用戶行為影響因素、動(dòng)機(jī)和意愿的研究;4)大數(shù)據(jù)與信息共享背景下的信息安全問(wèn)題、隱私問(wèn)題研究;5)元數(shù)據(jù)在不同信息載體與學(xué)科的應(yīng)用研究;6)在線新聞或評(píng)論、社會(huì)化媒體數(shù)據(jù)的情感分析研究;7)知識(shí)管理、知識(shí)共享、知識(shí)轉(zhuǎn)移的相關(guān)問(wèn)題研究;8)以科學(xué)計(jì)量學(xué)和補(bǔ)充計(jì)量學(xué)為代表的文獻(xiàn)計(jì)量學(xué)研究;9)利用商業(yè)智能改進(jìn)業(yè)務(wù)流程管理和組織人力資本的研究。
從研究情境或研究背景來(lái)說(shuō),包括:1)以大數(shù)據(jù)為研究背景或主題的研究,重點(diǎn)是對(duì)大數(shù)據(jù)應(yīng)用價(jià)值的研究;2)以云計(jì)算為研究背景或主題的研究,重點(diǎn)是對(duì)云計(jì)算應(yīng)用價(jià)值的研究;3)以在線社交網(wǎng)絡(luò)為研究情境或主題的研究;4)以社會(huì)化媒體為研究情境或主題的研究。
從研究方法出發(fā),包括:1)以內(nèi)容分析為方法的研究,特別是對(duì)研究領(lǐng)域的綜述與整體評(píng)價(jià);2)運(yùn)用文本挖掘(主題建模)方法的研究,特別是運(yùn)用社會(huì)化媒體文本信息的主題建模或意見(jiàn)挖掘研究;3)以案例研究為研究方法的研究;4)以真實(shí)用戶為研究對(duì)象的對(duì)照試驗(yàn)研究;5)以社會(huì)網(wǎng)絡(luò)分析作為研究方法的研究。
表5是以更加簡(jiǎn)潔的形式歸納的情報(bào)學(xué)前沿研究領(lǐng)域。需要指出的是,應(yīng)當(dāng)特別歡迎這些研究領(lǐng)域、背景、方法相互交叉所產(chǎn)出的研究成果,這意味著研究的選題很可能具有較好的前瞻性,并在發(fā)表后取得良好的關(guān)注度。
當(dāng)然,本研究仍然存在一定的局限性。由于研究采用關(guān)鍵詞來(lái)作為研究話題的表征形態(tài),但作者關(guān)鍵詞的指定有一定的隨意性和較大的自由度,雖然研究對(duì)詞形和詞態(tài)進(jìn)行了歸一化處理,但仍然不能與規(guī)范化處理的敘詞相比,其結(jié)果并不是絕對(duì)的準(zhǔn)確和全面;另一方面,部分刊物的編排格式中不含有關(guān)鍵詞或類似項(xiàng)目,研究對(duì)這部分文獻(xiàn)采用了機(jī)器自動(dòng)抽取結(jié)合人工標(biāo)引關(guān)鍵詞的做法予以補(bǔ)充,使得樣本集內(nèi)的每篇文獻(xiàn)均有關(guān)鍵詞數(shù)據(jù)可供分析,但這種做法得到的關(guān)鍵詞與作者關(guān)鍵詞存在不同程度的差異,可能造成分析過(guò)程中對(duì)部分研究領(lǐng)域的過(guò)度解讀或是疏漏。因而,上述研究結(jié)論應(yīng)當(dāng)成為研究選題的合理但不盲從的參考。
參考文獻(xiàn)
[1]楊國(guó)立,蘇新寧.邁向Intelligence導(dǎo)向的現(xiàn)代情報(bào)學(xué)[J].情報(bào)學(xué)報(bào),2018,37(5):460-466.
[2]巴志超,李綱,周利琴,等.數(shù)據(jù)科學(xué)及其對(duì)情報(bào)學(xué)變革的影響[J].情報(bào)學(xué)報(bào),2018,37(7):653-667.
[3]王琳.社科情報(bào)學(xué)學(xué)科內(nèi)涵和理論核心問(wèn)題的思考[J].情報(bào)資料工作,2018,(6):37-42.
[4]劉強(qiáng).中國(guó)“情報(bào)學(xué)”亂象和迷途的終結(jié)與選擇——基于信息與情報(bào)的本源內(nèi)涵和學(xué)科機(jī)理與邊界[J].情報(bào)雜志,2018,37(11):1-9.
[5]張?jiān)疲瑮罱?從學(xué)科交叉視角看國(guó)內(nèi)情報(bào)學(xué)的學(xué)科地位與發(fā)展思考[J/OL].情報(bào)理論與實(shí)踐.http://kns.cnki.net/kcms/detail/11.1762.g3.20181129.1217.002.html,2019-02-16.
[6]趙蓉英,魏明坤.2010-2015年國(guó)內(nèi)外情報(bào)學(xué)研究熱點(diǎn)可視化比較[J].圖書館雜志,2016,35(8):15-22.
[7]劉志輝,趙筱媛,許曉陽(yáng),等.文獻(xiàn)計(jì)量分析視角下的情報(bào)學(xué)理論研究進(jìn)展[C]//中國(guó)國(guó)防科學(xué)技術(shù)信息學(xué)會(huì).情報(bào)學(xué)進(jìn)展:第11卷,2014-2015年度評(píng)論.北京:國(guó)防工業(yè)出版社,2016:27-46.
[8]王知津,曹文振.我國(guó)圖書館新媒體服務(wù)研究展望——基于高被引論文的分析[J].圖書館論壇,2017,37(9):62-69.
[9]陳仕吉.科學(xué)研究前沿探測(cè)方法綜述[J].現(xiàn)代圖書情報(bào)技術(shù),2009,25(9):28-33.
[10]Eom S.Author Cocitation Analysis:Quantitative Methods for Mapping the Intellectual Structure of an Academic Discipline[M].New York:Information Science Reference,2008:10.
[11]Zhou Q,Leydesdorff L.The Normalization of Occurrence and Co-Occurrence Matrices in Bibliometrics Using Cosine Similarities and Ochiai Coefficients[J].Journal of the Association for Information Science and Technology,2016,67(11):2805-2814.
[12]逯萬(wàn)輝,馬建霞,趙迎光.爆發(fā)詞識(shí)別與主題探測(cè)技術(shù)研究綜述[J].情報(bào)理論與實(shí)踐,2012,35(6):125-128.
[13]Campos-Domínguez E.Twitter and Political Communication[J].El Profesional de la Información,2017,26(5):785-793.
[14]Quan W,Chen B,Shu F.Publish or Impoverish:An Investigation of the Monetary Reward System of Science in China(1999-2016)[J].Aslib Journal of Information Management,2017,69(5):486-502.
[15]Zhao M,Yan E,Li K.Data Set Mentions and Citations:A Content Analysis of Full-Text Publications[J].Journal of the Association for Information Science and Technology,2018,69(1):32-46.
[16]Cox A M,Griffin B,Hartel J.What Everybody Knows:Embodied Information in Serious Leisure[J].Journal of Documentation,2017,73(3):386-406.
[17]Yan B,Luo J.Measuring Technological Distance for Patent Mapping[J].Journal of the Association for Information Science and Technology,2017,68(2):423-437.
[18]Aletras N,Baldwin T,Lau J H,et al.Evaluating Topic Representations for Exploring Document Collections[J].Journal of the Association for Information Science and Technology,2017,68(1):154-167.
[19]Delgado A D,Martínez R,Montalvo S,et al.Person Name Disambiguation in the Web Using Adaptive Threshold Clustering[J].Journal of the Association for Information Science and Technology,2017,68(7):1751-1762.
[20]Jeng W,DesAutels S,He D,et al.Information Exchange on an Academic Social Networking Site:A Multidiscipline Comparison on ResearchGate Q&A[J].Journal of the Association for Information Science and Technology,2017,68(3):638-652.
[21]López-Meri A,Marcos-García S,Casero-Ripollés A.What Do Politicians Do on Twitter?Functions and Communication Strategies in the Spanish Electoral Campaign of 2016[J].El Profesional de la Información,2017,26(5):795-804.
[22]Wang L,Yan J,Lin J,et al.Let the Users Tell the Truth:Self-Disclosure Intention and Self-Disclosure Honesty in Mobile Social Networking[J].International Journal of Information Management,2017,37(1):1428-1440.
[23]Cohan A,Young S,Yates A,et al.Triaging Content Severity in Online Mental Health Forums[J].Journal of the Association for Information Science and Technology,2017,68(11):2675-2689.
[24]Schwartz D G,Yahav I,Silverman G.News Censorship in Online Social Networks:A Study of Circumvention in the Commentsphere[J].Journal of the Association for Information Science and Technology,2017,68(3):569-582.
[25]Lim S,Woo J R,Lee J,et al.Consumer Valuation of Personal Information in the Age of Big Data[J].Journal of the Association for Information Science and Technology,2018,69(1):60-71.
[26]Martínez-Martínez D F.Unification of Personal Data Protection in the European Union:Challenges and Implications[J].El Profesional de la Información,2018,27(1):185-194.
[27]Colomo-Palacios R,F(xiàn)ernandes E,Soto-Acosta P,et al.A Case Analysis of Enabling Continuous Software Deployment Through Knowledge Management[J].International Journal of Information Management,2018,40:186-189.
[28]Pee L G.Affordances for Sharing Domain-Specific and Complex Knowledge on Enterprise Social Media[J].International Journal of Information Management,2018,43:25-37.
[29]Severyn A,Moschitti A,Uryupina O,et al.Multi-Lingual Opinion Mining on YouTube[J].Information Processing & Management,2016,52(1):46-60.
[30]Dhir A,Yossatorn Y,Kaur P,et al.Online Social Media Fatigue and Psychological Wellbeing—A Study of Compulsive Use,F(xiàn)ear of Missing Out,F(xiàn)atigue,Anxiety and Depression[J].International Journal of Information Management,2018,40:141-152.
[31]Ramachandran M.Software Security Requirements Management as an Emerging Cloud Computing Service[J].International Journal of Information Management,2016,36(4):580-590.
[32]Mntymki M,Riemer K.Enterprise Social Networking:A Knowledge Management Perspective[J].International Journal of Information Management,2016,36(6):1042-1052.
[33]Pacauskas D,Rajala R,Westerlund M,et al.Harnessing User Innovation for Social Media Marketing:Case Study of a Crowdsourced Hamburger[J].International Journal of Information Management,2018,43:319-327.
[34]Harris M A,Brookshire R,Chin A G.Identifying Factors Influencing Consumers Intent to Install Mobile Applications[J].International Journal of Information Management,2016,36(3):441-450.
[35]Maruping L M,Bala H,Venkatesh V,et al.Going Beyond Intention:Integrating Behavioral Expectation into the Unified Theory of Acceptance and Use of Technology[J].Journal of the Association for Information Science and Technology,2017,68(3):623-637.
[36]Thelwall M,Wilson P.Mendeley Readership Altmetrics for Medical Articles:An Analysis of 45 Fields[J].Journal of the Association for Information Science and Technology,2016,67(8):1962-1972.
[37]Rahimi F,Mller C,Hvam L.Business Process Management and IT Management:The Missing Integration[J].International Journal of Information Management,2016,36(1):142-154.
[38]Araújo J,Pestana G.A Framework for Social Well-Being and Skills Management at the Workplace[J].International Journal of Information Management,2017,37(6):718-725.
[39]Kim J,Hastak M.Social Network Analysis:Characteristics of Online Social Networks after a Disaster[J].International Journal of Information Management,2018,38(1):86-96.
(責(zé)任編輯:馬 卓)