賀亞輝,吳勝男,李軍紀(jì)*
(1 山西醫(yī)科大學(xué)管理學(xué)院,太原 030001;2 山西醫(yī)科大學(xué)學(xué)報(bào)編輯部;*通訊作者,E-mail:junji2003@163.com)
目前,《山西醫(yī)科大學(xué)學(xué)報(bào)》編輯部的審稿專家遴選機(jī)制主要通過以下幾種方式獲取審稿專家信息:在學(xué)報(bào)編輯部的學(xué)術(shù)關(guān)系網(wǎng)內(nèi)獲取、從來源稿件的參考文獻(xiàn)作者中尋找;根據(jù)文章題名和關(guān)鍵詞等關(guān)鍵字段信息從中國知網(wǎng)、Web of Science、專家?guī)臁<宜趩挝坏墓倬W(wǎng)獲??;從作者及其研究團(tuán)隊(duì)已發(fā)表成果中獲取相關(guān)資訊信息等[1]。最后,期刊編輯綜合自身知識素養(yǎng)及編輯部的審稿專家數(shù)據(jù)庫信息進(jìn)行最終的審稿專家選用與優(yōu)選。隨著新興醫(yī)學(xué)學(xué)術(shù)領(lǐng)域的不斷涌現(xiàn)和學(xué)術(shù)領(lǐng)域的不斷融合交叉,醫(yī)學(xué)領(lǐng)域期刊的來稿量愈發(fā)增多[2],如網(wǎng)絡(luò)問診[3]、基因組學(xué)[4]等,學(xué)術(shù)期刊的同行評審負(fù)荷不斷增加。此外,同行評審專家由于學(xué)術(shù)視野和學(xué)緣結(jié)構(gòu)的約束,難以準(zhǔn)確地判斷某些新領(lǐng)域的學(xué)術(shù)趨勢和動向,難免會在學(xué)術(shù)論文的評判中出現(xiàn)偏倚[5]。勢必會影響學(xué)術(shù)期刊編輯的審稿效率和期刊的出版質(zhì)量[6]。本文對《山西醫(yī)科大學(xué)學(xué)報(bào)》預(yù)應(yīng)用的信息檢索網(wǎng)頁平臺進(jìn)行功能介紹,評價(jià)其對期刊編輯審稿專家遴選工作的支持作用,以期提高期刊編輯工作的效率與質(zhì)量。
本文介紹的系統(tǒng)是基于Django框架之上建立的信息檢索網(wǎng)頁平臺。Django框架是一種使用Python語言開發(fā)的Web應(yīng)用框架,通過開發(fā)服務(wù)端來提供服務(wù),提供了強(qiáng)大的后臺管理系統(tǒng),最初于2005年發(fā)布,應(yīng)用于新聞行業(yè)網(wǎng)站[7],非常適用于內(nèi)容管理系統(tǒng)類型的應(yīng)用。數(shù)據(jù)庫為MySQL數(shù)據(jù)庫[8],服務(wù)器端建立在VMware虛擬機(jī)上,操作系統(tǒng)為Linux系統(tǒng),期刊編輯可通過輸入IP(Internet Protocol,網(wǎng)際互連協(xié)議)地址直接訪問平臺系統(tǒng)的操作界面。
目前,該服務(wù)器端數(shù)據(jù)庫約有95名左右審稿專家信息,數(shù)據(jù)庫數(shù)據(jù)更新時(shí)間截止至2021年11月。數(shù)據(jù)庫數(shù)據(jù)包括審稿專家發(fā)表文獻(xiàn)特征信息、文獻(xiàn)的基金信息、文獻(xiàn)被收錄期刊來源及期刊復(fù)合影響因子、h指數(shù)等內(nèi)容數(shù)據(jù),基本涵蓋了審稿專家學(xué)術(shù)領(lǐng)域特征。當(dāng)有來源稿件需要分配審稿專家時(shí),網(wǎng)頁平臺即可利用具有審稿專家遴選邏輯功能的評價(jià)體系算法對數(shù)據(jù)庫的審稿專家信息進(jìn)行分析,獲取與來源稿件相關(guān)的審稿專家排序信息,通過進(jìn)一步對審稿專家與來源稿件相關(guān)的數(shù)據(jù)庫數(shù)據(jù)二次分析及可視化,即可將審稿專家與來源稿件相關(guān)的學(xué)術(shù)領(lǐng)域特征通過人機(jī)交互界面展現(xiàn)給期刊編輯。
具有審稿專家遴選邏輯功能的評價(jià)體系算法由關(guān)聯(lián)度評價(jià)、傳播效應(yīng)評價(jià)、專長吻合度3個(gè)指標(biāo)利用目標(biāo)優(yōu)化矩陣法[9]聯(lián)合而成。關(guān)聯(lián)度評價(jià)指標(biāo)評價(jià)了來源稿件與審稿專家發(fā)表文獻(xiàn)之間的文本關(guān)聯(lián)度高低;傳播效應(yīng)評價(jià)指標(biāo)則評價(jià)了審稿專家發(fā)表文獻(xiàn)在分享和傳播過程中形成的影響力高低;專長吻合度評價(jià)指標(biāo)則評價(jià)了審稿專家在與來源稿件相關(guān)的研究領(lǐng)域的擅長程度高低。
網(wǎng)頁平臺的人機(jī)交互界面分為三級界面,分別為信息檢索層、檢索結(jié)果層、信息展示層。在信息檢索層可以由期刊編輯輸入期刊來源稿件的關(guān)鍵字段信息進(jìn)行加密檢索,平臺經(jīng)評價(jià)體系算法的編碼邏輯,判斷來源稿件與數(shù)據(jù)庫中審稿專家的匹配度高低,賦予審稿專家不同的分值,即可得到審稿專家從高到低的排序結(jié)果,并將其回傳至檢索結(jié)果層;檢索結(jié)果層則對審稿專家排序結(jié)果進(jìn)行了展示,通過點(diǎn)擊檢索結(jié)果層的審稿專家姓名即可跳轉(zhuǎn)到信息展示層;在信息展示層展示該審稿專家發(fā)表文章中與來源稿件關(guān)聯(lián)度最高的前10篇文獻(xiàn)信息、時(shí)間-發(fā)文量柱狀圖、詞云圖、LDA聚類交互式可視化界面共4個(gè)功能模塊。
本文以“慢性腎衰竭伴甲狀旁腺激素升高的相關(guān)因素分析”標(biāo)題字段進(jìn)行檢索為例,對平臺功能進(jìn)行展示。
在網(wǎng)頁平臺的信息檢索層界面進(jìn)行上述標(biāo)題字段檢索,在檢索結(jié)果層界面可得到共計(jì)45名審稿專家排序結(jié)果,表明在當(dāng)前審稿專家數(shù)據(jù)庫中,有45名審稿專家涉足腎衰竭等腎臟疾病領(lǐng)域方向。由于界面中顯示的審稿專家結(jié)果過多,在對患者敏感信息進(jìn)行處理的基礎(chǔ)上,僅顯示排名前8位的審稿專家姓名(見圖1)。點(diǎn)擊審稿專家姓名后,即可跳轉(zhuǎn)到信息展示層。
圖1 檢索結(jié)果層的審稿專家推薦結(jié)果Figure 1 The results of recommended peer reviewer in the retrieval result layer
前10篇文章信息是按照關(guān)聯(lián)度評價(jià)指標(biāo)對審稿專家的相關(guān)發(fā)表文獻(xiàn)進(jìn)行評分,然后按照評分從高到低排列。排名第一的審稿專家的前10篇發(fā)表文章與腎衰竭緊密相關(guān),并且文獻(xiàn)來源于《中國中西醫(yī)結(jié)合腎病雜志》等專注于腎臟疾病研究的期刊和學(xué)會(見圖2)。說明在目前的審稿專家數(shù)據(jù)庫中,該審稿專家在腎衰竭等腎臟疾病領(lǐng)域有一定的權(quán)威性。
圖2 按與來源稿件文本關(guān)聯(lián)度從高到低排列的審稿專家前10篇文獻(xiàn)信息Figure 2 Information of the top ten literatures of the peer reviewers ranked from high to low according to the correlation degree with the source manuscript
時(shí)間-發(fā)文量圖則展示了該審稿專家文檔集中與來源稿件關(guān)聯(lián)的文獻(xiàn)數(shù)量隨發(fā)表時(shí)間的變化情況,展現(xiàn)該審稿專家在該研究領(lǐng)域的發(fā)文狀況。排名第一的審稿專家共計(jì)有48篇文獻(xiàn)與檢索詞相關(guān)。自2001年起,該審稿專家就首次進(jìn)行了與腎臟疾病相關(guān)的研究,2008年以后進(jìn)行了持續(xù)研究,2016年發(fā)表量達(dá)到峰值,表明該審稿專家對腎衰竭領(lǐng)域的相關(guān)研究日漸深入;近年來,該審稿專家在腎衰竭領(lǐng)域的相關(guān)研究減少(見圖3)。
圖3 審稿專家與來源稿件相關(guān)的發(fā)文量的時(shí)間序列Figure 3 Time series of peer reviewer’s publications related to source manuscripts
詞云圖展示了該審稿專家與來源稿件相匹配的文檔集的關(guān)鍵詞字段的頻次高低信息。信息檢索平臺利用排名第一的審稿專家的48篇文獻(xiàn)的關(guān)鍵詞頻次構(gòu)建了詞云圖,其中,慢性腎衰竭、慢性腎臟病、糖尿病腎病、結(jié)腸透析等文獻(xiàn)特征詞最為突出(見圖4),表明了該審稿專家的重點(diǎn)研究方向。
圖4 與來源稿件相關(guān)的審稿專家文獻(xiàn)集關(guān)鍵詞的詞云圖Figure 4 Construct Word cloud graphs of keywords from reviewer literature related to source manuscripts
LDA聚類交互式可視化界面則是對審稿專家文獻(xiàn)中與來源稿件相匹配的文獻(xiàn)的標(biāo)題、關(guān)鍵詞、摘要字段信息進(jìn)行LDA算法計(jì)算得到的聚類結(jié)果。通過文本聚類可以有效地降低文本中存在的噪聲,進(jìn)行信息融合,得到文本內(nèi)在的知識結(jié)構(gòu),可以讓期刊編輯對審稿專家的學(xué)術(shù)方向有著更加精準(zhǔn)的認(rèn)知。該界面因整體界面大,單一圖片無法完整展示信息,因此分圖進(jìn)行敘述。該界面共分為兩大部分:第一部分為文檔主題關(guān)聯(lián)度可視化界面;第二部分則展示了選中的主題內(nèi),特征詞與主題關(guān)聯(lián)度的可視化界面。
第一部分內(nèi)容信息見圖5。在這個(gè)界面中,圓圈代表不同的主題,圓圈之間的距離越遠(yuǎn),代表主題之間的相似性越低;圓圈之間有重疊,代表主題彼此的關(guān)鍵詞有交叉;圓圈越大,圓圈內(nèi)的數(shù)字越接近1,表明該主題越能代表該審稿專家的研究主題。在排名第一的審稿專家的LDA聚類圖中,共計(jì)展示了21個(gè)主題,其中主題1圓圈最大,并且與其他主題保持較遠(yuǎn)的距離,與其他主題相似性低,最能代表該審稿專家的研究主題。
圖5 與來源稿件相關(guān)的審稿專家文獻(xiàn)集的聚類分析Figure 5 Cluster analysis of reviewer literature related to source manuscripts
圖6顯示了主題1中按權(quán)重占比從大到小排序的前30個(gè)特征詞,30個(gè)特征詞占該審稿專家48篇文獻(xiàn)所有特征詞的24%權(quán)重。藍(lán)色的部分代表該特征詞占該審稿專家48篇文獻(xiàn)所有特征詞的權(quán)重,紅色的部分代表該特征詞在這個(gè)主題中的權(quán)重,通過調(diào)整λ值,30個(gè)特征詞從上至下的排列順序隨之發(fā)生變化,λ值越靠近0時(shí),排名越靠前的特征詞與該審稿專家的關(guān)聯(lián)度越高,λ值越靠近1時(shí),越靠前的特征詞與該主題的關(guān)聯(lián)度越高。其中,DN、糖尿病腎病、TSP、腎間質(zhì)纖維化、終末期腎臟病、腎組織、終末期、免疫炎癥等特征詞與該審稿專家48篇文獻(xiàn)所有特征詞和主題1的關(guān)聯(lián)度均很高。無論是在文本內(nèi)在的知識屬性還是在詞云圖表明的文本特征詞頻次上,表明該審稿專家在腎衰竭領(lǐng)域的研究有著一定的廣度和深度。
圖6 主題1內(nèi)的前30個(gè)特征詞可視化界面Figure 6 Visual interface of the top 30 characteristic words in topic 1
經(jīng)過對與檢索詞相關(guān)的、排名第一的審稿專家學(xué)術(shù)領(lǐng)域外在特征和內(nèi)在知識架構(gòu)的分析及描述,可得出,在目前的審稿專家數(shù)據(jù)庫中,與檢索詞相關(guān)的、排名第一的該審稿專家在腎衰竭的腎臟疾病研究領(lǐng)域有著一定的權(quán)威性。
面對信息化全域賦能的趨勢,為了彌補(bǔ)編輯部應(yīng)用的勤云采編系統(tǒng)審稿專家獲取和優(yōu)選功能的缺失,提高期刊同行評審機(jī)制的效率與質(zhì)量,本文著重對具有審稿人遴選功能和審稿人信息展示功能的信息檢索網(wǎng)頁平臺功能進(jìn)行了介紹。面對來稿量激增和學(xué)科領(lǐng)域不斷交叉融合的現(xiàn)狀,該網(wǎng)頁平臺在審稿專家數(shù)據(jù)庫完善的前提下,可以為期刊編輯提供具有參考價(jià)值的審稿專家推薦結(jié)果,并可對與來源稿件相關(guān)的審稿專家學(xué)術(shù)領(lǐng)域特征屬性進(jìn)行二次分析,將分析結(jié)果以文字、圖片等可視化界面展現(xiàn)給期刊編輯,提高了期刊編輯獲取審稿專家學(xué)術(shù)領(lǐng)域信息效率,有助于加強(qiáng)期刊編輯對該審稿專家的認(rèn)知。尤其在面對新興的醫(yī)學(xué)領(lǐng)域投稿時(shí),該網(wǎng)頁平臺可以突破期刊編輯在學(xué)術(shù)視野和學(xué)緣結(jié)構(gòu)上的局限性,對學(xué)報(bào)編輯部的審稿專家遴選機(jī)制起到輔助決策的作用,有助于推進(jìn)科技期刊的集群化建設(shè)。