• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      我國圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)發(fā)掘及發(fā)展軌跡探究
      ——基于1992—2022年圖書情報領(lǐng)域核心期刊論文的分析

      2022-10-17 07:31:20沈思湯斌朱曉峰謝靖
      圖書情報知識 2022年4期
      關(guān)鍵詞:學(xué)術(shù)觀點(diǎn)情報學(xué)學(xué)術(shù)思想

      沈思 湯斌 朱曉峰 謝靖

      (1.南京理工大學(xué)經(jīng)濟(jì)管理學(xué)院,南京,210094;2.南京工業(yè)大學(xué)經(jīng)濟(jì)與管理學(xué)院,南京,211816;3.南京中醫(yī)藥大學(xué)經(jīng)貿(mào)管理學(xué)院,南京,210046)

      1 引言

      在圖書情報學(xué)的發(fā)展過程中,關(guān)于圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的研究由來已久,并陸續(xù)有學(xué)者就圖書情報學(xué)的學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)闡發(fā)自己的思考或提出自己的觀點(diǎn)[1-2]。然而,鑒于圖書情報學(xué)的交叉學(xué)科背景和廣泛的理論基礎(chǔ),對圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)的研究整體狀況缺乏歷時、細(xì)顆粒度知識維度上的探討。在學(xué)科體系、學(xué)術(shù)體系、話語體系的背景下梳理和分析圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)依然非常必要,不僅有助于系統(tǒng)地了解和掌握圖書情報學(xué)科在學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)研究上所取得的成就,而且在一定程度上也可以促進(jìn)圖書情報學(xué)的未來工作[3]。

      學(xué)術(shù)思想是由學(xué)術(shù)和思想兩個詞語構(gòu)成的偏正結(jié)構(gòu)的術(shù)語,指與學(xué)術(shù)相關(guān)的“思維的結(jié)果或認(rèn)知的心理歷程”[4],在本文中則主要指與圖書情報學(xué)相關(guān)的學(xué)術(shù)思想[5],比如“杜威圖書館學(xué)教育思想”“信息生態(tài)思想”和“波普爾思想”等,從特征上看具有體系性、主觀性和預(yù)見性,在呈現(xiàn)形式上有顯性和隱性兩種形態(tài)。學(xué)術(shù)觀點(diǎn)的詞語構(gòu)成也是偏正結(jié)構(gòu),在語義上的涵義為學(xué)術(shù)的“研究、分析或批評問題、事物所依據(jù)的立場”[4],在本研究中則主要指與圖書情報學(xué)相關(guān)的學(xué)術(shù)觀點(diǎn)[6],比如“情報系統(tǒng)建設(shè)觀點(diǎn)”“信息熵觀點(diǎn)”和“學(xué)科館員觀點(diǎn)”,而隸屬性、創(chuàng)新性和自我性是其主要的特性,在呈現(xiàn)形式上也有顯性和隱性兩種形態(tài)[7]。

      本研究使用自然語言處理和文本分析方法,對在期刊上發(fā)表的關(guān)于圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)探究的文獻(xiàn)進(jìn)行挖掘和分析,以期總結(jié)和提煉圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的演變和發(fā)展特點(diǎn),并為其他領(lǐng)域的學(xué)者在研究類似問題時提供相應(yīng)的研究思路。在一定程度上,本研究有助于從歷時的角度歸納和總結(jié)圖書情報學(xué)的整體研究狀況,也有益于發(fā)掘隨時間變遷學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)討論深度和廣度的變化,從而可為圖書情報學(xué)研究歷史的梳理、圖書情報學(xué)體系的構(gòu)建等后續(xù)的探究工作提供相應(yīng)的支持。

      2 相關(guān)研究概況

      根據(jù)本文整體的研究內(nèi)容,筆者對圖書情報學(xué)領(lǐng)域中學(xué)術(shù)思想、學(xué)術(shù)觀點(diǎn)的主要研究以及學(xué)術(shù)全文本挖掘的應(yīng)用技術(shù)進(jìn)行了梳理。

      (1)圖情領(lǐng)域?qū)W術(shù)思想的相關(guān)研究。圖書情報理論來源具有廣泛性,學(xué)術(shù)思想從時間跨度上看不僅有現(xiàn)當(dāng)代的也有古代的,并且來源上既有國內(nèi)的也有國外的?,F(xiàn)有研究不僅將諸葛亮、孫子、鬼谷子、管子等思想加以場景化拓展,也借鑒了錢學(xué)森[8]、毛澤東[9]、章學(xué)誠[10]、彭斐章[11]、姚名達(dá)[12]等人的思想。德迪約社會情報思想[13]、貝爾金的情報學(xué)思想[14]、貝爾納的情報交流思想[15]、克勞塞威茨的軍事情報思想[16]和阮岡納贊圖書情報思想[17]也得到了相應(yīng)的探究。具體研究包括:李竹和曹文振[18]從定名、脈絡(luò)和內(nèi)核三個維度對錢學(xué)森情報學(xué)思想研究的情況進(jìn)行了總結(jié)、歸納和分析;譚安洛[9]概述了毛澤東同志決策行為中的情報思想、情報基礎(chǔ)、情報加工和情報思維;許富宏[19]對《鬼谷子》中豐富的情報思想進(jìn)行了概括,并與信息學(xué)的理論和方法相結(jié)合對相應(yīng)的思想進(jìn)行了深度探究;通過文本對比方法,劉忠[20]對《孫子》和《吳子》兩部兵學(xué)經(jīng)典進(jìn)行對比研究,重點(diǎn)闡述兩者在唯物主義的情報認(rèn)識論、實用主義的情報觀等思想方面的相同點(diǎn)和不同點(diǎn);王崇[21]細(xì)致而全面地探究了《管子》中的情報分析思想,以及該書對孫子情報分析思想的繼承和發(fā)展;張守衛(wèi)[22]對我國古典目錄學(xué)的“直齋書錄解題”分類思想進(jìn)行了詳細(xì)的論述;劉春茂[23]回顧了英國著名情報學(xué)家布魯克斯的思想體系并對其所闡釋的情報學(xué)的任務(wù)、遠(yuǎn)景目標(biāo)等核心問題進(jìn)行了細(xì)致和全面的分析;婁銀銀[24]分析了布氏情報學(xué)思想對網(wǎng)絡(luò)信息檢索結(jié)果的優(yōu)化情況。與本研究類似的探究為趙冰峰[25]對中美兩國情報思想演變的梳理,但該探究沒有采用定量手段進(jìn)行分析。上述研究主要是從單一的角度對某一個學(xué)術(shù)思想進(jìn)行分析和探究,缺乏從整個學(xué)科的角度歷時地對圖書情報學(xué)學(xué)術(shù)思想的整體情況進(jìn)行梳理和探析。

      (2)圖書情報學(xué)科代表性學(xué)術(shù)觀點(diǎn)研究?,F(xiàn)有研究圍繞信息檢索、文獻(xiàn)主題與資料、情報學(xué)的體系與學(xué)科等圖書情報學(xué)的主題內(nèi)容展開探究并提出了有代表性的觀點(diǎn)。王知津[26]從薩拉塞維克的情報學(xué)發(fā)展的三大觀點(diǎn)出發(fā),從意義、概念、模型三個方面對信息檢索的互動性進(jìn)行了詳細(xì)闡述并提出了總結(jié)性的觀點(diǎn)。曹樹金[27]討論了國內(nèi)外有關(guān)文獻(xiàn)主題結(jié)構(gòu)的觀點(diǎn),提出了應(yīng)多級設(shè)計文獻(xiàn)主題結(jié)構(gòu)的觀點(diǎn)。通過系統(tǒng)剖析蘭德派和米哈依洛夫派的情報學(xué)觀點(diǎn),杜余培[28]明確而具體地提出了文獻(xiàn)資料是基礎(chǔ)、二次文獻(xiàn)是“鑰匙”、情報研究是手段、情報服務(wù)是目的的觀點(diǎn)。在對波普爾世界3理論、布魯克斯情報學(xué)方程式和引文分析評價的基礎(chǔ)上,李志生[6]闡述了情報的本質(zhì)、情報學(xué)理論基礎(chǔ)、情報科學(xué)研究方法等觀點(diǎn)。通過對新世紀(jì)中國情報學(xué)的發(fā)展走向的展望與思考,肖勇[29]針對學(xué)科建設(shè)路徑方向、學(xué)科研究范式、學(xué)科體系等提出了相應(yīng)的觀點(diǎn)。從實踐的角度,盧宏[30]對長期以來國內(nèi)情報學(xué)領(lǐng)域形成的關(guān)于情報學(xué)學(xué)科性質(zhì)的觀點(diǎn)做了系統(tǒng)的梳理,并對每一種觀點(diǎn)的優(yōu)缺點(diǎn)進(jìn)行了評述。結(jié)合關(guān)于學(xué)術(shù)觀點(diǎn)的定義特征可知,上述觀點(diǎn)均是從研究者自我的探究視角出發(fā)所得出的,觀點(diǎn)具有較強(qiáng)的創(chuàng)新性,同時也有一定的主觀性。

      (3)學(xué)術(shù)全文本挖掘技術(shù)研究?,F(xiàn)有大部分圖情領(lǐng)域?qū)W者采用非數(shù)據(jù)驅(qū)動的方法進(jìn)行學(xué)術(shù)思想與學(xué)術(shù)觀點(diǎn)的研究,而隨著學(xué)術(shù)論文全文本數(shù)據(jù)獲取的便捷性和機(jī)器學(xué)習(xí)技術(shù)的快速發(fā)展,利用自然語言處理和深度學(xué)習(xí)的技術(shù)針對全文本進(jìn)行多個維度和視角下的知識抽取方法也開始為圖情領(lǐng)域?qū)W者采用。在英文學(xué)術(shù)全文本相應(yīng)知識單元抽取研究的基礎(chǔ)上[31-33],漢語學(xué)術(shù)全文本中相應(yīng)知識單元的抽取研究也受到了關(guān)注。例如:陳鋒[34]等通過歸納學(xué)術(shù)論文中理論句子中的實體分布,基于條件隨機(jī)場設(shè)計了理論識別的算法并且最優(yōu)模型的調(diào)和平均值為95.38%;通過多種深度學(xué)習(xí)的方法,張穎怡和章成志[35]針對《情報學(xué)報》學(xué)術(shù)全文中的研究方法句設(shè)計了抽取算法,從整體來看基于BERT的抽取結(jié)果相對其他深度學(xué)習(xí)模型來說較優(yōu);以菊花研究領(lǐng)域的學(xué)術(shù)全文本為數(shù)據(jù)對象,周海晨[36]針對學(xué)術(shù)全文本中的創(chuàng)新句構(gòu)建了深度學(xué)習(xí)抽取模型,并基于所抽取的結(jié)果對學(xué)術(shù)創(chuàng)新進(jìn)行了數(shù)據(jù)驅(qū)動下的探析。一方面,已有研究為本文面向?qū)W術(shù)全文本構(gòu)建學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)表述的抽取模型提供了方法論上的支撐;另一方面,面向漢語學(xué)術(shù)全文本相應(yīng)知識單元抽取的研究還處于起步階段,而學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)表述句的抽取及探究會豐富這一研究領(lǐng)域的內(nèi)容。

      綜上所述,目前尚缺少對圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)的系統(tǒng)性研究,大部分學(xué)者基于非數(shù)據(jù)驅(qū)動的方法進(jìn)行探究,而基于個案數(shù)據(jù)的研究使用的是學(xué)術(shù)論文的摘要數(shù)據(jù)而缺少全文本數(shù)據(jù)的探析,從而導(dǎo)致無法具體而歷時地展現(xiàn)學(xué)術(shù)思想和觀點(diǎn)的演變過程和整體概貌。因此,本文基于國內(nèi)圖書情報學(xué)核心期刊全文本數(shù)據(jù),使用深度學(xué)習(xí)方法構(gòu)建圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)自動標(biāo)注識別模型,在自動抽取模型的基礎(chǔ)上,使用主題模型可視化地描述圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)的發(fā)展軌跡。

      3 圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)發(fā)掘

      本文提出一種面向圖情學(xué)術(shù)全文本的學(xué)術(shù)思想和觀點(diǎn)自動抽取和發(fā)展軌跡識別方法,總體路線如圖1所示。結(jié)合領(lǐng)域內(nèi)的圖書情報學(xué)詞表,通過人工標(biāo)注每篇論文全文本中相關(guān)圖書情報學(xué)學(xué)術(shù)思想與學(xué)術(shù)觀點(diǎn),利用深度學(xué)習(xí)模型構(gòu)建自動化抽取模型,隨后在抽取結(jié)果的基礎(chǔ)上基于主題模型生成圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)的研究主題圖,最后進(jìn)行可視化展現(xiàn)和分析。

      圖1 技術(shù)框架圖Fig.1 Technical Framework

      3.1 抽取模型簡介

      在序列標(biāo)注方法中,本文選擇條件隨機(jī)場(CRF)[37]、Bi-LSTM-CRF[38]模型和BERT[39]模型三種方法進(jìn)行對比。模型選擇的具體原因如下:條件隨機(jī)場模型(CRF)為面向序列化知識抽取的傳統(tǒng)機(jī)器學(xué)習(xí)算法的代表,最大的優(yōu)勢在于克服了隱馬爾可夫模型的缺點(diǎn)并能融入各種特征知識。Bi-LSTM為循環(huán)神經(jīng)網(wǎng)絡(luò)中處理自然語言處理任務(wù)性能較為突出的模型,與CRF的組合模型在處理小規(guī)模文本數(shù)據(jù)時往往能夠達(dá)到最優(yōu)結(jié)果。BERT模型為預(yù)訓(xùn)練模型的代表,在大規(guī)模文本處理上的性能目前是最為突出的。上述三個模型代表了抽取學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的三種方案,筆者對三種模型的性能按照自然語言處理研究的規(guī)范進(jìn)行了對比,最終從中選擇了最優(yōu)的模型來抽取其他學(xué)術(shù)全文本中的學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)。圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)表述的抽取樣例如表1所示。三種模型的原理與樣例分別如圖2-4所示。

      圖2 圖書情報學(xué)術(shù)思想和觀點(diǎn)抽取技術(shù)CRF原理圖Fig.2 Schematic Diagram of CRF in Extracting Аcademic Thoughts and Viewpoints of LΙS

      表1 圖書情報學(xué)術(shù)思想和觀點(diǎn)抽取序列格式樣例Table.1 Sample of Sequence Format of Аcademic Thoughts and Viewpoints Extracted in LΙS

      3.2 訓(xùn)練語料庫構(gòu)建

      圖3 圖書情報學(xué)術(shù)思想和觀點(diǎn)抽取技術(shù)Bi-LSTM-CRF原理圖Fig.3 Schematic Diagram of Bi-LSTM-CRF in Extracting Аacademic Thoughts and Viewpoints of LΙS

      圖4 圖書情報學(xué)術(shù)思想和觀點(diǎn)抽取技術(shù)BERT原理圖Fig.4 Schematic Diagram of BERT in Extracting Cademic Thoughts and Viewpoints of LΙS

      本文從中國知網(wǎng)抓取1992—2022年圖書情報學(xué)核心期刊論文的題錄信息共148,875條①本文圖書情報學(xué)的核心期刊論文由1998—2022年的CSSCΙ收錄期刊論文和1992—1997年的北大核心收錄期刊論文構(gòu)成。原因為CSSCΙ所收錄期刊論文是從1998年開始,為了完整和系統(tǒng)地探尋三十年的學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)發(fā)展?fàn)顩r,本文使用北大核心期刊1992—1997的論文數(shù)據(jù)作為增補(bǔ)。。首先,結(jié)合上文對學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的界定,以“思想”或“觀點(diǎn)”為標(biāo)引詞,面向題錄信息中的標(biāo)題、摘要和關(guān)鍵詞,通過字面匹配抽取含有“思想”或“觀點(diǎn)”的圖書情報論文共6,600篇。其次,結(jié)合對學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)定義的描述,對于題錄信息雖然包含了“思想”和“觀點(diǎn)”,但實際上不是學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的論文進(jìn)行了刪除,比如“……為了提高農(nóng)民的文化素質(zhì),改變農(nóng)民陳舊的【思想】觀念,需要農(nóng)村圖書館這樣的輔助教育基地……”中的“思想”就不屬于本文所界定的學(xué)術(shù)思想范疇。經(jīng)過對6,600篇學(xué)術(shù)論文的逐一核實刪減,最終數(shù)據(jù)集包含3,415篇學(xué)術(shù)論文,之后設(shè)計專門的程序獲取了3,415篇學(xué)術(shù)論文的全文本。數(shù)據(jù)集具體分布如表2所示。

      表2 不同時間段文獻(xiàn)分布情況Table 2 Distribution of Literature in Different Periods

      再次,基于已經(jīng)轉(zhuǎn)化并存儲為文本文件的3,415篇學(xué)術(shù)論文,在有關(guān)圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)界定的基礎(chǔ)上,通過小規(guī)模地觀察學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)在學(xué)術(shù)全文本中的分布情況,制定相應(yīng)的標(biāo)注規(guī)范。最后,在標(biāo)注規(guī)范的基礎(chǔ)上,選取925篇圖書情報學(xué)術(shù)全文本,組織具有圖書情報領(lǐng)域知識的研究生和老師對全文本中的學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)表述進(jìn)行標(biāo)注,并最終構(gòu)建學(xué)術(shù)題錄信息和全文本的學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)表述語料庫。標(biāo)注樣例如圖5所示。

      圖5 學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)標(biāo)注語料樣例Fig.5 Examples of Corpus of Аcademic Thoughts and Viewpoints

      3.3 抽取模型性能對比

      根據(jù)人工校對的由925篇圖書情報學(xué)術(shù)論文所構(gòu)成的語料庫,本文分別將學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)表述進(jìn)行序列標(biāo)簽化,具體標(biāo)簽如表3所示。

      表3 學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)表述標(biāo)記形式Table 3 Expression Marking Form of Аcademic Thoughts and Viewpoints

      基于所構(gòu)建的圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)語料庫,結(jié)合所制定的標(biāo)記集合,通過CRF、Bi-LSTM-CRF和BERT模型,本文構(gòu)建了針對圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)的自動抽取模型。對于所構(gòu)建的模型,本文使用精準(zhǔn)率、召回率和調(diào)和平均值三個指標(biāo)對所構(gòu)建模型的整體性能進(jìn)行判定。在模型的具體構(gòu)建過程中,訓(xùn)練語料和測試語料按照9:1的比例進(jìn)行劃分。具體三個模型的整體性能如圖6所示。

      圖6 三種模型實驗結(jié)果Fig.6 Experimental Results of the Three Models

      如圖6所示,在構(gòu)建學(xué)術(shù)全文本學(xué)術(shù)概念抽取模型中,Bi-LSTM-CRF的效果最佳,平均F值為98.45%,CRF其次,平均F值為91.98%,兩者效果都超過90%。在三個模型中,學(xué)術(shù)觀點(diǎn)的平均F值分別為99.09%、95.22%和91.38%,識別效果相對學(xué)術(shù)思想來說更好。從原因上分析,學(xué)術(shù)觀點(diǎn)的序列通常帶有特定的動詞,如“提出”“考慮”,這一特征能讓學(xué)術(shù)觀點(diǎn)的表述與語料庫中的其他表述有效地區(qū)分開來,而學(xué)術(shù)思想的表述則沒有突出的特征。最終,我們選取Bi-LSTM-CRF模型,對2,490篇圖書情報學(xué)學(xué)術(shù)全文本中學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)表述進(jìn)行標(biāo)注,并對標(biāo)注結(jié)果進(jìn)行人工校對。比如對于“,筆者將以民機(jī)客服競爭情報系統(tǒng)開發(fā)為例,著重探討三個子系統(tǒng)功能模塊的設(shè)計過程?!边@一自動標(biāo)注結(jié)果雖然有“思想”二字,但結(jié)合本文所給出的學(xué)術(shù)思想的界定,人工判定這是一個錯誤的標(biāo)注結(jié)果。在所核對的圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)表述基礎(chǔ)上,本文構(gòu)建了圖書情報學(xué)核心期刊論文學(xué)術(shù)思想和觀點(diǎn)表述語料庫,并基于該語料庫對圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)的主題進(jìn)行探析。

      3.4 主題識別模型

      LDА是經(jīng)典的主題挖掘模型[40],近年來隨著深度學(xué)習(xí)的發(fā)展,lda2vec[41]主題模型隨之出現(xiàn)。在針對學(xué)術(shù)文本主題知識的挖掘過程中,lda2vec將LDА和深度學(xué)習(xí)中的低維向量表示方法進(jìn)行密切融合,不僅發(fā)揮了LDА主題模型在文檔生成時不同主題能夠混合的優(yōu)點(diǎn),而且有機(jī)融入了神經(jīng)網(wǎng)絡(luò)模型將文本表示為稠密向量的特點(diǎn),能夠精準(zhǔn)地獲取主題知識。為了解決數(shù)據(jù)過擬合的問題,本文對圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)表述向量和主詞向量(pivot word vector)進(jìn)行了隨機(jī)失活(dropout)處理。lda2vec模型的訓(xùn)練由兩部分構(gòu)成,一部分用于訓(xùn)練得到圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)表述的不同主題所占比重的信息,另一部分在主詞(pivot word)和目標(biāo)詞(target word)確定的情況下,學(xué)習(xí)語境向量(context vector)的向量表示。舉例來說,如果一篇主題偏重圖書情報學(xué)觀點(diǎn)的文章,出現(xiàn)“管理”這個詞,按照通常的詞向量表示,這個詞的上下位詞的預(yù)測會接近于“員工”“領(lǐng)導(dǎo)”等名詞;但如果在得到這個詞在本篇文檔的語境向量表示的情況下,相應(yīng)的上下位詞應(yīng)該更接近于“知識管理”“數(shù)據(jù)管理”等詞匯或者術(shù)語。

      表 5 學(xué)術(shù)觀點(diǎn)主題結(jié)果Table 5 The Excavating Result of Topics of Аcademic Viewpoints

      針對學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的主題識別,本文所設(shè)置的lda2vec的參數(shù)如下:本文對6個時間段的3,415篇文獻(xiàn)進(jìn)行主題劃分,在多次調(diào)參之后,將主題數(shù)設(shè)置為25,平均每個時間段文獻(xiàn)主題數(shù)為4。負(fù)采樣指數(shù)β設(shè)置為0.75,集中參數(shù)α設(shè)置為0.04,Dirichlet調(diào)和參數(shù)λ為500。學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)主題向量、文檔向量和詞向量的學(xué)習(xí)率均設(shè)為1e-3。本文將1992—2022年圖書情報全文本數(shù)據(jù)集以5年為一個時段進(jìn)行劃分②最后一個時間段的跨度為2017—2022,所跨度的時間為6年。,并把不同時間段的標(biāo)注語料輸入到上述主題模型中,從而得到學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的主題結(jié)果。表4和表5展現(xiàn)了圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)在不同時間段的主題詞和對應(yīng)主題概率的結(jié)果。

      表4 學(xué)術(shù)思想主題結(jié)果Table 4 The Excavating Result of Topics of Аcademic Thoughts

      4 圖書情報學(xué)學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)發(fā)展分析

      4.1 圖書情報學(xué)學(xué)術(shù)思想發(fā)展分析

      由圖7可知,不同時段所聚焦的學(xué)術(shù)思想均有一定的變化,每個階段具有自身研究的熱點(diǎn)和趨勢。從主題可以看出,學(xué)術(shù)思想既具有整體貫穿性,也具有實時變化性,比如目錄學(xué)相關(guān)的思想基本上貫穿了圖書情報研究的始終,新的學(xué)術(shù)思想也折射出新的研究方向和趨勢。

      圖7 圖書情報學(xué)學(xué)術(shù)思想發(fā)展軌跡河流圖Fig.7 River Map of the Development Track of Аcademic Thoughts in LΙS

      (1)1992—1996年。這一時段的代表性主題由“毛澤東思想、章氏目錄學(xué)思想、杜威的圖書館學(xué)教育思想、阮氏分類思想”等構(gòu)成?!懊珴蓶|思想”主要涉及到高校圖書館教育和圖書館的建設(shè)指導(dǎo)思想兩方面的內(nèi)容?!罢率夏夸泴W(xué)思想”包含了章學(xué)誠的辨考、互著別裁、索引和分類等內(nèi)容?!岸磐膱D書館學(xué)教育思想”主要涵蓋了杜威圖書館學(xué)教育思想形成的歷程、核心內(nèi)容以及對中國圖書館教育的價值和意義等內(nèi)容?!叭钍戏诸愃枷搿敝饕巳顚{贊分類思想的傳播、核心內(nèi)容、重要作用和歷史地位等內(nèi)容。

      (2)1997—2001年。這一時段的代表性主題主要由“讀者為本思想、目錄學(xué)思想、人本思想、數(shù)字圖書館”等構(gòu)成?!白x者為本思想”的主題主要涉及到圖書信息系統(tǒng)的設(shè)計、圖書館管理原則和與讀者的關(guān)系等內(nèi)容?!澳夸泴W(xué)思想”的主題主要圍繞錢大昕的目錄學(xué)、毛坤的目錄學(xué)、目錄學(xué)應(yīng)用于特定領(lǐng)域文本等方面展開。“人本思想”的主題主要包含了圖書館管理模式的構(gòu)建、中國傳統(tǒng)的人本思想的內(nèi)涵、以人為中心的管理思想等研究內(nèi)容。“數(shù)字圖書館”相關(guān)的主題主要涵蓋了數(shù)字圖書館的中國特色、互聯(lián)網(wǎng)與數(shù)字圖書館、文獻(xiàn)保障和文獻(xiàn)信息開發(fā)等方面。

      (3)2002—2006年。這一時段的代表性主題主要由“知識管理、波普爾思想、引文分析、顧氏校勘學(xué)思想”等構(gòu)成。“知識管理”相關(guān)的主題主要圍繞知識管理與知識創(chuàng)新、知識管理與信息資源和服務(wù)體系的關(guān)系、知識管理與圖書館管理等內(nèi)容展開。“波普爾思想”的研究主題主要涵蓋了波普爾的三個世界理論、知識論及其在情報學(xué)中的應(yīng)用等內(nèi)容?!耙姆治觥钡难芯恐黝}主要涉及了加菲爾德和普賴斯的思想、引文分析數(shù)據(jù)庫、定量評價等內(nèi)容。“顧氏??睂W(xué)思想”的研究主題主要由顧氏??彼枷氲男纬?、“不校校之”思想闡發(fā)、顧氏??彼枷氲挠绊懙葍?nèi)容構(gòu)成。

      (4)2007—2011年。這一時段的代表性主題主要由“梁啟超近代目錄學(xué)、波特價值鏈思想、知識管理思想和文獻(xiàn)學(xué)思想”等內(nèi)容構(gòu)成。“梁啟超近代目錄學(xué)”的研究主題主要由分科設(shè)學(xué)、維新思想和目錄學(xué)的專著等內(nèi)容構(gòu)成?!安ㄌ貎r值鏈思想”的研究主要圍繞該思想的發(fā)展歷程、圖書館業(yè)務(wù)價值鏈模型構(gòu)建和圖書館讀者關(guān)系管理等方面展開?!爸R管理思想”仍然是這一時段的熱點(diǎn)研究主題,其研究主題主要由參考咨詢與知識管理的關(guān)系探討、知識管理與專業(yè)圖書館數(shù)字資源整合兩方面內(nèi)容構(gòu)成?!拔墨I(xiàn)學(xué)思想”的研究主題主要涵蓋了周永年文獻(xiàn)學(xué)思想、王欣夫文獻(xiàn)學(xué)思想、洪業(yè)現(xiàn)代文獻(xiàn)學(xué)思想等內(nèi)容。

      (5)2012—2016年。這一時段的代表性主題主要由“杜定友的公共圖書館思想、知識系統(tǒng)工程、信息生態(tài)思想、本體論”等構(gòu)成?!岸哦ㄓ训墓矆D書館思想”的研究主要包括了杜定友的公共圖書館思想的形成過程、主要內(nèi)容以及對中國圖書館學(xué)的研究等?!爸R系統(tǒng)工程”的研究主要涵蓋了虛擬參考咨詢服務(wù)、知識管理理念和咨詢平臺的搭建等內(nèi)容?!靶畔⑸鷳B(tài)思想”的研究主要包括了信息生態(tài)中的倫理、競爭情報系統(tǒng)范式和信息生態(tài)鏈等研究內(nèi)容。“本體論”的研究主題主要包括了語義網(wǎng)的構(gòu)建和本體論在應(yīng)急事件中的應(yīng)用兩方面的內(nèi)容。

      (6)2017—2022年。這一時段的代表性主題主要由“巴克蘭德圖書情報學(xué)思想、知識集成思想、知識元思想和安全情報思想”等構(gòu)成?!鞍涂颂m德圖書情報學(xué)思想”的研究主要包括了巴克蘭德圖書情報學(xué)思想的內(nèi)涵、價值和影響等內(nèi)容。“知識集成思想”的研究主要涵蓋了知識集成思想形成的歷程、知識集成在圖書館中的應(yīng)用和知識集成與信息存儲的關(guān)聯(lián)等內(nèi)容。“知識元思想”的研究主要包含了知識元思想的理論溯源、知識元與圖書館的關(guān)系、知識元在出版上應(yīng)用等內(nèi)容。“安全情報思想”的研究主要包括了總體國家安全觀、國家安全情報理論及安全情報思想的應(yīng)用等內(nèi)容。

      4.2 圖書情報學(xué)學(xué)術(shù)觀點(diǎn)發(fā)展分析

      隨著圖書情報學(xué)的學(xué)科建設(shè)不斷發(fā)展和完善,在此過程中學(xué)者們提出了各種觀點(diǎn)。相較于學(xué)術(shù)思想,學(xué)術(shù)觀點(diǎn)更加多樣和更及時地反映了圖書情報學(xué)的研究方向和趨勢。圖8的六個時段呈現(xiàn)出了當(dāng)時學(xué)界所關(guān)注的研究主題,比如“目錄學(xué)觀點(diǎn)、認(rèn)知情報學(xué)觀點(diǎn)、定量和定性評價、學(xué)科館員、輿情觀點(diǎn)、輿情演化觀點(diǎn)”等。

      圖8 圖書情報學(xué)學(xué)術(shù)觀點(diǎn)發(fā)展軌跡河流圖Fig.8 River Map of the Development Track of Аcademic Viewpoints in LΙS

      (1)1992—1996年。這一時段的圖書情報學(xué)研究觀點(diǎn)主題主要集中在“目錄學(xué)”“讀者服務(wù)”和“圖書館管理”三個方面?!澳夸泴W(xué)”主要是圍繞鄭樵、章學(xué)誠等的觀點(diǎn)進(jìn)行探究,比如“六經(jīng)皆史”“道寓于器”等。從河流圖的“讀者服務(wù)”和“圖書館管理”兩個主題可知這一時間段內(nèi)有關(guān)圖書館學(xué)的觀點(diǎn)相對較多,這也與圖書情報學(xué)的研究和發(fā)展歷程相吻合。

      (2)1997—2001年。這一時段的圖書情報學(xué)學(xué)術(shù)觀點(diǎn)主要圍繞“藏書、圖書館哲學(xué)、認(rèn)知情報學(xué)和情報系統(tǒng)建設(shè)”展開?!安貢彼岢龅挠^點(diǎn)主要圍繞藏書樓與圖書館的關(guān)系、藏書具體政策、知名藏書家等方面進(jìn)行探析,而“圖書館哲學(xué)”主要圍繞與圖書館相關(guān)的哲學(xué)體系和圖書館哲學(xué)著作展開?!罢J(rèn)知情報學(xué)”是這一時期情報學(xué)領(lǐng)域所提出觀點(diǎn)最多的研究主題之一,主要針對認(rèn)知情報學(xué)的原理以及認(rèn)知情報學(xué)與檢索和計量相結(jié)合的應(yīng)用點(diǎn)兩個方面進(jìn)行探究?!扒閳笙到y(tǒng)建設(shè)”這一觀點(diǎn)下的研究主要圍繞情報系統(tǒng)的設(shè)計與情報的傳遞兩方面進(jìn)行探索。

      (3)2002—2006年。這一時段的圖書情報學(xué)的學(xué)術(shù)觀點(diǎn)主要由“藏書、數(shù)字資源、定量和定性評價、信息服務(wù)”等主題構(gòu)成?!安貢敝饕獓@中國古代藏書和將藏書用之于學(xué)術(shù)研究兩個方面展開觀點(diǎn)探究?!皵?shù)字資源”主要針對數(shù)字資源的存儲、數(shù)字資源的網(wǎng)絡(luò)化轉(zhuǎn)換和數(shù)字圖書館等展開探析?!岸亢投ㄐ栽u價”主要圍繞評價指標(biāo)權(quán)重、引文分析法和間接評價等方面展開探究。“信息服務(wù)”主要圍繞學(xué)科館員和人格化信息服務(wù)兩個方面展開。

      (4)2007—2011年。這一時段的圖書情報學(xué)學(xué)術(shù)觀點(diǎn)主要圍繞“知識服務(wù)、系統(tǒng)論、耗散結(jié)構(gòu)和學(xué)科館員”等內(nèi)容展開。“知識服務(wù)”主要涵蓋了圖書館視角下的知識服務(wù)內(nèi)涵與外延、數(shù)字圖書館和知識服務(wù)模式三個方面?!跋到y(tǒng)論”主要包括了系統(tǒng)論在圖書情報中的內(nèi)涵與外延、社會系統(tǒng)工程、系統(tǒng)論的應(yīng)用等內(nèi)容?!昂纳⒔Y(jié)構(gòu)”所指的結(jié)構(gòu)為遠(yuǎn)離平衡的一種非線性呈現(xiàn),在圖書情報學(xué)的學(xué)術(shù)觀點(diǎn)上主要是圍繞數(shù)字環(huán)境下的圖書館運(yùn)行和圖書館系統(tǒng)的非平衡性兩個方面展開探究。關(guān)于“學(xué)科館員”這一制度,圖書情報學(xué)的相關(guān)學(xué)術(shù)觀點(diǎn)主要針對學(xué)科館員術(shù)語溯源、學(xué)科館員的發(fā)展方向和學(xué)科館員的服務(wù)等內(nèi)容展開探究。

      (5)2012—2016年。這一時段的圖書情報學(xué)學(xué)術(shù)觀點(diǎn)主要由“社會認(rèn)知、輿情和信息熵”等內(nèi)容構(gòu)成?!吧鐣J(rèn)知”涵蓋了對信息行為研究的認(rèn)知觀點(diǎn)、認(rèn)知理論的觀點(diǎn)和社會認(rèn)知下的信息機(jī)制等方面的內(nèi)容。隨著移動互聯(lián)網(wǎng)和信息智能化的發(fā)展,“輿情”的信息化、網(wǎng)絡(luò)化和實時交互性成為了這一時段的重要特征,圖書情報學(xué)領(lǐng)域有關(guān)“輿情”的學(xué)術(shù)觀點(diǎn)研究主要包括了界定網(wǎng)絡(luò)輿情場、輿情受眾和輿情監(jiān)測等內(nèi)容。“信息熵”的觀點(diǎn)主要與信息資源評價研究相關(guān)。

      (6)2017—2022年。這一時段的圖書情報學(xué)學(xué)術(shù)觀點(diǎn)由“圖書館教育、閱讀學(xué)、讀者第一和輿情演化”等內(nèi)容構(gòu)成?!皥D書館教育”主要包括了對杜定友圖書館學(xué)教育觀點(diǎn)的探析、圖書館學(xué)教育與圖書館事業(yè)發(fā)展的關(guān)系和圖書館學(xué)教育的困頓等內(nèi)容?!伴喿x學(xué)”主要涵蓋了網(wǎng)絡(luò)閱讀行為、閱讀習(xí)慣和閱讀理論等內(nèi)容?!白x者第一的觀點(diǎn)”涉及到了圖書館的讀者史、創(chuàng)建讀者學(xué)和讀者中心論等內(nèi)容。隨著對“輿情”研究的系統(tǒng)化和體系化,“輿情演化”成為了這一時段學(xué)術(shù)觀點(diǎn)所討論的主要主題,具體涵蓋了個體間的行為動機(jī)、情感作用和智能推薦機(jī)制等研究內(nèi)容。

      5 結(jié)語

      話語體系建立在學(xué)科體系和學(xué)術(shù)體系之上,而學(xué)術(shù)思想與學(xué)術(shù)觀點(diǎn)則是學(xué)科體系和學(xué)術(shù)體系的核心構(gòu)成要素。在探討構(gòu)建圖書情報學(xué)學(xué)科體系、學(xué)術(shù)體系和話語體系大背景下,從微觀角度對學(xué)術(shù)思想與觀點(diǎn)進(jìn)行抽取及主題挖掘并對其發(fā)展軌跡進(jìn)行探究具有特定的時代價值和意義。面向?qū)W術(shù)全文本,圍繞學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)所形成的領(lǐng)域知識探尋模式為相關(guān)的探究提供了方法論上的借鑒。通過歷時地分析三十年來圖書情報學(xué)的學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的演化,一方面具體而體系化地探尋了學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的階段化特點(diǎn)和總體性發(fā)展趨勢,另一方面從學(xué)術(shù)思想和學(xué)術(shù)觀點(diǎn)的維度上為加快構(gòu)建中國特色圖書情報學(xué)的學(xué)科體系、學(xué)術(shù)體系、話語體系提供了前期支撐。雖然本文對圖書情報學(xué)學(xué)術(shù)思想和觀點(diǎn)進(jìn)行了發(fā)掘并對發(fā)展軌跡進(jìn)行了相應(yīng)的探究,但如何把深度學(xué)習(xí)模型與文本數(shù)據(jù)進(jìn)行更加密切地結(jié)合,以及對所發(fā)掘出來的主題知識進(jìn)行深度、全面和體系化的分析,還需進(jìn)一步深入和強(qiáng)化。

      致謝:在整個論文的框架搭建、模型構(gòu)建和結(jié)果分析過程中,南京大學(xué)蘇新寧教授均進(jìn)行了細(xì)致和全面的指導(dǎo),在此對蘇新寧教授給予本論文的指導(dǎo)和幫助致以衷心的感謝!

      作者貢獻(xiàn)說明

      沈思:提出研究思路,論文起草;

      湯斌:進(jìn)行實驗,論文最終版本修訂;

      朱曉峰:采集、清洗和分析數(shù)據(jù);

      謝靖:撰寫論文。

      支撐數(shù)據(jù)

      支撐數(shù)據(jù)由作者自存儲,E-mail120107022851@njust.edu.cn。

      1.湯斌. papers_data.xlsx.學(xué)術(shù)文獻(xiàn)數(shù)據(jù).

      2.湯斌.pytorch_model.bin.圖情構(gòu)成要素標(biāo)注模型.

      猜你喜歡
      學(xué)術(shù)觀點(diǎn)情報學(xué)學(xué)術(shù)思想
      開放與融合:公安情報學(xué)進(jìn)入情報學(xué)方式研究*
      情報雜志(2022年10期)2022-10-20 03:25:42
      關(guān)于大分流的獨(dú)特探索——兼談馬德斌學(xué)術(shù)觀點(diǎn)與加州學(xué)派的差別
      《張道一學(xué)術(shù)思想研究》簡介
      藏族音樂研究中的原創(chuàng)性學(xué)術(shù)觀點(diǎn)及其價值——以西藏音樂史的分期問題為例
      構(gòu)建中國特色的情報學(xué)
      陳陽春研究員學(xué)術(shù)思想略論
      方慎盦及其學(xué)術(shù)思想考略
      數(shù)據(jù)挖掘技術(shù)在情報學(xué)領(lǐng)域的應(yīng)用
      河南科技(2014年11期)2014-02-27 14:16:48
      知識管理視域下的圖書情報學(xué)研究
      河南科技(2014年4期)2014-02-27 14:07:36
      第二十一屆國際軍事歷史研討會學(xué)術(shù)觀點(diǎn)綜述
      軍事歷史(1995年6期)1995-08-21 05:58:24
      平湖市| 始兴县| 阆中市| 布尔津县| 祁连县| 黄骅市| 凤城市| 远安县| 钦州市| 武宣县| 个旧市| 拜城县| 竹北市| 双江| 班玛县| 大埔县| 天等县| 大渡口区| 禹州市| 顺昌县| 霍林郭勒市| 东宁县| 怀柔区| 合阳县| 那坡县| 滁州市| 积石山| 重庆市| 旌德县| 凉山| 故城县| 广元市| 保德县| 镇康县| 绥芬河市| 治多县| 洪江市| 合阳县| 陕西省| 托克托县| 张家界市|