摘要:想要完善并健全建設(shè)領(lǐng)域?qū)W科方法庫(kù),那么就需要識(shí)別圖書情報(bào)領(lǐng)域中的研究方法。因此需要對(duì)現(xiàn)有的研究方法進(jìn)行探究分析,并且從各項(xiàng)數(shù)據(jù)中獲取相應(yīng)的難點(diǎn)內(nèi)容,本文依靠圖書情報(bào)學(xué)以及計(jì)算機(jī)學(xué)之間知識(shí)的流通特性,提出知識(shí)角色遷移規(guī)律,并對(duì)數(shù)據(jù)進(jìn)行批量標(biāo)注,同時(shí)也需要應(yīng)用深度學(xué)習(xí)模型。經(jīng)研究證明此法值得進(jìn)行推廣和應(yīng)用,可以從大規(guī)模文本中識(shí)別圖書情報(bào)學(xué)的研究方法。
關(guān)鍵詞:知識(shí)角色遷移;圖書情報(bào)學(xué);研究方法識(shí)別
引言:從我國(guó)目前圖書情報(bào)領(lǐng)域的發(fā)展?fàn)顩r來看,照比之前現(xiàn)有的方法識(shí)別研究已經(jīng)取得了一定的進(jìn)步,而且在實(shí)際進(jìn)行的過程中通常會(huì)應(yīng)用NLP以及深度學(xué)習(xí)技術(shù)。當(dāng)前我國(guó)現(xiàn)存的識(shí)別模型可以在學(xué)習(xí)文本中詞匯、語法以及語義等特征的同時(shí),識(shí)別抽取研究方法實(shí)體。圖書情報(bào)學(xué)是一項(xiàng)較為復(fù)雜的學(xué)科,而且其研究方法多種多樣,除了文獻(xiàn)計(jì)量法、引文網(wǎng)絡(luò)法等常見的圖書情報(bào)學(xué)方法,還會(huì)融合其他學(xué)科的技術(shù)方法。
一、研究方法實(shí)體識(shí)別概述
研究方法識(shí)別換一種說法就是信息抽取問題,簡(jiǎn)單來說就是在圖書或者是文本之中抽取描述方法的詞語或者是語句。從形式上來講,與它相近的任務(wù)還包括研究任務(wù)識(shí)別、理論術(shù)語抽取以及知識(shí)元抽取等,最開始研究這個(gè)話題時(shí)主要是應(yīng)用基于規(guī)則的方法。當(dāng)前我國(guó)科學(xué)技術(shù)手段以及信息技術(shù)手段也在不斷地優(yōu)化和完善,因此用于研究方法識(shí)別的技術(shù)也更加成熟,當(dāng)前機(jī)器學(xué)習(xí)以及NLP技術(shù)照比之前也更加完善,而且目前大部分的研究主要以將信息抽取轉(zhuǎn)化為機(jī)器可解的標(biāo)簽判定問題為主,現(xiàn)階段,在實(shí)際進(jìn)行研究方法識(shí)別工作的過程中通常會(huì)應(yīng)用多類別分類或者是序列標(biāo)注的方法,進(jìn)而得到文本中包含的方法類實(shí)體。
現(xiàn)階段我國(guó)研究人員對(duì)于圖書情報(bào)學(xué)研究方法識(shí)別也進(jìn)行了大量的研究,并不斷進(jìn)行探究和分析,從目前的研究成果來看,在圖書情報(bào)學(xué)之中方法實(shí)體識(shí)別已經(jīng)取得了很大的進(jìn)步。而且目前統(tǒng)計(jì)學(xué)以及相關(guān)技術(shù)也更加完善,因此目前主要以機(jī)器學(xué)習(xí)為主,逐漸取代了模塊學(xué)習(xí)的地位。以機(jī)器學(xué)習(xí)為主進(jìn)行實(shí)體識(shí)別其效果更加明顯,也更加優(yōu)質(zhì),但是其在使用的過程中也存在一定的弊端,在實(shí)際應(yīng)用的過程中,主要是依靠大規(guī)模以及高質(zhì)量的訓(xùn)練樣本。但是受到跨學(xué)科的特性以及學(xué)科知識(shí)內(nèi)容交叉的影響,在圖書情報(bào)學(xué)之中研究方法來源更加廣泛,各類型之間也存在一定的差異性,目前現(xiàn)有的方法語料庫(kù)主要是應(yīng)用人工標(biāo)準(zhǔn)的形式完成數(shù)據(jù)的集構(gòu)建,但是其成本較高,文本主體類型較為單一,并且在數(shù)據(jù)體量方面也存在一定的局限性。因此研究人員需要針對(duì)這一問題進(jìn)一步進(jìn)行探究和分析,進(jìn)而實(shí)現(xiàn)自建研究方法識(shí)別模型的訓(xùn)練擬合,推動(dòng)圖書情報(bào)學(xué)的發(fā)展和進(jìn)步[1]。
二、知識(shí)角色遷移的顯現(xiàn)機(jī)理
知識(shí)遷移在遷移學(xué)領(lǐng)域中的重要內(nèi)容,也是其理論基礎(chǔ),知識(shí)遷移主要是將源領(lǐng)域中學(xué)習(xí)到的知識(shí)更好地應(yīng)用到目標(biāo)領(lǐng)域之中,進(jìn)而幫助目標(biāo)問題進(jìn)行求解。而圖書情報(bào)學(xué)是一種教學(xué)復(fù)雜且繁瑣的學(xué)科,其融合交叉了多種學(xué)科內(nèi)容,比如說自然科學(xué)、技術(shù)科學(xué)以及社會(huì)科學(xué),在其發(fā)展進(jìn)步的過程中,需要不斷地融合吸收其知識(shí)內(nèi)容。隨著我國(guó)經(jīng)濟(jì)社會(huì)的不斷進(jìn)步,越來越多的研究人員投身至科學(xué)技術(shù)以及信息技術(shù)領(lǐng)域的研究之中,而且也取得了很大的進(jìn)步,并且也在不斷地進(jìn)行完善和優(yōu)化,科學(xué)技術(shù)手段以及信息技術(shù)手段也在不斷地創(chuàng)新,而實(shí)際進(jìn)行工作的過程中不難發(fā)現(xiàn),計(jì)算機(jī)領(lǐng)域與圖書情報(bào)領(lǐng)域之間的知識(shí)角色遷移也愈加明顯,研究人員在實(shí)際對(duì)圖書情報(bào)學(xué)進(jìn)行研究探究的過程中,通常會(huì)應(yīng)用到大量的計(jì)算機(jī)算法、模型、工具以及計(jì)算機(jī)系統(tǒng)。我國(guó)研究學(xué)者張瑞等對(duì)于圖書情報(bào)學(xué)中的知識(shí)角色遷移也進(jìn)行了大量的研究,并且對(duì)圖書情報(bào)學(xué)中的知識(shí)流入特點(diǎn)進(jìn)行進(jìn)一步分析,并明確指出在眾多學(xué)科之中,相對(duì)而言計(jì)算機(jī)學(xué)科輸出圖書情報(bào)學(xué)中知識(shí)內(nèi)容最多。而且以作者發(fā)文角度為出發(fā)點(diǎn),也可以看出計(jì)算機(jī)學(xué)科與圖書情報(bào)學(xué)科之間存在緊密的關(guān)聯(lián)性。
總體來看,學(xué)科之間的交叉學(xué)習(xí)以及一個(gè)學(xué)科的交叉特性一般都會(huì)在研究方法之中展現(xiàn)出來。其實(shí)現(xiàn)階段知識(shí)產(chǎn)生知識(shí)內(nèi)容的主要方式還是跨學(xué)科合作以及多學(xué)科知識(shí)交叉,對(duì)于圖書情報(bào)學(xué)之中,主要是以計(jì)算機(jī)學(xué)科為主不斷對(duì)其進(jìn)行影響和滲透,在圖書情報(bào)領(lǐng)域之中為了解決出現(xiàn)的各種研究問題,通常會(huì)應(yīng)用計(jì)算機(jī)學(xué)科之中的各種算法、模型以及工具等[2]。
三、研究思路概述
目前在圖書情報(bào)學(xué)之中較為突出的一個(gè)問題就是研究方法自動(dòng)識(shí)別問題,因此以計(jì)算機(jī)學(xué)科向圖書情報(bào)學(xué)進(jìn)行知識(shí)角色遷移規(guī)律為基礎(chǔ),建立一種基于弱監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型,并且在此過程中,研究人員以及相關(guān)工作人員需要進(jìn)行大量標(biāo)準(zhǔn)樣本的訓(xùn)練擬合,這樣做的目的是更有效地實(shí)現(xiàn)高精準(zhǔn)度以及魯棒的圖書情報(bào)性研究方法識(shí)別,進(jìn)而促進(jìn)其發(fā)展和進(jìn)步,整體框架如圖1所示。
圖1研究方法實(shí)體識(shí)別整體框架
從圖1中不難看出,可以將整體框架分為三個(gè)流程:(1)數(shù)據(jù)獲取以及預(yù)處理:首先,工作人員可以利用信息網(wǎng)絡(luò)技術(shù)收集獲取源數(shù)據(jù);其次應(yīng)用字典并結(jié)合bootstrapping自學(xué)習(xí)策略,進(jìn)而獲取圖書情報(bào)學(xué)中文本中的方法字典集;最后,需要對(duì)圖書情報(bào)領(lǐng)域中文本數(shù)據(jù)進(jìn)行一定的匹配,在這一過程中通常會(huì)應(yīng)用計(jì)算機(jī)學(xué)科中的算法以及模型等實(shí)體,而且受到計(jì)算機(jī)學(xué)科向圖書情報(bào)學(xué)領(lǐng)域知識(shí)角色遷移規(guī)律的影響,將出現(xiàn)在圖書情報(bào)文獻(xiàn)中的計(jì)算機(jī)算法或者是模型當(dāng)作其研究識(shí)別方法,這樣才能獲取圖書情報(bào)學(xué)領(lǐng)域中關(guān)于方法實(shí)體的標(biāo)注數(shù)據(jù)。(2)深度學(xué)習(xí)模型選擇:再次過程中選擇利用三種較為先進(jìn)且應(yīng)用較為廣泛的神經(jīng)網(wǎng)絡(luò)模型,即LSTM+CRF、BERT、ALBERT,然后工作人員利用實(shí)驗(yàn)檢測(cè)方法實(shí)體識(shí)別的效果。(3)方法實(shí)體識(shí)別:應(yīng)用通過訓(xùn)練擬合之后的模型完成學(xué)術(shù)文本中研究方法的識(shí)別。
結(jié)語:綜上所述,本文對(duì)研究方法實(shí)體識(shí)別進(jìn)行詳細(xì)說明,并且對(duì)知識(shí)角色遷移的顯現(xiàn)機(jī)理進(jìn)行進(jìn)一步探究,同時(shí)詳細(xì)解釋了其研究思路,并且研究方法實(shí)體識(shí)別的整體框架進(jìn)行探究和分析。從中不難發(fā)現(xiàn),計(jì)算機(jī)學(xué)科與圖書情報(bào)學(xué)領(lǐng)域之間存在大量的知識(shí)角色遷移,而且其學(xué)科知識(shí)內(nèi)容教學(xué)較為明顯,同時(shí)在進(jìn)行圖書情報(bào)學(xué)中研究方法識(shí)別的過程中,通常會(huì)應(yīng)用到計(jì)算領(lǐng)域的算法和模型,因此在今后的發(fā)展之中值得被進(jìn)一步研究分析。
參考文獻(xiàn):
[1]李鵬程,程齊凱.知識(shí)角色遷移視域下圖書情報(bào)學(xué)研究方法識(shí)別[J].情報(bào)雜志:1-7.
[2]孫琳,孫向榮.知識(shí)轉(zhuǎn)移視角下中國(guó)圖書情報(bào)學(xué)六種合著關(guān)系探析[J].內(nèi)蒙古科技與經(jīng)濟(jì),2021(11):134-137139.
作者簡(jiǎn)介:李佳蓮;1985.8;女;漢族;四川省眉山市;大學(xué)本科;講師;研究方向:圖書情報(bào);單位:四川工商學(xué)院圖書館。