• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于文獻(xiàn)資料科技查新關(guān)鍵詞的選擇方法

      2021-04-11 16:23:42謝雨珊
      甘肅科技 2021年18期
      關(guān)鍵詞:查新檢索文獻(xiàn)

      張 勇,謝雨珊

      (1.甘肅省科學(xué)技術(shù)情報研究所,甘肅 蘭州 730000;2.蘭州交通大學(xué)外國語學(xué)院,甘肅 蘭州 730070)

      近年來科學(xué)技術(shù)高速發(fā)展,科技查新委托量迅猛增長,公眾對科技文獻(xiàn)查新服務(wù)質(zhì)量的要求越來越高。科技查新已成為成果轉(zhuǎn)化、新產(chǎn)品鑒定、科技進(jìn)步獎評定、設(shè)立創(chuàng)新基金、專利申請和科研立項等申報過程中必不可少的一環(huán)。至2009 年世界上總計有超過5000 萬篇科技論文[1],而每年新增的期刊論文數(shù)量超250 萬[2],同時專利申請量的劇增帶來了巨量專利文獻(xiàn)。如何從海量的數(shù)據(jù)庫中挖掘出符合查新項目所屬技術(shù)要求的相關(guān)文獻(xiàn),給查新工作提出了更高的要求,查新質(zhì)量管控建設(shè)對查新機(jī)構(gòu)越發(fā)重要。在開展科技查新時,關(guān)鍵詞、檢索式是重中之重。如何全、準(zhǔn)、快地從數(shù)據(jù)庫獲得相關(guān)文獻(xiàn),并不是十分容易的事。一方面,查新員受知識面、外語水平、文獻(xiàn)檢索能力等綜合業(yè)務(wù)素質(zhì)和社會責(zé)任感的影響,阻礙了其對委托查新項目包含的技術(shù)要點深層次的理解;另一方面,委托人由于各種原因不能通過技術(shù)交底書將項目的技術(shù)要點充分地表達(dá)出來;再有,沒有建立一套規(guī)范的查新標(biāo)準(zhǔn)化工作程序和使用科學(xué)的檢索方法。實際上,查新機(jī)構(gòu)已經(jīng)意識到以上問題的存在,同時已經(jīng)在逐步改進(jìn)其工作方法并研究制定相應(yīng)的工作流程,如開展查新人員業(yè)務(wù)培訓(xùn)、進(jìn)行工作心得交流、舉辦委托人學(xué)習(xí)班、設(shè)置受理業(yè)務(wù)崗等。而“關(guān)鍵詞”的選擇一直以來卻無法有統(tǒng)一的標(biāo)準(zhǔn),都是因人而異進(jìn)行操作。

      1 關(guān)鍵詞在科技文獻(xiàn)查新中的作用

      關(guān)鍵詞是圖書館學(xué)中的專有名詞,也是使用詞頻最高的文獻(xiàn)檢索詞語,早期來源于英文“keywords”。確定關(guān)鍵詞是開展查新工作的起點。人們一般都是在進(jìn)行專利檢索時認(rèn)識“檢索詞”,了解科技查新與專利檢索的不同,專利“檢索詞”與科技查新“關(guān)鍵詞”的區(qū)別對我們掌握科學(xué)的查新方法提高查新質(zhì)量非常有益,通過研究比較二者的區(qū)別了解“關(guān)鍵詞”在科技查新中所起的作用能更好地理解其在實際工作中的應(yīng)用價值。

      (1)作用不同。專利檢索中使用“檢索詞”、利用檢索工具開展檢索工作,是對在一定時間內(nèi)已公布的國內(nèi)外公開出版物進(jìn)行所指技術(shù)的新穎性,創(chuàng)造性的檢索,檢索詞提供了查找專利文件的渠道和方法。文獻(xiàn)查新中的“關(guān)鍵詞”反映了查新項目主題內(nèi)容的查新點,借此獲取密切相關(guān)文獻(xiàn),并運用綜合分析和對比方法,對技術(shù)要點的新穎性、創(chuàng)造性做出文獻(xiàn)評價和情報咨詢服務(wù)[3]。

      (2)目的不同。通過專利檢索詞獲取的對比文獻(xiàn),是為了將文獻(xiàn)中的技術(shù)與現(xiàn)有技術(shù)進(jìn)行比對,對擬申請專利的技術(shù)方案做出新穎性、創(chuàng)造性的判斷,目標(biāo)為文獻(xiàn)記載的技術(shù)方案(說明書和權(quán)利要求書)。而科技查新是通過科技文獻(xiàn)查新結(jié)合科技咨詢?yōu)榭蒲辛㈨椇丸b定工作提供鑒證,是對查新項目的新穎性、創(chuàng)造性做出基于文獻(xiàn)報道的相關(guān)技術(shù)的評價,對比的是包含有相關(guān)技術(shù)的文獻(xiàn)。

      (3)主體不同。專利檢索的主體是與專利有關(guān)的利害關(guān)系人,文獻(xiàn)查新的主體是與該項技術(shù)有關(guān)的創(chuàng)新者。

      (4)檢索(查新)報告的結(jié)論不一樣。專利檢索的結(jié)論必須明確,對擬申請專利的技術(shù)方案作出是否具有新穎性、創(chuàng)造性的判斷;而文獻(xiàn)查新是找出與技術(shù)要點相關(guān)、不同、以及完全相同的公開發(fā)表文獻(xiàn),查新結(jié)論實際上是對相關(guān)公開文獻(xiàn)與技術(shù)要點對比后做出的評價報告。

      科技查新采用的工作方法和過程都與專利檢索不同,它是文獻(xiàn)檢索和情報調(diào)研相結(jié)合的研究工作,且具有獨特性。由此可見,掌握一套科學(xué)的查新方法十分重要。“關(guān)鍵詞”就像一把打開通往數(shù)據(jù)庫大門的鑰匙,如何選擇關(guān)鍵詞直接關(guān)系到查新結(jié)果的準(zhǔn)確性與全面性。我們把“關(guān)鍵詞”理解為作為查新入口的關(guān)鍵性專業(yè)名詞術(shù)語更為恰當(dāng)。

      2 研究資料與方法

      (1)文獻(xiàn)來源:檢索2010 年1 月1 日-2020 年12 月31 日收錄在萬方數(shù)據(jù)知識服務(wù)平臺和中國知識資源總庫——CNKI 系列數(shù)據(jù)庫的文章。

      (2)研究方法:選擇關(guān)鍵詞“科技查新、關(guān)鍵詞、選擇”組建檢索式,依數(shù)據(jù)庫特點進(jìn)行文獻(xiàn)查新,兩個數(shù)據(jù)庫共查到20 篇相關(guān)文獻(xiàn)。篩選出符合研究標(biāo)準(zhǔn)的文獻(xiàn),對有關(guān)“關(guān)鍵詞選擇”的方法及研究的文獻(xiàn)進(jìn)行分析比對。

      3 研究目的

      通過檢索科技查新中有關(guān)選擇關(guān)鍵詞的文獻(xiàn),整理總結(jié)出實際工作中選擇關(guān)鍵詞的步驟和常用方法,以此改進(jìn)現(xiàn)有查新方法與同行共勉。

      4 研究過程

      選擇關(guān)鍵詞必須要遵循科技查新快、準(zhǔn)、全的原則,這就使得選擇關(guān)鍵詞的方法具有一致性。但要兼顧三方面是不易做到的,它們之間存在矛盾性,導(dǎo)致關(guān)鍵詞的選擇始終伴隨著“擴(kuò)大或縮小”檢索范圍而貫穿查新工作的始終。

      康陽[4]提出的采用組合選擇方法調(diào)整匹配關(guān)鍵詞即通過布爾邏輯算法組配關(guān)鍵詞和限定檢索優(yōu)化法即向已選關(guān)鍵詞提供不同類型的限定語法。該方法通過確定各關(guān)鍵詞之間的關(guān)聯(lián)性來制定檢索策略,實現(xiàn)數(shù)個關(guān)鍵詞之間的邏輯化組配。采用優(yōu)化方式限定關(guān)鍵詞數(shù)量、縮減關(guān)鍵詞選擇范圍以此約束文獻(xiàn)的檢索范圍,保障文獻(xiàn)檢索的準(zhǔn)確性。截詞檢索優(yōu)化、加權(quán)檢索優(yōu)化、位置算符優(yōu)化這些方法化解了關(guān)鍵詞選擇中的矛盾性,盡可能保證了其一致性的特征。該方法的優(yōu)點是:優(yōu)化關(guān)鍵詞,拓寬檢索途徑,約束檢索范圍,使檢索結(jié)果達(dá)到“全、準(zhǔn)”的要求。張柏秋,吳曉鐄[5]以“布氏桿菌病的防治研究課題”為例闡述了關(guān)鍵詞擴(kuò)展前后的檢出文獻(xiàn)篇數(shù)的差異性。選擇維普數(shù)據(jù)庫作為檢索數(shù)據(jù)來源,以布氏桿菌病防治為關(guān)鍵詞進(jìn)行檢索,共檢到83篇文獻(xiàn)。然而借助詞表對“布氏桿菌病”進(jìn)行擴(kuò)展,得到布魯桿菌?。?9 篇)、布魯氏菌?。?352 篇)、布氏菌病(579 篇)等,如果使用以上擴(kuò)展詞進(jìn)行組合建立檢索式(布氏+布魯+傳染性流產(chǎn)+波狀熱+馬爾他熱+地中海熱)防治共檢到897 篇相關(guān)文獻(xiàn)。使用詞表擴(kuò)展關(guān)鍵詞對查新結(jié)果的客觀性、公正性的影響不言而喻,由此可見詞表在關(guān)鍵詞選擇中的作用非同小可。

      近年來,同行從不同角度對選擇關(guān)鍵詞的方法做了大量研究工作。肖紅,連麗艷[6]提出了借助專業(yè)術(shù)語、標(biāo)準(zhǔn)、辭海、詞典、等工具書及檢出文獻(xiàn)的參考資料展開關(guān)鍵詞,利用關(guān)鍵詞的同義詞、近義詞以及上下位詞、外來詞等,綜合考慮關(guān)鍵詞的擴(kuò)展問題,使其成為關(guān)鍵詞選擇的常用方法,基本方法。邢春國[7]從查新人角度提出了“預(yù)檢索”概念,對其使用的自由詞法進(jìn)行了解釋。他認(rèn)為目前采用關(guān)鍵詞檢索法和主題詞檢索法是科技查新的主要途徑。關(guān)鍵詞法一般稱為自由詞法,是應(yīng)計算機(jī)自編索引而產(chǎn)生。實際經(jīng)驗告訴我們,濃縮文獻(xiàn)內(nèi)容的摘要是關(guān)鍵詞出現(xiàn)頻率最高的地方,從摘要中選出關(guān)鍵詞進(jìn)行文獻(xiàn)檢索結(jié)果更加可靠,比題目、全文檢索更快更準(zhǔn)確。如果把這種預(yù)見方法使用在諸如以查新為目的的檢索,達(dá)到“快”的目的更為有效。同時還提出了作者法、機(jī)構(gòu)檢索法、期刊瀏覽法、引文檢索法等檢索策略值得查新人員借鑒。

      不可忽視,近年來國內(nèi)越來越多的高質(zhì)量學(xué)術(shù)論文都選擇了在國外期刊發(fā)表,國外文獻(xiàn)檢索日益增多。英文關(guān)鍵詞的選擇與中文存在較大差異,除了不同語言帶來的理解問題外還有兩種語言使用的詞語表達(dá)方式不盡相同的原因。諸如中文中的“一詞多義”和英語中“自由詞”問題,故進(jìn)行國外文獻(xiàn)檢索時選擇關(guān)鍵詞的方法有所不同。張美琦[8]分析了國外文獻(xiàn)查新中英文關(guān)鍵詞的選擇,提出的從網(wǎng)絡(luò)資源視角下英文關(guān)鍵詞的擴(kuò)展與完善策略不愧為一種創(chuàng)舉。文章指出,中文關(guān)鍵詞的選擇方法不適用于國外文獻(xiàn)檢索。初選英文關(guān)鍵詞后,借助CNKI 翻譯助手(http://dict.cnki.net)、歐洲專利局網(wǎng)站(http://ep.espacenet.com)、電子詞典(格斯翻譯家、有道詞霸和谷歌金山詞霸等)等,采用邏輯組配方法列出檢索式,進(jìn)入文獻(xiàn)數(shù)據(jù)庫開始試檢。英文關(guān)鍵詞通過這種方式依次完成復(fù)選、再篩選、擴(kuò)補(bǔ)和精煉、以能夠直接檢索到國際同行發(fā)表的英語相關(guān)文獻(xiàn)為目標(biāo)。這樣我們就可以較容易得到符合英語語法表達(dá)方式和語境的詞頻、雙語、新鮮詞等;合理地將 “自由詞” 轉(zhuǎn)化為符合查新關(guān)鍵詞的復(fù)核目的。

      隨著大數(shù)據(jù)的發(fā)展,結(jié)合計算機(jī)技術(shù)的應(yīng)用,許多研究者已經(jīng)開始探索借助網(wǎng)絡(luò)技術(shù),基于大數(shù)據(jù)下的關(guān)鍵詞選擇方法,使AI 應(yīng)用于科技查新,克服手工工作量大、不規(guī)范、費時費力的突出問題,實現(xiàn)關(guān)鍵詞選擇過程的自動化、智能化、規(guī)范化。王培,霞余海,陳力[9]等提出了借助統(tǒng)計特征、基于主題模型和基于詞圖模型的關(guān)鍵詞自動抽取方法。兩種模型分別采取通過計算詞的某些特征(如詞頻、N-gram、TF-IDF 值等),結(jié)合其位置標(biāo)記(如題名、段首、首次出現(xiàn)的位置等)為詞分配權(quán)重,根據(jù)權(quán)重大小順序提取關(guān)鍵詞;通過大量已知的 “詞語-文檔” 矩陣和一系列訓(xùn)練推理出 “文檔-主題” 分布和 “主題-詞語” 分布的LDA 模型;以Text Rank 算法,將文檔構(gòu)建成一個詞圖,圖中每個節(jié)點對應(yīng)一個候選關(guān)鍵詞,每條邊代表候選關(guān)鍵詞之間的關(guān)系。該方法利用文獻(xiàn)本身作者標(biāo)注關(guān)鍵詞的領(lǐng)域?qū)I(yè)特性,有助于防止漏檢、提高查全率、查準(zhǔn)率,這與以文獻(xiàn)標(biāo)引為目的的關(guān)鍵詞抽取有很大區(qū)別。其優(yōu)點為:相關(guān)文獻(xiàn)的來源更豐富。通過檢索過程中產(chǎn)生的文獻(xiàn)語料,充分考慮相關(guān)文獻(xiàn)所屬領(lǐng)域的相關(guān)性、數(shù)據(jù)量、內(nèi)容及結(jié)論的權(quán)威性等,突出表現(xiàn)出檢索過程的顯著性特點。所抽取的關(guān)鍵詞通過網(wǎng)絡(luò)爬蟲在線獲取,可以與數(shù)據(jù)源保持同步,具有動態(tài)性、實時性,不會隨著時間的變化而發(fā)生過時的特點;抽取的關(guān)鍵詞通常是表示領(lǐng)域概念的基本要素,具有較強(qiáng)的指示性、領(lǐng)域區(qū)分能力,是檢索詞的重要來源。

      5 研究結(jié)果

      從科技查新質(zhì)量管控視角下研究關(guān)鍵詞的選擇方法,嘗試一些關(guān)鍵詞的選擇方法非常必要??萍疾樾轮胁槿筒闇?zhǔn)始終是矛盾體,但他們是評價某一檢索系統(tǒng)檢索性能高低的標(biāo)準(zhǔn)。在檢索過程中,查新員應(yīng)依勢靈活調(diào)整檢索策略,解決好查全率和查準(zhǔn)率之間的互逆關(guān)系。但在實際工作中,查全是整個查新工作的前提,查準(zhǔn)是必然結(jié)果。盡力做到根據(jù)查新目的不同合理解決二者的關(guān)系,對課題鑒定、產(chǎn)品查新、成果評價應(yīng)提高查準(zhǔn)率;對立項查新、科研申報應(yīng)重點保證查全率。選擇關(guān)鍵詞包括兩個步驟,即確定初選關(guān)鍵詞和擴(kuò)展關(guān)鍵詞。參考用戶提供的關(guān)鍵詞、通過項目名稱、技術(shù)方案、查新點等初步選擇關(guān)鍵詞。選擇有效方法調(diào)整匹配關(guān)鍵詞,使關(guān)鍵詞組配邏輯化,在“快、準(zhǔn)、全”的原則下使關(guān)鍵詞拓展與關(guān)鍵詞限定語法科學(xué)結(jié)合,既要有效縮減關(guān)鍵詞選擇范圍,又要保障檢索結(jié)果的準(zhǔn)確性;采用同義詞、近義詞、上下位詞、外來詞、以及反義詞,掌握不同領(lǐng)域詞表的使用方法,充分利用詞表的擴(kuò)展功能;利用網(wǎng)絡(luò)資源對英文關(guān)鍵詞進(jìn)行擴(kuò)展與完善;利用相關(guān)文獻(xiàn)的參考文獻(xiàn);大數(shù)據(jù)環(huán)境下采用基于計算機(jī)建模的關(guān)鍵詞選擇方法等。通過以上擴(kuò)展策略,對關(guān)鍵詞進(jìn)行重新復(fù)核、篩選、補(bǔ)充、精煉使其精確運用于查新工作中。

      猜你喜歡
      查新檢索文獻(xiàn)
      Hostile takeovers in China and Japan
      速讀·下旬(2021年11期)2021-10-12 01:10:43
      《建筑結(jié)構(gòu)》開啟科技查新新技能
      《建筑結(jié)構(gòu)》開啟科技查新新技能
      《建筑結(jié)構(gòu)》開啟科技查新新技能
      《建筑結(jié)構(gòu)》開啟科技查新新技能
      Cultural and Religious Context of the Two Ancient Egyptian Stelae An Opening Paragraph
      大東方(2019年12期)2019-10-20 13:12:49
      2019年第4-6期便捷檢索目錄
      The Application of the Situational Teaching Method in English Classroom Teaching at Vocational Colleges
      The Role and Significant of Professional Ethics in Accounting and Auditing
      商情(2017年1期)2017-03-22 16:56:36
      專利檢索中“語義”的表現(xiàn)
      專利代理(2016年1期)2016-05-17 06:14:36
      沾化县| 涿鹿县| 改则县| 柘城县| 泸西县| 徐闻县| 手机| 天镇县| 房山区| 手游| 黔江区| 潼关县| 通辽市| 织金县| 嘉定区| 新疆| 社旗县| 乌兰察布市| 毕节市| 莱西市| 广东省| 喀喇| 百色市| 大连市| 怀安县| 武汉市| 屏南县| 红河县| 商城县| 安塞县| 延安市| 平凉市| 三都| 铜山县| 射洪县| 全椒县| 宁安市| 磐石市| 平凉市| 荥阳市| 泊头市|