• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      《中圖法》在圖書館資源語義化中的應(yīng)用

      2017-03-22 04:00:04,,,,,
      關(guān)鍵詞:中圖法詞表皰疹

      , , , ,,

      所謂語義信息,就是將文獻變?yōu)橛嬎銠C能理解的信息,即語義標簽,用語義標簽表述文獻內(nèi)容,是圖書館資源組織發(fā)展趨勢。在語義環(huán)境下,知識服務(wù)轉(zhuǎn)變?yōu)閷ξ墨I資源的深度挖掘,提供文獻的語義信息。由于傳統(tǒng)的資源組織方法在圖書館資源組織中的長期應(yīng)用,形成了規(guī)范的分類體系和詞組,其高度結(jié)構(gòu)化、規(guī)范化的內(nèi)容是資源組織長期積累的成果。如何揚長避短、利用這些成果是我們必須考慮的問題。

      1 中圖法在語義化中應(yīng)用的優(yōu)缺點

      分類法是按照知識的門類、邏輯次序,層層劃分、逐級展開的列舉式線性結(jié)構(gòu)組織信息[1],是傳統(tǒng)紙質(zhì)文獻的組織方式,其體系等級結(jié)構(gòu)可以看作邏輯結(jié)構(gòu),從而幫助計算機理解概念。在網(wǎng)絡(luò)時代仍被應(yīng)用于網(wǎng)站建設(shè)等方面,雅虎就是因其分類的特點而被視為分類網(wǎng)站發(fā)展的模板。

      《中圖法》是一部既可以組織藏書排架,又可以分類檢索的列舉式等級式體系組配分類法?!吨袌D法》是使用最廣泛的中國圖書分類法,主要供大型綜合性圖書館及情報機構(gòu)類分文獻、編制分類檢索工具、組織文獻分類排架使用,同時也可供其他不同規(guī)模和類型的圖書情報機構(gòu)根據(jù)需要調(diào)整使用。其中的每個類不僅有類名,還有中圖法設(shè)定的類號,按照一定的規(guī)則,每個類目有其特定的中圖法分類號。由于《中圖法》的類號被廣泛應(yīng)用,通用性較強,同時從其排版形式和類號的結(jié)構(gòu)都可以看出,類與類之間的父子關(guān)系,很好地揭示了類目之間的關(guān)系。其不足之處是只反映了類與類之間的父子關(guān)系,關(guān)系揭示深度不夠。由于是專業(yè)人員編制,不容易被大眾接受,需要專業(yè)人員的轉(zhuǎn)換,增加了利用難度?!吨袌D法》的修訂是一項浩大的工程,涉及的學(xué)科范圍廣泛,版本之間的修訂年度一般時間很長,不能及時反映學(xué)科的發(fā)展。

      2 資源語義化的理論基礎(chǔ)

      資源語義化是文獻服務(wù)的終極目標,但是以現(xiàn)有的技術(shù)水平還不能實現(xiàn)。劉耀等根據(jù)共軛控制原理(即如果對事物甲的控制不能實現(xiàn),則可以通過控制與其相似的事物乙,進而控制事物甲),提出“內(nèi)容與形式交互的圖書館資源組織語義化”理論,即把資源語義化分為內(nèi)容語義化和組織語義化兩個層次。內(nèi)容語義化即我們的終極目標,是對文獻內(nèi)容的語義化理解;組織語義化是利用自然語言處理技術(shù)對資源進行處理,從而實現(xiàn)形式上的語義化。形式上的語義化和內(nèi)容上的語義化交互促進,進而最終實現(xiàn)內(nèi)容語義化[2]?;谶@種理論,以皮膚病為例展開研究,在本體自動構(gòu)建平臺和語料加工平臺下,嘗試進行皮膚病學(xué)本體的自動構(gòu)建,語料的處理及相關(guān)文獻的語義標注。

      3 《中圖法》在語義化中的應(yīng)用

      語義化涉及的兩個關(guān)鍵問題是語義元數(shù)據(jù)的生成和語義標注。本文主要論述了《中圖法》在語義化的這兩個環(huán)節(jié)中的應(yīng)用。

      語義元數(shù)據(jù)是依賴于本體知識創(chuàng)建的,是利用本體中的實體概念,對領(lǐng)域知識文檔進行標注后形成的標注資源的集合,其本質(zhì)是對語料經(jīng)過語義標注后形成的領(lǐng)域?qū)嶓w數(shù)據(jù)。當前語義元數(shù)據(jù)的構(gòu)建和語義標注技術(shù)發(fā)展迅速,涌現(xiàn)了很多工具和方法。語義元數(shù)據(jù)提供數(shù)據(jù)的語義信息,其生成技術(shù)與本體的構(gòu)建方法基本一致。本體是描述概念的模型,其描述的范圍主要集中在語義和知識表現(xiàn)層面,是領(lǐng)域知識的通用表述方式,能夠在不同系統(tǒng)、不同層面進行共享并且可以進行推理和復(fù)用。

      3.1 《中圖法》在語義元數(shù)據(jù)構(gòu)建中的應(yīng)用

      領(lǐng)域本體構(gòu)建的關(guān)鍵是概念的獲取及概念之間關(guān)系的獲取。如何將領(lǐng)域知識及其之間的關(guān)系轉(zhuǎn)變?yōu)楸倔w能描述的關(guān)系是關(guān)鍵技術(shù)。關(guān)于對領(lǐng)域知識及其之間關(guān)系的描述,我們選取了該領(lǐng)域的結(jié)構(gòu)化詞表。該領(lǐng)域的結(jié)構(gòu)化詞表是專業(yè)人士對該領(lǐng)域知識的提煉總結(jié),并將其關(guān)系用詞表的形式表現(xiàn)出來,如中國圖書分類法和Mesh詞表都是結(jié)構(gòu)化詞表的代表。

      目前,分類法的體系等級結(jié)構(gòu)可以看作邏輯結(jié)構(gòu),從而幫助計算機對概念的理解。本體概念自動獲取的方法主要是將敘詞表和專業(yè)詞典中的概念直接轉(zhuǎn)換填充到本體中,其中基于詞表的轉(zhuǎn)換是本體概念獲取的研究重點,詞表中又以敘詞表、主題詞表的研究為重點中的熱點。他們通常能夠揭示文章的顯性、重要信息,但無法揭示隱形信息。為了解決全面揭示蘊含在文獻中的知識信息的問題,在利用傳統(tǒng)資源組織方法構(gòu)建語義元數(shù)據(jù)的同時,引入了標簽本體。

      本文所應(yīng)用的本體輔助構(gòu)建平臺就是基于結(jié)構(gòu)化的詞表,并且支持3種類型的結(jié)構(gòu)化詞表:按代碼分層、由Tab鍵分層、按上下位關(guān)系分層的詞表[3]。本文就是基于這3種類型的詞表(圖1),將其關(guān)系轉(zhuǎn)變?yōu)楸倔w里類間的關(guān)系,并獲取概念間的邏輯關(guān)系,即父類與子類之間的關(guān)系[4]。

      實例討論如下。如圖2所示,根目錄下面是大類,大類下面是子類,構(gòu)成樹狀結(jié)構(gòu)圖,從而構(gòu)成了本體的類。該過程基本實現(xiàn)類的獲取,類間關(guān)系的獲取的自動化。評價方式采用了常用的3個評測指標:準確率(P)、召回率(R)、綜合指標F值(F)。

      其中,準確率(P)的計算方式如下:

      召回率(R)的計算方式如下:

      F值的計算方式如下:

      通過對該實驗進行統(tǒng)計,其中T為導(dǎo)入結(jié)果中正確的個數(shù),N為導(dǎo)入后的數(shù)據(jù)總和,M為要導(dǎo)入的數(shù)據(jù)總和。

      通過計算得出:P=1,R=0.998,F(xiàn)=0.999

      通過結(jié)果可以看出,該導(dǎo)入方法表現(xiàn)出很高的準確率、召回率,綜合指標表現(xiàn)優(yōu)秀。運用該方法導(dǎo)入詞表,實現(xiàn)語義概念的生成完全可行。

      圖1 詞表的導(dǎo)入

      圖2 導(dǎo)入后生成的樹狀結(jié)構(gòu)圖

      3.2 《中圖法》在專業(yè)語義詞典建設(shè)中的應(yīng)用

      領(lǐng)域?qū)I(yè)詞典是區(qū)別于一般的關(guān)于該學(xué)科領(lǐng)域的詞典,主要用于領(lǐng)域文獻的切分標注。由于用通用詞典進行領(lǐng)域文獻的切分標注,其效果不如專業(yè)詞典。如通用詞典不能反映詞條間的關(guān)系,只是按照一定規(guī)則將詞條列舉出來;專業(yè)的語義詞典不僅是專業(yè)術(shù)語的羅列,更能反應(yīng)詞條間的邏輯關(guān)系?;赪eb的多領(lǐng)域語料標注加工系統(tǒng)(MDCA)的一個重要功能是專業(yè)語義詞典的生成、編輯[5]。本文的皮膚病學(xué)語料加工部分的實驗就是在此基礎(chǔ)上進行的。

      (MDCA)系統(tǒng)支持的詞典生成工具是專業(yè)語義詞典生成工具flat2tree.jar,用戶只需按照系統(tǒng)要求上傳所需的文件格式,系統(tǒng)就可自動生成專業(yè)語義詞典。本實驗采用的是輸入系統(tǒng)要求的專業(yè)詞典格式,上傳格式要求為:每行一對術(shù)語的上下位詞語,前面是子類,后面是其所屬的父類,兩個詞語中間以空格分開如下所示:

      皮膚病 疾病

      皮炎 皮膚病

      接觸性皮炎 皮炎

      特應(yīng)性皮炎 皮炎

      自身敏感性皮炎 皮炎

      郁積性皮炎 皮炎

      濕疹 皮膚病

      嬰兒濕疹 皮膚病

      汗皰疹 皮膚病

      手癬和腳癬 皮膚病

      將該格式保存為UTF-8格式,然后上傳至系統(tǒng)界面(圖3),點擊“開始生成”,系統(tǒng)即自動生成專業(yè)語義詞典。

      圖3 詞典的生成

      生成的專業(yè)語義詞典將顯示在系統(tǒng)界面上,輸出的詞典格式為以Tab鍵分割的語義詞典上下位關(guān)系,同時在每個條目后面以漢語拼音的首字母縮寫作為標注。生成的專業(yè)語義詞典格式如下:

      疾病,jb

      皮膚病,pfb

      皮炎,py

      接觸性皮炎,jcxpy

      特應(yīng)性皮炎,tyxpy

      自身敏感性皮炎,zsmgxpy

      郁積性皮炎,yjxpy

      濕疹,sz

      嬰兒濕疹,yesz

      汗皰疹,hpz

      手癬和腳癬,sxhjx

      詞典生成的同時系統(tǒng)將激活與專業(yè)語義詞典相關(guān)的功能,而詞典的生成功能將不能使用。此時與專業(yè)語義詞典相關(guān)的功能為:查看語義關(guān)系樹、保存到數(shù)據(jù)庫、導(dǎo)出專業(yè)語義詞典。

      語義詞典生成后可用來對語料進行標注。生語料如下:

      急性濕疹表現(xiàn)為原發(fā)性和多形性皮疹。常在紅斑基礎(chǔ)上有針頭到粟粒大小的丘疹、丘皰疹,嚴重時有小水皰,常融合成片,境界不清楚。在損害周邊,丘皰疹逐漸稀疏。皮疹分布對稱,多見于面、耳、手、足、前臂、小腿外露部位,嚴重者可彌漫全身,自覺瘙癢較重。常因瘙癢形成點狀糜爛面,有明顯漿性滲出。如繼發(fā)感染,則形成膿皰、膿液、膿痂、淋巴結(jié)腫大,甚至有發(fā)熱等全身癥狀,如合并單純皰疹病毒感染,則可形成嚴重的皰疹性濕疹[6]。

      標注后的語料如下:

      急性/n 濕疹/n 表現(xiàn)/v 為/p 原發(fā)性/n 和/c 多形性/n 皮疹/n 。/x 常/d 在/p 紅斑[疾病C,/n_jbc.皮膚和結(jié)締組織疾病,/n_pfhjdzzjb.皮膚疾病,/n_pfjb.紅斑./n_hb3] 基礎(chǔ)/n 上有/v 針頭/n 到/v 粟粒/nr 大小/b 的/uj 丘疹/n 、/x 丘/nr 皰疹/n ,/x 嚴重/a 時/ng 有/v 小/a 水皰/n ,/x 常/d 融合/vn 成片/n ,/x 境界/n 不/d 清楚/a 。/x 在/p 損害/v 周邊/f ,/x 丘/nr 皰疹/n 逐漸/d 稀疏/a 。/x 皮疹/n 分布/v 對稱/v ,/x 多見于/d 面/n 、/x 耳[耳./n_e2] 、/x 手[解剖A,/n_jpa.身體部位,/n_stbw.四肢,/n_sz.臂,/n_b1.手./n_s] 、/x 足[解剖A,/n_jpa.身體部位,/n_stbw.四肢,/n_sz.腿,/n_t1.足./n_z2] 、/x 前臂[解剖A,/n_jpa.身體部位,/n_stbw.四肢,/n_sz.臂,/n_b1.前臂./n_qb] 、/x 小腿/n 外露/v 部位/n ,/x 嚴重者/nr 可/v 彌漫/v 全身/n ,/x 自覺/d 瘙癢/a 較重/a 。/x 常因/n 瘙癢/a 形成/v 點狀/n 糜爛面/nr ,/x 有/v 明顯/a 漿性/n 滲出/v 。/x 如/v 繼發(fā)/v 感染[疾病C,/n_jbc.細菌感染和真菌病,/n_xjgrhzjb.感染./n_gr] ,/x 則/d 形成/v 膿皰/n 、/x 膿液/n 、/x 膿/n 痂/n 、/x 淋巴結(jié)[淋巴組織,/n_lbzz.淋巴結(jié)./n_lbj] 腫大/v ,/x 甚至/d 有/v發(fā)熱[疾病C,/n_jbc.體征和癥狀病理狀態(tài),/n_tzhzzblzt.體征和癥狀,/n_tzhzz.體溫變化,/n_twbh.發(fā)熱./n_fr]等/u 全身/n 癥狀/n ,/x 如/v 合并/v 單純/a 皰疹病毒/n 感染[疾病C,/n_jbc.細菌感染和真菌病,/n_xjgrhzjb.感染./n_gr] ,/x 可/v 形成/v 嚴重/a 的/uj 皰疹/n 性[生物科學(xué),/n_swkx.生殖和泌尿生理學(xué),/n_szhmnslx.生殖,/n_sz11.性./n_x10] 濕疹/n。/x

      通過對比可以發(fā)現(xiàn),標注后的語料不僅包含專業(yè)詞組,還揭示了該專業(yè)詞典的上下位邏輯關(guān)系等,更有助于理解語義。

      4 結(jié)論

      本文參照《中圖法》和《MeSH》詞表,對傳統(tǒng)詞表進行重構(gòu),在語義元數(shù)據(jù)輔助平臺下導(dǎo)入專業(yè)語義詞典,設(shè)置本體類的屬性,成功構(gòu)建了皮膚病學(xué)領(lǐng)域本體并生成樹狀語義結(jié)構(gòu),并且構(gòu)建了專業(yè)的語義詞典用以對文獻進行語義標注。但是構(gòu)建過程中發(fā)現(xiàn),《中圖法》電子化、網(wǎng)絡(luò)化的程度不夠,在使用過程中存在困難。

      隨著自動分類標引以及自動主題標引的研究與發(fā)展,分類主題一體化越發(fā)顯得重要,情報檢索語言將由單一的檢索語言轉(zhuǎn)變?yōu)榉诸?主題-自然語言一體化以及國內(nèi)外分類法兼容化[7]。

      猜你喜歡
      中圖法詞表皰疹
      A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
      英語世界(2021年13期)2021-01-12 05:47:51
      皰疹性咽峽炎來襲,幫寶寶渡過難關(guān)
      啟蒙(3-7歲)(2019年5期)2019-06-27 07:25:04
      汗皰疹的中醫(yī)治療
      中醫(yī)治皰疹性咽峽炎
      敘詞表與其他詞表的互操作標準
      改良Trizol-SiO2法在咽拭子及皰疹液EV71-RNA提取中的應(yīng)用
      知識圖譜視角下《中國圖書館分類法》研究演進與思考
      國外敘詞表的應(yīng)用與發(fā)展趨勢探討*
      《中圖法》與《中分表》修訂信息(連載3)
      常用聯(lián)綿詞表
      對聯(lián)(2011年20期)2011-09-19 06:24:36
      老河口市| 宜都市| 长泰县| 偏关县| 南开区| 内江市| 宣武区| 赣州市| 雷波县| 门头沟区| 永吉县| 宁国市| 琼海市| 彭山县| 房产| 东宁县| 尚志市| 漳州市| 兴业县| 绵竹市| 西充县| 龙江县| 北安市| 连云港市| 云霄县| 长阳| 上林县| 资溪县| 瑞安市| 达拉特旗| 高雄市| 平塘县| 当阳市| 彩票| 黔西县| 通山县| 额尔古纳市| 昌黎县| 临清市| 定西市| 赣州市|