• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于MediaWiki實(shí)現(xiàn)知識組織系統(tǒng)的語義在線維護(hù)*
      ——以ISO 5127術(shù)語國際標(biāo)準(zhǔn)為例

      2021-12-10 07:43:12黃華軍曾新紅
      數(shù)字圖書館論壇 2021年10期
      關(guān)鍵詞:國際標(biāo)準(zhǔn)術(shù)語語義

      黃華軍 曾新紅

      (深圳大學(xué)圖書館,深圳 518060)

      如何實(shí)現(xiàn)知識組織系統(tǒng)的共建和及時(shí)更新維護(hù)是知識組織系統(tǒng)相關(guān)各界共同面對的難題,如擁有大量高質(zhì)量傳統(tǒng)知識組織系統(tǒng)的圖書情報(bào)界,希望構(gòu)建內(nèi)部KOS以提高信息處理、知識管理和系統(tǒng)之間互操作效率的企業(yè)界,以及試圖構(gòu)建具有強(qiáng)大語義處理能力與開放互聯(lián)能力的知識圖譜相關(guān)各界等。ISO等國際或國家標(biāo)準(zhǔn)化組織也同樣面臨術(shù)語等知識組織系統(tǒng)標(biāo)準(zhǔn)的共建和及時(shí)更新問題。

      《信息與文獻(xiàn)——基礎(chǔ)與術(shù)語》(Information and Documentation—Foundation and Vocabulary,ISO 5127)為整個(gè)信息領(lǐng)域的文獻(xiàn)領(lǐng)域提供了一個(gè)概念系統(tǒng)和通用術(shù)語詞表[1]。ISO 5127術(shù)語國際標(biāo)準(zhǔn)新版本的修訂工作由ISO/TC46/WG4負(fù)責(zé),修訂工作的具體情況請參見文獻(xiàn)[2]。筆者作為ISO/TC46/WG4的中方專家和ISO/TC46/AHG“Maintenance of ISO 5127”(ISO 5127維護(hù)特別工作組)的召集人,負(fù)責(zé)審查可能的解決方案,將ISO 5127作為一項(xiàng)數(shù)據(jù)庫標(biāo)準(zhǔn)進(jìn)行維護(hù)。在實(shí)現(xiàn)該國際標(biāo)準(zhǔn)的SKOS語義描述方案和共享服務(wù)系統(tǒng)ISO 5127_CLSS[3]之后,進(jìn)一步為實(shí)現(xiàn)其網(wǎng)絡(luò)在線維護(hù)和動(dòng)態(tài)完善尋求可行方案。

      MediaWiki最初是為維基百科量身打造的開源工具,它自由開放、功能強(qiáng)大、擴(kuò)展豐富?;谄湓诠步ǚ矫娴拿黠@優(yōu)勢,MediaWiki已在很多領(lǐng)域被廣泛應(yīng)用,國內(nèi)外已建設(shè)了大量Wiki項(xiàng)目和網(wǎng)站進(jìn)行知識的收集和管理。

      近一年多來,筆者調(diào)研了ISO 5127國際術(shù)語標(biāo)準(zhǔn)的共建共享、在線修訂和語義維護(hù)等需求,在已有的研究成果和實(shí)踐經(jīng)驗(yàn)基礎(chǔ)上,借助MediaWiki的強(qiáng)大功能,實(shí)現(xiàn)了ISO 5127的術(shù)語在線維護(hù)系統(tǒng)。

      1 研究背景與研究意義

      1.1 研究背景

      知識組織系統(tǒng)必須不斷更新才能跟上時(shí)代的發(fā)展,滿足相關(guān)領(lǐng)域的應(yīng)用需求。雖然已有少量共建研究和實(shí)施成功案例(如深圳大學(xué)圖書館NKOS研究室的OTCSS方案[4-5]和《漢語主題詞表(工程技術(shù)卷)》[6]的敘詞表協(xié)同編制軟件),國內(nèi)外現(xiàn)有的知識組織系統(tǒng)大多數(shù)仍單純依賴專家維護(hù),多由指定專家主導(dǎo)編輯,經(jīng)過修訂、審核和定稿的漫長過程,最終由出版商印刷、銷售,相關(guān)工作無法實(shí)現(xiàn)高效的協(xié)作和去中心化,不能集中廣大用戶群體的意見和智慧,存在周期長、可追溯性差、獲取和利用難等困擾。隨著信息技術(shù)的發(fā)展,自然語言學(xué)習(xí)等機(jī)器學(xué)習(xí)方法逐漸被引入,但目前這些自動(dòng)處理方法推送的結(jié)果距離真正滿足高端應(yīng)用需求還有不小的差距。在這種背景下,利用MediaWiki的強(qiáng)大共建功能快速實(shí)現(xiàn)知識組織系統(tǒng)的網(wǎng)絡(luò)化語義在線維護(hù)不失為一種低投入、高效率的可自增值方案。

      例如,ISO術(shù)語國際標(biāo)準(zhǔn)(術(shù)語表是知識組織系統(tǒng)的一種類型,參見參考文獻(xiàn)[5]圖1-1)傳統(tǒng)的紙版和PDF等電子版閱讀服務(wù)方式以及由少量ISO專家主導(dǎo)的修訂工作,已嚴(yán)重滯后于當(dāng)前網(wǎng)絡(luò)信息時(shí)代的發(fā)展需求,這使得術(shù)語標(biāo)準(zhǔn)采用“標(biāo)準(zhǔn)作者+利益相關(guān)者”的多渠道在線維護(hù)方式越來越成為各方的共識和要求。

      在ISO中引入和實(shí)現(xiàn)SMART(Standards Machine Applicable,Readable and Transferable)標(biāo)準(zhǔn)是ISO未來工作的方向,其路線圖(roadmap)中包括:在機(jī)器可讀標(biāo)準(zhǔn)的執(zhí)行標(biāo)準(zhǔn)化過程的方法上允許TC擁有自由,如工具和技術(shù)的選擇,因?yàn)檫@種開發(fā)需要數(shù)字化的工作流程;更新法律框架以啟用機(jī)器可讀標(biāo)準(zhǔn),使最終用戶能夠利用機(jī)器可讀標(biāo)準(zhǔn)而不違反ISO法律權(quán)利;與標(biāo)準(zhǔn)利益相關(guān)者(作者和最終用戶)一起制定創(chuàng)建機(jī)器可讀標(biāo)準(zhǔn)所需的工具和過程要求,制定流程和政策,讓最終用戶(和外部各方)參與到機(jī)器可讀標(biāo)準(zhǔn)的輸入中,包括評論、更新和勘誤[7]。

      因此,ISO 5127術(shù)語國際標(biāo)準(zhǔn)新版本除了應(yīng)該是一種機(jī)器可用、可讀和可轉(zhuǎn)換的標(biāo)準(zhǔn),即符合SMART趨勢之外,還應(yīng)該建立起一套有效的允許“利益相關(guān)者”參與意見的在線維護(hù)機(jī)制,以此來滿足其利益相關(guān)者的訴求。

      1.2 研究意義

      本研究旨在借助MediaWiki的強(qiáng)大共建功能,為相關(guān)行業(yè)領(lǐng)域的知識組織系統(tǒng)實(shí)現(xiàn)語義在線維護(hù)提供實(shí)證和示范,提供一套具有實(shí)際參考和借鑒意義的解決方案,讓ISO術(shù)語國際標(biāo)準(zhǔn)及其他類型的知識組織系統(tǒng)能夠更方便快捷地實(shí)現(xiàn)在線維護(hù)。

      此方案為用戶提供廣泛參與ISO術(shù)語國際標(biāo)準(zhǔn)等知識組織系統(tǒng)的網(wǎng)絡(luò)化共建共享服務(wù)的便捷渠道,利用Web用戶的集體智慧進(jìn)一步完善這些KOS,使其走出傳統(tǒng)的服務(wù)模式,煥發(fā)出新的生命力,從而更好地發(fā)揮其在網(wǎng)絡(luò)時(shí)代傳播知識的職能。

      2 MediaWiki與ISO 5127在線維護(hù)需求的結(jié)合

      本節(jié)將MediaWiki的應(yīng)用特征和功能與ISO 5127的修訂業(yè)務(wù)工作緊密結(jié)合,尋求在MediaWiki的基礎(chǔ)之上解決ISO 5127的在線維護(hù)難題。

      2.1 MediaWiki簡介

      MediaWiki是一個(gè)開源的、充滿活力的網(wǎng)絡(luò)協(xié)作平臺社區(qū)工具,已被成千上萬的網(wǎng)站、公司和機(jī)構(gòu)使用。它為維基百科(作為MediaWiki應(yīng)用最成功的案例之一)網(wǎng)絡(luò)協(xié)作平臺提供了非常強(qiáng)大的動(dòng)力。MediaWiki幫助收集和組織知識,并將其提供給人們使用。它具有功能強(qiáng)大、多語言、免費(fèi)開放、可擴(kuò)展、可定制、可靠且安全等特征[8]。

      國內(nèi)外成功應(yīng)用MediaWiki的案例,除了MediaWiki和Semantic MediaWiki[9]本身以及維基百科之外,還有如研究數(shù)據(jù)聯(lián)盟(Research Data Alliance,RDA)的TeD-T[10]、Discourse DB(一個(gè)收集世界記者和評論員對當(dāng)前政治事件和問題的意見的Wiki)[11]、食品伙伴網(wǎng)旗下食品論壇運(yùn)營的食品百科全書計(jì)劃[12]和專注于經(jīng)濟(jì)管理領(lǐng)域的MBA智庫百科[13]等典型例子。它們借助MediaWiki的強(qiáng)大能力和易用性,實(shí)現(xiàn)人人可自由訪問和編輯、互動(dòng)和貢獻(xiàn)的開放共享社區(qū)。但目前還未見有專門面向知識組織系統(tǒng)語義在線維護(hù)的應(yīng)用實(shí)例。

      MediaWiki的應(yīng)用特征和功能可通過“Help about MediaWiki”了解,其提供詳細(xì)的多語種的功能介紹和用戶幫助,網(wǎng)址詳見參考文獻(xiàn)[14]。

      2.2 ISO 5127在線維護(hù)需求

      國際標(biāo)準(zhǔn)化組織ISO的Online Browsing Platform(OBP)[15]提供最新的ISO標(biāo)準(zhǔn)、圖形符號、代碼、術(shù)語和定義的在線搜索和訪問服務(wù),并可在標(biāo)準(zhǔn)之間輕松導(dǎo)航。因其內(nèi)容在數(shù)據(jù)庫中進(jìn)行封閉維護(hù),修訂和更新在內(nèi)部完成而不對外開放,無法拓寬其服務(wù)渠道和領(lǐng)域,網(wǎng)絡(luò)用戶也無法參與共建。

      根據(jù)ISO/TC46/WG4在ISO/TC46的2019年年會中展示的ISO 5127 Annex B“ISO 5127 management of terminology maintenance(術(shù)語維護(hù)管理)”[16]中建立的維護(hù)原則,并順應(yīng)ISO未來的SMART發(fā)展方向[7],為ISO 5127在線維護(hù)系統(tǒng)設(shè)計(jì)了以下功能。(1)在線提交維護(hù)建議:ISO/TC46的標(biāo)準(zhǔn)制定者或最終用戶可以提交增加新術(shù)語或修改/刪除一個(gè)現(xiàn)有術(shù)語的意見。(2)在線編輯術(shù)語款目或處理已提交的維護(hù)建議:每種語言版本的管理員負(fù)責(zé)該種語言版本的修訂工作,且每種語言版本必須與英文版本保持一致。(3)在線管理或發(fā)布新版本:由系統(tǒng)管理員負(fù)責(zé),與各語種版本管理員合作完成。

      該系統(tǒng)的輸入輸出設(shè)計(jì)如下。(1)允許多種數(shù)據(jù)來源:Word、SKOS、XML、RDF以及其他機(jī)器可識別格式。(2)允許多種修訂方式:線上,通過在線維護(hù)系統(tǒng);線下,即傳統(tǒng)方式,修訂后提交Word文件或其他機(jī)器可識別格式文件,由系統(tǒng)管理員轉(zhuǎn)入系統(tǒng)。(3)實(shí)現(xiàn)與其他平臺的數(shù)據(jù)轉(zhuǎn)換和共享,提供靈活的服務(wù)方式(在版權(quán)許可下)。①輸出SKOS文件:提供給ISO 5127_CLSS(發(fā)布新版本),提供下載和其他服務(wù),面向所有用戶。②輸出Word文件:提供給紙本出版者。③輸出XML(或其他指定格式)文件:提供給OBP或其他相關(guān)平臺。④修改過的(新增/修改/刪除過的)術(shù)語款目列表可以以指定的格式從系統(tǒng)輸出,提供給ISO進(jìn)行官方審核(如有組織的投票和走工作組程序)。

      總體目標(biāo)是向所有用戶提供搜索和瀏覽服務(wù),準(zhǔn)許授權(quán)用戶根據(jù)自己選擇的語言參與編輯、討論、提交意見、修訂管理及其他相關(guān)服務(wù),并為后續(xù)進(jìn)一步提供更多的網(wǎng)絡(luò)服務(wù)做準(zhǔn)備。

      相較于從頭開發(fā)一個(gè)完整的在線維護(hù)系統(tǒng),采用MediaWiki實(shí)現(xiàn)ISO 5127術(shù)語國際標(biāo)準(zhǔn)的在線修訂和語義維護(hù)可以做到開發(fā)量少和維護(hù)容易。該方案同時(shí)具備展示直觀、獲取方便、共享范圍更廣、多語言功能、可交互式協(xié)作編輯與管理、自由參與討論、意見提交與處理、分工明確等優(yōu)勢,可大大提高修訂工作的效率。

      3 基于MediaWiki的ISO 5127在線維護(hù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)

      3.1 系統(tǒng)需求功能設(shè)計(jì)

      筆者分析了ISO 5127語義在線維護(hù)的需求,結(jié)合MediaWiki,通過不斷探索確定了系統(tǒng)的整體需求,其主要功能如下。

      (1)用戶管理與權(quán)限分配:這是應(yīng)用系統(tǒng)中不可缺少的一部分。不同用戶對系統(tǒng)功能的需求不同。出于安全性和專業(yè)性考慮,不同于一般Wiki網(wǎng)站的全開放,在本系統(tǒng)中,重要的系統(tǒng)功能需限定部分用戶使用,并可根據(jù)需要為用戶定制不同的權(quán)限。默認(rèn)情況下,筆者將系統(tǒng)用戶分為5個(gè)用戶組,其中“建議用戶”和“修訂用戶”是根據(jù)需要新設(shè)定的兩個(gè)用戶組,通過安裝Lockdown和SimpleSecurity擴(kuò)展可設(shè)置用戶權(quán)限,用戶和權(quán)限的具體對應(yīng)信息如表1所示。

      表1 基于MediaWiki的ISO 5127在線維護(hù)系統(tǒng)用戶與權(quán)限對應(yīng)表

      (2)術(shù)語表展示:其一按照術(shù)語等級或?qū)哟谓Y(jié)構(gòu)展示,其二按照字母順序展示。點(diǎn)擊任一術(shù)語即進(jìn)入該術(shù)語的詳細(xì)信息頁面,每個(gè)術(shù)語的詳細(xì)頁面均有針對該術(shù)語的討論和歷史頁面。

      (3)術(shù)語表搜索、獲取、參與討論與瀏覽變更歷史(可追溯性)。

      (4)術(shù)語表修訂:新增、修改和刪除術(shù)語款目,提取并處理修訂意見。

      (5)修訂意見提交:參考OTCSS系統(tǒng)的修訂規(guī)則[5],系統(tǒng)將需要采集的用戶知識(修改意見)分為5種類型。①新增補(bǔ)術(shù)語款目(概念);②為原術(shù)語款目增加同義詞(入口詞);③修改原術(shù)語款目信息;④原術(shù)語款目整條刪除;⑤新增關(guān)系種類。

      (6)多語言版:可支持中文、英文、法文、德文和希臘文等多種語言的自動(dòng)切換顯示和編輯修訂。

      (7)提供創(chuàng)建和發(fā)布機(jī)器可訪問、可讀和可轉(zhuǎn)換標(biāo)準(zhǔn)的工具和過程。

      系統(tǒng)功能可通過網(wǎng)站左側(cè)導(dǎo)航菜單進(jìn)行試用,圖1為術(shù)語表展示界面,圖2為建議用戶提交意見和修訂用戶處理意見入口界面,圖3為修訂用戶修訂術(shù)語操作界面。

      圖1 術(shù)語表按字母順序展示界面

      圖2 建議用戶提交意見和修訂用戶處理意見入口界面

      圖3 修訂用戶修訂術(shù)語操作界面

      3.2 系統(tǒng)詳細(xì)設(shè)計(jì)與實(shí)現(xiàn)

      系統(tǒng)詳細(xì)設(shè)計(jì)與實(shí)現(xiàn)的過程、方法和工具見圖4所示的系統(tǒng)流程圖。本文選取系統(tǒng)中較為核心的3個(gè)功能需求作為示例進(jìn)行進(jìn)一步的介紹。

      圖4 系統(tǒng)詳細(xì)設(shè)計(jì)和實(shí)現(xiàn)流程圖

      (1)術(shù)語語義描述與MediaWiki模板定制。通過分析ISO 5127的DC和SKOS語義描述[3],結(jié)合MediaWiki的模版定義,設(shè)計(jì)了一套適用于術(shù)語的表達(dá)方式。根據(jù)ISO 5127術(shù)語的skos:prefLabel值的唯一性,使用該值作為經(jīng)MediaWiki定制的術(shù)語個(gè)性化語義頁面的URI或標(biāo)題。通過MediaWiki的特殊頁Special:SpecialPages,首先創(chuàng)建ISO 5127術(shù)語款目的語義屬性(關(guān)系)和數(shù)據(jù)類型,選擇是否采用列舉可取值選項(xiàng);其次創(chuàng)建術(shù)語表管理和建議提交的頁面模板(template)、表單(form)、分類(category)和入口(entrance);最后以此類推分別創(chuàng)建其他語言的相應(yīng)模板、表單、分類和入口。MediaWiki中ISO 5127的術(shù)語(concept)的表達(dá)方式可從該術(shù)語的“View source”中查看。

      (2)個(gè)性化需求與擴(kuò)展實(shí)現(xiàn)。系統(tǒng)的個(gè)性化需求的實(shí)現(xiàn)基于MediaWiki豐富的擴(kuò)展,從MediaWiki下載所需的Extension,安裝與配置完成后即可實(shí)現(xiàn)特定的擴(kuò)展功能,甚至可以對Extension進(jìn)行二次開發(fā)以實(shí)現(xiàn)更符合最終用戶的體驗(yàn)需求。如術(shù)語語義化顯示與編輯(下載、安裝和配置PageForms與Semantic MediaWiki擴(kuò)展)、多語言版(下載、安裝和配置Polyglot或LanguageSelector與UniversalLanguageSelector擴(kuò)展)和用戶權(quán)限管理(下載、安裝和配置Lockdown與SimpleSecurity擴(kuò)展)等需求功能均可依此實(shí)現(xiàn)。

      (3)數(shù)據(jù)轉(zhuǎn)換與導(dǎo)入??焖賹?shí)現(xiàn)和部署基于MediaWiki的ISO 5127在線維護(hù)系統(tǒng)需要進(jìn)行數(shù)據(jù)的轉(zhuǎn)換和導(dǎo)入,避免人工編輯錄入的煩瑣。通過厘清MediaWiki頁面的特征和格式,使用Java語言編程實(shí)現(xiàn)SKOS描述的ISO 5127術(shù)語向MediaWiki頁面的自動(dòng)轉(zhuǎn)變,然后利用MediaWiki的批量導(dǎo)入功能可將ISO 5127的2 126條術(shù)語全部遷移到系統(tǒng)。轉(zhuǎn)換與導(dǎo)入之后,術(shù)語的顯示效果如圖1所示。

      限于篇幅,其他功能請登錄系統(tǒng)網(wǎng)站體驗(yàn)和試用。操作指引請見網(wǎng)站左側(cè)菜單“How to add content”,點(diǎn)擊“Help about MediaWiki”可全面了解MediaWiki的各項(xiàng)功能。整個(gè)系統(tǒng)的源代碼、安裝步驟和詳細(xì)配置都是公開的,可以從系統(tǒng)網(wǎng)站上獲取,以促進(jìn)MediaWiki在知識組織系統(tǒng)在線維護(hù)方面的應(yīng)用和完善,更好地實(shí)現(xiàn)同行之間的交流合作以達(dá)到共同進(jìn)步。如需了解更多的實(shí)現(xiàn)細(xì)節(jié),請與作者聯(lián)系。如有必要,也會基于其他的KOS案例開發(fā)無版權(quán)爭議的示范系統(tǒng)。

      4 結(jié)語

      本文基于MediaWiki的自由、開放、共享、可擴(kuò)展和語義化等特征,積極推進(jìn)和實(shí)現(xiàn)了ISO 5127術(shù)語國際標(biāo)準(zhǔn)的語義在線維護(hù)系統(tǒng)。此系統(tǒng)有助于在大數(shù)據(jù)和人工智能環(huán)境下發(fā)揮人與計(jì)算機(jī)的各自優(yōu)勢。

      本研究為來自不同ISO技術(shù)委員會(TC)、分技術(shù)委員會(SC)和所有感興趣的團(tuán)體共同維護(hù)ISO 5127術(shù)語國際標(biāo)準(zhǔn)提供了技術(shù)基礎(chǔ),在2021年5月召開的第48屆ISO/TC46年會上,促進(jìn)了ISO 5127 TCG(Terminology Coordination Group,術(shù)語協(xié)調(diào)工作組,一個(gè)常設(shè)機(jī)構(gòu),取代之前的AHG)的成立(經(jīng)由ISO/TC46 Resolution 2021/06)。我們將在下一步繼續(xù)完善該系統(tǒng),為ISO 5127的維護(hù)建立完善的協(xié)調(diào)共建流程和機(jī)制。

      同時(shí),該方案可為國內(nèi)外同類型和其他類型的知識組織系統(tǒng)快速實(shí)現(xiàn)語義在線維護(hù)提供參考和借鑒。例如,各種類型的中文知識組織系統(tǒng)可依據(jù)“中文知識組織系統(tǒng)形式化語義描述標(biāo)準(zhǔn)體系”[5]實(shí)現(xiàn)語義描述,然后可借鑒本文方案快速實(shí)現(xiàn)語義在線維護(hù)。

      猜你喜歡
      國際標(biāo)準(zhǔn)術(shù)語語義
      國際標(biāo)準(zhǔn)ISO 22992-2:2020正式發(fā)布
      語言與語義
      CTTC中紡標(biāo):國際標(biāo)準(zhǔn)誕生記
      “上”與“下”語義的不對稱性及其認(rèn)知闡釋
      我國參與編制多項(xiàng)光伏逆變器國際標(biāo)準(zhǔn)
      認(rèn)知范疇模糊與語義模糊
      最新國際標(biāo)準(zhǔn)
      有感于幾個(gè)術(shù)語的定名與應(yīng)用
      從術(shù)語學(xué)基本模型的演變看術(shù)語學(xué)的發(fā)展趨勢
      語義分析與漢俄副名組合
      鹤庆县| 麻阳| 额敏县| 景泰县| 大同市| 武平县| 常德市| 潮安县| 陆良县| 荣昌县| 樟树市| 黎平县| 诏安县| 洛隆县| 桐梓县| 旌德县| 丽水市| 哈密市| 搜索| 定日县| 松原市| 榆树市| 高阳县| 章丘市| 龙山县| 孝义市| 梅河口市| 门源| 浪卡子县| 临海市| 六盘水市| 嫩江县| 犍为县| 万盛区| 海兴县| 阿克苏市| 郴州市| 涟水县| 红安县| 平凉市| 正蓝旗|