袁滿(mǎn) 曹陽(yáng) 陳萍
[摘? ?要] 教育是典型的知識(shí)密集型領(lǐng)域,因此,進(jìn)行領(lǐng)域知識(shí)的共享研究對(duì)教育領(lǐng)域的發(fā)展非常重要。多年信息化的歷史經(jīng)驗(yàn)告誡我們:共享的前提是必須對(duì)領(lǐng)域資源實(shí)施標(biāo)準(zhǔn)化。盡管我國(guó)教育領(lǐng)域研發(fā)了系列教育元數(shù)據(jù)標(biāo)準(zhǔn),但是從智慧教育的需求來(lái)看,這些標(biāo)準(zhǔn)普遍表現(xiàn)為缺乏語(yǔ)義、比較零散、體系不夠完善等。隨著近些年知識(shí)圖譜的提出,為教育資源的知識(shí)整合發(fā)展提供了重要的技術(shù)手段。然而,目前知識(shí)圖譜構(gòu)建的主要焦點(diǎn)在構(gòu)建技術(shù)方面,忽視了構(gòu)建中的標(biāo)準(zhǔn)化問(wèn)題。長(zhǎng)此以往,領(lǐng)域?qū)?huì)構(gòu)建出很多“知識(shí)孤島”。為解決這些問(wèn)題,本文在對(duì)國(guó)內(nèi)外教育領(lǐng)域內(nèi)標(biāo)準(zhǔn)進(jìn)行研究的基礎(chǔ)上,以系統(tǒng)理論為依據(jù)提出并構(gòu)建了一個(gè)集預(yù)定義詞匯的W3C語(yǔ)義Web標(biāo)準(zhǔn)、頂層詞匯標(biāo)準(zhǔn)和領(lǐng)域詞匯標(biāo)準(zhǔn)于一體的三層架構(gòu)模型——教育資源知識(shí)圖譜標(biāo)準(zhǔn)詞匯參考模型?;谠撃P徒?gòu)知識(shí)圖譜,不僅為教育領(lǐng)域數(shù)據(jù)的標(biāo)準(zhǔn)化提供標(biāo)準(zhǔn)詞匯參考,而且也為規(guī)范構(gòu)建教育領(lǐng)域知識(shí)圖譜提供了參考。
[關(guān)鍵詞] 教育資源; 知識(shí)圖譜; 詞匯; 知識(shí)融合; 標(biāo)準(zhǔn)化
[中圖分類(lèi)號(hào)] G434? ? ? ? ? ? [文獻(xiàn)標(biāo)志碼] A
[作者簡(jiǎn)介] 袁滿(mǎn)(1965—),男,黑龍江大慶人。教授,主要從事知識(shí)組織與教育資源標(biāo)準(zhǔn)化研究。E-mail:yuanman @nepu.edu.cn。
一、引? ?言
過(guò)去40多年信息化進(jìn)程中,由于各個(gè)領(lǐng)域?qū)?biāo)準(zhǔn)的建設(shè)都缺乏足夠的重視,使得各個(gè)領(lǐng)域信息資源建設(shè)普遍缺乏標(biāo)準(zhǔn)支撐,所以導(dǎo)致領(lǐng)域“信息孤島”嚴(yán)重泛濫,也包括教育領(lǐng)域。眾所周知,各領(lǐng)域?yàn)檎线@些“信息孤島”而花費(fèi)了大量人力、財(cái)力和物力,這給領(lǐng)域的信息化建設(shè)留下了深刻的歷史教訓(xùn)??梢?jiàn),標(biāo)準(zhǔn)在領(lǐng)域信息化中的重要地位。尤其是新興技術(shù)的崛起,如人工智能和大數(shù)據(jù)等在教育領(lǐng)域的應(yīng)用,為當(dāng)下及未來(lái)智慧教育的進(jìn)一步發(fā)展提供了技術(shù)支撐,因此,從數(shù)字化向智能化轉(zhuǎn)型在教育領(lǐng)域也被提到了重要的日程。在數(shù)字化時(shí)代,是數(shù)據(jù)標(biāo)準(zhǔn)在支撐著信息化,而進(jìn)入智能化時(shí)代必將用知識(shí)標(biāo)準(zhǔn)支撐智能化。在教育領(lǐng)域,國(guó)際上對(duì)教育技術(shù)標(biāo)準(zhǔn)研究的機(jī)構(gòu)有許多,諸如美國(guó)、國(guó)際組織和歐洲等,他們都研發(fā)了系列教育技術(shù)相關(guān)標(biāo)準(zhǔn)。其中美國(guó)標(biāo)準(zhǔn)研發(fā)的典型機(jī)構(gòu)與項(xiàng)目包括美國(guó)航空工業(yè)計(jì)算機(jī)輔助訓(xùn)練委員會(huì)(AICC)、美國(guó)高級(jí)分布式學(xué)習(xí)研究項(xiàng)目(ADL)、美國(guó)全球?qū)W習(xí)聯(lián)合公司(IMS)、美國(guó)教育部教育統(tǒng)計(jì)中心(NCES)、美國(guó)Internet內(nèi)容分級(jí)協(xié)會(huì)(ICRA)等。國(guó)際標(biāo)準(zhǔn)化典型機(jī)構(gòu)包括都柏林核心元數(shù)據(jù)研究行動(dòng)(DCMI)、IEEE學(xué)習(xí)技術(shù)系統(tǒng)標(biāo)準(zhǔn)化委員會(huì)(IEEE-LTCS)、國(guó)際標(biāo)準(zhǔn)化組織(ISO-JTC1/SC36)、萬(wàn)維網(wǎng)聯(lián)盟(W3C)以及國(guó)際課件證書(shū)標(biāo)準(zhǔn)(ASTD-ELC)等。歐洲網(wǎng)絡(luò)教育技術(shù)標(biāo)準(zhǔn)機(jī)構(gòu)及項(xiàng)目包括歐洲遠(yuǎn)程教學(xué)創(chuàng)作與銷(xiāo)售網(wǎng)聯(lián)盟(ARIADNE)、促進(jìn)歐洲社會(huì)教育與培訓(xùn)中使用多媒體工程項(xiàng)目(PROMEETEUS)、歐洲標(biāo)準(zhǔn)化委員會(huì)/信息系社會(huì)標(biāo)準(zhǔn)化系統(tǒng)(CEN/ISSS)、歐洲諒解備忘錄(MoU)、在線教育系統(tǒng)元數(shù)據(jù)擴(kuò)展標(biāo)準(zhǔn)(GEMSTONES)和英國(guó)學(xué)習(xí)管理工具標(biāo)準(zhǔn)(TOOLMOL)等。在國(guó)內(nèi),為適應(yīng)時(shí)代發(fā)展,2010年發(fā)布的《國(guó)家中長(zhǎng)期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》提出“加快教育信息化進(jìn)程”“制定教育質(zhì)量國(guó)家標(biāo)準(zhǔn)”“建立完善國(guó)家教育基本標(biāo)準(zhǔn)”[1],強(qiáng)調(diào)了標(biāo)準(zhǔn)對(duì)于教育信息化的重要性;2017年發(fā)布的《關(guān)于深化教育體制機(jī)制改革的意見(jiàn)》再次強(qiáng)調(diào)要“完善教育標(biāo)準(zhǔn)體系”。由此可見(jiàn),知識(shí)共享對(duì)教育信息化的重要性。
知識(shí)圖譜作為人工智能知識(shí)組織與表示的最新技術(shù),是新時(shí)代作為知識(shí)表示的最具潛力的發(fā)展方向。由于知識(shí)圖譜是以語(yǔ)義Web七層協(xié)議為基礎(chǔ)的,所以在知識(shí)圖譜中表示知識(shí)的核心與關(guān)鍵是其中的本體層。本體提供了預(yù)定義共享詞匯,即提供了整套的元本體規(guī)范。眾所周知,知識(shí)圖譜是由模式層與數(shù)據(jù)層構(gòu)成的,其中模式層由本體來(lái)定義。由此可見(jiàn),盡管語(yǔ)義Web七層協(xié)議棧自底向上,全部由W3C給出標(biāo)準(zhǔn)化定義,但是并不代表由本體所表示的領(lǐng)域知識(shí)就一定是標(biāo)準(zhǔn)化的。如果要使領(lǐng)域的知識(shí)表示的模式層也是標(biāo)準(zhǔn)化的,那么就必須采用領(lǐng)域標(biāo)準(zhǔn)。隨著當(dāng)下語(yǔ)義標(biāo)準(zhǔn)化技術(shù)的發(fā)展,國(guó)際上一些機(jī)構(gòu)發(fā)布了許多用來(lái)表示語(yǔ)義的本體事實(shí)標(biāo)準(zhǔn)或法律意義上的本體標(biāo)準(zhǔn)。這些本體標(biāo)準(zhǔn)中,有許多是通用領(lǐng)域的標(biāo)準(zhǔn),因此,可以作為教育領(lǐng)域的標(biāo)準(zhǔn)之一予以采用。知識(shí)圖譜不僅克服了傳統(tǒng)元數(shù)據(jù)標(biāo)準(zhǔn)存在的語(yǔ)義缺乏問(wèn)題,而且還能夠解決數(shù)據(jù)語(yǔ)義的互聯(lián)互通問(wèn)題,利用這一新技術(shù)能夠建立教育資源中知識(shí)的表示標(biāo)準(zhǔn),從根本上避免“知識(shí)孤島”的再次產(chǎn)生。
本文在對(duì)國(guó)內(nèi)外教育知識(shí)圖譜及相關(guān)領(lǐng)域元數(shù)據(jù)標(biāo)準(zhǔn)研究基礎(chǔ)上,以W3C語(yǔ)義Web標(biāo)準(zhǔn)協(xié)議棧為基礎(chǔ),深入地研究了國(guó)際、國(guó)內(nèi)與教育領(lǐng)域相關(guān)的詞匯標(biāo)準(zhǔn),包括元數(shù)據(jù)詞匯標(biāo)準(zhǔn)和本體詞匯標(biāo)準(zhǔn),提出了一種將國(guó)內(nèi)外多種標(biāo)準(zhǔn)詞匯融合為一體的教育領(lǐng)域標(biāo)準(zhǔn)詞匯參考模型,利用該模型來(lái)指導(dǎo)教育領(lǐng)域知識(shí)圖譜的構(gòu)建。盡管該參考模型是基于教育領(lǐng)域提出的,但它對(duì)于其他領(lǐng)域的知識(shí)圖譜標(biāo)準(zhǔn)構(gòu)建同樣具有借鑒意義。
二、國(guó)內(nèi)外教育詞匯標(biāo)準(zhǔn)研究
(一)教育資源元數(shù)據(jù)標(biāo)準(zhǔn)研究現(xiàn)狀
1. 國(guó)外關(guān)于教育資源元數(shù)據(jù)標(biāo)準(zhǔn)的研究
學(xué)習(xí)資源共享和系統(tǒng)互操作的根本解決措施是教育資源標(biāo)準(zhǔn)化。國(guó)際上對(duì)教育資源標(biāo)準(zhǔn)化的研究始于1960年代末,當(dāng)時(shí)的政府和學(xué)術(shù)界針對(duì)學(xué)習(xí)資源的可共享性、可互通性以及系統(tǒng)的互操作性提出了一系列的標(biāo)準(zhǔn)和規(guī)范。這些標(biāo)準(zhǔn)相互借鑒、相互兼容并逐漸完善,從而形成了一系列具有影響力的研究成果,并在實(shí)踐中逐漸被采納和應(yīng)用,其中有一些典型國(guó)家和組織代表,諸如美國(guó)、歐洲以及標(biāo)準(zhǔn)化組織等。
美國(guó)相關(guān)標(biāo)準(zhǔn)研究:1993年,AICC就提出了CMI(計(jì)算機(jī)管理教學(xué)互操作指導(dǎo)規(guī)范)[2],后來(lái)美國(guó)國(guó)防部(DoD)在ADL項(xiàng)目中又借鑒了此標(biāo)準(zhǔn),并且建立了SCORM(可共享課程對(duì)象參考模型)[3]。1996年,EDUCOM又設(shè)立了IMS組織[4],并一直進(jìn)行一系列IMS標(biāo)準(zhǔn)的研究制定工作。后來(lái)的許多標(biāo)準(zhǔn)都引用了IMS的標(biāo)準(zhǔn)文檔,比如IEEE/LTSC和SCORM等。1998年,NCES設(shè)立了SPEEDE/ExPRESS研究項(xiàng)目[5],并由此產(chǎn)生了一套適用于電子教育的電子數(shù)據(jù)交換標(biāo)準(zhǔn)。此外,由非營(yíng)利性組織RSCA發(fā)展而來(lái)的ICRA,其主要目標(biāo)是研究網(wǎng)頁(yè)內(nèi)容的分級(jí)研究及推廣的標(biāo)準(zhǔn)。除此之外,美國(guó)其他網(wǎng)絡(luò)教育技術(shù)相關(guān)標(biāo)準(zhǔn)研究還有Microsoft LRN(學(xué)習(xí)資源交換),2009年發(fā)布的CEDS的通用教育數(shù)據(jù)標(biāo)準(zhǔn)的研究計(jì)劃,研究的最終目的是通過(guò)對(duì)數(shù)據(jù)的規(guī)范來(lái)提高教育質(zhì)量和改善教育問(wèn)題。這些標(biāo)準(zhǔn)化組織多年來(lái)一直進(jìn)行著標(biāo)準(zhǔn)的研究制定工作,2013年ADL發(fā)布了Experience API規(guī)范。近幾年IMS又制定了電子學(xué)習(xí)檔案規(guī)范[6]。
歐洲相關(guān)標(biāo)準(zhǔn)研究:ARIDNE是一個(gè)從事網(wǎng)絡(luò)教育技術(shù)標(biāo)準(zhǔn)研究的組織,研究方向一直是教學(xué)法的建模和標(biāo)準(zhǔn)化研究,它與著名的IMS一同推進(jìn)了LOM的國(guó)際標(biāo)準(zhǔn)化[7],促進(jìn)了多媒體工程在社會(huì)教育與培訓(xùn)過(guò)程中的使用,多媒體、多語(yǔ)種與學(xué)習(xí)者模型都作為其重點(diǎn)研究對(duì)象;另外還有CEN/ISSS,也與多個(gè)組織有廣泛的合作,并共同進(jìn)行標(biāo)準(zhǔn)的研究工作,如IMS、IEEE LTSC、ISO SC36等;還有由歐盟資助的GESTALT工程項(xiàng)目,一直以來(lái)致力于一個(gè)大規(guī)模的教育信息化系統(tǒng)的開(kāi)發(fā)研究,通過(guò)對(duì)IEEE LOM V2.5、IMS V1.0、ARIADNE V2.0等標(biāo)準(zhǔn)進(jìn)行分析研究,最終產(chǎn)生了GEMSTONES(在線教育元數(shù)據(jù)擴(kuò)展標(biāo)準(zhǔn))。
國(guó)際組織的相關(guān)標(biāo)準(zhǔn)研究:1995年,在都柏林發(fā)起了一項(xiàng)DCMI研究行動(dòng),其于2008年成為一個(gè)進(jìn)行電子數(shù)據(jù)對(duì)象標(biāo)準(zhǔn)相關(guān)研究的組織[8],隨后,成立了一個(gè)教育工作小組DC-E,他們從電子圖書(shū)元數(shù)據(jù)標(biāo)準(zhǔn)中篩選出15個(gè)元素作為學(xué)習(xí)對(duì)象的數(shù)據(jù)元素。它的標(biāo)準(zhǔn)目前已經(jīng)被國(guó)際廣泛采用和參考。1996年,IEEE-LTCS開(kāi)始了學(xué)習(xí)技術(shù)標(biāo)準(zhǔn)的研究制定工作,目標(biāo)是促進(jìn)學(xué)習(xí)資源的開(kāi)發(fā)、使用、維護(hù)及互通,最終在2002年發(fā)布了IEEE P1484系列標(biāo)準(zhǔn),此標(biāo)準(zhǔn)覆蓋范圍很大,其中包括教育、培訓(xùn)、學(xué)習(xí)技術(shù)和元數(shù)據(jù)等,其中有一項(xiàng)標(biāo)準(zhǔn)IEEE 1484.12于2011年發(fā)布,在該標(biāo)準(zhǔn)的基礎(chǔ)之上,隨后產(chǎn)生了LOM(學(xué)習(xí)對(duì)象元數(shù)據(jù)標(biāo)準(zhǔn))[9],目的是通過(guò)定義一個(gè)元數(shù)據(jù)模型,讓學(xué)習(xí)者或教育者可以快速準(zhǔn)確地發(fā)現(xiàn)學(xué)習(xí)對(duì)象,并在評(píng)估和使用方面提供支持,基于此來(lái)實(shí)現(xiàn)學(xué)習(xí)對(duì)象的共享和互換;2015年—2019年,IEEE P1484系列又相繼發(fā)布了一些標(biāo)準(zhǔn)。除此之外,日本的先進(jìn)學(xué)習(xí)基架協(xié)議會(huì)、W3C的相關(guān)標(biāo)準(zhǔn)如XML、RDF、SMIF、PICS、P3P、ASTD在2001年推出的E-Learning課件證書(shū)標(biāo)準(zhǔn)等等。ISO/IEC JTC1/SC36 負(fù)責(zé)制定學(xué)習(xí)、教育和培訓(xùn)領(lǐng)域信息技術(shù)(ITLET)國(guó)際標(biāo)準(zhǔn),在2013年—2016年分別發(fā)布了ISO/IEC 2382-36:2013、ISO/IEC 20006-1:2014、ISO/IEC 20006-2:2015和ISO/IEC TR 18120:2016等系列標(biāo)準(zhǔn)。
2. 國(guó)內(nèi)關(guān)于教育資源元數(shù)據(jù)標(biāo)準(zhǔn)的研究
資源共享的前提是資源的規(guī)范化,我國(guó)在教育信息化的號(hào)角吹響以后,緊跟時(shí)代步伐,2000年成立了DLTSC(現(xiàn)代遠(yuǎn)程教育技術(shù)標(biāo)準(zhǔn)化委員會(huì))[6],在2002 年又經(jīng)過(guò)批準(zhǔn)成立全國(guó)信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員會(huì)教育技術(shù)分技術(shù)委員會(huì)CELTSC(China E-Learning Technology Standardization Committee),研究出了符合我國(guó)特色的一系列CELTS規(guī)范和遠(yuǎn)程教育技術(shù)標(biāo)準(zhǔn)體系結(jié)構(gòu), 此體系結(jié)構(gòu)被分為指導(dǎo)類(lèi)、學(xué)習(xí)資源類(lèi)、學(xué)習(xí)者類(lèi)、學(xué)習(xí)環(huán)境類(lèi)和教育管理類(lèi)五類(lèi)。根據(jù)作用范圍不同,這些標(biāo)準(zhǔn)又可以分為通用規(guī)范與專(zhuān)用規(guī)范,其中通用類(lèi)范圍適用對(duì)象廣泛,與此同時(shí),還為用戶(hù)留下了適用于自己的發(fā)展空間,使用戶(hù)在統(tǒng)一的框架下,可以選擇以及改進(jìn)部分?jǐn)?shù)據(jù)項(xiàng)目,而另一個(gè)是指對(duì)于特定領(lǐng)域來(lái)說(shuō)約束力更強(qiáng)的規(guī)范。這些標(biāo)準(zhǔn)大部分根據(jù)國(guó)際IEEE1484借鑒而來(lái)。近些年,隨著信息技術(shù)在教育領(lǐng)域的應(yīng)用,學(xué)者對(duì)于應(yīng)用的規(guī)范也更加關(guān)注,而此規(guī)范不僅可以應(yīng)用于遠(yuǎn)程教育系統(tǒng),也適用于其他教學(xué)系統(tǒng)。此規(guī)范中,面向教育資源的國(guó)內(nèi)標(biāo)準(zhǔn)有CELTS3、CELTS42、CELTS41和CELTS9等,其中CELTS41的側(cè)重點(diǎn)在于將資源開(kāi)發(fā)者的開(kāi)發(fā)行為、制作要求和應(yīng)用的功能等要求進(jìn)行規(guī)范,它將教育資源分為媒體素材、網(wǎng)絡(luò)課程、試題庫(kù)、試卷、課件、案例、文獻(xiàn)資料、常見(jiàn)問(wèn)題解答、資源目錄索引9種類(lèi)型。CELTS3主要參照IEEE LOM,通過(guò)定義一個(gè)統(tǒng)一的數(shù)據(jù)模型,描述學(xué)習(xí)對(duì)象和保障學(xué)習(xí)對(duì)象之間的語(yǔ)義互操作。CELTS42以DC元數(shù)據(jù)為主要參考,旨在提供一個(gè)統(tǒng)一的教學(xué)資源數(shù)據(jù)模型,該模型主要面向基礎(chǔ)教育,該規(guī)范包含了23個(gè)數(shù)據(jù)元素,其中有11個(gè)必需的數(shù)據(jù)元素,有 12 個(gè)是可選數(shù)據(jù)元素,另外還包含了限定詞匯和編目詞匯表。CELTS9則以IMS 和 ADL SCORM 兩個(gè)規(guī)范為參照對(duì)象,它主要定義在網(wǎng)絡(luò)化學(xué)習(xí)中的學(xué)習(xí)內(nèi)容之間進(jìn)行互操作時(shí)需要的數(shù)據(jù)結(jié)構(gòu)以及如何對(duì)學(xué)習(xí)內(nèi)容進(jìn)行包裝。除此之外,我國(guó)在2013年發(fā)布了《電子圖書(shū)元數(shù)據(jù)》[10],目的是規(guī)范電子圖書(shū)的元數(shù)據(jù)構(gòu)成、元素和屬性。同年,還立項(xiàng)了“信息技術(shù)學(xué)習(xí)、教育和培訓(xùn) 教育中的電子課本需求”。2016年,為了規(guī)范我國(guó)電子課本與電子書(shū)包的可持續(xù)發(fā)展,正式發(fā)布了對(duì)電子課本與電子書(shū)包的標(biāo)準(zhǔn)體系研究,另外,《中小學(xué)數(shù)字教材元數(shù)據(jù)》標(biāo)準(zhǔn)以數(shù)字教材為描述對(duì)象,在元數(shù)據(jù)結(jié)構(gòu)上的設(shè)計(jì)以《電子圖書(shū)元數(shù)據(jù)》為基礎(chǔ),規(guī)范了中小學(xué)數(shù)字教材的開(kāi)發(fā)和管理以及應(yīng)用。教育部教育信息化技術(shù)標(biāo)準(zhǔn)委員會(huì)在2017年又發(fā)布了《GB/T 35298—2017信息技術(shù)學(xué)習(xí)、教育和培訓(xùn) 教育管理基礎(chǔ)信息》和《GB/T 33782—2017信息技術(shù)學(xué)習(xí)、教育和培訓(xùn)教育管理》。我國(guó)一直積極參與國(guó)際標(biāo)準(zhǔn)化組織的相關(guān)標(biāo)準(zhǔn)的制定工作,如ISO/IEC TR 24725-1:2011、ISO/IEC TR 24725-3:2010、ISO/IEC TR 18121:2015和ISO/IEC TR 18120:2016等。
資源標(biāo)準(zhǔn)化和教育信息化都是一個(gè)不斷推進(jìn)的過(guò)程,教育資源建設(shè)的開(kāi)發(fā)者需要在實(shí)踐過(guò)程中不斷探索,資源共享的前提是資源的標(biāo)準(zhǔn)化,只有教育資源標(biāo)準(zhǔn)化工作和教育信息化同步進(jìn)行,我國(guó)教育資源的建設(shè)及網(wǎng)絡(luò)教育的普及才能順利向前推動(dòng)[11]。
(二)關(guān)于教育領(lǐng)域本體的研究
1. 本體定義與標(biāo)準(zhǔn)詞匯的關(guān)系
目前對(duì)于本體公認(rèn)的定義是 Studer在 1998 年給出的知識(shí)本體的定義:它是一種概念體系的明確的、形式化、可共享的規(guī)范[12];另外一個(gè)同樣被廣泛認(rèn)可和采用的定義是Neches等人提出來(lái)的,他將本體定義為給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語(yǔ)和關(guān)系,并根據(jù)這些術(shù)語(yǔ)和關(guān)系來(lái)構(gòu)成規(guī)定這些詞匯的外延規(guī)則的定義[13]。綜合Studer和Neches給出的本體定義可以看出:本體的實(shí)質(zhì)即概念模型,尤其N(xiāo)eches是從標(biāo)準(zhǔn)化的角度闡述了本體的定義。本文正是將指定概念的指稱(chēng)或名稱(chēng)或術(shù)語(yǔ)統(tǒng)稱(chēng)為標(biāo)準(zhǔn)詞匯。
三、教育知識(shí)圖譜標(biāo)準(zhǔn)詞匯參考模型與構(gòu)建流程
(一)標(biāo)準(zhǔn)詞匯參考模型
通過(guò)對(duì)國(guó)內(nèi)外通用領(lǐng)域、教育領(lǐng)域的各種元數(shù)據(jù)標(biāo)準(zhǔn)以及事實(shí)本體標(biāo)準(zhǔn)詞匯的匯總與研究,并以系統(tǒng)理論作為依據(jù),融入語(yǔ)義Web標(biāo)準(zhǔn)體系,構(gòu)建了用于指導(dǎo)構(gòu)建教育領(lǐng)域知識(shí)圖譜的標(biāo)準(zhǔn)詞匯分類(lèi)體系參考模型,整個(gè)標(biāo)準(zhǔn)詞匯組成了一個(gè)詞匯標(biāo)準(zhǔn)系統(tǒng),該系統(tǒng)中的子系統(tǒng)是分層組織的,具體如圖1所示。
整個(gè)參考模型自底向上依次為第一層,即語(yǔ)義Web預(yù)定義詞匯層:本體序列化標(biāo)準(zhǔn)(W3C預(yù)定義的標(biāo)準(zhǔn)詞匯表);第二層是頂層標(biāo)準(zhǔn)詞匯;第三層是教育專(zhuān)題標(biāo)準(zhǔn)詞匯。其中第一層又包含兩個(gè)子層,第一個(gè)子層是元本體編碼標(biāo)準(zhǔn);第二個(gè)子層是元本體規(guī)范。第一個(gè)子層由W3C定義了網(wǎng)絡(luò)資源唯一標(biāo)識(shí)URI規(guī)范、UNICODE規(guī)范、XML規(guī)范、XML NS規(guī)范以及XML Schema規(guī)范等,這些都是基礎(chǔ)規(guī)范,為上層定義更高一級(jí)的語(yǔ)義表達(dá)語(yǔ)言奠定基礎(chǔ)。第二個(gè)子層由W3C制定的自底向上語(yǔ)義逐漸增強(qiáng)的RDF詞匯規(guī)范、RDFs詞匯規(guī)范以及OWL詞匯規(guī)范構(gòu)成,最后利用這些規(guī)范實(shí)現(xiàn)對(duì)教育知識(shí)圖譜進(jìn)行定義與序列化。
第二層是頂層標(biāo)準(zhǔn)詞匯,該層包含頂層元數(shù)據(jù)詞匯表與頂層本體詞匯表兩個(gè)子層。頂層詞匯表一般稱(chēng)為通用詞匯表,從理論上講,該層提供的詞匯可以被任何領(lǐng)域所引用。其中頂層元數(shù)據(jù)詞匯子層包括都柏林核心集元數(shù)據(jù)(DCMI)、政府定位信息服務(wù)元數(shù)據(jù)標(biāo)準(zhǔn)(GILS)、機(jī)讀目錄格式元數(shù)據(jù)標(biāo)準(zhǔn)(MARC)以及國(guó)際標(biāo)準(zhǔn)書(shū)目著錄元數(shù)據(jù)標(biāo)準(zhǔn)(ISBN)等,值得注意的是,這里列的不全,還有諸如國(guó)際標(biāo)準(zhǔn)時(shí)間元數(shù)據(jù)、事件活動(dòng)元數(shù)據(jù)等。頂層本體詞匯子層在國(guó)際上基本是作為事實(shí)或法律上的標(biāo)準(zhǔn)使用的,其中包含Schema.org本體,該本體中定義了組織機(jī)構(gòu)、人、地點(diǎn)、日期、時(shí)間、期限、事件、商品等;Dbpedia、SUMO、YAGO、Wordnet、Hownet、FOAF、BIBO等,這些頂層本體中的一些詞匯可以作為標(biāo)準(zhǔn)直接引用。
第三層教育專(zhuān)題標(biāo)準(zhǔn)詞匯表包含兩個(gè)子層,一個(gè)是教育專(zhuān)題元數(shù)據(jù)詞匯子層,另一個(gè)是教育本體詞匯表子層。其中專(zhuān)題元數(shù)據(jù)詞匯子層包括教育領(lǐng)域各種元數(shù)據(jù)標(biāo)準(zhǔn),該類(lèi)標(biāo)準(zhǔn)最為豐富,它既包括國(guó)際上的一些教育元數(shù)據(jù)標(biāo)準(zhǔn),也包括國(guó)內(nèi)教育元數(shù)據(jù)標(biāo)準(zhǔn)。國(guó)際上一些典型的教育元數(shù)據(jù)標(biāo)準(zhǔn)有美國(guó)ACII提出的最早的計(jì)算機(jī)管理教學(xué)CMI標(biāo)準(zhǔn)、SCORM標(biāo)準(zhǔn);歐洲及歐盟提出的IEEE LOM V2.5、ARIADNE V2.0系列標(biāo)準(zhǔn);國(guó)際標(biāo)準(zhǔn)化組織建立的IEEE P1484和LOM標(biāo)準(zhǔn); 國(guó)內(nèi)最具代表性的機(jī)構(gòu)就是CELTSC,它針對(duì)我國(guó)國(guó)情提出的CELTS系列標(biāo)準(zhǔn),這些標(biāo)準(zhǔn)吸收了國(guó)際上DC、DCMI以及LOM等標(biāo)準(zhǔn),其中包括學(xué)習(xí)對(duì)象元數(shù)據(jù)(CELTS-3)、簡(jiǎn)單課程編列規(guī)范(CELTS-8)等圖譜。第三層中第二個(gè)子層是教育專(zhuān)題本體詞匯,它又包括兩個(gè)子層,目前,這里的教育本體詞匯尚未存在;對(duì)于此處的輕型本詞匯表主要是教育領(lǐng)域的分類(lèi)法、敘詞表等,對(duì)于教育來(lái)講,其中的《教育主題詞表》收藏了教育各個(gè)主題的標(biāo)準(zhǔn)敘詞詞匯,這些都是構(gòu)建教育知識(shí)圖譜的寶貴資源。
(二)教育知識(shí)圖譜構(gòu)建流程
本體建模方法有很多,諸如骨架法、TOVE法、Methontology、斯坦福大學(xué)的七步法,其中以七步法應(yīng)用比較多。本文以七步法為基礎(chǔ)構(gòu)建教育知識(shí)圖譜,流程如下:
步驟1:確定構(gòu)建教育知識(shí)圖譜的主題領(lǐng)域和范疇。
步驟2:復(fù)用本體,從所構(gòu)建的教育知識(shí)圖譜標(biāo)準(zhǔn)詞匯參考模型中去檢索有沒(méi)有可復(fù)用的本體,分別在標(biāo)準(zhǔn)詞匯參考模型的頂層標(biāo)準(zhǔn)詞匯中的頂層本體詞匯和教育專(zhuān)題詞匯中的教育專(zhuān)題本體詞匯中去檢索可復(fù)用的本體。
步驟3:依據(jù)步驟1確定的主題范圍,通過(guò)需求分析確定該主題所有概念對(duì)應(yīng)的專(zhuān)業(yè)術(shù)語(yǔ),并列出這些專(zhuān)業(yè)術(shù)語(yǔ)。在術(shù)語(yǔ)列表的基礎(chǔ)上進(jìn)行完善,自頂而下細(xì)化概念之間的關(guān)系,完善概念間的等級(jí)體系,定義概念屬性,最后建立類(lèi)屬性。
步驟4:類(lèi)和類(lèi)的等級(jí)體系,到標(biāo)準(zhǔn)詞匯表參考模型中檢索出術(shù)語(yǔ)對(duì)應(yīng)的標(biāo)準(zhǔn)詞匯,定義出類(lèi)與類(lèi)之間的層次關(guān)系,可以采用自底向上和自頂向下的方法,在定義過(guò)程中可以考慮約束、公理等的定義。
步驟5:定義類(lèi)的屬性,從步驟3選出的那些術(shù)語(yǔ),除了表示類(lèi)的術(shù)語(yǔ)之外,剩下的大多數(shù)就是類(lèi)的屬性,研究并選出類(lèi)的屬性。對(duì)類(lèi)屬性進(jìn)行全面定義,對(duì)于對(duì)象類(lèi)屬性可以采用對(duì)象定義方法,當(dāng)類(lèi)屬性為數(shù)據(jù)屬性時(shí),可以定義該數(shù)據(jù)屬性的類(lèi)型、寬度、計(jì)量單位、約束等。
步驟6:創(chuàng)建實(shí)例,首先確定定義實(shí)例的類(lèi),確定一個(gè)具體的類(lèi),最后創(chuàng)建該類(lèi)的一個(gè)實(shí)例,并添加這個(gè)類(lèi)的屬性值。
步驟7:從步驟4到步驟6,這個(gè)過(guò)程可以利用現(xiàn)成的工具,例如Protégé工具,也可以手動(dòng)建立,最后由標(biāo)準(zhǔn)詞匯參考模型中的本體規(guī)范對(duì)所構(gòu)建本體進(jìn)行形式化。
通過(guò)上述流程實(shí)現(xiàn)依據(jù)標(biāo)準(zhǔn)詞匯參考模型的教育知識(shí)圖譜的構(gòu)建。
四、原型系統(tǒng)
(一)項(xiàng)目背景及系統(tǒng)的技術(shù)架構(gòu)
原型實(shí)現(xiàn)中,融合推薦系統(tǒng)通用模型與自適應(yīng)學(xué)習(xí)系統(tǒng)通用模型(AEHS)作為參考,提出了本項(xiàng)目的基于知識(shí)圖譜的學(xué)習(xí)資源可視化與個(gè)性化推薦系統(tǒng)架構(gòu),如圖2所示。系統(tǒng)架構(gòu)主要由領(lǐng)域知識(shí)模型、學(xué)習(xí)者模型和可視化功能等組成,其中學(xué)習(xí)資源模型是一個(gè)領(lǐng)域知識(shí)庫(kù),用于表示某個(gè)領(lǐng)域或某一門(mén)課程的知識(shí)結(jié)構(gòu);學(xué)習(xí)者模型用于表示學(xué)習(xí)者信息、用戶(hù)信息、關(guān)系信息、興趣偏好等知識(shí);可視化功能主要用于知識(shí)的可視化。
(二)C語(yǔ)言學(xué)習(xí)資源與學(xué)習(xí)者知識(shí)圖譜的構(gòu)建
1. C語(yǔ)言知識(shí)圖譜的構(gòu)建
依據(jù)文中給出的知識(shí)圖譜構(gòu)建流程,并根據(jù)“C程序設(shè)計(jì)”課程內(nèi)容大綱進(jìn)行術(shù)語(yǔ)的確定,總結(jié)出“C程序設(shè)計(jì)”的重要術(shù)語(yǔ),同時(shí)將元數(shù)據(jù)規(guī)范的術(shù)語(yǔ)列表提取出來(lái),接下來(lái)根據(jù)“C程序設(shè)計(jì)”課程主要知識(shí)結(jié)構(gòu)進(jìn)行類(lèi)的級(jí)別的確定,依照標(biāo)準(zhǔn)詞匯參考模型中的CELTS42教育資源建設(shè)技術(shù)規(guī)范和DC元數(shù)據(jù)規(guī)范,基于課程資源屬性選擇需要的數(shù)據(jù)元素,擴(kuò)展新的數(shù)據(jù)元素,確定相應(yīng)的詞匯和分類(lèi)方法,最后建立實(shí)例,并添加相應(yīng)的數(shù)據(jù)屬性或者對(duì)象屬性,構(gòu)建基于網(wǎng)絡(luò)學(xué)習(xí)資源屬性的元數(shù)據(jù)模型,所構(gòu)建的C語(yǔ)言課程資源知識(shí)圖譜如圖3所示。
2. 學(xué)習(xí)者知識(shí)圖譜的構(gòu)建
標(biāo)準(zhǔn)詞匯參考模型中的頂層本體詞匯有FOAF和Relationship。目前FOAF本體已經(jīng)是一個(gè)比較成熟的本體系統(tǒng),F(xiàn)OAF本體包含了多個(gè)類(lèi)和屬性,其中類(lèi)主要包括代理、文件、組織、聯(lián)機(jī)賬戶(hù)、人、個(gè)人信息文件、項(xiàng)目等,描述的內(nèi)容非常詳細(xì)和廣泛。Relationship本體只有一個(gè)類(lèi),但包含30多個(gè)屬性,親屬關(guān)系、婚姻及居住關(guān)系、師承關(guān)系、工作關(guān)系、關(guān)系親疏、影響關(guān)系等,基本上涵蓋了人與人之間的所有關(guān)系。將FOAF和本體Relationship進(jìn)行融合,融合后的本體含有類(lèi)和屬性。FOAF本體定義了關(guān)于用戶(hù)、用戶(hù)關(guān)系以及相關(guān)活動(dòng)的元數(shù)據(jù),用于描述Web中的人、實(shí)體、他們之間的關(guān)系以及他們的行為所產(chǎn)生的內(nèi)容。
五、結(jié)論與展望
本文對(duì)國(guó)內(nèi)外教育領(lǐng)域相關(guān)數(shù)據(jù)標(biāo)準(zhǔn)進(jìn)行了較為全面的研究,認(rèn)為國(guó)內(nèi)外教育數(shù)據(jù)標(biāo)準(zhǔn)的研究主要處于元數(shù)據(jù)標(biāo)準(zhǔn)研發(fā)階段。目前,盡管有些文獻(xiàn)提出并強(qiáng)調(diào)了教育標(biāo)準(zhǔn)語(yǔ)義化的重要性,但是還未見(jiàn)到系統(tǒng)的研究成果。隨著大數(shù)據(jù)與人工智能技術(shù)在教育領(lǐng)域的深度應(yīng)用,人們?cè)絹?lái)越認(rèn)識(shí)到教育知識(shí)共享的重要性。目前,無(wú)論是國(guó)際還是國(guó)內(nèi)都研究了大量的教育元數(shù)據(jù)標(biāo)準(zhǔn),隨著近十多年本體技術(shù)在各個(gè)領(lǐng)域的應(yīng)用,國(guó)際與國(guó)內(nèi)出現(xiàn)了一些事實(shí)或法律上的本體標(biāo)準(zhǔn),再加之近幾年知識(shí)圖譜技術(shù)的提出與應(yīng)用的流行,這些都為我國(guó)研究與建設(shè)標(biāo)準(zhǔn)化的教育領(lǐng)域知識(shí)圖譜創(chuàng)造了前所未有的條件。因此,為滿(mǎn)足我國(guó)教育領(lǐng)域當(dāng)下及未來(lái)的教育智慧化對(duì)知識(shí)的迫切需求,研發(fā)我國(guó)教育領(lǐng)域的知識(shí)標(biāo)準(zhǔn)迫在眉睫。因此,在這種背景下,本文將國(guó)內(nèi)外教育領(lǐng)域標(biāo)準(zhǔn)詞匯以及與教育相關(guān)的本體標(biāo)準(zhǔn)和W3C七層語(yǔ)義Web規(guī)范融合為一體,提出了教育標(biāo)準(zhǔn)詞匯參考模型。最后,結(jié)合具體項(xiàng)目構(gòu)建了基于“C程序設(shè)計(jì)”的學(xué)習(xí)者模型和學(xué)習(xí)資源的知識(shí)圖譜,實(shí)現(xiàn)了對(duì)它們的可視化功能。本研究為未來(lái)教育知識(shí)圖譜標(biāo)準(zhǔn)化的研究提供了一種新思想,并得出結(jié)論:我國(guó)教育資源的標(biāo)準(zhǔn)化勢(shì)在必行!沒(méi)有融入標(biāo)準(zhǔn)而構(gòu)建的教育知識(shí)圖譜,其生命周期不會(huì)很長(zhǎng),只有融入標(biāo)準(zhǔn)的教育知識(shí)圖譜才能為未來(lái)教育領(lǐng)域資源的融合、集成、共享及互操作奠定基礎(chǔ)。接下來(lái),我們將對(duì)教育資源細(xì)粒度的元數(shù)據(jù)標(biāo)準(zhǔn)整合展開(kāi)研究,以期為教育知識(shí)的融合探路。
[參考文獻(xiàn)]
[1] 教育部.關(guān)于印發(fā)《教育信息化“十三五”規(guī)劃》的通知[J].蘇州教育信息化,2016(3):7-11,18.
[2] 祝智庭.網(wǎng)絡(luò)教育技術(shù)標(biāo)準(zhǔn)研究[J].電化教育研究,2001(8):72-78.
[3] NJUGUNA N,F(xiàn)LANDERS AE,KAHN CE JR et al.Informatics in radiology:envisioning the future of? E-Learning in radiology:an introduction to SCORM[J].Radiographics,2011,31(4):1173-1179.
[4] IMS. IMS learning tools interoperability[EB/OL]. [2017-10-12]. http://www.imsglobal.org/activity/learning-tools-interoperability.
[5] 余勝泉,楊琰華.從網(wǎng)絡(luò)互聯(lián)到應(yīng)用互聯(lián)——“校校通”的“通”途[J].電化教育研究,2004(6):41-46.
[6] 吳砥,王楊春曉,彭嫻.教育信息化標(biāo)準(zhǔn)研究綜述[J].電化教育研究,2019,40(1):45-51,76.
[7] 過(guò)玉清.學(xué)習(xí)對(duì)象元數(shù)據(jù)LOM在教育資源建設(shè)中的應(yīng)用初探[J].電腦迷,2017(7):149-150.
[8] DCMI Metadata Terms.Dublin Core Metadata Initiative[EB/OL].(2019-04-20)[2019-12-05].http://www.dublincore.org/documents/dcmi-terms.
[9] 吳砥,饒景陽(yáng),王楊春曉.教育大數(shù)據(jù)標(biāo)準(zhǔn)化的思考與建議[J].計(jì)算機(jī)教育,2018(11):12-15.
[10] 鐘岑岑.中小學(xué)數(shù)字教材元數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)比較研究[J].出版參考,2017(11):42-44.
[11] 方勇.職業(yè)教育標(biāo)準(zhǔn)的建設(shè)與管理[J].職教論壇,2017(28):20-23.
[12] STUDER R,BENJAM INS V R,F(xiàn)ENSEL D.Knowledge engineering:principles and methods[J].Data and knowledge engineering,1998,25(1):161-197.
[13] NECHES R,F(xiàn)IKES R E,GRUBER T R,et al.Enabling technology for knowledge sharing [J].AI magazine,1991,12(3):36.
[14] 趙健,孫暢.DC元數(shù)據(jù)的編碼語(yǔ)言研究[J].情報(bào)雜志,2004(4):26-28.
[15] 張玉根.基于語(yǔ)義的中職課程本體的構(gòu)建及應(yīng)用[D].保定:河北大學(xué),2019.
[16] 劉小樂(lè).教育領(lǐng)域頂層本體構(gòu)建及其應(yīng)用研究[D].長(zhǎng)春:吉林大學(xué),2012.
[17] 吳鵬飛,余勝泉,丁國(guó)柱,潘升.學(xué)習(xí)語(yǔ)義關(guān)聯(lián)數(shù)據(jù)構(gòu)建研究與實(shí)踐[J]電化教育研究,2016,37(3):78-85.
[18] 馮瑤,馮錫煒.基于元數(shù)據(jù)標(biāo)準(zhǔn)的語(yǔ)義化教育資源本體庫(kù)構(gòu)建與實(shí)現(xiàn)[J].電子設(shè)計(jì)工程,2015,23(18):12-15.
[19] 林杰.基于本體的網(wǎng)絡(luò)教育資源庫(kù)的研究與實(shí)現(xiàn)[D].廣州:華南理工大學(xué),2009.
[20] 湯庸,陳國(guó)華,賀超波,彭博.知識(shí)圖譜及其在學(xué)術(shù)信息服務(wù)領(lǐng)域的應(yīng)用[J].華南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,50(5):110-119.
[21] 王紅,丁媛,張劍.SUMO——頂級(jí)本體的介紹與啟示[J].圖書(shū)館理論與實(shí)踐,2007(3):96-98.
[22] 徐增林,盛泳潘,賀麗榮,王雅芳.知識(shí)圖譜技術(shù)綜述[J].電子科技大學(xué)學(xué)報(bào), 2016,45(4):589-606.
[23] 楊瑛,朱頻頻.語(yǔ)義技術(shù)應(yīng)用與標(biāo)準(zhǔn)發(fā)展[J].信息技術(shù)與標(biāo)準(zhǔn)化,2015(4):18-20.
[24] TANG F Y,ZHU J,HE CB,e,al.SCHOLAT;an innovative academic information service platform[M]//CHEEMA M, ZHANG W, CHANG L.Databases Theory and Applications.Berlin:Springer,2016:453-456.
[25] TANG J.Science knowledge graph[Z/OL].(2009-12-12)[2018-05-03].https://www.aminer.cn/scikg.
[26] 李振,周東岱.教育知識(shí)圖譜的概念模型與構(gòu)建方法研究[J].電化教育研究,2019(8):78-86,113.
[27] 李艷燕,張香玲,李新,杜靜.面向智慧教育的學(xué)科知識(shí)圖譜構(gòu)建與創(chuàng)新應(yīng)用[J].電化教育研究,2019(8):60-69.