李京杰
摘? 要 語義網(wǎng)是未來萬維網(wǎng)的一種趨勢,對(duì)教育資源建設(shè)有著重要意義。為了更好地把握語義網(wǎng)在教育資源建設(shè)領(lǐng)域的應(yīng)用方向,采用文獻(xiàn)分析法,從發(fā)文量、研究內(nèi)容、發(fā)表來源等方面,探究語義網(wǎng)在教育資源建設(shè)領(lǐng)域的研究現(xiàn)狀,總結(jié)當(dāng)前存在的主要問題和趨勢,提出其在教育資源建設(shè)領(lǐng)域應(yīng)用的建議。
關(guān)鍵詞 語義網(wǎng);教育資源;網(wǎng)絡(luò)教育;教育信息化
中圖分類號(hào):G642? ? 文獻(xiàn)標(biāo)識(shí)碼:B
文章編號(hào):1671-489X(2019)04-0005-04
Abstract Semantic Web is a trend of the future World Wide Web, which is of great significance to the construction of educational resources. In order to better grasp the application direction of Seman-tic Web in the field of education resources construction, the paper uses literature analysis method to explore the research status of Se-mantic Web in the field of education resources construction from the aspects of volume of issuance, content of research, and source of publication. This paper summarizes the main problems and trends, and puts forward some suggestions on the application of Semantic Web in the field of educational resources construction.
Key words semantic web; educational resources; network educa-tion; education informatization
1 研究背景
現(xiàn)今教育信息化建設(shè)已取得顯著成就,而文字、圖片、視頻等異構(gòu)性的學(xué)習(xí)資源,因其自身的模糊特性和數(shù)據(jù)格式的多樣性,僅適應(yīng)于人們的閱讀需求,而無法被計(jì)算機(jī)檢索系統(tǒng)精確理解。由于這些信息間缺乏內(nèi)在聯(lián)系,因此給學(xué)習(xí)者甄選有效資源帶來很多困難。人機(jī)交互障礙是造成網(wǎng)絡(luò)學(xué)習(xí)低完成率和高輟學(xué)率的一個(gè)主要問題。
如今一些學(xué)者提出Web 3.0概念,其最重要也是最被看好的一點(diǎn)就是語義網(wǎng)[1]。智能是語義網(wǎng)最基本的內(nèi)涵,它能夠根據(jù)語義進(jìn)行判斷,可以實(shí)現(xiàn)人機(jī)之間的溝通,這其實(shí)已涉及人工智能范疇[1]。與傳統(tǒng)網(wǎng)絡(luò)相比,語義網(wǎng)技術(shù)能通過搜索引擎進(jìn)行語義推理,使分散于全球的獨(dú)立數(shù)據(jù)庫融合,解決各種資源的兼容和推廣問題。在大數(shù)據(jù)時(shí)代,學(xué)習(xí)者正在追求一種更加智能的方式以獲取有效的學(xué)習(xí)信息。語義網(wǎng)也為實(shí)現(xiàn)深度學(xué)習(xí)創(chuàng)造了良好的網(wǎng)絡(luò)環(huán)境,人性化檢索、個(gè)性化學(xué)習(xí)、跨語言共享、深度學(xué)習(xí)等理念已經(jīng)成為未來網(wǎng)絡(luò)教育的目標(biāo)。
我國教育資源建設(shè)各自為政,存在嚴(yán)重的資源浪費(fèi)和共享不均的情況。本研究旨在窺探語義網(wǎng)在教育資源建設(shè)中的積極意義,為更好地促進(jìn)我國教育資源環(huán)境建設(shè)提供策略參考。
2 對(duì)語義網(wǎng)的理解
語義萬維網(wǎng)(Semantic Web,簡稱語義網(wǎng))由萬維網(wǎng)創(chuàng)始人Tim Berners-Lee提出,是當(dāng)前Web的延伸和擴(kuò)展,是一種能理解人類語意的智能網(wǎng)絡(luò)。語義網(wǎng)研究的主要目的就是擴(kuò)展當(dāng)前的WWW,使網(wǎng)絡(luò)中盡可能多的信息都具有語義,在Web世界中流動(dòng)的不再是單純的數(shù)據(jù)流,而是機(jī)器可以理解的語義信息,從而更便于人和計(jì)算機(jī)之間的交互與合作[2]。
目前,Web網(wǎng)頁信息的呈現(xiàn)方式多種多樣,這些信息傳遞在給人們帶來豐富的視聽信息的同時(shí),也給人們使用搜索引擎獲取信息帶來困難。從量大而雜的信息中甄選有效內(nèi)容,大部分是人工進(jìn)行的,因?yàn)橛?jì)算機(jī)只能理解機(jī)器語言,如數(shù)據(jù)庫、程序符號(hào)和傳感器輸入等語言;而無法理解信息的語義,如對(duì)“母親”“娘”“Mother”,計(jì)算機(jī)會(huì)當(dāng)作若干個(gè)獨(dú)立概念理解,這樣就加大了有效信息共享和獲取的難度。語義網(wǎng)的研究目的是改變現(xiàn)有互聯(lián)網(wǎng)共享資源的模式,實(shí)現(xiàn)信息在語義層次的交流共享或推薦。語義理念的出現(xiàn)將深化Web的服務(wù)范疇,使網(wǎng)絡(luò)變得更加人性化和智能化,使人更加高效地獲取信息。
3 研究樣本來源及研究方法
研究樣本來源? 本文的研究文獻(xiàn)資源來源為CNKI中國知網(wǎng)的中文全文期刊數(shù)據(jù)庫和優(yōu)秀碩博士論文數(shù)據(jù)庫。由于Tim Berners-Lee 2001年才正式提出“語義網(wǎng)”的概念,因此,本文將時(shí)間設(shè)定為2001—2018年,以“語義網(wǎng)”和“教育資源”為條件進(jìn)行搜索,在剔除與主題無關(guān)和會(huì)議報(bào)道等文獻(xiàn)后,截至2018年8月,一共篩選出227篇文章為研究樣本進(jìn)行文獻(xiàn)分析。
研究方法? 筆者首先利用中國知網(wǎng)的文獻(xiàn)分析工具對(duì)文獻(xiàn)信息文檔進(jìn)行關(guān)鍵詞抽取分析,然后采用內(nèi)容分析法對(duì)文獻(xiàn)研究主題進(jìn)行歸類。研究過程中主要用到SPSS統(tǒng)計(jì)軟件、WordSplit分詞軟件以及詞云圖制作軟件等工具對(duì)文獻(xiàn)進(jìn)行數(shù)據(jù)統(tǒng)計(jì)以及可視化分析。
4 語義網(wǎng)在教育資源建設(shè)領(lǐng)域的文獻(xiàn)分析
論文總量分析? 筆者對(duì)從知網(wǎng)篩選出的227篇文獻(xiàn)資料進(jìn)行SPSS統(tǒng)計(jì)分析??紤]到2018年時(shí)間不到一年,以及知網(wǎng)收錄的遲滯性,因此不參與本文的討論。如圖1所示,從文獻(xiàn)數(shù)量上看,自2002—2009年呈現(xiàn)一個(gè)非常明顯的遞增趨勢;2010—2017年每年的文獻(xiàn)數(shù)量有一定波動(dòng),但是不低于14篇/年,相較2008年以前每年的文獻(xiàn)量,整體上仍然處于上升趨勢;其中2016年為語義網(wǎng)在教育資源建設(shè)領(lǐng)域文獻(xiàn)發(fā)布最多的一年,突破26篇。
由圖1可以看出,2002—2017年整體呈現(xiàn)波動(dòng)遞增狀態(tài)。分析其原因,一是與國家教育信息化發(fā)展戰(zhàn)略密不可分。隨著教育信息化的推進(jìn),人們要求提供更加智能的網(wǎng)絡(luò)服務(wù)。目前“開放”正在成為一種價(jià)值,無論內(nèi)容的開放、數(shù)據(jù)的開放、資源的開放,其本質(zhì)上都是順暢獲取數(shù)據(jù)和信息[3]。網(wǎng)絡(luò)教育資源正向著更加“開放”和“智慧化”趨勢發(fā)展,要實(shí)現(xiàn)人—機(jī)語言的無障礙溝通,只有達(dá)到語義層次的搜索與共享,因此,語義網(wǎng)在教育信息化中的價(jià)值,在這個(gè)發(fā)展過程中引起教育界的關(guān)注。
二是語義技術(shù)逐步成熟。早期由于語義網(wǎng)概念剛剛提出,僅有少數(shù)理論介紹;近年來隨著語義網(wǎng)技術(shù)不斷成熟,語義網(wǎng)逐漸應(yīng)用于各個(gè)主要領(lǐng)域,如圖情檔、互聯(lián)網(wǎng)建設(shè)服務(wù)、計(jì)算機(jī)科學(xué)、軍隊(duì)建設(shè)等[4]。在生活中不難發(fā)現(xiàn),現(xiàn)今幾乎所有大型的電子商務(wù)系統(tǒng),如Amazon、淘寶、當(dāng)當(dāng)網(wǎng)等,都不同程度地使用了各種形式的語義推薦技術(shù)。國外語義網(wǎng)在教育應(yīng)用方面每年的研究成果數(shù)量自2000年以來一直在不斷增加[5],我國的文獻(xiàn)總量也在波動(dòng)中整體呈上升趨勢,這說明語義網(wǎng)在教育領(lǐng)域得到越來越多的重視。隨著網(wǎng)絡(luò)向智能化方向發(fā)展,語義網(wǎng)的應(yīng)用空間將變得更加廣泛。
研究內(nèi)容分析? 對(duì)研究內(nèi)容的分析有助于了解語義網(wǎng)在教育資源建設(shè)領(lǐng)域的研究現(xiàn)狀、研究熱點(diǎn)、發(fā)展趨勢及存在問題。筆者對(duì)227篇甄選文獻(xiàn)進(jìn)行內(nèi)容分析,應(yīng)用分詞軟件對(duì)文獻(xiàn)進(jìn)行分詞處理,并進(jìn)行熱詞研究。通過對(duì)文獻(xiàn)內(nèi)容的詳細(xì)分析,將文獻(xiàn)分為圖2所示幾個(gè)主要研究方向。
在數(shù)據(jù)統(tǒng)計(jì)過程中發(fā)現(xiàn),部分論文存在研究內(nèi)容交叉現(xiàn)象,本研究根據(jù)論文實(shí)際的研究重點(diǎn),將其歸入主要方向所屬的一類。如圖2所示,該領(lǐng)域研究內(nèi)容集中在三個(gè)方向,分別是“教育資源本體構(gòu)建”“檢索技術(shù)領(lǐng)域”“促進(jìn)教育資源共享”,這三項(xiàng)研究內(nèi)容總和達(dá)到所有研究領(lǐng)域的60%以上;此外,“理論介紹與歸納”“促進(jìn)個(gè)性化學(xué)習(xí)”“學(xué)習(xí)環(huán)境構(gòu)建”等領(lǐng)域文獻(xiàn)反映出人們對(duì)語義網(wǎng)在教育領(lǐng)域其他方向的應(yīng)用實(shí)踐探索。
發(fā)表來源分析? 分析發(fā)表來源有助于了解哪類期刊或單位在關(guān)注該領(lǐng)域的研究。筆者將文獻(xiàn)來源一共分為五類:教育類雜志;計(jì)算機(jī)科學(xué)類雜志;圖書情報(bào)類雜志;學(xué)報(bào)類雜志;碩博士學(xué)位論文。對(duì)文獻(xiàn)的發(fā)表來源進(jìn)行統(tǒng)計(jì),結(jié)果如圖3所示,除了優(yōu)秀碩博士論文,教育類雜志的相關(guān)文獻(xiàn)所占比重排在所有雜志之首,這說明語義網(wǎng)在教育領(lǐng)域應(yīng)擁有較高的研究價(jià)值和空間。
5 語義網(wǎng)在教育資源建設(shè)應(yīng)用中的問題及趨勢
語義檢索技術(shù)研究成果有待投入教育領(lǐng)域?qū)嵺`應(yīng)用? 通過文獻(xiàn)分析總結(jié)得出,我國語義網(wǎng)在教育領(lǐng)域的實(shí)踐研究主要內(nèi)容是:基于語義檢索的教育資源共享方案以及共享模式研究;基于語義的教育資源個(gè)性化推薦策略研究;基于本體的教育資源建設(shè)理論研究。在現(xiàn)有研究中,方案、模式、策略等理論性探索研究居多,而實(shí)踐應(yīng)用性研究較少,研究成果實(shí)用性不強(qiáng)。語義網(wǎng)人性化的檢索技術(shù)在教育資源的共享和個(gè)性化服務(wù)方面比萬維網(wǎng)有著絕對(duì)的優(yōu)勢,語義檢索技術(shù)切實(shí)地投入教育領(lǐng)域?qū)嵺`應(yīng)用,促進(jìn)教育資源共享,是未來在教育資源領(lǐng)域的一個(gè)新研究方向。
解決教育資源本體庫的具體建設(shè)問題? 教育領(lǐng)域本體作為教育知識(shí)領(lǐng)域的一種專門本體,應(yīng)該能夠清晰地表示教育領(lǐng)域主要的概念術(shù)語、屬性以及相互關(guān)系,對(duì)教育領(lǐng)域活動(dòng)所具有的屬性規(guī)律進(jìn)行形式化的描述[6]。目前在醫(yī)學(xué)、電子工程、電子政務(wù)等多個(gè)領(lǐng)域進(jìn)行了本體構(gòu)建方法的研究和實(shí)踐,為語義檢索提供了本體資源基礎(chǔ),但在教育本體方面的實(shí)踐研究較少,只在一些具體的學(xué)科構(gòu)建了相應(yīng)的本體[6]。由于目前沒有公認(rèn)的設(shè)計(jì)與評(píng)價(jià)標(biāo)準(zhǔn)及質(zhì)量保證體系,因而對(duì)本體的評(píng)價(jià)方法和本體的設(shè)計(jì)方法一樣存在多元化現(xiàn)象[7]。
教育資源本體的構(gòu)建需要統(tǒng)一的標(biāo)準(zhǔn)。已有研究文獻(xiàn)中,很多研究者一直在倡導(dǎo)和呼吁確定統(tǒng)一的標(biāo)準(zhǔn),也有一些研究者對(duì)確定標(biāo)準(zhǔn)或提高本體科學(xué)性做出了實(shí)踐性嘗試,雖然小范圍保證了數(shù)據(jù)的統(tǒng)一,但仍然不能宏觀上解決問題。本體能夠以明確的形式描述信息資源的概念以及資源之間的語義關(guān)系,構(gòu)建教育領(lǐng)域本體則意味著建立計(jì)算機(jī)能夠理解的教育資源語義標(biāo)簽庫,這為解決各種教育資源的兼容和推廣問題提供了有利條件。教育資源本體庫的構(gòu)建是未來語義技術(shù)廣泛投入應(yīng)用的基礎(chǔ)。但是如何建立教育領(lǐng)域本體統(tǒng)一標(biāo)準(zhǔn),本體由誰來構(gòu)建,怎么建構(gòu),如何實(shí)現(xiàn)更新擴(kuò)展等,都是目前研究沒有解決的問題,在將來的研究中還將是該領(lǐng)域需要繼續(xù)探索解決的問題。
教育資源個(gè)性化服務(wù)的實(shí)現(xiàn)問題? 目前主要的個(gè)性化推薦技術(shù)有四類:基于協(xié)同過濾技術(shù)的推薦、基于內(nèi)容的推薦算法、基于規(guī)則的推薦算法、基于聚類的推薦技術(shù)。這幾類技術(shù)在應(yīng)用中存在各自的缺點(diǎn)。目前語義網(wǎng)廣泛應(yīng)用于電子商務(wù)領(lǐng)域的個(gè)性化推薦系統(tǒng)并已經(jīng)取得良好的經(jīng)濟(jì)效益,這對(duì)教育學(xué)界有著很大的啟示。人們大膽設(shè)想將語義技術(shù)運(yùn)用于教學(xué)領(lǐng)域,并且初步嘗試了各種研究,語義網(wǎng)在教育個(gè)性化的應(yīng)用未來將有廣泛的空間?;谡Z義技術(shù)的個(gè)性化推薦服務(wù)的出現(xiàn),為教育資源個(gè)性化推薦的實(shí)現(xiàn)提供了更智能的選擇,但在目前的網(wǎng)絡(luò)環(huán)境下,準(zhǔn)確地標(biāo)識(shí)用戶興趣并進(jìn)行合理歸類,是語義推薦技術(shù)實(shí)現(xiàn)的難點(diǎn)所在。語義服務(wù)實(shí)現(xiàn)有賴于教育本體的建立以及一個(gè)完善的支持語義技術(shù)實(shí)施的網(wǎng)絡(luò)平臺(tái)系統(tǒng)的建設(shè)完善。
6 語義網(wǎng)在教育資源建設(shè)應(yīng)用中的建議
創(chuàng)建語義學(xué)習(xí)生態(tài)環(huán)境? Web從1.0到3.0不斷更新發(fā)展的過程,展示了用戶對(duì)未來網(wǎng)絡(luò)發(fā)展的一種人性化和智能化需求趨勢,人們不再滿足信息獲取是否海量,而是追求信息獲得的精準(zhǔn)性和人性化。語義技術(shù)是Web 3.0時(shí)代顯著的亮點(diǎn),也是其優(yōu)勢所在。然而語義網(wǎng)的實(shí)現(xiàn)需要良好的網(wǎng)絡(luò)平臺(tái)支持。目前我國主要存在的問題是支持語義技術(shù)的教育資源網(wǎng)站非常稀少。要成為學(xué)習(xí)者廣泛使用的網(wǎng)絡(luò)平臺(tái),就必須要以提高基于語義網(wǎng)技術(shù)的教育資源網(wǎng)站的數(shù)量和使用范圍為前提,智能語義程序必須廣泛地應(yīng)用于計(jì)算機(jī)、移動(dòng)學(xué)習(xí)工具等終端設(shè)備上,形成一批與語義網(wǎng)相互依賴的“智能個(gè)體”,以它們組合而形成一個(gè)以學(xué)習(xí)為目的的智能語義生態(tài)環(huán)境,才能為語義網(wǎng)在教育實(shí)踐中廣泛應(yīng)用提供實(shí)現(xiàn)的網(wǎng)絡(luò)環(huán)境。
構(gòu)建完善的教育本體資源庫? 本體建設(shè)主體的確定是本體構(gòu)建的首要問題,因?yàn)閺V泛地征集本體庫元語是提供全面的本體庫數(shù)據(jù)資源之基礎(chǔ)。所以建立本體的主體不應(yīng)該是個(gè)別專家學(xué)者研究的專利,而應(yīng)由學(xué)習(xí)者、施教者、業(yè)界專家共同參與建構(gòu)。此外,要實(shí)現(xiàn)非結(jié)構(gòu)化資源的共享,筆者認(rèn)為教育本體庫還需要有強(qiáng)大的寬容度和動(dòng)態(tài)更新的能力。通過全面的本體構(gòu)建主體參與建設(shè),以及本體庫自身的兼容性和擴(kuò)充性,從而實(shí)現(xiàn)用戶的“查全率”。此外,一個(gè)完善的語義檢索平臺(tái)不僅體現(xiàn)在“查全率”,還體現(xiàn)在“查準(zhǔn)率”上。業(yè)界嘗試各種方法建立本體的文獻(xiàn)已很多,而對(duì)本體準(zhǔn)確性評(píng)價(jià)的研究卻很少。面對(duì)復(fù)雜的數(shù)據(jù)環(huán)境中出現(xiàn)的大量歸類錯(cuò)誤或重復(fù)的現(xiàn)象,對(duì)本體的科學(xué)確認(rèn)和評(píng)價(jià)是在后續(xù)工作中必不可少的一項(xiàng)環(huán)節(jié)。在今后的研究中,研究者更多地關(guān)注本體準(zhǔn)確性的評(píng)價(jià)研究,實(shí)現(xiàn)對(duì)構(gòu)建本體的排查和維護(hù)工作,才能保證數(shù)據(jù)定義的準(zhǔn)確性,建構(gòu)科學(xué)的本體庫。
對(duì)已建成的異構(gòu)教育資源進(jìn)行“歸類打包”? 我國成熟的教育信息化標(biāo)準(zhǔn)較國外來說相對(duì)較晚,教育信息化技術(shù)標(biāo)準(zhǔn)體系(CELTS)到2012年才頒布系列標(biāo)準(zhǔn),到目前為止,該標(biāo)準(zhǔn)仍在不斷的完善中。統(tǒng)一規(guī)范的標(biāo)準(zhǔn)在本體構(gòu)建中發(fā)揮著主導(dǎo)作用。在權(quán)威的標(biāo)準(zhǔn)建立前,我國教育資源建設(shè)已大力開展;然而標(biāo)準(zhǔn)確立之后,教育資源建設(shè)各自為政,初具規(guī)模的教育資源仍然不夠規(guī)范,教育資源建設(shè)主體的多元化很難達(dá)到統(tǒng)一,此時(shí)也很難讓各個(gè)停留在“自治共享”層次上的教育資源重新規(guī)范一次。因此,目前在此情況下,對(duì)已建成的異構(gòu)教育資源采用規(guī)范的語義標(biāo)簽將其“歸類打包”,則能夠避免多元的教育資源重復(fù)建設(shè)造成的資源浪費(fèi),從而使其融入新的語義生態(tài)資源環(huán)境中,提高資源利用率。
7 結(jié)語
本研究通過文獻(xiàn)調(diào)查,分析了語義網(wǎng)在教育資源建設(shè)領(lǐng)域的應(yīng)用現(xiàn)狀和發(fā)展趨勢,希望通過本研究的分析能夠?qū)φZ義網(wǎng)在教育資源領(lǐng)域的應(yīng)用研究起到拋磚引玉的作用。語義網(wǎng)與傳統(tǒng)網(wǎng)絡(luò)相比,更加符合未來學(xué)習(xí)環(huán)境對(duì)開放化和個(gè)性化的追求趨勢,語義識(shí)別技術(shù)讓不同時(shí)期、不同國家、不同語言的教育資源都可以進(jìn)入一個(gè)超前融合的階段,其在教育資源建設(shè)中的價(jià)值召喚著更多的研究者去關(guān)注與開發(fā)。
參考文獻(xiàn)
[1]余燕芳,葛正鵬.終身學(xué)習(xí)平臺(tái)建設(shè)的理念與架構(gòu):從Web2.0到Web3.0[J].電化教育研究,2014(8):57-63.
[2]Robin D, Morris.Web3.0: Implications for Online Learning[J].TechTrends,2011(1):43.
[3]NMC地平線項(xiàng)目.2013地平線報(bào)告高等教育版(上)[J].廣州廣播電視大學(xué)學(xué)報(bào),2013(2):1-6.
[4]劉明國.語義網(wǎng)應(yīng)用研究的文獻(xiàn)計(jì)量學(xué)分析[J].圖書館界,2012(3):86-88.
[5]劉清堂,黃景修,吳林靜,等.基于語義網(wǎng)的教育應(yīng)用研究現(xiàn)狀分析[J].現(xiàn)代遠(yuǎn)距離教育,2015(1):60-65.
[6]馬捷,劉小樂,黃嵐,等.教育領(lǐng)域本體構(gòu)建研究[J].情報(bào)理論與實(shí)踐,2012(7):104-108.
[7]田俊華.基于本體知識(shí)庫的教學(xué)資源自動(dòng)采集技術(shù)研究[D].南京:南京師范大學(xué),2011.