• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于社會化標簽的非遺檔案數(shù)字平臺建設實踐與分析

      2023-05-29 19:41:33劉向紅
      檔案天地 2023年5期
      關鍵詞:社會化標簽數(shù)字

      一、引言

      中共中央辦公廳、國務院辦公廳印發(fā)的《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》中指出:“從國家、地區(qū)多層面一體推進檔案信息共享利用工作,建設以全國檔案查詢利用服務平臺為支撐、檔案查詢‘一網通辦的全國檔案信息共享利用體系。[1]”非遺檔案雖因非遺項目的特殊性,多數(shù)保存在非遺管理機構,但應隸屬于檔案大類,為了有利于非物質文化遺產傳承,非遺數(shù)字檔案建設和數(shù)字平臺建設應以信息共享、廣泛傳播和充分利用為目的。

      目前,各地非遺檔案的數(shù)字化工作呈不均衡狀態(tài),有些地區(qū)的非遺檔案未建成數(shù)字平臺,長期蒙塵,無從面世;已建成的數(shù)字平臺質量良莠不齊,有些平臺維護不及時,數(shù)據(jù)更新滯后,大多數(shù)平臺的非遺檔案資料呈“粗線條”展示狀態(tài),無法滿足現(xiàn)代非遺愛好者的知識服務需求。

      二、非遺檔案數(shù)字平臺建設現(xiàn)狀及存在問題

      根據(jù)筆者所在的課題組對國內非遺網站的調研,發(fā)現(xiàn)目前非遺數(shù)字化平臺存在的現(xiàn)狀和共性問題如下:

      (一)發(fā)展不均衡,非遺檔案信息量不足

      由于地方政府的重視程度不同以及對不同級別非遺項目重視程度的不同,各地各級的非遺數(shù)字化工作發(fā)展不均衡,非遺數(shù)字檔案的內容豐富程度、更新頻率等不均衡,很多非遺網站尤其是市級網站內容單一、更新不及時,所承載的非遺檔案信息量低,造成非遺檔案處于相對封閉狀態(tài),社會融合度低。

      (二)非遺數(shù)字平臺組織架構單一,無法揭示非遺項目的歷史文化內涵

      非遺的數(shù)字檔案和數(shù)字平臺一般以非遺傳統(tǒng)分類的十類法為基礎組織形式,按照民間文學、傳統(tǒng)音樂、傳統(tǒng)舞蹈、傳統(tǒng)戲劇、曲藝、傳統(tǒng)體育、游藝與雜技、傳統(tǒng)美術、傳統(tǒng)技藝、傳統(tǒng)醫(yī)藥及民俗等十個類目進行分類組織和展示。十類法類目符合非遺項目的組織特性,參考了檔案資料的分類方法,設置科學、規(guī)范。但是十類法目前還沒有統(tǒng)一、標準的二級類目,分類粒度過粗,在組織種類繁雜、規(guī)模龐大的非遺資源前顯得捉襟見肘。另外,十類法分類維度有限,比如對非遺項目而言,其存在的文化空間非常重要,是非遺生存的土壤,非遺文化表現(xiàn)形式與之息息相關,但由于文化空間表達晦澀、模糊,無法與十類法的其他類目成為并列類目,所以現(xiàn)有的非遺數(shù)字平臺對非遺的文化空間存在描述缺失[2]。

      (三)缺乏主題標引手段,無法揭示非遺項目之間的關聯(lián)信息

      依據(jù)國家標準《文獻主題標引規(guī)則》,我國檔案資源通常按“主體因素”“通用因素”“位置因素”“時間因素”和“文件類型因素”五要素來標引和體現(xiàn)主題內容[3],而由于非遺檔案資源的特殊性,以這些因素對非遺數(shù)字檔案進行主題標引并不適合非遺項目的特征,技術上難以實現(xiàn),而且這五要素不能有效揭示各類非遺之間的關聯(lián)信息。非遺數(shù)字化的目的之一是為便利相關人員以歷史背景為依托,研究、挖掘各民族、各地區(qū)的歷史文化。非遺項目由于其文化背景、地域背景等方面的異同,存在著大量的關聯(lián)關系,這對研究非遺文化非常有價值[2]。中國非物質文化遺產網經過改版后對非遺項目的關聯(lián)信息做了部分揭示,在每一個非遺項目下列出了相關傳承人、相關項目、相關資訊、相關學術的鏈接地址,但是受版面限制,揭示的關聯(lián)信息有限。

      筆者所在的課題組通過對非遺數(shù)字平臺的調研和對承德非遺項目的田野調研,掌握了第一手非遺資料,針對目前非遺數(shù)字平臺存在的問題,建設了承德地區(qū)非遺檔案數(shù)字平臺,打破了傳統(tǒng)非遺平臺的信息組織方式,引入社會化標簽,并進行改良,拓展了非遺檔案的內涵和外延。

      三、基于社會化標簽的非遺數(shù)字平臺的建設思路

      (一)社會化標簽用于非遺數(shù)字平臺的可行性分析

      社會化標簽是一種靈活、開放并體現(xiàn)用戶興趣的信息組織方式,它興起于Web2.0時代,多用于一些用戶貢獻內容的開放性網站,如del .icio.us,flickr,CiteUlike,目前Librarything、豆瓣等網站還在使用這種信息組織方式,知網研學平臺、印象筆記等知識工具軟件也在大量使用。使用標簽的信息組織模式曾被圖書館界稱為Folksonomy(分眾分類法),是對網絡信息資源組織與管理一種代價較小且有效的自由主題標引方法,體現(xiàn)用戶對其興趣資源的主題和內容的解讀。

      將社會化標簽應用于非遺數(shù)字平臺,作為非遺檔案的一種主題標引形式,一是有利于將興趣用戶同非遺檔案資源有機地結合起來,可以從用戶理解和需要的角度來揭示和組織非遺檔案資源,打破非遺檔案資源信息量低、相對封閉的困境;二是解決十類法列類單一、分類維度少、分類粒度粗的問題,有效揭示非遺項目的文化內涵,還可以通過標簽的主題標引作用,揭示十類法中無法列類的文化空間;三是對標簽進行技術處理后,通過標簽的聚類分析有利于將隸屬不同類目的非遺項目關聯(lián)起來,挖掘不同類目非遺項目歷史和文化內涵的關聯(lián)性。

      (二)社會化標簽用于文化遺產類數(shù)字平臺的案例

      文化遺產數(shù)字化保護工作由于數(shù)據(jù)資源龐大,標引工作量巨大,亟需志愿者的參與和協(xié)作,國外的文化遺產數(shù)字化保護工作都曾經通過引入眾包模式,借助群體力量和智慧來解決數(shù)字文化遺產的主題標引工作。如史蒂夫博物館項目(Steve.museum)通過開發(fā)一個在線平臺,鼓勵興趣用戶為數(shù)字藏品加注標簽,來探索社會標簽服務于藝術博物館的可行性,提高公眾對數(shù)字博物館館藏的訪問量和參與度[4];美國的“公民檔案工作者”(Citizen Archivist)項目[5]和英國“檔案志愿者”(Archive Volunteer)項目[6]都支持興趣用戶為館藏目錄加標簽,同時支持用戶將檔案資料圖像上傳至Flickr,并加標簽、注釋,一方面增加公眾對館藏檔案的訪問率,另一方面通過相對大眾化的標簽標引資源,增加館藏的易獲取性[7]。

      (三)社會化標簽用于非遺數(shù)字平臺的建設思路

      社會化標簽雖然具有諸多優(yōu)點,但是由于自由度高,不規(guī)范、歧義詞匯(長尾標簽)過多,同義詞難以處理,容易產生檢索噪音,所以Web2.0時代多用于開放的網絡社交平臺?,F(xiàn)在開放使用社會化標簽的網絡系統(tǒng)如LibraryThing、豆瓣大多已進行了改進,多采用自由標簽與受控語言相結合的混合信息組織模式,對同義詞進行分組、定期清除長尾標簽等,逐步克服最初不受控的自由標簽產生的一系列問題[8]。

      非遺檔案資源不同于開放的網絡信息資源,是經過加工整理而形成的資源,是有控制規(guī)范和標準的產物,在使用社會化標簽標引資源進行內容揭示和主題標引時,可以借鑒社會化標簽的標引理念,但需對標簽進行規(guī)范與控制,并及時進行標簽清洗,去除無效標簽、合并同義標簽,將社會化標簽轉換為限制性標簽即受控標簽,達到通過標簽的聚類分析來揭示非遺資源之間關聯(lián)性的目的。

      課題組在建設承德非遺數(shù)字平臺時,充分考慮了非遺檔案資源的規(guī)范性及非遺項目的特殊屬性,以一種混合式信息組織框架對非遺檔案資源進行分類組織,并在試運行過程中根據(jù)出現(xiàn)的問題不斷修整,在實踐層面驗證了社會化標簽應用于非遺數(shù)字平臺的可行性。

      四、基于社會化標簽的非遺檔案數(shù)字平臺的建設驗證

      (一)基于十類法和社會化標簽的平臺建設框架

      承德非遺平臺的建設框架采用十類法和受控標簽混合的分類框架,如圖1所示。平臺主體組織框架按照十類法將非遺項目分為民間文學、傳統(tǒng)音樂、傳統(tǒng)舞蹈、傳統(tǒng)戲劇等十個類目,即按照非遺檔案的內容屬性進行劃分,屬于縱向框架;輔助分類框架屬于橫向框架,一是按照非遺項目的外部特征如地區(qū)、傳承人、獲批批次、級別、獲批時間等進行劃分,二是按照非遺項目的內容特征分析形成的受控標簽聚類。這樣混合架構的組織模式有利于對非遺檔案資料進行深入揭示,用戶不僅可以按照非遺類目,還能夠按照每種非遺項目所蘊含的文化、歷史背景檢索到感興趣的項目。

      (二)對社會化標簽的改進措施

      承德非遺數(shù)字平臺在使用社會化標簽標引資源時,為了規(guī)避其自由度過高帶來的檢索噪音和網絡安全風險,借鑒文獻主題標引的理念,采用經過規(guī)范處理的受控標簽標引非遺資源,這種受控標簽亦可稱之為限制性標簽。同時,為了獲取足夠的標簽,設置用戶分組,然后通過清洗標簽、合并同義標簽獲取有標引價值的受控標簽,如圖2所示。

      1.規(guī)范標簽數(shù)據(jù),構建基于5W+1H分析法的主題標引框架

      根據(jù)“5W+1H”分析法[9],在對非遺檔案資源進行標注時,通過分析非遺項目所承載的歷史活動內容,使用“何人(who)”“何故(why)”“何時(when)”“何地(where)”“何事(what)”“何方式(how)”6個維度對其主題內容(對象)進行標注,從而充分體現(xiàn)非遺的文化空間和歷史背景。例如,國家級非遺“豐寧滿族吵子會”隸屬于“傳統(tǒng)音樂”大類,設置標簽如下:who—陳安良(傳承人),滿族(所屬民族)why,how—民間花會(其主要表演背景),when—乾隆年間,簡化為乾?。òl(fā)源時間),where—豐寧,八間房村(發(fā)源地),what,how—嗩吶藝術,吹打樂(表演形式)。省級非遺“蝴蝶舞”隸屬于“傳統(tǒng)舞蹈”大類,設置標簽如下:who—滿族,why,how—民間花會,吵子會(因其以吵子會為伴奏樂),when—康熙年間,簡化為康熙,where—豐寧,八間房村,what,how—背歌(背桿);省級非遺“十番樂”,why,how—民間花會,廟會,where—灤平,張百灣,what,how—杠房音樂,吹打樂,等等,以上標簽全部是在“5W+1H”框架下,經過規(guī)范處理的受控標簽(如表1)。這些標簽認知度高,成為網站平臺的基礎標簽和用戶加注標簽時的推薦標簽,可以引導用戶使用和創(chuàng)建標簽,隨著平臺的運行、用戶的使用,逐漸成為網站的高頻標簽。

      2.用戶群體分組,獲取標簽數(shù)據(jù)

      為了建設標簽群,平臺將用戶進行分組,按照用戶在設置標簽時的作用權重分作 5 類用戶,第一類用戶是非遺傳承人及非遺申報者,他們在申報非遺項目時,即可根據(jù)每種非遺資源的特征預設部分標簽; 第二類用戶是非遺項目相關領域的專家、數(shù)據(jù)庫建庫專家; 第三類用戶是政府相關職能部門及從事非遺保護工作的專業(yè)人員; 第四類用戶是非遺文化愛好者。

      第一、二、三類用戶屬于高級用戶,項目組邀請這三類用戶根據(jù)5W+1H框架預設基礎標簽,他們所標注的標簽相對規(guī)范性高,可以精準地反映非遺項目的文化特征, 第四類用戶是普通用戶,他們是網站的活躍用戶,也能貢獻部分有價值的標簽,但是其貢獻的標簽規(guī)范性、準確性降低。

      3.標簽數(shù)據(jù)清洗

      高級用戶加注的標簽相對專業(yè)和規(guī)范,能深刻揭示非遺項目的內容特征,但是由于不同用戶對非遺項目的認知不同,同時這些用戶對標簽的組織原理理解不透徹,他們所加注的標簽會產生大量不同表達方式的同義詞,這也會產生檢索噪音,普通用戶的標簽更甚之。所以要對標簽進行清洗、合并、遴選(如圖2),一是將普通用戶加注的使用頻率低、與資源相關度低、過于個性化的標簽清洗掉。二是將高級用戶加注的同義詞標簽合并、規(guī)范處理,形成基礎標簽庫,基礎標簽將成為第四類用戶加注標簽時的推薦標簽,隨著標簽的大量使用,逐漸成為高頻標簽。

      清洗標簽時,一是要考慮用戶的使用習慣,盡量簡明。二是標簽要具有代表性和關聯(lián)性。三是重點清洗同質標簽,如將“民間花會”和“花會”合并為“民間花會”,將“豐寧縣”和“豐寧”合并為“豐寧”,將“乾隆年間”和“乾隆”合并簡化為“乾隆”等等。這些標簽在承德非遺項目中廣泛使用,被用來標注多個非遺項目,可以放入基礎標簽庫,作為用戶推薦標簽備用,并逐漸成為高頻標簽。

      (三)形成標簽云圖,標簽聚合同質資源、同質用戶

      經過處理的規(guī)范標簽積累到一定數(shù)量,平臺將自動生成標簽云、標簽列表,高頻標簽在標簽云中字體變大,在標簽列表中依據(jù)標簽點擊數(shù)排序靠前(如圖3)。標簽的聚類作用開始逐步體現(xiàn)。

      首先,標簽揭示了十類法所不能表達的非遺項目的歷史文化內涵,如發(fā)源地、發(fā)源時間、活動場所、活動時間、表現(xiàn)形式,即非遺項目的文化空間,文化空間在十類法中是無法列類的,而同樣文化空間的非遺項目往往由于隸屬不同類目而被人為割裂,標簽則實現(xiàn)揭示了這種關聯(lián)關系。

      其次,同類標簽聚合了具有相同主題特征的非遺項目,有利于用戶發(fā)現(xiàn)非遺項目的關聯(lián)性。如“民間花會”這個民俗表現(xiàn)場所標簽聚合了“隆化滿族二貴摔跤”“寬城背桿”“豐寧滿族吵子會”“蹦跶會”“八大怪”“蝴蝶舞”“棉花鬼”等19個非遺項目,“豐寧”這個地域標簽聚合了12個非遺項目,“滿族”這個民族標簽聚合了18個非遺項目等等,這些非遺項目分別隸屬于十個非遺類目之下,這些標簽將相同歷史背景、地域背景、文化背景的非遺項目關聯(lián)起來。又如,豐寧滿族吵子會隸屬于傳統(tǒng)音樂,蝴蝶舞隸屬于傳統(tǒng)舞蹈,二者都是滿族騎射文化的產物,文化空間類似,發(fā)源地同為豐寧八間房村,都是民間花會的表演項目,蝴蝶舞的伴奏音樂即是吵子會,二者看似不相關,但通過“豐寧”“滿族”“八間房村”“民間花會”等多個標簽被用戶同時檢索到,即可發(fā)現(xiàn)二者的高度關聯(lián)性;豐寧滿族吵子會與十番樂都隸屬于傳統(tǒng)音樂,用戶通過“吹打樂”這個表演形式標簽可以同時檢索到兩個非遺項目,揭示出二者表演形式的關聯(lián)性。

      第三,高頻標簽聚合同質用戶。在標簽云圖中,被點擊數(shù)量越高的標簽字體越突出,而標簽指向的非遺資源被點擊率也較高,表明用戶對該標簽和標簽聚合的資源關注度高,這類用戶具有同質性。

      五、結論和建議

      以往的非遺檔案展示平臺,存在組織架構單一、主題標引手段單一、無法揭示非遺項目的歷史文化內涵及其關聯(lián)關系等問題,承德非遺數(shù)字平臺進行了信息組織模式的變革,首次引入社會化標簽,通過分析非遺項目的歷史背景、文化空間、內容特征,參照5W1H框架,提煉出標簽數(shù)據(jù),然后進行標簽清洗、合并,將其改進為受控標簽,實現(xiàn)了對非遺項目的主題標引,同時基于標簽聚合了不同類目的非遺項目和同質用戶。試運行過程中,標簽及其標注資源的訪問量較大,標簽云一直在動態(tài)變化中,從實踐角度驗證了社會化標簽經改良后作為非遺數(shù)字平臺主題標引手段的可行性。

      平臺建設過程中也出現(xiàn)了一些問題,首先,作為受控標簽主要貢獻者的高級用戶,由于對非遺項目和5W1H框架理解程度的偏頗和對標簽這種標引方式的不了解,加注了大量無效標簽和同義不同形的同義標簽,在對這些標簽進行清洗、合并和遴選時,花費了較大的人力成本和時間成本;其次,出于網絡安全和技術開發(fā)能力考慮,未能放開普通用戶加注標簽的入口,從一定程度上限制了普通用戶的參與度,所以網站的受控標簽有余,而自由標簽不足,網站技術開發(fā)未考慮大量自由標簽清洗的技術難度。

      針對以上問題,平臺還在持續(xù)完善,用戶層面,要加強高級用戶和志愿者用戶加注標簽的規(guī)范化培訓;技術層面,通過機器學習和半監(jiān)督學習,提高關鍵詞向量特征提取,實現(xiàn)標簽的有效清洗和同義詞合并;安全層面,增加用戶標簽數(shù)據(jù)審核環(huán)節(jié),保障開放標簽數(shù)據(jù)后的信息內容安全。

      參考文獻:

      [1]中辦國辦印發(fā)《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》 - 中華人民共和國國家檔案局[EB/OL] [2023-2-2]. https://www.saac.gov.cn/daj/yaow/202106/899650c1b1ec4c0e9ad3c2ca7310eca4.shtml.

      [2]劉向紅. 基于用戶協(xié)作的非物質文化遺產數(shù)字資源分類模式研究[J]. 現(xiàn)代情報, 2017, (3): 21-25, 31.

      [3]呂元智. 基于限制性標簽的檔案資源主題標引方法探索[J]. 檔案學研究, 2020, (1): 59-66.

      [4]Steve.Museum[EB/OL] [2023-2-2]. https://www.steve.museum/.

      [5]Citizen Archivist | National Archives[EB/OL] [2023-2-2]. https://www.archives.gov/citizen-archivist.

      [6]The National Archives[EB/OL] [2023-2-2]. https://www.nationalarchives.gov.uk/.

      [7]閆靜. 檔案事業(yè)公眾參與特點及新趨勢探析——基于英國“檔案志愿者”和美國“公民檔案工作者”的思考[J]. 檔案學研究, 2014, (3): 81-84.

      [8]Bolanos-mejias Carmen. Folksonomy Indexing From the Assignment of Free Tags to Setup Subject: A Search Analysis into the Domain of Legal History[J]. Knowledge Organization: KO, 2018, (7): 574-585.

      [9]5W1H分析法_百度百科[EB/OL] [2023-2-2]. https://baike.baidu.com/item/5W1H分析法/10091536?fromtitle=5W1H&fromid=6062002&fr=aladdin.

      基金項目:本文是2022年度國家檔案局科技項目計劃《基于社會化標簽的非遺數(shù)字檔案主題標引方法研究——以承德地區(qū)非遺數(shù)據(jù)平臺為例》(課題編號:2022-R-017)階段性研究成果之一

      作者單位:河北石油職業(yè)技術大學

      猜你喜歡
      社會化標簽數(shù)字
      熊蜂可以進行社會化學習
      牽手校外,堅持少先隊社會化
      少先隊活動(2021年5期)2021-07-22 08:59:48
      行政權社會化之生成動因闡釋
      無懼標簽 Alfa Romeo Giulia 200HP
      車迷(2018年11期)2018-08-30 03:20:32
      不害怕撕掉標簽的人,都活出了真正的漂亮
      海峽姐妹(2018年3期)2018-05-09 08:21:02
      答數(shù)字
      數(shù)字看G20
      南風窗(2016年19期)2016-09-21 16:56:12
      標簽化傷害了誰
      高校學生體育組織社會化及路徑分析
      體育科技(2016年2期)2016-02-28 17:06:14
      基于多進制查詢樹的多標簽識別方法
      計算機工程(2015年8期)2015-07-03 12:20:27
      安丘市| 万州区| 若羌县| 朝阳区| 丰城市| 新源县| 宿迁市| 临海市| 贺兰县| 沽源县| 卢湾区| 开阳县| 西盟| 枞阳县| 江孜县| 阳江市| 手游| 井陉县| 邓州市| 松滋市| 稷山县| 大洼县| 民权县| 分宜县| 盐池县| 梅河口市| 岳阳市| 武山县| 盖州市| 舒城县| 荔浦县| 涿鹿县| 苏尼特右旗| 潮州市| 盘山县| 靖江市| 西藏| 本溪市| 越西县| 昂仁县| 景洪市|