• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)智賦能視域下侗族大歌主題挖掘及演化分析研究

      2023-05-14 22:17:38楊秀璋武帥項美玉廖文婧任天舒劉建義
      計算機時代 2023年5期

      楊秀璋 武帥 項美玉 廖文婧 任天舒 劉建義

      摘? 要: 針對新范式對傳統(tǒng)人文社科造成學(xué)科邊界模糊的問題,提出一種基于LDA模型和關(guān)系圖譜的領(lǐng)域主題演化算法。首先運用綜合指數(shù)確認(rèn)領(lǐng)域核心研究人員;再利用LDA模型和層次聚類確認(rèn)領(lǐng)域劃分的主題數(shù),構(gòu)建關(guān)系圖譜,探究主題詞關(guān)聯(lián)性;最后創(chuàng)新性的提出演化各主題間的關(guān)聯(lián)性。實驗將侗族大歌領(lǐng)域分為三個主題,并演化出他們之間的聯(lián)系。該研究可為數(shù)智賦能語音音頻的深入研究提供基礎(chǔ)。

      關(guān)鍵詞: 侗族大歌; 數(shù)智賦能; 領(lǐng)域主題挖掘; 關(guān)系圖譜; 主題演化

      中圖分類號:TP391? ? ? ? ? 文獻(xiàn)標(biāo)識碼:A? ? ?文章編號:1006-8228(2023)05-118-05

      Research on the theme mining and evolution analysis of the Dong Chorus

      from the perspective of data intelligence empowerment

      Yang Xiuzhang1, Wu Shuai1,2, Xiang Meiyu3, Liao Wenjing1, Ren Tianshu1, Liu Jianyi1

      (1. School of Information, Guizhou University of Finance and Economics, Guiyang, Guizhou 550025, China;

      2. School of Information Management of Nanjing Agricultural University;

      3. Guiyang School of Big Data and Finance, School of Big Data Application and Economics, Guizhou University of Finance and Economics)

      Abstract: Aiming at the problem that the new paradigm has blurred the boundaries of traditional humanities and social sciences, a domain theme evolution algorithm based on the LDA model and relationship map is proposed. Firstly, the composite index is used to identify core researchers in the domain. Secondly, the LDA model and hierarchical clustering are used to confirm the number of themes divided by the domain, and a relationship map is constructed to explore the relevance of theme words. Finally, the innovative proposal is made to evolve the relevance among the themes. In the experiments, the domain of the Dong Chorus is divided into three themes and the relationship between them is evolved. The research can provide a basis for the in-depth study of data intelligence empowering voice audio.

      Key words: Dong Chorus; data intelligence empowerment; domain theme mining; relationship map; theme evolution

      0 引言

      侗族大歌作為一種起源于春秋戰(zhàn)國時期的演唱方式,距今已有2500年歷史,是我國最早且被國際所認(rèn)可的一種無指揮、無伴奏、自然多聲部的民間復(fù)調(diào)音樂藝術(shù)類型[1]。侗族大歌演奏環(huán)節(jié)無指揮、無伴奏,民族特征性強,研究侗族大歌的意義一定程度高于其他民族歌曲。

      隨著數(shù)智賦能研究熱度不斷增加,國內(nèi)學(xué)者高度重視文化載體研究,嘗試對中國傳統(tǒng)文化進行創(chuàng)新性發(fā)展和轉(zhuǎn)化,探索人文定性與數(shù)字定量分析的融合過程,貢獻(xiàn)了大量研究研究成果,開拓出一系列研究領(lǐng)域和熱點[2]。但由于新范式一定程度沖擊了傳統(tǒng)人文社科的研究認(rèn)知體系,存在學(xué)科邊界模糊、共識標(biāo)準(zhǔn)無序、評價體系欠缺等問題,一定程度影響數(shù)智賦能研究的發(fā)展。本文以“侗族大歌”的學(xué)術(shù)文獻(xiàn)作為研究對象,研究其主題變化趨勢,一定程度能反映相關(guān)領(lǐng)域的研究變化,為數(shù)智賦能語音音頻領(lǐng)域研究的深入提供理論基礎(chǔ),同時也為民族文化保護提供了指導(dǎo)性意見。

      1 相關(guān)研究

      1.1 主題挖掘

      主題挖掘(Topic Mining)[3]作為文本挖掘領(lǐng)域的一個重要研究問題,旨在發(fā)掘文本隱含的主題信息,實現(xiàn)解決“一詞多義”和“一義多詞”的語言現(xiàn)象。最初運用于信息檢索領(lǐng)域,后推廣至網(wǎng)絡(luò)輿情、電商推薦、文獻(xiàn)挖掘以及語料提升。

      1.2 主題演化

      主題演化分析旨在通過共詞分析、主題模型、文本聚類等方法挖掘各個階段主題的發(fā)展歷程及演變趨勢[4]。主題演化的構(gòu)建需要應(yīng)用到多方面信息處理技術(shù),其分析過程可分為三步。①實體識別,是構(gòu)建主題演化的基礎(chǔ),對文獻(xiàn)結(jié)構(gòu)化數(shù)據(jù)進行實體抽取,并存儲于圖數(shù)據(jù)庫中。②共詞網(wǎng)絡(luò),是提升主題演化的關(guān)鍵,將抽取的實體映射到共詞網(wǎng)絡(luò)中,發(fā)現(xiàn)共現(xiàn)關(guān)鍵詞組,并賦予共現(xiàn)詞組權(quán)重系數(shù)。③圖譜可視化,是展現(xiàn)主題演化的結(jié)果,將已確認(rèn)的各實體間的關(guān)系按照時間段進行可視化呈現(xiàn)。

      2 總體框架

      本文的主題演化分析框架大致可分為四個模塊,如圖1所示,分別是數(shù)據(jù)采集和預(yù)處理;核心科研群體發(fā)現(xiàn);侗族大歌主題挖掘;侗族大歌主題演化模塊。

      ⑴ 數(shù)據(jù)采集和預(yù)處理:以“侗族大歌”為關(guān)鍵詞,截至2022年10月,檢索篩選中國知網(wǎng)(CNKI)平臺上論文1378篇,存于csv文件中,并對其進行中文分詞、去停用詞等數(shù)據(jù)預(yù)處理,編碼UTF-8。

      ⑵ 核心科研群體發(fā)現(xiàn):第一作者發(fā)文量和總引用量結(jié)合普萊斯定律、綜合指數(shù)確認(rèn)核心作者。

      ⑶ 侗族大歌主題挖掘:對目標(biāo)數(shù)據(jù)的主題及相似度進行LDA主題挖掘和層次聚類挖掘。

      ⑷ 侗族大歌主題演化:結(jié)合目標(biāo)數(shù)據(jù)的主題和時間數(shù)據(jù)來構(gòu)建關(guān)系圖譜,進行主題演化分析。

      3 核心作者群體發(fā)現(xiàn)

      文獻(xiàn)數(shù)字化提升學(xué)術(shù)成果傳播速度的同時,一定程度造成學(xué)術(shù)信息過載的現(xiàn)象,研究專業(yè)團隊識別程度降低,不利于專業(yè)學(xué)術(shù)的發(fā)展。核心作者作為學(xué)術(shù)研究的基準(zhǔn),決定研究方向和質(zhì)量。然而,單維度通過發(fā)文量,忽略論文質(zhì)量來確定核心作者一定程度存在片面性。針對上述不足,本文嘗試采用一種結(jié)合普萊斯定律和綜合指數(shù)的核心作者確認(rèn)方法來確認(rèn)“侗族大歌”核心研究人員。首先,依據(jù)普萊斯定理確認(rèn)核心作者候選人,再結(jié)合綜合指數(shù)遴選“侗族大歌”核心研究人員。

      3.1 普萊斯定律分析

      本文通過使用普萊斯定律初步確認(rèn)“侗族大歌”核心研究人員,具體確認(rèn)方式如下:

      ⑴ 確認(rèn)最低被引量

      侗族大歌文獻(xiàn)被引用次數(shù)最高的文獻(xiàn)是彭兆榮[5]于1999年發(fā)表《中國音樂學(xué)》的“族性的認(rèn)同與音樂的發(fā)生”,被引用84次,記Cmax。結(jié)合普萊斯定律確認(rèn)最低被引用量Mc,詳見公式⑴。文獻(xiàn)引用量超過七次的作者可視為核心作者的候選人。

      [Mc=0.749×Cmax=0.749×84≈6.86]? ⑴

      ⑵ 確認(rèn)最低發(fā)文量

      “侗族大歌”發(fā)文量最多的作者為吳媛姣,共計發(fā)文13篇,記Pmax。結(jié)合普萊斯定律確認(rèn)最低發(fā)文量Mp,詳見公式⑵。發(fā)表3篇及以上的作者可入選核心作者候選人。

      [Mp=0.749×Pmax=0.749×13≈2.70]? ⑵

      ⑶ 核心作者候選人確認(rèn)

      步驟⑴和步驟⑵初步篩選以吳媛姣為代表的178位核心作者候選人,共發(fā)文486篇,被引4617次。

      3.2 綜合指數(shù)遴選核心作者

      結(jié)合綜合指數(shù)從上述篩選的178位核心作者候選人中遴選出10位“侗族大歌”研究核心作者。具體步驟如下。

      ⑴ 確認(rèn)平均發(fā)文量

      178位核心作者候選人總發(fā)文量,記X總,核心作者候選人數(shù),記n,確認(rèn)核心作者候選人的平均發(fā)文量[x],詳見公式⑶。

      [x=X總n=486178≈2.73]? ? ? ⑶

      ⑵ 確認(rèn)平均被引量

      178位核心作者候選人所發(fā)文獻(xiàn)的總被引用量,記Y總,核心作者候選人數(shù),記n,確認(rèn)核心作者候選人的平均被引量[y],詳見公式⑷。

      [y=Y總n=4617178≈25.96]? ? ? ?⑷

      ⑶ 綜合指數(shù)遴選

      結(jié)合公式⑸計算各核心作者候選人的綜合指數(shù)scorei。第i位核心作者候選人的發(fā)文量記xi;第i位核心作者候選人的總被引量記yi。

      [Scorei=xix×0.5+yiy×0.5]? ⑸

      設(shè)置綜合指數(shù)閾值為2.2,遴選出10位“侗族大歌”的核心作者,詳見表1。第一位核心作者為四川音樂學(xué)院音樂學(xué)系的楊曉[6],發(fā)文10篇,篇均被引19.30次,綜合指數(shù)5.55,單篇最高被引文獻(xiàn)為“南侗‘歌師述論——小黃侗寨的民族音樂學(xué)個案研究”,被引用47次。第二位核心作者為中央音樂學(xué)院音樂學(xué)系的樊祖蔭[7],發(fā)文9篇,篇均被引19.22次,綜合指數(shù)4.98,單篇最高被引文獻(xiàn)為“侗族大歌在中國多聲部民歌中的獨特地位”,被引用52次。篇均被引次數(shù)最高的是桂林理工大學(xué)旅游學(xué)院的陳煒[15],發(fā)文3篇,篇均被引29.00次,綜合指數(shù)2.23,單篇最高被引文獻(xiàn)為“旅游開發(fā)對少數(shù)民族非物質(zhì)文化遺產(chǎn)保護的影響研究——以廣西三江侗族自治縣為例”,被引用63次。

      4 侗族大歌領(lǐng)域主題挖掘

      特征主題詞作為領(lǐng)域知識的重要知識元,能較好反映該領(lǐng)域研究主題,本文首先嘗試使用LDA模型對篩選的“侗族大歌”文獻(xiàn)進行主題挖掘研究,之后結(jié)合Hierarch算法進行層次聚類主題挖掘。

      4.1 基于LDA模型的主題挖掘

      首先借助Jieba分詞系統(tǒng),對目標(biāo)語料進行中文分詞處理,結(jié)合去停用詞表剔除以虛詞、數(shù)詞等語義相對較低語料,形成特征主題詞相對集中的語料數(shù)據(jù)集。通過困惑度計算,確認(rèn)“侗族大歌”領(lǐng)域文獻(xiàn)的主題包括三類,分別是:區(qū)域旅游文化(Topic 1)、侗族音樂民歌(Topic 2)、文化傳承保護(Topic 3)。

      4.2 基于層次聚類的主題挖掘

      層次聚類旨在通過聚類算法將侗族大歌文獻(xiàn)中具有相似屬性的特征進行聚集,繪制樹狀主題聚類圖。本文采用Sk-leran環(huán)境下的Hierarch算法對特征主題進行層次聚類計算,繪制出圖2所示層次聚類圖,共劃分為三個類別:

      ⑴ T1:以地域文化和旅游地點為主的主題,關(guān)鍵特征包括“肇興侗寨”、“風(fēng)雨橋”、“民族文化”等;

      ⑵ T2:以侗族音樂和音樂特征為主的主題,關(guān)鍵特征包括“多聲部民歌”、“侗族音樂”、“民間音樂”等;

      ⑶ T3:以文化傳承和文化保護為主的主題,關(guān)鍵特征包括“非物質(zhì)文化遺產(chǎn)”、“文化傳承”、“侗歌”等。

      對比發(fā)現(xiàn)層次聚類與LDA主題挖掘效果基本一致,兩者均將“侗族大歌”文獻(xiàn)分成三類主題。

      5 侗族大歌領(lǐng)域主題演化分析

      侗族大歌領(lǐng)域主題演化分析主要包括構(gòu)建主題關(guān)系圖譜和探究各主題間演化關(guān)聯(lián)性。

      5.1 主題關(guān)系圖譜

      本文對篩選后的主題特征詞構(gòu)建共詞網(wǎng)絡(luò),發(fā)現(xiàn)主題詞間關(guān)聯(lián)性,構(gòu)建“主題詞A—主題詞B—關(guān)系—權(quán)重”四元關(guān)系組。由于存在大量低關(guān)聯(lián)性四元關(guān)系組,在此利用普萊斯定律設(shè)置閾值篩選目標(biāo)四元關(guān)系組,提升主題關(guān)系圖譜整體聚類效果。

      統(tǒng)計發(fā)現(xiàn),主題詞“侗族大歌”與主題詞“黎平縣”共現(xiàn)次數(shù)最多,共計出現(xiàn)35次,結(jié)合普萊斯定律設(shè)置閾值為5,計算公式詳見公式⑹。其中Fmax表現(xiàn)權(quán)重系數(shù)最高的共現(xiàn)四元組,Mf表示篩選為主題關(guān)系圖譜的共現(xiàn)四元組權(quán)重最低系數(shù)。

      [Mf=0.749×Fmax=0.749×35≈4.43]? ?⑹

      最終篩選出88組符合要求的共現(xiàn)四元組,利用Gephi工具繪制圖3所示侗族大歌領(lǐng)域主題關(guān)系圖譜。該圖譜分為兩大研究領(lǐng)域,分別是以“侗族大歌”為主的民族文化理論研究和以“侗族”為主的民族文化傳承與保護實踐研究。兩大研究領(lǐng)域就“旅游”、“民族文化”、“非物質(zhì)文化遺產(chǎn)”等主題詞將兩大主題交疊融合,從側(cè)面反映民間民族文化的保護需重點傳承其特有的非物質(zhì)文化遺產(chǎn)。

      5.2 主題演化分析

      相比于傳統(tǒng)主題演化分析旨在挖掘不同階段主題的發(fā)展歷程及變化趨勢,本文創(chuàng)新性地結(jié)合主題挖掘的分類結(jié)果探究各個主題間的演變關(guān)系。

      首先,前文已確認(rèn)將侗族大歌文獻(xiàn)主題分為三類,通過采用主題詞頻和主題貢獻(xiàn)度評估主題詞貢獻(xiàn)度,計算方法詳見公式⑺。其中[Wi,j]表示主題詞i在Topic n的貢獻(xiàn)度,該值由詞頻[Ci,j]與Topic n下主題詞總數(shù)的比值來決定。

      [Wi,j=Ci,jSj]? ? ?⑺

      其次,按照主題貢獻(xiàn)度篩選各主題下貢獻(xiàn)前20主題詞,能夠一定程度代表該主題的活躍度和關(guān)聯(lián)性,結(jié)合WordCloud繪制主題詞云圖。最后,對三大主題詞云圖深入挖掘,探究各主題間的演化關(guān)系,繪制圖4所示侗族大歌領(lǐng)域主題演化趨勢圖,深層次語義挖掘,發(fā)現(xiàn)如下結(jié)論:

      通過對各主題下的高貢獻(xiàn)度主題詞分析可知,區(qū)域旅游文化主題包括“非物質(zhì)文化遺產(chǎn)”、“侗族文化”、“黎平縣”、“肇興侗寨”等特征;侗族音樂民歌主題包括“傳承”、“民族文化”、“多聲部民歌”、“民族音樂”等特征;文化傳承保護主題包括“侗族民歌”、“黔東南”、“文化傳承”、“音樂教育”等特征。

      通過對各主題之間關(guān)聯(lián)性分析可知,民族區(qū)域文化(Topic 1)和侗族音樂民歌(Topic 2)的關(guān)聯(lián)性是“衍生”;侗族音樂民歌(Topic 2)和文化傳承保護(Topic 3)的關(guān)聯(lián)性是“傳播”;民族區(qū)域文化(Topic 1)和文化傳承保護(Topic 3)的關(guān)聯(lián)性是“創(chuàng)造”。

      6 結(jié)束語

      針對新范式對傳統(tǒng)人文社科的研究認(rèn)知體系的影響,造成學(xué)科邊界模糊、共識標(biāo)準(zhǔn)無序、評價體系欠缺等問題,一定程度影響數(shù)智賦能研究的發(fā)展。本文以“侗族大歌”學(xué)術(shù)文獻(xiàn)作為研究對象,運用計量統(tǒng)計與文本挖掘相結(jié)合的研究框架體系探究其主題變化的趨勢。

      首先,運用普萊斯定律和綜合指數(shù)的核心作者確認(rèn)方法,探究“侗族大歌”核心研究人員。研究表明“侗族大歌”的核心研究人員以西南地區(qū)為主,多數(shù)集中于音樂學(xué)院,符合學(xué)科研究發(fā)展趨勢。其次,分別運用LDA模型和層次聚類模型對侗族大歌的領(lǐng)域主題數(shù)進行了對比計算,對比結(jié)果表明兩個模型均將侗族大歌文獻(xiàn)內(nèi)容分成三大類。之后,構(gòu)建侗族大歌領(lǐng)域主題關(guān)系圖譜,發(fā)現(xiàn)侗族大歌文獻(xiàn)的研究呈現(xiàn)以“侗族大歌”和“侗族”兩大主題為主,“民族文化”、“非物質(zhì)文化遺產(chǎn)”等主題詞將兩大主題交疊融合的研究態(tài)勢。最后,創(chuàng)新性提出探究各主題間的關(guān)聯(lián)性演化,發(fā)現(xiàn)三大主題以“衍生”、“傳播”、“創(chuàng)造”三種關(guān)聯(lián)性有效形成一個研究整體??傮w而言,本文的研究結(jié)論一定程度反映民間民族文化領(lǐng)域的研究變化趨勢,為數(shù)智賦能語音音頻領(lǐng)域研究的深入提供理論基礎(chǔ),同時為民間民族文化保護提供指導(dǎo)性意見。

      參考文獻(xiàn)(References):

      [1] 余艷.中國傳統(tǒng)音樂研究——以侗族大歌為例[J].藝術(shù)品鑒,2022(6):55-57

      [2] 武帥,任天舒,劉建義,等.基于數(shù)據(jù)計量和社交網(wǎng)絡(luò)的圖書情報學(xué)科發(fā)展探究[J].情報探索,2022(1):28-40

      [3] 武帥.科學(xué)研究前沿主題識別[D].碩士,貴州財經(jīng)大學(xué),2021[4] 楊秀璋,武帥,宋籍文,廖文婧,任天舒,劉建義.基于LDA和關(guān)

      系圖譜的數(shù)據(jù)治理文獻(xiàn)主題演化研究[J].信息技術(shù)與信息化,2022(8):6-12[5] 彭兆榮.族性的認(rèn)同與音樂的發(fā)生[J].中國音樂學(xué),1999(3):

      47-55

      [6] 楊曉.南侗“歌師”述論——小黃侗寨的民族音樂學(xué)個案研究[J].中央音樂學(xué)院學(xué)報,2003(1):89-98

      [7] 樊祖蔭.侗族大歌在中國多聲部民歌中的獨特地位[J].貴州大學(xué)學(xué)報(藝術(shù)版),2003(2):1-5

      [8] 張中笑.侗族大歌研究50年(上)[J].貴州大學(xué)學(xué)報(藝術(shù)版),2003(2):33-37

      [9] 徐新建.無字傳承“歌”與“唱”:關(guān)于侗歌的音樂人類學(xué)研究[J].民族藝術(shù)研究,2006(1):61-70

      [10] 吳媛姣,吐爾洪·司拉吉丁.侗族音樂文化生態(tài):研究綜述及意義[J].貴州民族研究,2014,35(11):95-99

      [11] 普虹.侗族大歌——民族的瑰寶[J].貴州大學(xué)學(xué)報(藝術(shù)版),2003(2):11-16

      [12] 甘明,劉光梓.論非物質(zhì)文化遺產(chǎn)保護法權(quán)利主體制度的構(gòu)建——以黔東南苗族侗族自治州為例[J].廣西民族研究,

      2009(1):172-176

      [13] 李延紅.“國家在場”與侗族嘎老的鄉(xiāng)村傳承——以貴州省黎平縣“十洞”地區(qū)兩個侗寨為例[J].中央音樂學(xué)院學(xué)報,2015(1):35-45

      [14] 喬馨.論侗族大歌傳統(tǒng)音樂文化的傳承[J].東北師大學(xué)報(哲學(xué)社會科學(xué)版),2007(4):109-114

      [15] 陳煒,唐景薇.旅游開發(fā)對少數(shù)民族非物質(zhì)文化遺產(chǎn)保護的影響研究——以廣西三江侗族自治縣為例[J].前沿,2010(15):142-149

      林口县| 突泉县| 临颍县| 互助| 大安市| 西乌珠穆沁旗| 台南市| 商南县| 遵义市| 四川省| 宾川县| 丹东市| 扎兰屯市| 黑河市| 溧阳市| 隆回县| 翁源县| 河东区| 和平区| 盘山县| 铜鼓县| 龙岩市| 洪雅县| 个旧市| 读书| 定安县| 扬中市| 镇江市| 宁晋县| 温宿县| 类乌齐县| 开阳县| 辽阳市| 平潭县| 泗洪县| 赤水市| 西贡区| 建平县| 珠海市| 衡山县| 精河县|