• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種數(shù)字樂譜音樂信息快速智能提取算法

      2024-10-01 00:00:00王有能
      無線互聯(lián)科技 2024年18期

      摘要:數(shù)字樂譜信息來源廣泛且格式多樣,導(dǎo)致提取目標(biāo)信息花費(fèi)時(shí)間較長(zhǎng),為此,文章提出一種數(shù)字樂譜音樂信息快速提取算法。從初始音樂信息中提取一級(jí)種子URL,將其加入待爬取的數(shù)字樂譜URL隊(duì)列,識(shí)別并匹配與目標(biāo)樂譜相關(guān)的特征?;谏疃葘W(xué)習(xí)算法篩選出與目標(biāo)樂譜相匹配的信息部分,實(shí)現(xiàn)快速準(zhǔn)確的信息提取。經(jīng)驗(yàn)證,該算法在確保FI值達(dá)到0.98的前提下,提取測(cè)試曲目樂譜的高音音符、長(zhǎng)音音符以及節(jié)奏音符信息的整體時(shí)間開銷僅為115 s,展現(xiàn)出了出色的信息提取速度。

      關(guān)鍵詞:網(wǎng)絡(luò)爬蟲;數(shù)字樂譜;音樂信息;快速提取技術(shù);深度學(xué)習(xí);目標(biāo)特征

      中圖分類號(hào):TP183 文獻(xiàn)標(biāo)志碼:A

      0 引言

      數(shù)字樂譜的概念可以追溯到電子音樂的發(fā)展,隨著計(jì)算機(jī)技術(shù)的進(jìn)步,人們開始嘗試將音樂符號(hào)通過數(shù)字化的方式呈現(xiàn)出來。隨著對(duì)數(shù)字技術(shù)的不斷探索和應(yīng)用,數(shù)字樂譜得以不斷完善和發(fā)展,逐漸成為一種獨(dú)立且完善的音樂符號(hào)系統(tǒng),廣泛應(yīng)用于音樂行業(yè)和音樂教育領(lǐng)域。與傳統(tǒng)樂譜相比,數(shù)字樂譜具有更直觀易懂的特點(diǎn),使得學(xué)習(xí)和演奏音樂變得更加便捷和高效。數(shù)字樂譜作為一種現(xiàn)代化的音樂符號(hào)系統(tǒng),將繼續(xù)在音樂領(lǐng)域發(fā)揮重要作用,推動(dòng)音樂文化的傳承和發(fā)展。數(shù)字樂譜作為音樂信息的重要形式之一,其符號(hào)和標(biāo)記種類繁多[1-2]。傳統(tǒng)的信息提取方法須要花費(fèi)大量時(shí)間進(jìn)行識(shí)別和解析,無法滿足現(xiàn)代音樂創(chuàng)作與傳播的高效需求。因此,深入研究數(shù)字樂譜有助于更好地理解和利用音樂信息,推動(dòng)學(xué)科交叉與融合[3]。

      在當(dāng)前研究領(lǐng)域智能高效發(fā)展的背景下,王騰陽等[4]提出了基于詞性標(biāo)注規(guī)則和預(yù)設(shè)詞的文獻(xiàn)數(shù)據(jù)抽取方法,采用遠(yuǎn)程平滑算法和光學(xué)字符識(shí)別,對(duì)文本內(nèi)容進(jìn)行獲取,利用用戶建立的關(guān)鍵詞庫保存抽取項(xiàng),運(yùn)用正則表達(dá)式,對(duì)關(guān)鍵詞所在語句進(jìn)行獲取,使用自然語言處理語句,進(jìn)行分詞與詞性標(biāo)注,依據(jù)規(guī)則對(duì)目標(biāo)詞進(jìn)行抽取,融合關(guān)鍵詞和預(yù)設(shè)詞距離,對(duì)信息進(jìn)行抽取,完成文獻(xiàn)數(shù)據(jù)抽取。該方法雖然可以基于詞性標(biāo)注規(guī)則提取信息,但調(diào)試和優(yōu)化的時(shí)間開銷較大。梁建軍等[5]提出了基于規(guī)則模式的瓦斯爆炸事故信息抽取技術(shù)。依據(jù)事故分析理論基礎(chǔ),融合煤礦重特大瓦斯爆炸事故報(bào)告樣本庫,對(duì)事故致因詞典庫進(jìn)行構(gòu)建,采用信息抽取技術(shù),實(shí)現(xiàn)基于規(guī)則模式的事故致因信息抽取。該方法可以通過規(guī)則模式進(jìn)行信息提取,但須要耗費(fèi)大量時(shí)間和精力。Chantrapornchai等[6]提出了2種基于搜索引擎返回的全文提取特定信息的方法?;?個(gè)任務(wù):名稱實(shí)體識(shí)別、文本經(jīng)典化和文本摘要。構(gòu)建訓(xùn)練數(shù)據(jù)和數(shù)據(jù)清理,收集旅游數(shù)據(jù)并建立詞匯表。幾個(gè)小步驟包括句子提取、關(guān)系和名稱實(shí)體提取,用于標(biāo)記目的。創(chuàng)建正確的訓(xùn)練數(shù)據(jù)需要這些步驟,可以建立給定實(shí)體類型的識(shí)別模型。利用Transformer的雙向編碼器(Bidirectional Encoder Representations from Transformers,BERT)和SpaCy的方法快速提取信息,但該方法存在BERT模型參數(shù)較多且微調(diào)所需時(shí)間久的問題。

      為解決上述問題,本文利用網(wǎng)絡(luò)爬蟲技術(shù)準(zhǔn)確地提取數(shù)字樂譜中的音樂信息。通過引入深度學(xué)習(xí)技術(shù),篩選出符合目標(biāo)樂譜的信息部分,實(shí)現(xiàn)快速且準(zhǔn)確的信息提取。

      1 算法設(shè)計(jì)

      1.1 數(shù)字樂譜信息快速抓取

      爬蟲從初始化的統(tǒng)一資源定位器(Uniform Resource Locator,URL)和目標(biāo)音符出發(fā),獲取初始音符信息。本文從這些信息中提取一級(jí)種子URL,構(gòu)建待爬取的URL隊(duì)列,將其作為爬蟲爬取數(shù)字樂譜的起始點(diǎn)。具體的實(shí)現(xiàn)方式可以表示為:

      Twf(k)=m(i)/m(j)(1)

      其中,Twf(k)表示爬取中的數(shù)字樂譜URL隊(duì)列;k表示隊(duì)列的長(zhǎng)度參數(shù);w表示單詞爬取范圍;f表示爬取過程中執(zhí)行步幅參數(shù);m(i)表示初始化的URL中的音符信息;m(j)表示初始音樂信息中提取一級(jí)種子URL中的音符信息。

      1.2 基于深度學(xué)習(xí)技術(shù)提取目標(biāo)數(shù)字樂譜信息

      在爬蟲URL隊(duì)列中,首先,本文以梯形樹結(jié)構(gòu)向量化表示目標(biāo)音樂信息特征,利用樂譜中的特定超文本置標(biāo)語言(HyperText Markup Language,HTML)標(biāo)簽元素來標(biāo)記對(duì)應(yīng)的音符特征區(qū)域;其次,采用Dom選擇器,對(duì)樂譜中的特征音樂信息對(duì)應(yīng)的音符特征進(jìn)行深度學(xué)習(xí)處理,進(jìn)一步提升信息提取的效率和準(zhǔn)確性。最終,通過這種整合的方法,實(shí)現(xiàn)對(duì)數(shù)字樂譜音樂信息的精確提取。具體的實(shí)現(xiàn)方式可以表示為:

      其中,wik表示Dom選擇器對(duì)樂譜中特征音樂信息對(duì)應(yīng)的音符特征的深度學(xué)習(xí)結(jié)果;N表示樂譜中特征音樂信息的音符數(shù)量;nik表示特定的html標(biāo)簽元素;nmk表示音符特征包裹的音樂信息;r表示音符樂譜中的目標(biāo)信息。

      2 測(cè)試與分析

      2.1 測(cè)試準(zhǔn)備

      為了確保測(cè)試結(jié)果的可靠性和分析價(jià)值,本文采用梁建軍等[5]提出的算法和Chantrapornchai等[6]提出的算法作為對(duì)照組。在本文設(shè)計(jì)的數(shù)字樂譜音樂信息快速提取算法中,設(shè)置爬取深度為5層,爬取頻率的延遲時(shí)間為1 s,最大并發(fā)連接數(shù)為10。為了全面評(píng)估算法的性能,在某音樂軟件中隨機(jī)選擇了10首樂譜樂曲作為實(shí)驗(yàn)樣本,具體音樂信息如表1所示。

      基于表1所列的10個(gè)樂曲樂譜,實(shí)驗(yàn)分別采用了3種不同的算法進(jìn)行音樂信息提取。在本次實(shí)驗(yàn)中,設(shè)定了具體的提取目標(biāo),包括高音音符數(shù)量、長(zhǎng)音音符數(shù)量以及節(jié)奏音符數(shù)量。為了確保提取結(jié)果的準(zhǔn)確性,設(shè)定FI值達(dá)到0.98為基準(zhǔn)。

      2.2 測(cè)試結(jié)果與分析

      在上述實(shí)驗(yàn)條件下,對(duì)3種不同算法進(jìn)行了測(cè)試,收集3種算法在數(shù)字樂譜音樂信息快速提取過程中的時(shí)間開銷數(shù)據(jù),結(jié)果如圖1所示。

      從圖1可以看出,梁建軍等[5]提出的算法時(shí)間開銷最大,達(dá)到了140 s;在時(shí)間開銷的具體分布上,該算法的長(zhǎng)音音符信息提取時(shí)間最長(zhǎng),而高音音符信息和節(jié)奏音符信息的提取時(shí)間則較為接近。Chantrapornchai等[6]提出的算法整體時(shí)間開銷為135 s,對(duì)于高音音符信息、長(zhǎng)音音符信息和節(jié)奏音符信息的提取時(shí)間相對(duì)均衡,基本在40~50 s。而本文算法具有較高的提取效率,能夠顯著減少樂譜音樂信息提取所需的時(shí)間開銷。

      實(shí)驗(yàn)使用3種不同算法對(duì)10首樂譜樂曲的音符總數(shù)進(jìn)行提取,分析不同算法下音符提取的準(zhǔn)確性,具體結(jié)果如表2所示。

      通過表2可知,使用梁建軍等[5]提出的算法,在提取2號(hào)、5號(hào)、9號(hào)樂譜音符時(shí)與實(shí)際音符總數(shù)存在誤差;使用Chantrapornchai等[6]提出的算法,在提取4號(hào)、7號(hào)、8號(hào)、10號(hào)樂譜音符時(shí)也存在誤差。相比之下,本文所提算法的音符提取結(jié)果與實(shí)際音符總數(shù)一致,顯示出較高的準(zhǔn)確性。

      3 結(jié)語

      本文提出一種高效的數(shù)字樂譜音樂信息快速提取算法,通過引入深度學(xué)習(xí)技術(shù),利用數(shù)字音樂信息與音符特征之間的內(nèi)在聯(lián)系,實(shí)現(xiàn)了自動(dòng)定位并精準(zhǔn)爬取目標(biāo)數(shù)字樂譜。經(jīng)過實(shí)驗(yàn)驗(yàn)證,本文所提出的算法能夠快速、完整地提取數(shù)字樂譜中的音樂信息,整體時(shí)間開銷僅為115 s,相較于傳統(tǒng)算法具有顯著優(yōu)勢(shì),提升了信息提取的效率和準(zhǔn)確性。

      參考文獻(xiàn)

      [1]時(shí)業(yè)茂,顏曉宏,章祖華.基于Python使用爬蟲從豆瓣網(wǎng)獲取最新上映的電影信息[J].電腦編程技巧與維護(hù),2023(12):153-155.

      [2]張海霞.基于Python網(wǎng)絡(luò)爬蟲技術(shù)的海量教學(xué)資源獲取研究[J].太原城市職業(yè)技術(shù)學(xué)院學(xué)報(bào),2023(11):56-58.

      [3]曾炎.德彪西《g小調(diào)小提琴與鋼琴奏鳴曲》樂譜版本與演奏版本分析[J].中國(guó)民族博覽,2023(18):142-144.

      [4]王騰陽,趙小丹,胡林.基于詞性標(biāo)注規(guī)則的馬鈴薯文獻(xiàn)信息抽取方法[J].科學(xué)技術(shù)與工程,2023(27):11562-11569.

      [5]梁建軍,雷咸銳,吳斌,等.基于規(guī)則模式的瓦斯爆炸事故信息抽取技術(shù)[J].煤礦安全,2023(2):239-245.

      [6]CHANTRAPORNCHAI C,TUNSAKUL A.Information extraction tasks based on BERT and SpaCy on tourism domain[J].ECTI Transactions on Computer and Information Technology (ECTI-CIT),2021(1):108-122.

      Fast and intelligent algorithm for extracting digital score music information

      Abstract: Digital score information has a wide source and various formats, which leads to a long time to extract target information. Therefore, this study proposes a fast algorithm for the extraction of digital score music information. The primary seed URL was extracted from the initial music information and added to the digital score URL queue to be crawled to identify and match the features related to the target score. Based on the deep learning algorithm, the information that matches the target score is selected to achieve fast and accurate information extraction. It is proved that on the premise of ensuring the FI value of 0.98, the overall time cost of extracting the test track score is only 115 s, showing excellent information extraction speed.

      Key words: web crawlers; digital score; music information; rapid extraction technology; deep learning; target features

      锡林浩特市| 宁夏| 芜湖市| 仁化县| 贺兰县| 五大连池市| 天水市| 平乐县| 邻水| 定安县| 九寨沟县| 佛教| 汉中市| 和平区| 滦平县| 大兴区| 乌兰县| 噶尔县| 和硕县| 金塔县| 新晃| 剑河县| 大竹县| 邵东县| 青冈县| 博乐市| 佛坪县| 义马市| 长海县| 共和县| 随州市| 商南县| 罗山县| 河北区| 金湖县| 黄大仙区| 吴旗县| 北辰区| 鲁山县| 昌江| 东乡县|