• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      淺析贛南地區(qū)客家方言語(yǔ)音語(yǔ)料庫(kù)及檢索平臺(tái)的構(gòu)建*

      2016-02-04 15:17:09鄧海龍
      山西青年 2016年19期
      關(guān)鍵詞:客家方言建庫(kù)贛南

      蘆 丹 鄧海龍

      贛南師范大學(xué)外國(guó)語(yǔ)學(xué)院,江西 贛州 341000

      ?

      淺析贛南地區(qū)客家方言語(yǔ)音語(yǔ)料庫(kù)及檢索平臺(tái)的構(gòu)建*

      蘆丹鄧海龍

      贛南師范大學(xué)外國(guó)語(yǔ)學(xué)院,江西贛州341000

      語(yǔ)料庫(kù)在本質(zhì)上是一種數(shù)據(jù)庫(kù),其存在的目的就是對(duì)語(yǔ)言材料進(jìn)行有效的存放。伴隨著計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,贛南地區(qū)的客家方言語(yǔ)音語(yǔ)料庫(kù)以及檢索平臺(tái)也在不斷的構(gòu)建當(dāng)中。但是數(shù)據(jù)庫(kù)與語(yǔ)料庫(kù)并不是完全的等同,兩者之間既有交叉部分同時(shí)也存在各自的不同點(diǎn)。本文對(duì)方言數(shù)據(jù)庫(kù)概述進(jìn)行分析,較為詳細(xì)地闡述了方言數(shù)據(jù)庫(kù)研制的系統(tǒng)工程,并提出建設(shè)策略。

      贛南客家方言;語(yǔ)音語(yǔ)料庫(kù);檢索平臺(tái);構(gòu)建

      語(yǔ)料庫(kù)與數(shù)據(jù)庫(kù)是從不同層面來(lái)進(jìn)行闡述的。方言庫(kù)又不同于一般的數(shù)據(jù)庫(kù),方言庫(kù)有其自身的特殊性,主要表現(xiàn)在以下幾個(gè)方面:首先,方言具有自己完整的語(yǔ)音、詞匯以及語(yǔ)法系統(tǒng),想要更好地彰顯方言的特色,數(shù)據(jù)庫(kù)中的存儲(chǔ)方言的語(yǔ)料應(yīng)該要盡量豐富。但是,需要我們注意的是不管數(shù)據(jù)庫(kù)有多大,但是在某種語(yǔ)言的整體性上其數(shù)量是有限的。這也就說(shuō)明,對(duì)方言數(shù)據(jù)庫(kù)進(jìn)行收集與建立時(shí)要盡可能多的體現(xiàn)地方特色,另外,與一般的普通話不同,方言語(yǔ)料追求的是自己的個(gè)性化。因而要對(duì)采集的語(yǔ)料信息進(jìn)行各方面的分析,比如元數(shù)據(jù)以及語(yǔ)音信息甚至是音標(biāo)等方面的分析。也就是說(shuō),將采集的語(yǔ)料輸入數(shù)據(jù)庫(kù)之前要對(duì)其進(jìn)行有效分析與整理。進(jìn)而方便用戶更好的對(duì)其進(jìn)行研究與使用。也就是說(shuō),方言數(shù)據(jù)庫(kù)既有數(shù)據(jù)庫(kù)的共性,但同時(shí)又具有方言語(yǔ)料為主的特性。本文主要闡述方言數(shù)據(jù)庫(kù)的的建設(shè),主要從方言語(yǔ)料的采集、標(biāo)注以及數(shù)據(jù)庫(kù)的應(yīng)用構(gòu)想等幾個(gè)方面對(duì)方言數(shù)據(jù)進(jìn)行全面透徹的探究。

      一、方言數(shù)據(jù)庫(kù)概述

      相關(guān)的資料顯示,我國(guó)在方言的研究方面早有建樹(shù)。方言研究的歷史比較悠久,最早可以追溯到兩千多年以前。但是在五四運(yùn)動(dòng)之后,我國(guó)學(xué)術(shù)界對(duì)方言的研究開(kāi)始進(jìn)入全新的時(shí)期。因?yàn)榈谝粋€(gè)方言機(jī)讀語(yǔ)料庫(kù)的出現(xiàn),我國(guó)對(duì)方言學(xué)的研究不管是從深度還是從廣度方面考慮都進(jìn)入到一個(gè)前所未有的發(fā)展階段。近些年來(lái),我國(guó)在方言數(shù)據(jù)庫(kù)的研制以及理論方面都取得了一定的成效,集中體現(xiàn)在方言語(yǔ)音、語(yǔ)法、詞匯以及俗語(yǔ)等方面。下面主要從這些方面進(jìn)行闡述:

      (一)建立在方言語(yǔ)音基礎(chǔ)之上的數(shù)據(jù)庫(kù)的研究

      方言數(shù)據(jù)庫(kù)主要是對(duì)方言的語(yǔ)音進(jìn)行有效的收集,方言數(shù)據(jù)庫(kù)對(duì)于收集的方言語(yǔ)音并不是方方面面都進(jìn)行研究,有些數(shù)據(jù)庫(kù)只是研究某一部分的內(nèi)容。有的方言語(yǔ)音庫(kù)只是對(duì)方言的語(yǔ)音與語(yǔ)境進(jìn)行一定程度上的研究,甚至有些方言語(yǔ)音庫(kù)在對(duì)方言進(jìn)行研究時(shí)還給出了方言語(yǔ)境總量的計(jì)算方法。

      (二)建立在方言詞匯基礎(chǔ)之上的方言數(shù)據(jù)庫(kù)的研究

      詞匯數(shù)據(jù)庫(kù)其實(shí)就是詞庫(kù),詞匯數(shù)據(jù)庫(kù)有單語(yǔ)詞匯與多語(yǔ)詞匯之分。就目前我國(guó)方言詞匯庫(kù)的研究現(xiàn)狀而言,主要還是集中在對(duì)單語(yǔ)詞庫(kù)的研究上。這些數(shù)據(jù)庫(kù)有的是以廣泛收集方言詞匯語(yǔ)料為主;有的以詞匯的不同音節(jié)建庫(kù),詞匯數(shù)據(jù)庫(kù)建立與完善可以方便用戶在使用方言時(shí)對(duì)其進(jìn)行查詢,另外,也在某種程度上為更好地了解方言詞匯提供了必要的分析手段。

      (三)建立在方言語(yǔ)法以及俗語(yǔ)基礎(chǔ)之上的數(shù)據(jù)庫(kù)的研究

      目前對(duì)于方言語(yǔ)法以及俗語(yǔ)的研究并不多,但是伴隨著方言數(shù)據(jù)庫(kù)技術(shù)的不斷提升,建立在方言語(yǔ)法以及俗語(yǔ)基礎(chǔ)之上的數(shù)據(jù)庫(kù)將會(huì)逐漸的出現(xiàn)。

      二、方言數(shù)據(jù)庫(kù)的研制分析

      眾所周知,我國(guó)是個(gè)多民族國(guó)家,各地的方言都存在一定的個(gè)性特征,對(duì)于方言數(shù)據(jù)庫(kù)的研究必定會(huì)是一個(gè)相對(duì)復(fù)雜、系統(tǒng)的工程。方言數(shù)據(jù)庫(kù)的系統(tǒng)工程建設(shè)涉及到兩個(gè)層面:首先就是建設(shè)數(shù)據(jù)庫(kù)本身,針對(duì)這一層面,主要有數(shù)據(jù)庫(kù)的設(shè)計(jì)以及對(duì)方言語(yǔ)料的采集等;另一方面就是開(kāi)發(fā)數(shù)據(jù)庫(kù)的應(yīng)用平臺(tái),這一層面主要是對(duì)數(shù)據(jù)庫(kù)中的方言進(jìn)行加工管理以及對(duì)檢索系統(tǒng)的設(shè)計(jì)。關(guān)于數(shù)據(jù)庫(kù)的加工管理集中體現(xiàn)在對(duì)方言語(yǔ)料的標(biāo)注。下面從方言數(shù)據(jù)庫(kù)的建設(shè)相關(guān)經(jīng)驗(yàn)方面,對(duì)贛南地區(qū)客家方言數(shù)據(jù)庫(kù)系統(tǒng)工程的五個(gè)研制階段進(jìn)行詳細(xì)的闡述,這五個(gè)階段分別是數(shù)據(jù)庫(kù)的規(guī)劃階段;數(shù)據(jù)庫(kù)的設(shè)計(jì)階段;方言語(yǔ)料采集以及數(shù)據(jù)庫(kù)的實(shí)現(xiàn)階段;數(shù)據(jù)庫(kù)的標(biāo)注階段;數(shù)據(jù)庫(kù)的使用以及維護(hù)階段。

      (一)方言數(shù)據(jù)庫(kù)的規(guī)劃階段分析

      在對(duì)數(shù)據(jù)庫(kù)進(jìn)行建設(shè)之前,相關(guān)的工作人員要做好規(guī)劃工作??茖W(xué)合理的規(guī)劃對(duì)于整個(gè)數(shù)據(jù)庫(kù)的系統(tǒng)質(zhì)量有著決定性的影響。建庫(kù)者在對(duì)數(shù)據(jù)庫(kù)進(jìn)行規(guī)劃時(shí),要堅(jiān)持真實(shí)性與平衡性的原則。“真實(shí)性”是數(shù)據(jù)庫(kù)內(nèi)容的最根本的額特點(diǎn),建庫(kù)者在進(jìn)行建庫(kù)的時(shí)候首先就要保證方言語(yǔ)料的真實(shí)可靠性。其中“真實(shí)性”涉及兩個(gè)方面的內(nèi)容,一是收集的語(yǔ)料是在實(shí)際應(yīng)用中的,并非是建庫(kù)者自己編造出來(lái)的。二是,收集的語(yǔ)料要符合數(shù)據(jù)庫(kù)的要求。在對(duì)數(shù)據(jù)庫(kù)進(jìn)行規(guī)劃時(shí)還要注意另外一個(gè)問(wèn)題就是,盡量做到不同語(yǔ)料的均衡分布。比如要對(duì)口語(yǔ)以及書(shū)面語(yǔ)的分布比例進(jìn)行嚴(yán)格的控制。除此之外,相關(guān)的工作人員在對(duì)數(shù)據(jù)庫(kù)進(jìn)行建立時(shí)要考慮其建設(shè)的目的性以及建設(shè)的規(guī)模大小。除此之外,對(duì)方言的開(kāi)發(fā)成本以及開(kāi)發(fā)的進(jìn)度等因素都要進(jìn)行科學(xué)合理的規(guī)劃。盡量避免在規(guī)劃的過(guò)程中出現(xiàn)盲目、無(wú)序的現(xiàn)象。以贛南地區(qū)客家方言數(shù)據(jù)庫(kù)為例,選取的方言采集點(diǎn)就具有典型的代表性,采集人員在采集的過(guò)程中也很注意,其采集的方言基本上是代表地方特色的,是一種能夠在很大程度上反映地方方言的特色語(yǔ)料。

      (二)方言數(shù)據(jù)庫(kù)的設(shè)計(jì)階段分析

      針對(duì)方言數(shù)據(jù)庫(kù)的設(shè)計(jì)階段而言,主要有三個(gè)層面,即方言數(shù)據(jù)庫(kù)的平衡性原則、采樣原則以及建庫(kù)的邏輯思維等。

      1、方言數(shù)據(jù)庫(kù)的平衡性原則主要是指科學(xué)合理的控制方言數(shù)據(jù)庫(kù)中的各種語(yǔ)料的構(gòu)成比例以及數(shù)據(jù)庫(kù)的分類(lèi)標(biāo)準(zhǔn)。關(guān)于方言數(shù)據(jù)庫(kù)的分類(lèi)問(wèn)題,向來(lái)都是建庫(kù)者比教關(guān)注的問(wèn)題。不同的建庫(kù)者其建庫(kù)的思想是不同的。有的建庫(kù)者認(rèn)為方言數(shù)據(jù)庫(kù)的體裁比較重要,有的則認(rèn)為主題更重要,但是現(xiàn)今已經(jīng)建成的數(shù)據(jù)庫(kù)并不是按照某一種特性進(jìn)行分類(lèi),數(shù)據(jù)庫(kù)的建設(shè)更加趨向于多特征性。

      2、方言數(shù)據(jù)庫(kù)的語(yǔ)料收集原則主要包括對(duì)語(yǔ)料采集方法的設(shè)計(jì)以及語(yǔ)料的比例設(shè)計(jì)等。

      3、數(shù)據(jù)庫(kù)的結(jié)構(gòu)包含邏輯結(jié)構(gòu)以及物理結(jié)構(gòu)兩種。在對(duì)數(shù)據(jù)庫(kù)的邏輯機(jī)構(gòu)進(jìn)行設(shè)計(jì)時(shí),要明白數(shù)據(jù)庫(kù)的組成以及對(duì)元數(shù)據(jù)項(xiàng)進(jìn)行定義。對(duì)于元數(shù)據(jù)的定義,因?yàn)閿?shù)據(jù)庫(kù)的用途不同,彼此之間也存在一定的差異。

      (三)語(yǔ)料采集以及數(shù)據(jù)庫(kù)的實(shí)現(xiàn)階段分析

      一個(gè)方言數(shù)據(jù)庫(kù)不可能沒(méi)有語(yǔ)料,語(yǔ)料是數(shù)據(jù)庫(kù)的靈魂。語(yǔ)料的質(zhì)量對(duì)數(shù)據(jù)庫(kù)的使用價(jià)值有著最為直接的影響,建設(shè)方言數(shù)據(jù)庫(kù)的根本目的就是通過(guò)先進(jìn)的網(wǎng)絡(luò)技術(shù)對(duì)方言語(yǔ)料進(jìn)行還原性的保存,主要是為后人更好的研究與學(xué)習(xí)創(chuàng)造一定的條件。所以,在采集方言語(yǔ)料時(shí)要遵循真實(shí)性以及客觀性的原則。

      數(shù)據(jù)庫(kù)的實(shí)現(xiàn)階段涉及的內(nèi)容比較多,主要有數(shù)據(jù)庫(kù)存儲(chǔ)結(jié)構(gòu)的設(shè)計(jì)、方言語(yǔ)料的錄入、數(shù)據(jù)庫(kù)信息門(mén)戶的建設(shè)等。只有將數(shù)據(jù)庫(kù)存儲(chǔ)結(jié)構(gòu)的設(shè)計(jì)、方言語(yǔ)料的錄入、數(shù)據(jù)庫(kù)信息門(mén)戶的建設(shè)這三個(gè)方面進(jìn)行科學(xué)的設(shè)計(jì)以及合理的建設(shè),才能更好的方便用戶對(duì)方言數(shù)據(jù)庫(kù)的應(yīng)用與檢索。

      (四)方言數(shù)據(jù)庫(kù)的標(biāo)注階段分析

      在數(shù)據(jù)庫(kù)的建設(shè)過(guò)程中,對(duì)語(yǔ)料進(jìn)行標(biāo)注意義重大。語(yǔ)料標(biāo)注的質(zhì)量直接影響信息的豐富性以及準(zhǔn)確性。贛南地區(qū)客家方言數(shù)據(jù)庫(kù)的標(biāo)注主要是對(duì)文本語(yǔ)料的選擇與編著,對(duì)聲學(xué)參數(shù)的提取以及對(duì)口語(yǔ)資源的切音等。

      (五)方言數(shù)據(jù)庫(kù)的使用以及維護(hù)階段分析

      一旦語(yǔ)料被錄入數(shù)據(jù)庫(kù)并且對(duì)其進(jìn)行標(biāo)注之后,用戶就可以通過(guò)各種方式對(duì)方言語(yǔ)料進(jìn)行有效的檢索與利用。另外,建庫(kù)工作人員要及時(shí)的對(duì)信息進(jìn)行接受,并且實(shí)時(shí)的對(duì)方言語(yǔ)料進(jìn)行收集更新。進(jìn)而使數(shù)據(jù)庫(kù)更加科學(xué)以及具備時(shí)效性。數(shù)據(jù)庫(kù)的使用以及維護(hù)階段主要包括對(duì)數(shù)據(jù)庫(kù)檢索系統(tǒng)進(jìn)行設(shè)計(jì),對(duì)數(shù)據(jù)庫(kù)的相關(guān)維護(hù)等。數(shù)據(jù)庫(kù)具有豐富的語(yǔ)料,各種用戶都可以使用,為了給使用對(duì)象提供更多的方便,建庫(kù)者需要對(duì)數(shù)據(jù)庫(kù)的檢索系統(tǒng)進(jìn)行便捷的設(shè)計(jì)。檢索系統(tǒng)的使用率直接關(guān)系著數(shù)據(jù)庫(kù)的使用價(jià)值。便捷的數(shù)據(jù)庫(kù)檢索系統(tǒng)可以為使用者提供海量的方言語(yǔ)料。方言數(shù)據(jù)庫(kù)一旦建成之后,就應(yīng)該在實(shí)踐中進(jìn)行有效的應(yīng)用。另外,建庫(kù)的相關(guān)人員要對(duì)數(shù)據(jù)庫(kù)的信息進(jìn)行及時(shí)的更新與維護(hù),其主要目的是保證方言語(yǔ)料的真實(shí)性以及新鮮性。

      三、結(jié)語(yǔ)

      方言數(shù)據(jù)庫(kù)的建設(shè)是個(gè)復(fù)雜以及系統(tǒng)的過(guò)程,在建庫(kù)的過(guò)程中涉及的內(nèi)容也比較多,涉及到人力資源以及技術(shù)方面、語(yǔ)言學(xué)等多個(gè)領(lǐng)域。近些年,通過(guò)研建庫(kù)者的不懈努力,贛南地區(qū)客家方言的數(shù)據(jù)庫(kù)建設(shè)取得了一定的成就,但是在建庫(kù)的過(guò)程中還有很多需要改進(jìn)的地方,還有很大的發(fā)展空間擺在建庫(kù)者的面前,是需要建庫(kù)者進(jìn)行不懈的努力的。本文主要從方言數(shù)據(jù)庫(kù)的概述著手,對(duì)方言數(shù)據(jù)庫(kù)的研制系統(tǒng)工程進(jìn)行了科學(xué)的分析。

      [1]王紅梅.漢語(yǔ)方言單純動(dòng)詞重疊式比較研究[J].北方論叢,2014(02).

      [2]黃文杰.試析粵東北傳統(tǒng)客家山歌的語(yǔ)言特征[J].重慶科技學(xué)院學(xué)報(bào)(社會(huì)科學(xué)版),2014(08).

      [3]張炫.客贛方言語(yǔ)體標(biāo)記比較研究[J].大舞臺(tái),2015(08).

      H08;H174

      A

      1006-0049-(2016)19-0028-02

      *本文是課題《贛南地區(qū)客家方言語(yǔ)音語(yǔ)料庫(kù)及檢索平臺(tái)建設(shè)》(項(xiàng)目編號(hào):YY1413)研究成果。

      猜你喜歡
      客家方言建庫(kù)贛南
      粵北鄉(xiāng)鎮(zhèn)中小學(xué)生客家方言傳承研究
      ——以韶關(guān)市仁化縣為例
      文化三館講好贛南審計(jì)故事
      贛南采茶戲《一個(gè)人的長(zhǎng)征》簡(jiǎn)介
      影劇新作(2022年2期)2022-07-29 02:28:42
      近四十年來(lái)客家方言研究的歷史經(jīng)驗(yàn)與當(dāng)代反思*
      初探客家方言傳承存在的問(wèn)題及對(duì)策
      贛南臍橙整形修剪技術(shù)
      贛南早臍橙在幾種中間砧木上高接換種的表現(xiàn)
      面向建庫(kù)與制圖一體化的規(guī)則研究
      中文期刊回溯建庫(kù)的實(shí)踐與思考——以貴州省圖書(shū)館為例
      江西大塘客家方言聲母[n]的研究
      三原县| 建昌县| 恩平市| 元谋县| 泗洪县| 兴国县| 花莲县| 云龙县| 瓦房店市| 武安市| 龙山县| 班玛县| 乾安县| 凤凰县| 灵台县| 太仆寺旗| 海南省| 岗巴县| 湘西| 滦平县| 阜新市| 利津县| 新蔡县| 乐至县| 吉隆县| 许昌市| 化州市| 望城县| 平江县| 老河口市| 曲水县| 金阳县| 佛冈县| 桃源县| 富顺县| 浠水县| 临沭县| 定远县| 齐齐哈尔市| 尚义县| 宾川县|