• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      少數(shù)民族瀕危語(yǔ)言有聲語(yǔ)檔建設(shè)四論——關(guān)于語(yǔ)料采錄和加工、技術(shù)培訓(xùn)等問題

      2015-02-20 15:53:42范俊軍
      關(guān)鍵詞:錄音語(yǔ)料語(yǔ)料庫(kù)

      范俊軍

      (暨南大學(xué) 漢語(yǔ)方言研究中心,廣東 廣州510632)

      近幾年瀕危語(yǔ)言有聲語(yǔ)檔建設(shè)得到了學(xué)界的積極關(guān)注。從國(guó)際上語(yǔ)言文化學(xué)界應(yīng)對(duì)瀕危語(yǔ)言問題的實(shí)踐情況來(lái)看,建立有聲語(yǔ)檔是保存和保護(hù)瀕危語(yǔ)言的首選可行之策。國(guó)家哲學(xué)社會(huì)科學(xué)基金將瀕危語(yǔ)言有聲語(yǔ)檔建設(shè)列入課題指南,對(duì)此起到了有力的推動(dòng)作用。瀕危語(yǔ)言有聲語(yǔ)檔建設(shè)的中心任務(wù),就是要充分采錄現(xiàn)存的活態(tài)自然口語(yǔ)以及傳統(tǒng)環(huán)境知識(shí)表達(dá),對(duì)語(yǔ)料進(jìn)行充分轉(zhuǎn)寫標(biāo)注和科學(xué)立檔保管,以適應(yīng)未來(lái)對(duì)語(yǔ)言資源可能的多用途需求。瀕危語(yǔ)言口語(yǔ)資源的采錄和加工,既需要語(yǔ)言記錄方法的創(chuàng)新,也需要利用當(dāng)代多媒體、移動(dòng)通訊和數(shù)據(jù)庫(kù)技術(shù)手段。國(guó)內(nèi)瀕危語(yǔ)言調(diào)查研究從肇始至今已歷時(shí)20年,但就瀕危語(yǔ)言資源的數(shù)字化記錄和立檔而言,還沒有走向科學(xué)化和規(guī)范化的軌道,出現(xiàn)了不少重復(fù)勞動(dòng)和資源浪費(fèi)現(xiàn)象。鑒于此,本文繼續(xù)就瀕危語(yǔ)言語(yǔ)檔建設(shè)問題進(jìn)行討論。

      一、瀕危語(yǔ)言活態(tài)口語(yǔ)的采錄

      (一)瀕危語(yǔ)言活態(tài)口語(yǔ)采錄的倫理問題

      慣常的語(yǔ)言調(diào)查主要集中在單詞和語(yǔ)法例句,目的單一,語(yǔ)料形式和內(nèi)容有限,即使記錄話語(yǔ),也多半是幾則故事。這類語(yǔ)料很少涉及個(gè)人利益和隱私,發(fā)音人也樂于提供。但是,瀕危語(yǔ)言有聲語(yǔ)料主要是活態(tài)口語(yǔ)即自然話語(yǔ),內(nèi)容涉及個(gè)人和族群的生活領(lǐng)域;記錄方法主要是錄音和攝像,不再是單純的語(yǔ)言本體記錄,而是對(duì)個(gè)人、家庭和社群語(yǔ)言生活實(shí)踐的記錄。因此必須思考如下問題:如何協(xié)調(diào)采錄工作和語(yǔ)言族群的正常生產(chǎn)生活,如何與語(yǔ)言族群相處;如何尊重族群的文化禁忌、家庭和個(gè)人隱私;如何處理語(yǔ)言記錄中參加者的利益關(guān)系,避免田野調(diào)查引起的潛在文化沖突、身心傷害和權(quán)利侵犯;如何征得話語(yǔ)交際當(dāng)事人的許可;語(yǔ)料轉(zhuǎn)寫標(biāo)注中如何處理觸及個(gè)人敏感或文化禁忌的音像材料;如何判斷和劃分內(nèi)容禁忌和敏感級(jí)別;如何對(duì)話語(yǔ)交際事件當(dāng)事人匿名保護(hù);調(diào)研資料的發(fā)布、傳播、訪問應(yīng)如何保護(hù)發(fā)音人和說(shuō)話人的權(quán)利,等等。總之,瀕危語(yǔ)言口語(yǔ)采錄、語(yǔ)料轉(zhuǎn)寫、存儲(chǔ)、發(fā)布和訪問等一系列環(huán)節(jié)都涉及倫理問題,對(duì)此應(yīng)予以高度重視。關(guān)于這個(gè)問題,此前已有專文闡述①詳見《西北民族大學(xué)學(xué)報(bào)》2014年第4期拙文《我國(guó)少數(shù)民族田野調(diào)查記錄的倫理問題》。,不再贅述。

      (二)瀕危語(yǔ)言話語(yǔ)事件的發(fā)現(xiàn)

      瀕危語(yǔ)言活態(tài)口語(yǔ)存在于現(xiàn)實(shí)生活言語(yǔ)交際之中。話語(yǔ)事件是有明確目的和主題的言語(yǔ)交際活動(dòng)。如,說(shuō)話人講述一段經(jīng)歷,工匠一邊做工一邊介紹手藝,幾個(gè)人湊在一塊談?wù)撃臣?,等等。瀕危語(yǔ)言的言語(yǔ)交際功能已經(jīng)減弱,使用人口和場(chǎng)合越來(lái)越少,有的瀕危語(yǔ)言只有少數(shù)老人日常還在使用,或只在家庭內(nèi)部和某些個(gè)別特定場(chǎng)合使用。盡管現(xiàn)實(shí)生活中話語(yǔ)事件時(shí)時(shí)可見,但對(duì)瀕危語(yǔ)言來(lái)說(shuō),獲得自然話語(yǔ)語(yǔ)料的機(jī)會(huì)并不多,因而發(fā)現(xiàn)話語(yǔ)事件尤為重要。

      如何在有限時(shí)間和人力條件下采錄更多瀕危語(yǔ)言自然口語(yǔ)呢?我曾介紹了采錄漢語(yǔ)方言自然那話語(yǔ)的若干方法[1],這些方法大多可用于發(fā)現(xiàn)瀕危語(yǔ)言話語(yǔ)事件,其中情景介入法、群眾自錄法、定場(chǎng)地定戶跟蹤法、志愿者跟蹤法、電話錄音法、話題引導(dǎo)言談法等等都是可行之法。當(dāng)然,具體實(shí)施時(shí)還要根據(jù)不同瀕危語(yǔ)言的狀況和調(diào)查人員條件,選擇合適的方法。例如,語(yǔ)言社區(qū)只有幾位老人能說(shuō)瀕危語(yǔ)言,而且該社區(qū)沒有上過小學(xué)的人,這時(shí)最好是由附近村莊的志愿者來(lái)觀察老人的言談活動(dòng)。有的瀕危語(yǔ)言社區(qū),容易找到說(shuō)話人,瀕危語(yǔ)言還有一定的公開使用場(chǎng)合,這時(shí)就應(yīng)考慮更多的題材和體裁??傊射浀脑捳Z(yǔ)材料盡量覆蓋瀕危語(yǔ)言現(xiàn)存使用領(lǐng)域,涵蓋社區(qū)生活的典型事件,以及使用瀕危語(yǔ)言的代表人群。

      除了自然話語(yǔ)事件之外,還應(yīng)注意發(fā)現(xiàn)“傳統(tǒng)環(huán)境知識(shí)”[1],即語(yǔ)言族群的本土自然環(huán)境知識(shí)、生產(chǎn)知識(shí)、工藝知識(shí)和生活知識(shí)等等,這是人類知識(shí)體系的組成部分。傳統(tǒng)環(huán)境知識(shí)的話語(yǔ)可充實(shí)語(yǔ)料的內(nèi)涵價(jià)值。瀕危語(yǔ)言的固有詞匯和表達(dá),往往承載了傳統(tǒng)的環(huán)境知識(shí)。

      (三)錄音環(huán)境和設(shè)備的使用

      瀕危語(yǔ)言口語(yǔ)語(yǔ)料的采樣和錄制,應(yīng)達(dá)到兩點(diǎn)要求:一是有足夠的錄音時(shí)長(zhǎng),二是錄音質(zhì)量?jī)?yōu)良。前者與上面說(shuō)的發(fā)現(xiàn)程序和方法有關(guān),后者取決于錄音技能。

      錄制技能包括環(huán)境選擇和設(shè)備操作。錄音環(huán)境有室內(nèi)環(huán)境和戶外環(huán)境。室內(nèi)環(huán)境又分三種:一是室內(nèi)和周邊沒有噪聲和電磁波干擾的安靜環(huán)境,如當(dāng)?shù)貜V播臺(tái)的播音室,條件好的賓館房間。瀕危語(yǔ)言社區(qū)一般都是鄉(xiāng)村,沒有這個(gè)條件,而且這類環(huán)境只適合錄制個(gè)人講述和基本詞句發(fā)音。二是多數(shù)時(shí)間較安靜,但有時(shí)不可避免有噪聲或持續(xù)弱噪聲。如鄉(xiāng)村民宅,外面有間歇的雞鳴狗叫或敲門打擾等等。這種環(huán)境可錄制個(gè)人講述,但更適合錄制室內(nèi)聊天和對(duì)話。三是嘈雜的室內(nèi)環(huán)境。這種環(huán)境不適合錄音。

      戶外環(huán)境通常有持續(xù)低噪聲或偶爾的強(qiáng)噪聲,如細(xì)微風(fēng)聲,遠(yuǎn)處公路的車流,附近小溪的流水,突然雞鳴狗叫等等??谡Z(yǔ)語(yǔ)料主要來(lái)自戶外情景話語(yǔ),背景噪聲雖然不可避免,但調(diào)適操作錄音設(shè)備,可以降低和減少噪聲,獲得優(yōu)良的話語(yǔ)樣本。錄音設(shè)備最重要的是話筒,應(yīng)根據(jù)聲源位置和環(huán)境噪聲選擇不同的話筒。戶外個(gè)人采訪可用槍式話筒。二三人說(shuō)話,且少走動(dòng),可用單聲道或雙聲道指向話筒。說(shuō)話人一邊做事一邊說(shuō)話,且不停走動(dòng),可隨身攜帶錄音機(jī)并外接頭戴式話筒,或用無(wú)線話筒系統(tǒng)。大場(chǎng)地群眾活動(dòng),主要的說(shuō)話人可配戴獨(dú)立錄音機(jī)和頭戴式或領(lǐng)夾式話筒、無(wú)線話筒、懸吊話筒??傊丛捳Z(yǔ)事件特點(diǎn)和話語(yǔ)發(fā)生的場(chǎng)所環(huán)境狀況而定。戶外錄音,尤其是采錄勞作和活動(dòng)中的說(shuō)話人的自然話語(yǔ),應(yīng)使用專業(yè)便攜式數(shù)碼錄音機(jī)配頭戴或領(lǐng)夾話筒。Zoom-H4n(H6n)、Sony-PCM-D50等都是專業(yè)錄音機(jī),有內(nèi)置XY制式話筒,支持平衡輸入,性價(jià)比高,攜帶方便,操作簡(jiǎn)單。

      總的來(lái)說(shuō),應(yīng)考慮以采錄的語(yǔ)料類別、口語(yǔ)發(fā)生的環(huán)境來(lái)匹配錄音設(shè)備。

      (四)瀕危語(yǔ)言語(yǔ)料錄音時(shí)長(zhǎng)

      一種瀕危語(yǔ)言的話語(yǔ)錄音,多長(zhǎng)時(shí)間比較合適?錄音材料當(dāng)然越多越好,但這需要大量的時(shí)間、人力和物力,應(yīng)考慮可行性。我曾提出,漢語(yǔ)方言自然口語(yǔ)語(yǔ)料庫(kù)的生語(yǔ)料應(yīng)不低于50 000字,錄音時(shí)長(zhǎng)不低于13個(gè)小時(shí),隨機(jī)采錄毛語(yǔ)料應(yīng)達(dá)700個(gè)小時(shí)[2]。少數(shù)民族瀕危語(yǔ)言與漢語(yǔ)方言有所不同。漢語(yǔ)方言大都有口傳文學(xué),而瀕危語(yǔ)言則很少,它主要是日常生活口語(yǔ),能錄到這類話語(yǔ)已經(jīng)難得,挑選余地不多。根據(jù)國(guó)外的案例,結(jié)合我們的經(jīng)驗(yàn),將可用于轉(zhuǎn)寫的音頻語(yǔ)料定為不低于20 000詞次較為合適,按每分鐘50詞次的語(yǔ)速計(jì)算,錄音材料時(shí)長(zhǎng)應(yīng)不低于6小時(shí)。這可作為瀕危語(yǔ)言口語(yǔ)語(yǔ)料的基本數(shù)量要求。

      (五)錄音質(zhì)量的評(píng)估

      如何評(píng)估錄音的音質(zhì)效果?國(guó)標(biāo)GB/T9375—1988《收音機(jī)、錄音機(jī)聽音試驗(yàn)》定義了五級(jí)主觀評(píng)價(jià)標(biāo)準(zhǔn):(1)優(yōu):不察覺失真;(2)良:剛察覺失真,但不討厭;(3)中:察覺失真,稍微討厭;(4)差:討厭,但不令人反感;(5)劣:極其討厭,令人反感。

      質(zhì)量?jī)?yōu),表示錄制的語(yǔ)音(即重建語(yǔ)音)和原始語(yǔ)音之間只有很小的細(xì)節(jié)差異,若不對(duì)照聽比就覺察不出這種差異。質(zhì)量良,表示重建語(yǔ)音的畸變或失真不明顯,不注意聽就感覺不到。質(zhì)量一般,表示重建語(yǔ)音有比較明顯可感知的畸變或失真,但語(yǔ)音自然度和清晰度仍好,聽起來(lái)沒有疲勞感。質(zhì)量差,表示重建語(yǔ)音有較強(qiáng)的畸變或失真,聽起來(lái)已有疲勞感。質(zhì)量極差,表示重建語(yǔ)音的質(zhì)量極差,聽覺無(wú)法忍受。作為經(jīng)驗(yàn)法則,室內(nèi)話語(yǔ)錄音質(zhì)量應(yīng)不低于二級(jí),室外不低于三級(jí)。錄音過程應(yīng)實(shí)時(shí)監(jiān)聽。

      為確保瀕危語(yǔ)言有聲語(yǔ)料的采錄效率和質(zhì)量,目前我們已經(jīng)著手制定《瀕危語(yǔ)言語(yǔ)料種類、采錄環(huán)境和設(shè)備匹配規(guī)范》。

      二、瀕危語(yǔ)言口語(yǔ)的轉(zhuǎn)寫和標(biāo)注

      (一)口語(yǔ)語(yǔ)料的轉(zhuǎn)寫和標(biāo)注

      音頻視頻語(yǔ)料須經(jīng)過編輯、轉(zhuǎn)寫和標(biāo)注才能立檔保存,或研發(fā)語(yǔ)料庫(kù)做其他用途。轉(zhuǎn)寫是對(duì)錄音言語(yǔ)用文字或書面符號(hào)同步記錄,成為可閱讀文本。標(biāo)注不同于轉(zhuǎn)寫,包括兩個(gè)方面,一是用一套符號(hào)代碼,把話語(yǔ)的語(yǔ)言學(xué)特征(如語(yǔ)音、詞匯、語(yǔ)法等)在轉(zhuǎn)寫文本中做出標(biāo)記;二是對(duì)話語(yǔ)的語(yǔ)意、言語(yǔ)行為特征、情景意義以及相關(guān)的知識(shí)文化等等,進(jìn)行描述。轉(zhuǎn)寫和標(biāo)注的質(zhì)量直接關(guān)系到語(yǔ)料的利用價(jià)值。

      從目前技術(shù)來(lái)看,音頻視頻語(yǔ)料的文字轉(zhuǎn)寫和音標(biāo)注音、話語(yǔ)單位的時(shí)段切割、語(yǔ)音單位的切分、語(yǔ)言特征的標(biāo)注,通常由人工完成。一段話語(yǔ)錄音,一般先要對(duì)每個(gè)句子或意群語(yǔ)調(diào)單位的結(jié)束點(diǎn)做標(biāo)記。軟件雖然可以偵測(cè)語(yǔ)音流的靜音段,但準(zhǔn)確率不高,因?yàn)槿粘Q哉Z(yǔ)交際中,說(shuō)話人不是非得說(shuō)完一句話才停頓,句中或詞中停頓很普遍。幾個(gè)人言談不一定一人一句輪流說(shuō)話,同時(shí)插話和答話也常見。轉(zhuǎn)寫這類交疊話語(yǔ)必須先按說(shuō)話人進(jìn)行斷句。語(yǔ)音識(shí)別技術(shù)雖然可以根據(jù)說(shuō)話人的語(yǔ)音特征跟蹤說(shuō)話人,但對(duì)于有一些噪聲的情景話語(yǔ),自動(dòng)判斷說(shuō)話人話輪變換的準(zhǔn)確率會(huì)大打折扣,它需要人工做大量的修正。此外,錄音機(jī)和軟件都有自動(dòng)降噪功能,但也不能隨意啟用降噪,因?yàn)殪o音和噪聲有時(shí)是情景話語(yǔ)不可缺少的組成部分。在處理這類語(yǔ)料時(shí),哪些噪聲和靜音與話語(yǔ)情景有關(guān)而須保留,哪些與情境無(wú)關(guān)而應(yīng)刪除,還得靠人工判斷。

      我國(guó)少數(shù)民族瀕危語(yǔ)言語(yǔ)檔至少需要三類轉(zhuǎn)寫標(biāo)注文本:語(yǔ)音轉(zhuǎn)寫或標(biāo)音文本,中文翻譯文本,以及中文解釋和描寫文本。語(yǔ)音轉(zhuǎn)寫或標(biāo)音文本是用國(guó)際音標(biāo)或拼音方案同步記錄話語(yǔ),中文翻譯文本是用普通話逐詞對(duì)譯和逐句意譯,中文解釋和描寫文本是用中文對(duì)話語(yǔ)事件相關(guān)知識(shí)和口語(yǔ)現(xiàn)象進(jìn)行描述和標(biāo)注。這是語(yǔ)檔錄音的最簡(jiǎn)轉(zhuǎn)寫要求。

      標(biāo)注有基本標(biāo)注和富標(biāo)注?;緲?biāo)注一般包括詞類、時(shí)間戳、話輪。富標(biāo)注則無(wú)限制,語(yǔ)音、詞匯、語(yǔ)法、語(yǔ)義、語(yǔ)用等特征都可標(biāo)注。標(biāo)注的精度取決于話語(yǔ)分析的深度和廣度,以及語(yǔ)料的用途。詞類、時(shí)態(tài)、語(yǔ)態(tài)、句法、話輪、靜音、背景聲、停頓、韻律、語(yǔ)氣、情感等等都可標(biāo)注,語(yǔ)音可細(xì)到音節(jié)、音素、韻律、音步、語(yǔ)調(diào)特征,此外還可以進(jìn)行多模態(tài)特征標(biāo)注。關(guān)于標(biāo)注精度層次,可參閱美國(guó)英語(yǔ)口語(yǔ)語(yǔ)料庫(kù)的相關(guān)文件[3]。

      瀕危語(yǔ)言口語(yǔ)標(biāo)注應(yīng)高于基本標(biāo)注。標(biāo)注項(xiàng)越多,越有利于數(shù)據(jù)挖掘,但需要大量的人力和財(cái)力,因而要考慮可行性。作為經(jīng)驗(yàn)法則,1小時(shí)口語(yǔ)錄音,初步剪輯處理要5倍~6倍時(shí)間。用軟件對(duì)1分鐘錄音進(jìn)行分句、分詞、音標(biāo)注音,普通話逐詞對(duì)譯和逐句意譯,標(biāo)記語(yǔ)流中每個(gè)詞的詞類,標(biāo)記非言語(yǔ)聲音,需要6小時(shí)~7小時(shí),這還不包括檢查標(biāo)注一致性所用的時(shí)間。

      (二)轉(zhuǎn)寫規(guī)則和軟件工具

      為便于語(yǔ)料數(shù)據(jù)共享,口語(yǔ)轉(zhuǎn)寫和標(biāo)注必須遵循相關(guān)技術(shù)規(guī)范。早期的話語(yǔ)分析研究,主要采用美國(guó)學(xué)者Jefferson提出的標(biāo)注系統(tǒng)。后來(lái),國(guó)外一些著名的口語(yǔ)語(yǔ)料庫(kù),如英語(yǔ)國(guó)家語(yǔ)料庫(kù)(BNC)①其官網(wǎng)網(wǎng)址為http://www.natcorp.ox.a(chǎn)c.uk/,加州大學(xué)圣巴巴拉分校的美國(guó)英語(yǔ)口語(yǔ)語(yǔ)料庫(kù)(SBCSAE)[4],賓夕法尼亞大學(xué)語(yǔ)言數(shù)據(jù)聯(lián)盟(LDC)的口語(yǔ)語(yǔ)音數(shù)據(jù)庫(kù),德語(yǔ)口語(yǔ)語(yǔ)料庫(kù),維也納——牛津國(guó)際英語(yǔ)語(yǔ)料庫(kù)(VOICE)②其官網(wǎng)網(wǎng)址為http://www.univie.a(chǎn)c.a(chǎn)t/voice/等等,都制定了自己的轉(zhuǎn)寫規(guī)則系統(tǒng)。我國(guó)臺(tái)灣中研院的新世紀(jì)語(yǔ)料庫(kù)、北京語(yǔ)言大學(xué)的北京話口語(yǔ)語(yǔ)料庫(kù),也有自己的標(biāo)注符號(hào)。我們認(rèn)為,應(yīng)盡快建立適合我國(guó)少數(shù)民族瀕危語(yǔ)言和漢語(yǔ)瀕危方言的口語(yǔ)轉(zhuǎn)寫標(biāo)注系統(tǒng)。

      轉(zhuǎn)寫和標(biāo)注需要專門的工具。國(guó)外的軟件有 Transcriber[5],Xtrans,Elan,Anvil[6],Transana[7],EMU[8],CLAN③可在此網(wǎng)址下載:http://childes.psy.cmu.edu/clan/,Audamus[9],Praat,EXMARa LDA④可在此網(wǎng)址下載:http://www.exmaralda.org/等等。Transcriber支持多種音視頻格式,改進(jìn)版Transcriber AG功能有所提升,是入門級(jí)軟件。Xtrans主要用于轉(zhuǎn)寫廣播新聞和會(huì)議錄音。Transana有多種版本可以使用,只是數(shù)據(jù)格式比較單一。Praat也可做標(biāo)注,尤其適合切分和標(biāo)注音節(jié)、音素,但處理長(zhǎng)時(shí)音頻文件顯得不便。ELAN采用曲譜式分層標(biāo)注模式,支持視頻和音頻,有快速切割和轉(zhuǎn)寫模式,以及多種檢索功能。Anvil跨平臺(tái)且開源,能與ELAN/PRAAT交換數(shù)據(jù),可實(shí)現(xiàn)多模態(tài)標(biāo)注。EXMARaLDA Partiutr-editor采用曲譜式數(shù)據(jù)結(jié)構(gòu)模式,整合了幾種轉(zhuǎn)寫規(guī)則并能根據(jù)規(guī)則糾錯(cuò),還可調(diào)用praat查看語(yǔ)圖,導(dǎo)出和輸出多種轉(zhuǎn)寫文件格式,也能將話劇腳本式的三層文本導(dǎo)入轉(zhuǎn)換為標(biāo)注文件。這些軟件雖然各有優(yōu)勢(shì)⑤夏威夷大學(xué)的在線期刊Language Documentation &Conservation有“技術(shù)評(píng)論”評(píng)介軟件。,但根據(jù)我們的使用和測(cè)試,ELAN、Partitur、Anvil三種軟件的綜合性能更強(qiáng)。由于這些軟件都是由國(guó)外研發(fā)的,用于處理我國(guó)漢語(yǔ)方言和少數(shù)民族語(yǔ)言還存在一些缺陷,用戶可以將使用中發(fā)現(xiàn)的問題反饋給軟件研發(fā)者,以求不斷改進(jìn)和升級(jí)。

      三、開展瀕危語(yǔ)言語(yǔ)檔建設(shè)的技術(shù)培訓(xùn)

      《新發(fā)現(xiàn)語(yǔ)言叢書》已出版30多部,對(duì)國(guó)內(nèi)所有少數(shù)民族瀕危語(yǔ)言的代表方言已經(jīng)有了系統(tǒng)描寫,當(dāng)前和今后的任務(wù)是重點(diǎn)解決瀕危語(yǔ)言語(yǔ)音流失問題⑥這個(gè)觀點(diǎn)是北京師范大學(xué)王寧先生2009年10月首先提出。。瀕危語(yǔ)言語(yǔ)檔建設(shè)是跨學(xué)科領(lǐng)域,需要田野語(yǔ)言學(xué)、話語(yǔ)分析、語(yǔ)料庫(kù)、檔案學(xué)理論和現(xiàn)代新媒體技術(shù),同時(shí)它要求瀕危語(yǔ)言調(diào)查研究者實(shí)現(xiàn)以下轉(zhuǎn)變:從個(gè)人自留地式的語(yǔ)言調(diào)查和材料收集向團(tuán)隊(duì)主導(dǎo)的語(yǔ)言資源建設(shè)轉(zhuǎn)變,從傳統(tǒng)耳聽手寫的記錄方式向傳統(tǒng)方法和現(xiàn)代多媒體手段結(jié)合轉(zhuǎn)變,從為個(gè)人學(xué)術(shù)研究服務(wù)向?yàn)槿罕娬Z(yǔ)言生活需求轉(zhuǎn)變。

      以本世紀(jì)初美國(guó)夏威夷大學(xué)第一屆瀕危語(yǔ)言記錄和保存研討會(huì)以及倫敦大學(xué)始立“漢斯羅辛瀕危語(yǔ)言項(xiàng)目(HRELP)”⑦詳見SOAS基金網(wǎng)站:http://www.hrelp.org基金為標(biāo)志,瀕危語(yǔ)言的記錄和保存走過了十多年歷程⑧倫敦大學(xué)亞非學(xué)院的Language Description and Documentation白皮書和夏威夷大學(xué)國(guó)立語(yǔ)言資源中心的期刊Language Documentation &Consertion(LD&C)是瀕危語(yǔ)言記錄領(lǐng)域的重要出版物。。目前國(guó)內(nèi)首要問題是瀕危語(yǔ)言研究隊(duì)伍普遍缺乏數(shù)字化記錄和保存的專業(yè)技能。倫敦大學(xué)亞非學(xué)院曾對(duì)獲得漢斯羅辛基金項(xiàng)目的主持人進(jìn)行專業(yè)技術(shù)培訓(xùn),客觀上為全球?yàn)l危語(yǔ)言記錄和保存培養(yǎng)了一批應(yīng)急人才,我國(guó)有幾位語(yǔ)言學(xué)者承擔(dān)了該基金資助項(xiàng)目并接受了技術(shù)培訓(xùn),在他們的帶動(dòng)下,國(guó)內(nèi)對(duì)瀕危語(yǔ)言記錄技術(shù)的關(guān)注近年升溫,迫切需要推廣這方面的技術(shù)培訓(xùn)。

      開展瀕危語(yǔ)言有聲語(yǔ)檔建設(shè)的技術(shù)培訓(xùn),有助于培養(yǎng)和提升我國(guó)語(yǔ)言田野工作者的語(yǔ)料采錄和加工處理能力,倡導(dǎo)和推動(dòng)語(yǔ)言調(diào)查工作者學(xué)習(xí)和掌握跨學(xué)科知識(shí)和技能。對(duì)于瀕危語(yǔ)言有聲語(yǔ)檔建設(shè)工作而言,當(dāng)前的培訓(xùn)應(yīng)著重于以下內(nèi)容:語(yǔ)言田野倫理規(guī)范,口語(yǔ)語(yǔ)料庫(kù)基礎(chǔ)理論,口語(yǔ)記錄實(shí)踐,語(yǔ)料轉(zhuǎn)寫和標(biāo)注,語(yǔ)言技術(shù)軟件的使用,錄音設(shè)想設(shè)備的操作,音頻視頻的編輯處理,語(yǔ)音實(shí)驗(yàn)基礎(chǔ),語(yǔ)料管理和數(shù)字化檔案基礎(chǔ),等等。

      值得欣慰的是,自2013年起,中國(guó)民族語(yǔ)言學(xué)會(huì)和暨南大學(xué)漢語(yǔ)方言研究中心聯(lián)合舉辦了三期“中國(guó)瀕危語(yǔ)言有聲資源采錄和立檔技術(shù)高級(jí)研習(xí)班”,并計(jì)劃用3年時(shí)間舉辦6期,以期在我國(guó)少數(shù)民族語(yǔ)言學(xué)界和漢語(yǔ)方言學(xué)界,倡導(dǎo)和推動(dòng)現(xiàn)代語(yǔ)言記錄和立檔知識(shí)和技能的學(xué)習(xí)和普及,這將有力促進(jìn)我國(guó)瀕危語(yǔ)言有聲資源建設(shè)的科學(xué)發(fā)展。

      [1]范俊軍.漢語(yǔ)方言自然口語(yǔ)語(yǔ)料庫(kù)建設(shè)的幾個(gè)基本問題[J].學(xué)術(shù)研究,2013,(2):153-159.

      [2]Stanford Zent,Luisa Maffi.Final Report on Indicator No.2:Methodology for Developing a Vitality Index of Traditional Environmental Knowledge(VITEK)for the Project“Global Indicators of the Status and Trends of Linguistic Diversity and Traditional Knowledge.”[EB/OL].Terralingua,2010:1-112.http://www.terralingua.org/vitek/.

      [3]Peter K Austin.Communities,ethics and rights in language documentation[EB/OL].Language Documentation and Description.Volume 7,p35.

      [4]John W.Du Bois.Transcription Delicacy Hierarchy[EB/OL].http://www.linguistics.ucsb.edu/projects/transcription/.

      [5]Linda Barwick.Transcribe:Created by Seventh String Software[EB/OL].Language Documentation & Conservation,2009,3(2):236-240.http://nflrc.hawaii.edu/ldc/.

      [6]Kipp,Michael.Anvil:The video annotation research tool[EB/OL].2011.http://www.a(chǎn)nvil-software.de/#.

      [7]Oksana Afitska.Transana 2.30 from Wisconsin Center for Education Research[EB/OL].Language Documentation &Conservation.2009,3(2):226-235.http://nflrc.hawaii.edu/ldc/.

      [8]Briony Williams.EMU Speech Database System from The EMU Project[EB/OL].Language Documentation & Conservation.2008,2(1):166-175.http://nflrc.hawaii.edu/ldc/.

      [9]Amanda Brotchie.Audiamus 2.3:Created by Nicholas Thieberger[EB/OL].Language Documentation & Conservation.2007,1(2):290-292.http://nflrc.hawaii.edu/ldc/Further discussion of building audio archives of minority endangered languages.

      猜你喜歡
      錄音語(yǔ)料語(yǔ)料庫(kù)
      Funny Phonics
      funny phonics
      《語(yǔ)料庫(kù)翻譯文體學(xué)》評(píng)介
      Colorful Seasons多彩四季
      A New Term
      把課文的優(yōu)美表達(dá)存進(jìn)語(yǔ)料庫(kù)
      基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
      華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
      基于JAVAEE的維吾爾中介語(yǔ)語(yǔ)料庫(kù)開發(fā)與實(shí)現(xiàn)
      《苗防備覽》中的湘西語(yǔ)料
      宁南县| 普宁市| 砚山县| 青神县| 芜湖县| 贡嘎县| 龙井市| 绥江县| 玉田县| 庆元县| 大港区| 尉氏县| 房山区| 二连浩特市| 清水河县| 新化县| 文山县| 布尔津县| 广西| 太谷县| 双城市| 海宁市| 周宁县| 晋江市| 汝州市| 张家界市| 黎平县| 芦山县| 广南县| 鄱阳县| 莱阳市| 安图县| 新龙县| 乐业县| 兴国县| 饶阳县| 八宿县| 资溪县| 吉林省| 札达县| 惠安县|