丁喜霞
摘 ?要:中國(guó)語言資源保護(hù)工程和采錄展示平臺(tái)在政府統(tǒng)籌規(guī)劃、規(guī)范標(biāo)準(zhǔn)設(shè)計(jì)、現(xiàn)代技術(shù)運(yùn)用、資源保護(hù)利用、人才隊(duì)伍建設(shè)等方面取得了突出成效。同時(shí),在調(diào)查點(diǎn)布局和點(diǎn)位數(shù)量、方言片區(qū)歸屬和語言屬性標(biāo)注等方面,也存在一些有待完善之處。當(dāng)前,語保工程和平臺(tái)建設(shè)應(yīng)在政府統(tǒng)一規(guī)劃指導(dǎo)下,著力從補(bǔ)充完善前期成果、提高調(diào)查點(diǎn)的整體覆蓋率、科學(xué)標(biāo)注語言屬性、壯大專業(yè)人才隊(duì)伍等方面,推動(dòng)語言資源庫(kù)和采錄展示平臺(tái)的持續(xù)升級(jí)。
關(guān)鍵詞:中國(guó)語言資源保護(hù)工程;采錄展示平臺(tái);中原官話;點(diǎn)位布局;屬性標(biāo)注
中國(guó)語言資源保護(hù)工程(以下簡(jiǎn)稱“語保工程”),是教育部和國(guó)家語委于2015年正式啟動(dòng)的一項(xiàng)大型語言文化工程,是目前世界上規(guī)模最大的語言資源保護(hù)項(xiàng)目,主要包括中國(guó)語言資源調(diào)查匯聚、文化典藏、采錄展示平臺(tái)建設(shè)等內(nèi)容[1]、[2]。一期工程已于2019年底完成,二期建設(shè)正有序推進(jìn)??偟膩砜?,語保工程在政府統(tǒng)籌規(guī)劃、規(guī)范標(biāo)準(zhǔn)設(shè)計(jì)、現(xiàn)代技術(shù)運(yùn)用、語言資源保護(hù)利用、語保人才隊(duì)伍建設(shè)等方面,取得了許多成功經(jīng)驗(yàn)和突出成效。由于語保工程規(guī)模浩大,牽涉面廣,建設(shè)周期長(zhǎng),平臺(tái)建設(shè)專業(yè)性強(qiáng),在具體實(shí)施過程中會(huì)遇到各種各樣的困難和挑戰(zhàn),也難免會(huì)存在一些有待完善之處。本文在概述語保工程和平臺(tái)建設(shè)已取得成效的基礎(chǔ)上,以專業(yè)平臺(tái)采錄展示的中原官話點(diǎn)的語料為例,客觀分析專業(yè)平臺(tái)建設(shè)的實(shí)績(jī)及存在問題,探討其產(chǎn)生原因和發(fā)展方向,希望能夠?yàn)橥苿?dòng)語言資源庫(kù)和平臺(tái)建設(shè)的持續(xù)升級(jí)完善提供參考。
一、語保工程和平臺(tái)建設(shè)的顯著成效
語保工程建立了科學(xué)有效的管理體系,推行行之有效的“國(guó)家統(tǒng)一規(guī)劃、地方和專家共同實(shí)施、鼓勵(lì)社會(huì)參與”的工作模式。它在全國(guó)范圍內(nèi)整合專家學(xué)者成立調(diào)查團(tuán)隊(duì),設(shè)立了專業(yè)機(jī)構(gòu)、專家咨詢委員會(huì)和核心專家組,組織相關(guān)專家和技術(shù)人員,研制了系列工作規(guī)范和技術(shù)規(guī)范,對(duì)語保工程各方面、各環(huán)節(jié)的工作都做出了嚴(yán)格、明確的規(guī)定,保證了專業(yè)技術(shù)工作的科學(xué)性、規(guī)范性和一致性。制定了調(diào)查規(guī)范、語料整理規(guī)范、音像加工規(guī)范、屬性標(biāo)注規(guī)范、資源編碼系統(tǒng),研發(fā)了語保工程專用錄音軟件、攝錄軟件、規(guī)范命名軟件、電子材料校驗(yàn)軟件、語料標(biāo)注軟件等相關(guān)技術(shù)軟件[3]、[4],針對(duì)工作規(guī)范、技術(shù)標(biāo)準(zhǔn)、軟硬件使用等進(jìn)行專項(xiàng)培訓(xùn),明確并統(tǒng)一質(zhì)量要求。2019年,已完成1712個(gè)點(diǎn)的語言資源調(diào)查采集任務(wù),調(diào)查范圍涵蓋全國(guó)所有省份和123個(gè)語種及其主要方言[5],調(diào)查收集到原始語料數(shù)據(jù)1000多萬條,其中,音視頻數(shù)據(jù)各500多萬條,總?cè)萘窟_(dá)100TB。參與語保工程建設(shè)的高校和科研機(jī)構(gòu)達(dá)350多家,組建專家團(tuán)隊(duì)1000多個(gè),投入專業(yè)技術(shù)人員4500多名,并且針對(duì)各項(xiàng)具體工作舉辦了57期專項(xiàng)培訓(xùn),培訓(xùn)人次達(dá)4700余人次,在全國(guó)范圍內(nèi)鍛煉、造就了一支優(yōu)秀的語保人才隊(duì)伍[6]。
中國(guó)語言資源保護(hù)工程采錄展示平臺(tái)(以下簡(jiǎn)稱“語保平臺(tái)”),是語保工程的重要組成部分,主要任務(wù)是在漢語方言、少數(shù)民族語言、方言文化等資源調(diào)查保存的基礎(chǔ)上,利用前沿技術(shù),開展語言資源的數(shù)字化、存儲(chǔ)管理、整理分析和應(yīng)用展示等工作。通過科學(xué)整理加工,建成大規(guī)模、可持續(xù)增長(zhǎng)的多媒體語言資源庫(kù),推進(jìn)深度開發(fā)應(yīng)用,最終建成一個(gè)具有科學(xué)性和前瞻性的語言資源采錄展示平臺(tái),全面、立體、直觀地呈現(xiàn)我國(guó)語言資源的實(shí)態(tài)面貌,并利用互聯(lián)網(wǎng)面向社會(huì)大眾采集語言資源,保護(hù)和促進(jìn)語言多樣性。語保平臺(tái)是一個(gè)綜合性的、科學(xué)研究和社會(huì)化應(yīng)用相結(jié)合的信息化建設(shè)項(xiàng)目,主要包括中國(guó)語言資源庫(kù)子系統(tǒng)、中國(guó)語言資源統(tǒng)一管理系統(tǒng)、中國(guó)語言資源采錄展示系統(tǒng)。其中,中國(guó)語言資源采錄展示系統(tǒng)是語保平臺(tái)的重點(diǎn)建設(shè)內(nèi)容,按照用戶群體分為專業(yè)平臺(tái)和公眾平臺(tái)兩個(gè)子系統(tǒng)。專業(yè)平臺(tái)立足語言資源調(diào)查和科研需求,開發(fā)語言資源數(shù)據(jù)存儲(chǔ)、展示、檢索和分析應(yīng)用,為語言學(xué)領(lǐng)域的專家學(xué)者提供數(shù)據(jù)分析、檢索等專業(yè)服務(wù)[7]。
語保平臺(tái)自2015年開始建設(shè)、2016年上線以來,研發(fā)和運(yùn)行順利,成效顯著。2019年底,該平臺(tái)已匯集展示了32個(gè)省區(qū)、1396個(gè)調(diào)查點(diǎn)的語言資源數(shù)據(jù),其中,漢語方言調(diào)查點(diǎn)1079個(gè),少數(shù)民族語言調(diào)查點(diǎn)317個(gè),收錄音頻資源400多萬條,視頻資源300多萬條,總物理容量達(dá)46TB[7]。截至2020年9月底,語保平臺(tái)已匯聚了語保工程1613個(gè)調(diào)查點(diǎn)的語言資源數(shù)據(jù),其中,漢語方言調(diào)查點(diǎn)1284個(gè),少數(shù)民族語言調(diào)查點(diǎn)329個(gè),其他調(diào)查點(diǎn)的語言資源數(shù)據(jù)經(jīng)過科學(xué)、規(guī)范地整理加工后,也將通過己有資源匯聚的方式陸續(xù)進(jìn)入語保平臺(tái),向社會(huì)各界開放使用[5]。
總體而言,語保工程頂層設(shè)計(jì)科學(xué)合理,管理機(jī)制嚴(yán)密規(guī)范,各環(huán)節(jié)都有嚴(yán)格的制度監(jiān)控,保證了工程質(zhì)量,特別是在政府統(tǒng)籌規(guī)劃、規(guī)范標(biāo)準(zhǔn)設(shè)計(jì)以及現(xiàn)代化技術(shù)手段運(yùn)用等方面,具有顯著的先進(jìn)性和前瞻性[4]、[2]。同時(shí),語言資源庫(kù)和語言資源管理系統(tǒng)在分布式存儲(chǔ)技術(shù)、流媒體技術(shù)、全文索引等關(guān)鍵技術(shù)的支持下,始終保持高效、高可用的服務(wù)狀態(tài),在方言保護(hù)、語言研究和傳統(tǒng)文化傳承方面的價(jià)值和效用也得到了有效體現(xiàn)[7]。
二、專業(yè)平臺(tái)所展示的中原官話點(diǎn)現(xiàn)狀
如前所述,語保工程和平臺(tái)建設(shè)已經(jīng)取得了顯著的成效,不過,由于諸種原因,也難免會(huì)存在一些問題。鑒于中原官話在漢語方言發(fā)展史上的重要地位,我們以專業(yè)平臺(tái)所采錄展示的中原官話點(diǎn)的語料實(shí)態(tài)為例,著重從方言調(diào)查點(diǎn)的數(shù)量和區(qū)域分布、方言片區(qū)歸屬及其標(biāo)注等方面,客觀分析語保工程和平臺(tái)建設(shè)在方言調(diào)查、采錄、展示方面取得的實(shí)績(jī),以推動(dòng)語保平臺(tái)建設(shè)的持續(xù)升級(jí)完善。
(一)調(diào)查點(diǎn)數(shù)量和區(qū)域分布
據(jù)《中國(guó)語言地圖集(第2版)》(以下簡(jiǎn)稱《地圖集》)[8],中原官話的分布范圍,以中原地區(qū)黃河兩岸為核心,南北拓展,東西綿延,橫跨河南、河北、山東、江蘇、安徽、山西、陜西、甘肅、寧夏、青海、新疆、四川等12個(gè)省區(qū)、400個(gè)縣市,東西長(zhǎng)約3000多公里,南北寬約600多公里,使用人口達(dá)1.86億左右[9]。中原官話在漢語發(fā)展史上具有重要地位,對(duì)現(xiàn)代漢語各大方言的形成和發(fā)展產(chǎn)生了重大影響,在不同區(qū)域與不同方言和少數(shù)民族語言呈現(xiàn)出各種層次的接觸與互動(dòng),如西北部與蘭銀官話、藏語、阿爾泰語以及其他少數(shù)民族語言,中部與晉語、西南官話等,東部與冀魯官話、膠遼官話、江淮官話等,對(duì)于語言演變研究和語言接觸研究具有重要價(jià)值[10]。
從語保專業(yè)平臺(tái)所展示的中原官話點(diǎn)的情況來看,至2022年3月底,共涉及11個(gè)省區(qū)、110個(gè)縣市和7個(gè)方言島。其中,有109個(gè)縣市點(diǎn)見于《地圖集》,另有1個(gè)方言點(diǎn)和7個(gè)方言島不見于《地圖集》,涉及江蘇、湖南、海南、江西、山西5個(gè)省區(qū)。具體如表1所示:
專業(yè)平臺(tái)展示的每個(gè)中原官話點(diǎn),都明確標(biāo)注調(diào)查點(diǎn)名稱及所在省份、調(diào)查點(diǎn)的方言片區(qū)歸屬、調(diào)查點(diǎn)負(fù)責(zé)人及所在單位、調(diào)查點(diǎn)簡(jiǎn)介等內(nèi)容。其中的簡(jiǎn)介部分,對(duì)每個(gè)調(diào)查點(diǎn)的方言特征、區(qū)域分布和使用人口等情況作了簡(jiǎn)明扼要的介紹,并配以方言分布地圖和1000個(gè)單字、1200條詞匯、50個(gè)例句以及地普、話語講述、話語對(duì)話和口頭文化等音頻、視頻材料,內(nèi)容豐富翔實(shí)。同時(shí),對(duì)發(fā)音人和講述人的相關(guān)情況也進(jìn)行了詳細(xì)說明和音視頻記錄,保證了專業(yè)平臺(tái)采錄展示的方言材料的真實(shí)可靠,為學(xué)界利用相關(guān)資料進(jìn)行中原官話研究及其與周邊方言的比較研究提供了極大便利。
值得注意的是,專業(yè)平臺(tái)還展示了不見于《地圖集》的1個(gè)中原官話點(diǎn)和7個(gè)中原官話方言島。1個(gè)中原官話點(diǎn)是江蘇省徐州市賈汪區(qū)(賈汪),簡(jiǎn)介將其歸為中原官話洛徐片。7個(gè)中原官話方言島,分別是江蘇蘇州市吳江區(qū)菀平鎮(zhèn)河南話、江西吉安永豐河嘚佬話、湖南吉首市古丈縣死客話、郴州嘉禾城關(guān)土話、海南東方付馬話、海南陵水疍家話、山西長(zhǎng)治沁源河南話。其中,前6個(gè)方言島平臺(tái)均標(biāo)注為中原官話信蚌片,沁源河南話則標(biāo)注為鄭曹片。具體如表2所示:
中原官話方言島的形成與歷史上的中原移民尤其是河南移民有關(guān),隨著推普力度的加大和經(jīng)濟(jì)的快速發(fā)展,島方言使用者的語言心理亦發(fā)生了變化;同時(shí),受普通話和包圍方言的擠壓,其生存空間趨于萎縮,今多屬瀕危方言,急需進(jìn)行搶救性的調(diào)查保護(hù)。專業(yè)平臺(tái)采錄展示的7個(gè)中原官話方言島的材料,體現(xiàn)了中原官話方言的復(fù)雜性,它不僅對(duì)于研究中原官話的歷史演變、中原官話內(nèi)部的一致性與差異性、中原官話與周邊其他漢語方言或少數(shù)民族語言之間的歷史與現(xiàn)實(shí)關(guān)聯(lián),提供了更多的語言材料,而且對(duì)于保護(hù)漢語方言多樣性,促進(jìn)方言地理學(xué)、歷史語言學(xué)、社會(huì)語言學(xué)、文化語言學(xué)等學(xué)科的研究,均具有獨(dú)特的學(xué)術(shù)價(jià)值。
專業(yè)平臺(tái)已經(jīng)采錄展示了110個(gè)中原官話方言點(diǎn)和7個(gè)中原官話方言島的語料,為中原官話研究提供了大量真實(shí)可靠的資料,但與400個(gè)縣市點(diǎn)的中原官話分布范圍相比,平臺(tái)采錄展示的中原官話方言點(diǎn)的數(shù)量仍顯不足,區(qū)域分布也有待進(jìn)一步完善。
從語保專業(yè)平臺(tái)展示的中原官話點(diǎn)的數(shù)量來看,方言點(diǎn)最多的省份是河南和陜西,均超過20個(gè)點(diǎn);其次是甘肅和山西,均超過10個(gè)點(diǎn);再次是山東、江蘇、安徽,不足10個(gè)點(diǎn);寧夏、青海、新疆、河北等省區(qū)更少,不足5個(gè)點(diǎn);四川則暫無數(shù)據(jù)。從中原官話點(diǎn)的省區(qū)分布來看,主要集中在中部的河南、山西和西北部的陜西、甘肅等省區(qū),東部的山東、江蘇、安徽和西北部的寧夏、青海、新疆等省區(qū)設(shè)點(diǎn)較少。
從各省區(qū)中原官話點(diǎn)的采錄完成度(表1百分比欄)來看,江蘇省的完成度最高,省內(nèi)共有11個(gè)中原官話點(diǎn),全部屬于徐淮片,平臺(tái)已展示9個(gè)點(diǎn),完成度達(dá)82%。此外,平臺(tái)還展示有江蘇省不見于《地圖集》的一個(gè)中原官話點(diǎn)和一個(gè)方言島。其次是寧夏回族自治區(qū),區(qū)內(nèi)有中原官話點(diǎn)6個(gè),平臺(tái)已展示4個(gè),完成度達(dá)67%。河北省只有2個(gè)中原官話點(diǎn),平臺(tái)已展示1個(gè),完成50%。山西、甘肅兩省的完成度較高,分別達(dá)到48%和38%。而中原官話的核心區(qū)河南省的完成度較低,只有25%,安徽也只有23%;西北部的青海省和新疆維吾爾自治區(qū)完成度僅有15%和2%,需要投入更多的人力、物力和精力。
我們對(duì)中原官話方言片區(qū)的點(diǎn)數(shù)分布進(jìn)行了統(tǒng)計(jì),具體如表3所示:
從中原官話方言片區(qū)的點(diǎn)位分布來看,在14個(gè)方言片區(qū)中,點(diǎn)數(shù)最多的是秦隴片63、南疆片56、關(guān)中片48,其次是兗菏片33、汾河片和南魯片29、信蚌片25、鄭開片24、商阜片23,再次是漯項(xiàng)片17、洛嵩片15、徐淮片和隴中片14、河州片10。專業(yè)平臺(tái)所展示的中原官話方言點(diǎn),數(shù)量最多的是關(guān)中片19、秦隴片17、汾河片13,其次是徐淮片和兗菏片10,而中原官話的核心區(qū)河南省所在的6個(gè)片區(qū)(鄭開片、洛嵩片、南魯片、漯項(xiàng)片、商阜片、信蚌片),方言點(diǎn)數(shù)略顯不足,河州片僅有1個(gè)點(diǎn)(占10%),南疆片只有2個(gè)點(diǎn)(約占4%),相關(guān)數(shù)據(jù)有待增補(bǔ)。
(二)方言片區(qū)歸屬的標(biāo)注
專業(yè)平臺(tái)所展示的中原官話方言點(diǎn)與方言島的方言片區(qū)歸屬和標(biāo)注,絕大部分歸屬得當(dāng),標(biāo)注準(zhǔn)確,并且在調(diào)查點(diǎn)簡(jiǎn)介中對(duì)該調(diào)查點(diǎn)的方言特征、區(qū)域分布和使用人口等情況作了具體說明,標(biāo)注與簡(jiǎn)介彼此對(duì)應(yīng),相互印證,為中原官話研究提供了可資利用的翔實(shí)可靠的語料依據(jù)。由于參與方言調(diào)查采錄和平臺(tái)展示的工作人員較多,并且非一時(shí)一地完成,在具體的操作過程中難免會(huì)出現(xiàn)一些疏漏,因此,專業(yè)平臺(tái)在中原官話的方言片區(qū)歸屬和標(biāo)注方面也存在一些有待完善的地方。
第一,有些調(diào)查點(diǎn)的方言片區(qū)歸屬,專業(yè)平臺(tái)沒有標(biāo)注,簡(jiǎn)介也沒有相應(yīng)說明。在平臺(tái)所展示的109個(gè)見于《地圖集》的中原官話點(diǎn)中,此類情況共有25個(gè)點(diǎn),約占23%。如山東濟(jì)寧市曲阜市(曲阜),平臺(tái)沒有標(biāo)注其方言片區(qū)歸屬,只在簡(jiǎn)介中說明曲阜語言單一,正在向普通話靠攏,沒有說明其方言片區(qū)屬于中原官話兗菏片;安徽宿州市埇橋區(qū)(埇橋),簡(jiǎn)介只說它是宿州方言,沒有標(biāo)注和說明其方言片區(qū)應(yīng)為中原官話商阜片;甘肅慶陽市寧縣(寧縣),簡(jiǎn)介中提及寧縣方言有新寧話和早勝話兩種口音及其特點(diǎn)和分布,沒有標(biāo)注說明其方言片區(qū)應(yīng)為中原官話關(guān)中片;甘肅定西市隴西縣(隴西),簡(jiǎn)介中提及隴西方言有四種口音及其特點(diǎn)和分布,沒有標(biāo)注說明其方言片區(qū)應(yīng)為中原官話秦隴片;江蘇連云港市贛榆區(qū)(贛榆),簡(jiǎn)介中提及贛榆方言大致可分為五片及主要特點(diǎn),沒有標(biāo)注說明其方言片區(qū)應(yīng)為中原官話徐淮片。
又如,安徽淮北市相山區(qū)(相山)、河南開封市蘭考縣(蘭考)、河南開封市鼓樓區(qū)(開封)、山東臨沂市蘭山區(qū)(蘭山)、甘肅隴南市武都區(qū)(武都)、甘肅天水市秦州區(qū)(天水)、江蘇徐州市豐縣(豐縣)、江蘇徐州市雎寧縣(雎寧)、江蘇徐州市新沂市(新沂)、江蘇徐州市云龍區(qū)(徐州)、江蘇徐州市沛縣(沛縣)、江蘇徐州市邳州市(邳州)、寧夏固原市原州區(qū)(固原)、山西運(yùn)城市芮城縣(芮城)、山西運(yùn)城市垣曲縣(垣曲)、山西臨汾市鄉(xiāng)寧縣(鄉(xiāng)寧)、山西臨汾市洪洞縣趙城鎮(zhèn)(趙城)、山西臨汾市堯都區(qū)(臨汾)、陜西安康市漢濱區(qū)(安康)、陜西漢中市城固縣(城固)等方言點(diǎn),平臺(tái)均未標(biāo)注其方言片區(qū)歸屬,簡(jiǎn)介也未有相關(guān)說明。
有些調(diào)查點(diǎn)的方言片區(qū)歸屬,平臺(tái)雖然沒有標(biāo)注,簡(jiǎn)介卻有相關(guān)說明,可以起到一定的彌補(bǔ)作用,令人遺憾的是,簡(jiǎn)介并未對(duì)其方言片區(qū)歸屬進(jìn)行具體描述。在平臺(tái)展示的109個(gè)見于《地圖集》的中原官話點(diǎn)中,此類情況共有11個(gè)點(diǎn),約占10%。如甘肅隴南市文縣(文縣),平臺(tái)沒有標(biāo)注其方言片區(qū)歸屬,簡(jiǎn)介說:“文縣地處中原官話和西南官話交界地帶,碧口鎮(zhèn)為西南官話,文縣其他地方為中原官話”,雖有說明文縣方言屬中原官話,卻未具體說明它屬于中原官話秦隴片。河北邯鄲市魏縣(魏縣),平臺(tái)沒有標(biāo)注其方言片區(qū),簡(jiǎn)介說:“魏縣漢語方言的種類是晉語和中原官話。魏縣的絕大部分是中原官話”,沒有具體說明它屬于中原官話鄭開片。江蘇宿遷市宿城區(qū)(宿遷),平臺(tái)沒有標(biāo)注其方言片區(qū),簡(jiǎn)介說:“宿遷市區(qū)方言從地域角度可以分為兩大片,東部……屬江淮官話;中部西部大部分鄉(xiāng)鎮(zhèn)均不保留入聲,屬中原官話”,沒有具體說明它屬于中原官話徐淮片。安徽阜陽市潁州區(qū)(阜陽)、甘肅臨夏回族自治州臨夏市(臨夏)、甘肅甘南藏族自治州臨潭縣(臨潭)、甘肅平?jīng)鍪嗅轻紖^(qū)(平?jīng)觯?、陜西渭南市韓城市(韓城)、陜西渭南市富平縣(富平)、陜西渭南市合陽縣(合陽)、陜西寶雞市岐山縣(岐山)等方言點(diǎn),也存在類似情況。
第二,個(gè)別調(diào)查點(diǎn)的方言片區(qū)歸屬,標(biāo)注術(shù)語和標(biāo)準(zhǔn)不夠統(tǒng)一。中原官話的劃分標(biāo)準(zhǔn)、分布范圍、方言片區(qū)歸屬等問題,一直是方言學(xué)界比較關(guān)注的重要課題。隨著研究的不斷深入,雖然對(duì)一些方言點(diǎn)的具體歸屬仍有不同看法,如河南南部、湖北西北部、陜西南部的一些方言點(diǎn),但在許多重要問題上已經(jīng)達(dá)成了基本共識(shí),這集中體現(xiàn)在2012年版的《地圖集》“漢語方言卷”中。從專業(yè)平臺(tái)標(biāo)注中原官話方言片區(qū)歸屬的整體情況來看,它的分區(qū)標(biāo)準(zhǔn)和術(shù)語基本上是采用了《地圖集》的意見,同時(shí),也有個(gè)別方言片區(qū)的歸屬和標(biāo)注,使用的是較早時(shí)期不同體系的劃分標(biāo)準(zhǔn)和術(shù)語。
如河南平頂山市魯山縣(魯山),平臺(tái)標(biāo)注為中原官話鄭汴片,鄭汴片是張啟煥等在《河南方言研究》中提出的中原官話方言片區(qū)[11];按照2012年版《地圖集》的劃分,魯山點(diǎn)屬于中原官話南魯片。江蘇徐州市賈汪區(qū)(賈汪),平臺(tái)標(biāo)注為中原官話洛徐片,洛徐片是1987年版《地圖集》劃分的中原官話方言片區(qū)[12];在相關(guān)研究的基礎(chǔ)上,2012年版《地圖集》對(duì)中原官話方言片區(qū)進(jìn)行了調(diào)整,將之前的洛徐片分為洛嵩片和徐淮片,賈汪點(diǎn)屬于徐淮片。山西長(zhǎng)治沁源河南話,平臺(tái)標(biāo)注為鄭曹片,鄭曹片是1987年版《地圖集》劃分的中原官話方言片區(qū);按照2012年版《地圖集》的調(diào)整和劃分,山西長(zhǎng)治沁源河南話應(yīng)屬于鄭開片。
第三,個(gè)別調(diào)查點(diǎn)的方言片區(qū)歸屬,標(biāo)注與簡(jiǎn)介不盡相符。總體來看,專業(yè)平臺(tái)對(duì)中原官話方言片區(qū)歸屬的標(biāo)注,與調(diào)查點(diǎn)簡(jiǎn)介的內(nèi)容能夠相互印證,但也有個(gè)別方言點(diǎn)的方言片區(qū)歸屬,標(biāo)注與簡(jiǎn)介內(nèi)容不盡一致。如安徽淮南市田家庵區(qū)(淮南),平臺(tái)標(biāo)注其方言片區(qū)屬江淮官話洪巢片,簡(jiǎn)介說它屬中原官話信蚌片。根據(jù)該地方言特征,宜標(biāo)注為中原官話信蚌片。甘肅酒泉市敦煌市(敦煌),平臺(tái)標(biāo)注為中原官話南疆片,簡(jiǎn)介描述該地方言特征則說敦煌方言內(nèi)部有兩種口音:河?xùn)|話和河西話。河?xùn)|話屬中原官話,河西話則屬蘭銀官話。也就是說,屬于中原官話南疆片的是“敦煌河?xùn)|話”而非整個(gè)“敦煌”。寧夏吳忠市同心縣(同心),平臺(tái)標(biāo)注為蘭銀官話銀吳片同心小片;由簡(jiǎn)介可知,同心境內(nèi)屬于蘭銀官話和中原官話的過渡地帶,按口音大體分為南北兩片,北片屬蘭銀官話銀吳片,南片則屬中原官話秦隴片。因此,對(duì)于同心點(diǎn)的方言歸屬,標(biāo)注為“同心縣(南片)”屬中原官話秦隴片,“同心縣(北片)”屬蘭銀官話銀吳片,可能更為合適。
此外,個(gè)別調(diào)查點(diǎn)還存在標(biāo)注信息不全的情況。如陜西安康市白河縣(白河),平臺(tái)標(biāo)注為“官話,中原官話,小片系屬不明”,沒有注明其方言片區(qū)屬于中原官話關(guān)中片;陜西咸陽市三原縣(三原)和陜西西安市戶縣(戶縣),平臺(tái)均標(biāo)注為“關(guān)中片”,沒有明確其方言片區(qū)歸屬為中原官話關(guān)中片。
三、相關(guān)問題的產(chǎn)生原因
專業(yè)平臺(tái)所展示的中原官話點(diǎn)語料,在調(diào)查點(diǎn)布局和點(diǎn)位數(shù)量的充分性、方言片區(qū)歸屬標(biāo)注的準(zhǔn)確性等方面存在一些有待完善之處。究其原因,主要是受到了以下幾個(gè)方面因素的影響和制約:
第一,語保工程和采錄展示平臺(tái)是面向全國(guó)的、持續(xù)的分期建設(shè)項(xiàng)目。我國(guó)的語言資源十分豐富,按照學(xué)界比較通行的說法,目前有130多種語言,分屬漢藏、阿爾泰、南島、南亞和印歐五大語系;就漢語方言而言,有官話、晉方言、吳方言、閩方言、粵方言、客家話、贛方言、湘方言、徽方言、平話土話等十大方言;官話內(nèi)部又可分為東北、北京、冀魯、膠遼、中原、蘭銀、江淮、西南八種方言,中原官話只是其中之一。語保工程要實(shí)現(xiàn)對(duì)全國(guó)范圍內(nèi)的所有漢語方言和少數(shù)民族語言的實(shí)態(tài)語料進(jìn)行全面調(diào)查、采錄、整理加工、保存、展示和開發(fā)應(yīng)用的目標(biāo),實(shí)非短時(shí)間內(nèi)所能完成,需要根據(jù)國(guó)家統(tǒng)一規(guī)劃、按照統(tǒng)一的調(diào)查方案和工作計(jì)劃分期實(shí)施。語言資源采錄展示平臺(tái)作為語保工程的重要組成部分,也不可能一蹴而就。在先期的平臺(tái)建設(shè)中,在展示某種方言語料的充分性和標(biāo)注方言片區(qū)歸屬的準(zhǔn)確性等方面,難免會(huì)存在一些不足,這在任何一種大規(guī)模的分期建設(shè)項(xiàng)目中都是正常的現(xiàn)象,發(fā)現(xiàn)存在的問題,經(jīng)過后續(xù)不斷補(bǔ)充完善,才能最終實(shí)現(xiàn)建設(shè)目標(biāo)。
第二,中原官話分布地域廣,需要調(diào)查的方言點(diǎn)位多。據(jù)賀巍的研究,中原官話在漢語八大官話區(qū)的方言中分布范圍最大[13]。2012年版《地圖集》顯示,中原官話分布于12個(gè)行政省區(qū),若以一個(gè)縣市作為一個(gè)調(diào)查點(diǎn),共有400個(gè)縣市點(diǎn)。從各省區(qū)所占的方言點(diǎn)數(shù)和中原官話的歷史發(fā)展來看,中原官話的分布區(qū)域主要集中于中部的河南和西北部的陜西、新疆、甘肅等省區(qū),方言點(diǎn)數(shù)分別為105、73、55、50;其次是山東、山西和安徽,分別有31、27、26個(gè)方言點(diǎn);青海、江蘇、寧夏、河北、四川等地的中原官話,則與歷史上的中原移民有關(guān),是中原官話的邊緣地區(qū),方言點(diǎn)數(shù)較少,依次為13、11、6、2、1??梢?,區(qū)域分布很不平衡。新疆、甘肅等省區(qū)的中原官話方言點(diǎn)分布比較分散,有些方言點(diǎn)地處偏遠(yuǎn),交通不便,進(jìn)行實(shí)地的田野調(diào)查需要投入更多的時(shí)間和經(jīng)費(fèi);有些省區(qū)的中原官話方言點(diǎn)數(shù)很少,如四川省內(nèi)只有一個(gè)點(diǎn)。面對(duì)如此大范圍、多點(diǎn)位分布的中原官話方言,按照語保工程的統(tǒng)一規(guī)劃,初期只能完成部分相對(duì)集中的方言點(diǎn)的調(diào)查采錄和整理加工,專業(yè)平臺(tái)目前也只能展示部分中原官話調(diào)查點(diǎn)的語料。我們相信,隨著語保工程的持續(xù)開展,中原官話調(diào)查點(diǎn)的語料會(huì)得到不斷增補(bǔ)并陸續(xù)進(jìn)入平臺(tái)展示。
第三,中原官話的分布區(qū)和部分方言點(diǎn)的歸屬仍有爭(zhēng)議。“中原官話”作為區(qū)域方言概念,始見于李榮的《官話方言的分區(qū)》[14],繼而在1987年出版的《地圖集》中被正式命名并得到學(xué)界的普遍認(rèn)同。但關(guān)于中原官話的分布區(qū)域和部分方言點(diǎn)的片區(qū)歸屬問題,學(xué)界目前仍有不同意見。如賀巍認(rèn)為,中原官話的分布范圍跨11個(gè)省區(qū),387個(gè)縣市[13];熊正輝、張振興認(rèn)為,中原官話的分布區(qū)共有397個(gè)縣市[9];段亞廣認(rèn)為,中原官話的分布區(qū)共有394個(gè)縣市[15](P3);2012年版《地圖集》認(rèn)為,中原官話的分布區(qū)跨12個(gè)省區(qū),共有400個(gè)縣市[8](P55)。關(guān)于中原官話與蘭銀官話的分合、中原官話關(guān)中片與汾河片的分合、河南南部/湖北西北部/陜西南部一些方言點(diǎn)的歸屬等,也仍有爭(zhēng)議。有些地區(qū)方言情況復(fù)雜,如陜西省安康市漢濱區(qū)的方言主要有中原官話、江淮官話、混合方言區(qū)、江南話、贛語方言島等,中原官話主要分布在城關(guān)、流水、恒口、大同、五里、建民、河西、關(guān)廟、張灘、大河、茨溝、棗陽等鄉(xiāng)鎮(zhèn)。如何標(biāo)注陜西安康漢濱(安康)的方言片區(qū)歸屬,目前還沒有令人滿意的方案。隨著相關(guān)研究的深入開展,這些問題將會(huì)得到有效解決,專業(yè)平臺(tái)對(duì)于中原官話調(diào)查點(diǎn)的方言片區(qū)歸屬標(biāo)注也將得到完善。
第四,專業(yè)人才數(shù)量不足,部分地區(qū)力量比較薄弱。從專業(yè)平臺(tái)展示的109個(gè)中原官話點(diǎn)的情況來看,目前從事中原官話點(diǎn)方言調(diào)查采錄的專業(yè)人才共有65名,來自37個(gè)單位,主要集中于中部核心區(qū)的河南和西北部的陜西、甘肅等省區(qū),東部的山東、安徽、江蘇和西北部的新疆、青海、寧夏等省區(qū),參與中原官話點(diǎn)方言調(diào)查的單位和專業(yè)人才較少。具體如表4所示:
整體而言,各省區(qū)參與調(diào)查的單位和專業(yè)人才數(shù)量與完成調(diào)查點(diǎn)的數(shù)量呈正比,參與調(diào)查的單位和專業(yè)人才越多,完成的調(diào)查點(diǎn)就越多;反之,參與者越少,完成的方言點(diǎn)數(shù)也越少。如河南省有5個(gè)單位15個(gè)人參與調(diào)查采錄,完成了26個(gè)點(diǎn);陜西省有13個(gè)單位17個(gè)人參與調(diào)查采錄,完成了21個(gè)點(diǎn);甘肅省有6個(gè)單位12個(gè)人參與調(diào)查采錄,完成了19個(gè)點(diǎn)。寧夏有2個(gè)單位2個(gè)人參與調(diào)查采錄,完成4個(gè)點(diǎn);青海有1個(gè)單位2個(gè)人參與調(diào)查采錄,完成2個(gè)點(diǎn);新疆和河北各有1個(gè)單位1個(gè)人參與調(diào)查采錄,各完成1個(gè)點(diǎn)。
參與中原官話調(diào)查采錄的單位和專業(yè)人才數(shù)量,不僅在省區(qū)之間存在地域分布的不均衡,即使是同一省區(qū)之內(nèi),不同單位參與調(diào)查的專業(yè)人才數(shù)量也存在差異。如河南省,河南大學(xué)參與6人,完成了16個(gè)點(diǎn);河南師范大學(xué)參與1人,完成了1個(gè)點(diǎn)。陜西省投入了13個(gè)單位17人,其中,陜西師范大學(xué)參與5人,完成5個(gè)點(diǎn);其他12個(gè)單位各參加1人,每個(gè)單位完成1—2個(gè)方言點(diǎn)。甘肅省,蘭州城市學(xué)院參與5人,完成了11個(gè)點(diǎn);蘭州大學(xué)參與2人,各完成1個(gè)點(diǎn)。要完成中原官話全部400個(gè)縣市點(diǎn)的調(diào)查采錄工作,現(xiàn)有的專業(yè)人才數(shù)量明顯不夠,不同省區(qū)、不同單位之間專業(yè)人才的分布也不均衡,部分地區(qū)力量比較薄弱,有的需要進(jìn)行大量培訓(xùn)和鍛煉。
四、語保工程和平臺(tái)建設(shè)的發(fā)展方向
鑒于持續(xù)開展語保工程和采錄展示平臺(tái)建設(shè)的重大意義,針對(duì)目前專業(yè)平臺(tái)展示中原官話點(diǎn)語料中所存在的問題和產(chǎn)生原因,語保工程和采錄展示平臺(tái)建設(shè)的發(fā)展可以著力于以下幾個(gè)方面:
第一,在國(guó)家統(tǒng)一規(guī)劃的指導(dǎo)下,進(jìn)一步擴(kuò)大和完善語保工程成果,促進(jìn)展示平臺(tái)建設(shè)的改造升級(jí)。我國(guó)語言資源豐富,但在城鎮(zhèn)化和現(xiàn)代化的進(jìn)程中,許多漢語方言和少數(shù)民族語言迅速衰變,它們所承載的民族文化和地域文化快速流失。面對(duì)如此嚴(yán)峻的語保工作形勢(shì),亟需在前期已取得的語言資源調(diào)查成果的基礎(chǔ)上,統(tǒng)籌規(guī)劃,點(diǎn)面結(jié)合,進(jìn)一步擴(kuò)大語言資源調(diào)查保護(hù)的覆蓋面,擴(kuò)大語言資源庫(kù)的建設(shè)規(guī)模,為語言資源采錄展示平臺(tái)建設(shè)和今后的語言研究、語言資源的開發(fā)應(yīng)用提供更多的基礎(chǔ)材料。與此同時(shí),也需要對(duì)平臺(tái)展示的語言資源開展科學(xué)系統(tǒng)的數(shù)據(jù)維護(hù),對(duì)前期展示的語料中存在的一些疏漏進(jìn)行后續(xù)的補(bǔ)充完善,以提高語言數(shù)據(jù)的準(zhǔn)確度,促進(jìn)語保工程語言資源的深度加工與應(yīng)用開發(fā),加快語言資源采錄展示平臺(tái)的改造升級(jí),有效提升語言資源數(shù)字化和語言信息服務(wù)水平。
目前,語保工程二期建設(shè)正在有序推進(jìn),語保平臺(tái)展示的語言資源數(shù)據(jù)處于持續(xù)更新中,至2022年9月底,語保平臺(tái)已匯聚展示1718個(gè)調(diào)查點(diǎn)的語言資源數(shù)據(jù),比2019年底的1396個(gè)點(diǎn)增加了322個(gè)點(diǎn)。其中,漢語方言調(diào)查點(diǎn)新增210個(gè),達(dá)1289個(gè)點(diǎn);少數(shù)民族語言調(diào)查點(diǎn)新增112個(gè),達(dá)429個(gè)點(diǎn)。2022年10月,語保工程采錄展示平臺(tái)也完成了一次升級(jí)改造,在技術(shù)層面和視覺效果層面進(jìn)行了優(yōu)化和提升,新版語保工程采錄展示平臺(tái)也已上線[16]。需要指出的是,語言資源的調(diào)查保護(hù)和開發(fā)利用不是一次性的,語言資源采錄展示平臺(tái)的建設(shè)不會(huì)一勞永逸,語言資源后續(xù)的補(bǔ)充完善和平臺(tái)的升級(jí)改造仍有很大空間。
第二,統(tǒng)籌規(guī)劃,合理布局,提高中原官話調(diào)查點(diǎn)的整體覆蓋率。中原官話地域分布廣泛,消失速度較快,雖然語保專業(yè)平臺(tái)展示的中原官話方言點(diǎn)的數(shù)量,已由2019年底的102個(gè)點(diǎn)[10]增加到目前的110個(gè)點(diǎn)和7個(gè)方言島,但與400個(gè)縣市點(diǎn)的中原官話總量相比仍有較大缺口。同時(shí),中原官話方言點(diǎn)的地域分布和片區(qū)分布也不平衡:河南、陜西、甘肅三省的點(diǎn)數(shù)相對(duì)較多,分別是26/105、21/73、19/50,新疆、青海等地則只有1/55、2/13;關(guān)中片、秦隴片、汾河片的點(diǎn)數(shù)較多,依次是19/48、17/63、13/29,洛嵩片、漯項(xiàng)片、南疆片則只有2/15、3/17、2/56,難以體現(xiàn)中原官話的整體語言面貌和內(nèi)部各片區(qū)的方言差異。需要在已有語言資源調(diào)查成果的基礎(chǔ)上,根據(jù)中原官話的生存狀態(tài)和使用情況,在面向全國(guó)進(jìn)行大規(guī)模方言調(diào)查的同時(shí),統(tǒng)籌規(guī)劃,合理布局,進(jìn)一步擴(kuò)大中原官話的調(diào)查范圍:對(duì)尚未涉及的中原官話方言點(diǎn),特別是非中心區(qū)方言點(diǎn)、與其他漢語方言或少數(shù)民族語言有接觸互動(dòng)的方言點(diǎn)進(jìn)行深度調(diào)查;對(duì)當(dāng)前使用人口少、分布范圍小、語言活力弱的方言島進(jìn)行搶救性調(diào)查。切實(shí)提高中原官話調(diào)查點(diǎn)的整體覆蓋率,進(jìn)一步豐富和完善專業(yè)平臺(tái)采錄展示的中原官話語料,為系統(tǒng)推進(jìn)專業(yè)平臺(tái)建設(shè)和中原官話的深入研究提供基礎(chǔ)語料。
第三,深度調(diào)查,核定爭(zhēng)議,科學(xué)標(biāo)注方言片區(qū)歸屬。語保平臺(tái)作為語保工程的重要組成部分,肩負(fù)展示工程成果的重大使命,尤其是在大數(shù)據(jù)時(shí)代,語言資源的科學(xué)性也將在學(xué)術(shù)研究領(lǐng)域得到凸顯。正如范俊軍所指出的:“基礎(chǔ)的、核心部分的語料采集、加工必須精煉、準(zhǔn)確、嚴(yán)密”,“表現(xiàn)在語言學(xué)的標(biāo)注和描寫方面,所有基礎(chǔ)語料必須是完整的、系統(tǒng)的、完全標(biāo)注且不留疑點(diǎn)的”[17]。鑒于目前平臺(tái)展示的中原官話點(diǎn)的方言片區(qū)歸屬還存在一些有待完善之處,今后的語保平臺(tái)建設(shè)應(yīng)繼續(xù)在語保工程科學(xué)性定位的指導(dǎo)下,在前期研制的技術(shù)標(biāo)準(zhǔn)和相關(guān)軟件的基礎(chǔ)上,根據(jù)語保工程調(diào)查采錄的語言資源和已有的研究成果,對(duì)平臺(tái)展示的方言語料及片區(qū)歸屬標(biāo)注進(jìn)行補(bǔ)充完善。對(duì)某些存有爭(zhēng)議的中原官話方言點(diǎn)的片區(qū)歸屬,需要通過扎實(shí)的田野調(diào)查和先進(jìn)的技術(shù)手段進(jìn)行分析,以核實(shí)爭(zhēng)議,確定科學(xué)的描寫原則和統(tǒng)一的標(biāo)注術(shù)語進(jìn)行規(guī)范、準(zhǔn)確的標(biāo)注。有些地區(qū)方言情況復(fù)雜,需要在深入調(diào)查的基礎(chǔ)上,依據(jù)該調(diào)查點(diǎn)的方言特征,準(zhǔn)確描寫該地的語言事實(shí),科學(xué)標(biāo)注其方言片區(qū)歸屬。
第四,加強(qiáng)培訓(xùn),進(jìn)一步壯大專業(yè)人才隊(duì)伍。經(jīng)過語保工程和語保平臺(tái)的前期建設(shè),初步形成了一支比較成熟、業(yè)務(wù)能力過硬的專業(yè)人才隊(duì)伍,已投入專業(yè)人才4500多名。不過,與我國(guó)豐富的語言資源和語保工程的目標(biāo)任務(wù)相比,現(xiàn)有專業(yè)人才總量仍顯不足,人才的地區(qū)分布也不均衡。以平臺(tái)所展示的中原官話點(diǎn)的情況來看,目前僅有37個(gè)單位的65名專業(yè)人才參與中原官話方言調(diào)查,共完成110個(gè)中原官話點(diǎn)和7個(gè)方言島語料的調(diào)查采錄。要想完成400個(gè)中原官話點(diǎn)的語言資源調(diào)查采錄和平臺(tái)展示工作,則需要有更多的科研院所和專業(yè)人才(包括語言調(diào)查、采錄與平臺(tái)建設(shè)、數(shù)據(jù)維護(hù)等專業(yè)人才)投身其中。這就要求在政府相關(guān)政策支持下,在已有專業(yè)人才隊(duì)伍的基礎(chǔ)上,投入更多的時(shí)間、精力和物力,增強(qiáng)專業(yè)培訓(xùn)力度,進(jìn)一步壯大專業(yè)人才隊(duì)伍。同時(shí),促進(jìn)語言科學(xué)與計(jì)算機(jī)科學(xué)的高度結(jié)合,提升專業(yè)技術(shù)人員的工作能力,培養(yǎng)更多高水平、高素質(zhì)的語言資源保護(hù)、開發(fā)應(yīng)用的專業(yè)人才和研究人才。并根據(jù)中原官話的區(qū)域性特點(diǎn)和方言使用情況,對(duì)調(diào)查團(tuán)隊(duì)和專業(yè)人才進(jìn)行合理布局,以期在較短時(shí)間內(nèi)盡快完成對(duì)中原官話點(diǎn)的全面調(diào)查采錄和展示工作。
綜上所述,中國(guó)語言資源保護(hù)工程和語言資源采錄展示平臺(tái)建設(shè)是一個(gè)系統(tǒng)工程,在國(guó)家統(tǒng)一規(guī)劃的指導(dǎo)下,在語保工程提供的規(guī)范要求和模板基礎(chǔ)上,不斷補(bǔ)充完善方言調(diào)查語料。隨著新版語言資源采錄展示平臺(tái)的上線,專業(yè)平臺(tái)展示方言點(diǎn)數(shù)量不足和方言片區(qū)歸屬標(biāo)注不規(guī)范的情況,已得到一定程度的改善。今后應(yīng)通過擴(kuò)大語言資源調(diào)查范圍和持續(xù)開放的語言數(shù)據(jù)匯聚,進(jìn)一步深化和拓展語保工程成果,不斷研發(fā)語言資源應(yīng)用工具和服務(wù)形式,持續(xù)開展語言資源采錄展示平臺(tái)的改造升級(jí),從而順利實(shí)現(xiàn)語保工程建設(shè)目標(biāo),將語言資源采錄展示平臺(tái)建成世界上規(guī)模最大的語言資源庫(kù)和“準(zhǔn)確權(quán)威、開放共享的語言資源公共服務(wù)平臺(tái)”[18],全面提升我國(guó)語言資源保護(hù)利用和語言文字工作的信息化水平。
(本文的撰寫得到辛永芬教授的指正,特此致謝!)
參考文獻(xiàn):
[1]曹志耘.中國(guó)語言資源保護(hù)工程的定位、目標(biāo)與任務(wù)[J].語言文字應(yīng)用,2015,(4).
[2]丁石慶.中國(guó)語言資源保護(hù)工程語料資源的質(zhì)量、價(jià)值和效用——以少數(shù)民族語言材料為例[J].暨南學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2018,(10).
[3]王莉?qū)?中國(guó)語言資源保護(hù)工程的實(shí)施策略與方法[J].語言文字應(yīng)用,2015,(4).
[4]曹志耘.關(guān)于語保工程和語保工作的幾個(gè)問題[J].語言戰(zhàn)略研究,2017,(4).
[5]中華人民共和國(guó)教育部.中國(guó)語言資源采錄展示平臺(tái)上線試運(yùn)行[EB/OL].(2020-09-30)[2023-08-18].http://www.moe.gov.cn/jyb_xwfb/gzdt_gzdt/s5987/202009/t20200930_492655.html.
[6]新華網(wǎng).中國(guó)語言資源保護(hù)工程二期建設(shè)啟動(dòng)實(shí)施[EB/OL].(2021-04-19)[2023-08-18].http://www.xinhuanet.com/2021-04/19/c_1127349143.html.
[7]林佳慶,李涓子,張鵬.中國(guó)語言資源采錄展示平臺(tái)的關(guān)鍵技術(shù)及其應(yīng)用[J].語言文字應(yīng)用,2019,(4).
[8]中國(guó)社會(huì)科學(xué)院語言研究所,中國(guó)社會(huì)科學(xué)院民族學(xué)與人類學(xué)研究所,香港城市大學(xué)語言資訊科學(xué)研究中心.中國(guó)語言地圖集(第2版)·漢語方言卷[M].北京:商務(wù)印書館,2012.
[9]熊正輝,張振興.漢語方言的分區(qū)[J].方言,2008,(2).
[10]辛永芬.中原官話學(xué)術(shù)史梳理與研究展望[J].河南大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2022,(2).
[11]張啟煥,陳天福,程儀.河南方言研究[M].開封:河南大學(xué)出版社,1993.
[12]中國(guó)社會(huì)科學(xué)院,澳大利亞人文科學(xué)院合編.中國(guó)語言地圖集[M].香港:朗文出版有限公司,1987.
[13]賀巍.中原官話分區(qū)(稿)[J].方言,2005,(2).
[14]李榮.官話方言的分區(qū)[J].方言,1985,(1).
[15]段亞廣.中原官話音韻研究[M].北京:中國(guó)社會(huì)科學(xué)出版社,2012.
[16]語寶網(wǎng).新版語保工程采錄展示平臺(tái)上線啦[EB/OL].(2022-10-03)[2023-08-18].http://www.china languages.cn/.
[17]范俊軍.語保工程的語料資源利用問題[J].西北民族大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2019,(3).
[18]田立新,易軍.中國(guó)語言資源保護(hù)工程的建設(shè)成效及深化發(fā)展[J].語言文字應(yīng)用,2019,(4).
Some Reflection on the Project for Protecting Language Resources China and
the Collection and Service Platform
——Take Zhongyuan Mandarin Survey Point on the Professional Platform for Instance
Ding Xixia
(College of Chinese Language and Literature, Henan University, Kaifeng 475001, China)
Abstract:The Project for Protecting Language Resources China and the Collection and Service Platform have achieved outstanding results in the government overall planning, standard design, application of modern technology, protection and utilization of language resources and talent team construction. However, there are still some areas to be improved in terms of the sufficiency of the layout and number of survey points, the scientificity of regional attribution and language attribute annotation. At present, under the guidance of national unified planning, we should further supplement and improve the previous achievements, improve the overall coverage of the survey points, scientifically mark the language attributes, expand the team of professionals, promote the continuous upgrading and improvement of the construction of the language resource base and platform.
Key words:the Project for Protecting Language Resources China;China Language Resources Collection and Service Platform;Zhongyuan mandarin;survey point layout;attribute annotation