提 要 語言資源概念的提出有40多年的時(shí)間。20世紀(jì)80年代,澳大利亞曾依照語言資源理念制定了《國家語言政策》。中國在21世紀(jì)初開始在語言規(guī)劃中實(shí)踐語言資源理念,建立了國家語言資源監(jiān)測與研究中心,相繼開展了中國語言資源有聲數(shù)據(jù)庫建設(shè)和中國語言資源保護(hù)工程,并與聯(lián)合國教科文組織聯(lián)合召開了“世界語言資源保護(hù)大會”,發(fā)布了《岳麓宣言》,成為世界上提倡語言資源理念、開展語言保護(hù)最為突出的國家。中國語言資源研究在語言規(guī)劃的實(shí)踐推動(dòng)下展開,且與語言規(guī)劃實(shí)踐形成良性互動(dòng)。語言資源研究從論證語言的資源性質(zhì)到劃分語言資源的類型,再發(fā)展到對語言資源功能的認(rèn)識。本文較為詳細(xì)地論述了語言資源的認(rèn)識史、中國有關(guān)語言資源的實(shí)踐和研究,并嘗試把語言資源分為口頭語言資源、書面語言資源和語言衍生資源(語言知識、語言技術(shù)、語言藝術(shù)、語言人才等)三類,分析了語言保護(hù)、語言信息處理和語言學(xué)習(xí)等語言資源的三大功能域,還提出了“語言知識觀”,即語言不僅是一個(gè)符號系統(tǒng),更是一個(gè)貯存人類語言知識體系及文化體系的知識庫。依照“語言知識觀”建設(shè)語言資源,才能滿足語言保護(hù)和機(jī)器語言學(xué)習(xí)、人類語言學(xué)習(xí)的資源需要。
關(guān)鍵詞 語言規(guī)劃;語言資源;類型;功能;語言知識觀
中圖分類號 H002 文獻(xiàn)標(biāo)識碼 A 文章編號 2096-1014(2019)03-0016-13
Abstract Forty years have passed since the concept of language resources was advanced. In the 1980s, Australia formulated the National Language Policy based on this concept. Since the beginning of the 21st century, China has started to put this concept into practice. National Language Resources Monitoring and Research Center was established, and projects such as the Chinese Language Audio Database Resources and the National Project of Chinese Language Resource Preservation carried out. In cooperation with the UNESCO, China successfully held International Conference on Role of Linguistic Diversity in Building a Global Community with Shared Future and Yuelu Proclamation was adopted. China is outstanding for advocating the concept of language resources and implementing language protection. Research on Chinas language resources is carried out on the bases of the practices of language planning. The focus of research has moved from the nature of language as resources and their classification to the understanding of the functions of language resources. This article offers a detailed historical survey of the theories and practices of Chinas language resources. It classifies language resources into three kinds: oral, written, and derivative resources, and analyzes three functional domains of language resources: language reservation, language information processing and language learning. In addition, this paper proposes the view of language knowledge and regards language as not only a semiotic system, but also a bank for storing human language knowledge system and cultural system.
Key words language planning; language resources; types; functions; the view of language knowledge
中國有100多種語言,漢語的方言燦若星空,漢語文獻(xiàn)有數(shù)千年積累,汗牛充棟,是世界上語言資源十分豐富的國度。同時(shí),語言信息處理的重要基礎(chǔ)是語言數(shù)據(jù)庫,中國的語言信息處理事業(yè)發(fā)展一直在努力追趕世界先進(jìn)水平,有些技術(shù)及應(yīng)用已經(jīng)處在世界第一方陣,這也促使中國學(xué)人能夠從信息化的時(shí)代高度來認(rèn)識語言資源。中國在歷史上也比較重視對語言資源的保護(hù)和開發(fā)利用,如漢靈帝熹平年間的“熹平石經(jīng)”、三國時(shí)魏齊王正始年間的“三體石經(jīng)”,是通過勒石立碑來保護(hù)、展示經(jīng)書和文字的范本,歷代的韻書、字典就更是直接的語言資源保護(hù)產(chǎn)品。中國傳統(tǒng)重視書面語,對于經(jīng)典和文字的敬重保護(hù)做得十分到位;但對于口語相對輕視,歷代口語資源的記錄保護(hù)工作做得不好,雖然也有漢代揚(yáng)雄的《方言》,歷代的方志中也多有詞語俗諺的內(nèi)容。中國歷史上的語言資源意識及其保護(hù)利用等,有許多經(jīng)驗(yàn)值得總結(jié)和繼承。
但是,真正理性地認(rèn)識到語言的資源意義,特別是把語言資源作為國家語言規(guī)劃的重要理念,并在國家層面、在全國范圍采取語言資源保護(hù)行動(dòng),還是近十幾年來的事情。語言作為社會資源,也是近些年來才得到社會的認(rèn)可和重視的。
一、語言是資源
認(rèn)識語言的資源性質(zhì),十分不易,語言必然不如煤炭、石油、電力、水力那樣直接作用于人類的物質(zhì)生活。這也是符合人類的資源認(rèn)識規(guī)律的。
(一)資源的認(rèn)知路徑:由自然資源到社會資源
資源是人類生產(chǎn)、生活所憑借的資料。某種資料能否成為社會認(rèn)可的資源,取決于兩個(gè)條件:
第一,資源的“有用性”。
科學(xué)技術(shù)的發(fā)展可以將過去不能使用的資料用于生產(chǎn)和生活,將不能這樣或那樣使用的資料這樣地或那樣地用于生產(chǎn)和生活。比如,電和石油,古來存在,但是人類的科學(xué)技術(shù)發(fā)展到可以把電、石油作為能源的時(shí)代,電和石油才成為人類的資源。如此說來,資源與科技進(jìn)步密切相關(guān)。我們既要全面認(rèn)識、充分利用現(xiàn)代科技狀態(tài)下的“可用資源”,也要對那些隨著科技發(fā)展將來能用的“潛在資源”保持關(guān)注,特別是要對前沿科技所可能產(chǎn)生的資源效益密切關(guān)注,從而使資源建設(shè)具有預(yù)見性。
第二,資源“有用性”的被認(rèn)識。
有些資料本來是生產(chǎn)生活所憑借的、不可或缺的,但是由于某種原因,人們沒有認(rèn)識到它的資源性質(zhì),或者忽視了它的資源性質(zhì)。例如當(dāng)霧霾不嚴(yán)重時(shí),人們認(rèn)識不到清新空氣的資源性質(zhì);當(dāng)污染不嚴(yán)重時(shí),人們認(rèn)識不到清潔水的資源性質(zhì)。如此說來,資源有“被認(rèn)識資源”和“未被認(rèn)識資源”。我們要特別關(guān)注那些“未被認(rèn)識資源”,包括已在我們的生產(chǎn)生活中使用的“可用資源”,也包括將來可能會進(jìn)入我們生產(chǎn)生活的“潛在資源”。
資源的“有用性”能否被認(rèn)識,可從四方面來看:第一,社會有無科學(xué)的資源觀,作為一門學(xué)科的資源科學(xué)是否發(fā)達(dá);第二,對某種資源與人類關(guān)系的研究達(dá)到何種水平;第三,對科技的敏感性;第四,稀缺性。最易被社會感知到的資源是稀缺資源,有用而稀缺的資源,必然會具有昂貴的價(jià)格,因此,“稀缺性”也幾乎成為資源的一種附加屬性。
資源有自然資源和社會資源兩大類。在人類的資源意識中,首先被認(rèn)識的是自然資源,然后是社會資源。《現(xiàn)代漢語詞典》是反映“公民常識”的詞典,從第1版到第6版,對“資源”詞條的解釋,一直強(qiáng)調(diào)是生產(chǎn)資料和生活資料的“天然來源”,所舉的例子共涉及“地下資源”“水力資源”“人力資源”“旅游資源”等4種。2016年第7版對“資源”的解釋有了較大發(fā)展:
【資源】生產(chǎn)資料或生活資料的來源,包括自然資源和社會資源:地下~|水力~|旅游~|人力~|信息~。(第1732頁)
第7版的釋義,不再強(qiáng)調(diào)資源的“天然性”,明確把資源分為自然資源和社會資源,舉例中增加了“信息資源”,這些都是信息時(shí)代新資源意識的反映。
《辭?!肥且徊繋в邪倏菩再|(zhì)的工具書,第1版到第4版都把“資源”解釋為“資財(cái)?shù)膩碓础R话阒柑烊坏呢?cái)源”,顯然其對“資源”的認(rèn)識比同時(shí)的《現(xiàn)代漢語詞典》還狹窄。到1999年第5版,《辭海》為“資源”增加了一個(gè)新義項(xiàng):
一國或一定地區(qū)內(nèi)擁有的物力、財(cái)力、人力等物質(zhì)要素的總稱。分為自然資源和社會資源兩大類。前者如陽光、空氣、水、土地、森林、草原、動(dòng)物、礦藏等;后者包括人力資源、信息資源以及勞動(dòng)創(chuàng)造的物質(zhì)財(cái)富。(第3881頁)
這個(gè)認(rèn)識應(yīng)該說已比較到位,不僅不再強(qiáng)調(diào)資源的“天然性”,不僅把資源分為自然資源和社會資源,而且認(rèn)為社會資源包括“勞動(dòng)創(chuàng)造的物質(zhì)財(cái)富”。當(dāng)然,如果更進(jìn)一步看,社會資源不僅包括“勞動(dòng)創(chuàng)造的物質(zhì)財(cái)富”,也許還應(yīng)包括“勞動(dòng)創(chuàng)造的精神財(cái)富”。
(二)語言資源意識的建立
回看《現(xiàn)代漢語詞典》和《辭海》關(guān)于資源的定義,會發(fā)現(xiàn)它們在舉例中都沒有提及“語言資源”。這不大可能是因?yàn)榕e例的緣故而沒有列出語言資源,而更可能是當(dāng)時(shí)的社會和辭書編纂者還沒有認(rèn)識到語言的資源性質(zhì)。
人類對語言資源的認(rèn)識也的確是比較晚近的事情。國外語言規(guī)劃學(xué)界也有提及語言資源問題的,但其研究并不系統(tǒng)。費(fèi)什曼(1973)開始提及“語言資源”:“語言跟農(nóng)業(yè)、工業(yè)、勞力、水電等資源不同……顯然只是從其具有價(jià)值的意義上講,語言才是一種資源。……無論怎么說,語言都是一種特殊資源,很難用現(xiàn)有的成本-效益理論來管理。原因是我們很難對語言進(jìn)行度量,也很難把它同其他資源分割開來。然而,我們?nèi)杂凶銐虻睦碛商接懻Z言與其他資源以及資源規(guī)劃之間的異同?!保ㄒ娭軕c生,2001:422~423)
王輝(2007)指出,Ruiz于1984年曾提出影響語言規(guī)劃的3種取向:語言作為問題、語言作為權(quán)利、語言作為資源。語言資源取向可以緩解前兩種取向帶來的語言沖突,有助于重新樹立人們對語言和語言群體的態(tài)度。語言是一種需要管理、發(fā)展和保護(hù)的資源,雙語和多語能力是語言資源,少數(shù)族群的語言是一種專門的重要資源。Kaplan(1997)、Grin(2003)把語言看作重要的“人力資源”,看作重要的“人力資本”,語言規(guī)劃應(yīng)是國家規(guī)劃的一個(gè)方面。
在國家語言規(guī)劃實(shí)踐上,澳大利亞在20世紀(jì)70年代至80年代末,提倡文化多元政策,在《Grassby報(bào)告》(Grassby Report,1973)、《Galbally報(bào)告》(Galbally Report,1978)、《邁向國家語言政策報(bào)告》(Towards a National Language Policy,1982)、《一項(xiàng)國家語言政策》(A National Language Policy,1984)等“四報(bào)告”基礎(chǔ)上,1987年出臺了《國家語言政策》(National Policy on Languages)?!秶艺Z言政策》提出了指導(dǎo)澳大利亞語言政策的4條戰(zhàn)略:第一,保護(hù)澳大利亞的語言資源;第二,開發(fā)、擴(kuò)展這些語言資源;第三,將澳大利亞語言教學(xué)與語言使用的舉措同國家經(jīng)濟(jì)、社會與文化政策結(jié)合起來;第四,用客戶能理解的語言提供信息和服務(wù)。這是將語言資源理念變?yōu)閲艺Z言政策的不多案例。不過令人遺憾的是,進(jìn)入20世紀(jì)90年代,隨著《綠皮書》(1990)、《白皮書》(1991)的出臺,澳大利亞的語言政策衍變?yōu)橛⒄Z讀寫能力優(yōu)先,這相對削弱了語言資源在語言政策中的比重。
中國最早使用“語言資源”概念是在20世紀(jì)80年代。邱質(zhì)樸(1981)從信息化、語言教學(xué)、語言規(guī)劃等角度討論語言資源的開發(fā)問題,尤為關(guān)注“語言工程”和漢語國際傳播這兩個(gè)領(lǐng)域的語言資源開發(fā)問題。《語文建設(shè)》1988年發(fā)表了樓必安可(Lo Bianco)的《澳大利亞的國家語言政策》。樓必安可是澳大利亞著名的語言規(guī)劃學(xué)家,是澳大利亞《國家語言政策》(1987)的撰稿人?!墩Z文建設(shè)》發(fā)表的樓必安可(1988:55~57)的這篇文章,是《國家語言政策》(1987)的摘要,雖然是摘要,但對于澳大利亞語言資源理念及相關(guān)措施的介紹已經(jīng)較為詳細(xì),如:“但仍有許多人的母語卻是英語以外的其他語言。這是很寶貴的語言資源,充分利用這些語言資源有很重要的意義?!薄皣艺Z言政策的主要目標(biāo)就是使澳大利亞因能善加利用豐富的語言資源而獲最大利益。”“總而言之,只有細(xì)致周密的計(jì)劃才能收到利用澳大利亞語言資源的最大效果?!薄罢Z言資源的計(jì)劃需要各級政府……的合作和協(xié)調(diào)?!?/p>
20世紀(jì)90年代,邱質(zhì)樸、樓必安可的語言資源概念似乎并沒有在語言學(xué)界產(chǎn)生反響,只有陶原珂(1996)提出要注意開發(fā)利用澳門社會的語言資源,邱質(zhì)樸(2000)再次申明他1981年的觀點(diǎn),張政飚(2000)例舉西部方言在語言研究中的價(jià)值。不過據(jù)王世凱(2009:25~28)研究,中國文學(xué)界倒是在討論如何發(fā)掘、利用語言資源(舊白話、方言、民間語言等)搞好創(chuàng)作的問題,討論西方語言資源與中國文學(xué)創(chuàng)作的關(guān)系。在中國,語言與文學(xué)雖然同在一個(gè)“語言文學(xué)”學(xué)科里,有“中國語言文學(xué)”和“外國語言文學(xué)”兩個(gè)一級學(xué)科,但是語言與文學(xué)之間卻很少發(fā)生學(xué)術(shù)互動(dòng),仿佛是“雞犬之聲相聞,老死不相往來”。在語言資源等問題上,直到今天,語言、文學(xué)兩家也沒有對話。
進(jìn)入21世紀(jì),語言資源的討論逐漸增多,語言資源意識開始在中國建立。2004年前后,張普教授常與李宇明、王鐵琨等教育部語言文字信息管理司的同人討論語言資源問題。大家認(rèn)識到:語言是資源;語言資源是信息社會最重要的資源,是與礦產(chǎn)資源、土地資源、海洋資源、水資源、森林資源一樣的國家資源,國家應(yīng)當(dāng)對語言資源立法管理,進(jìn)行監(jiān)測、保護(hù)和開發(fā)利用。這些討論的學(xué)術(shù)成果反映在張普的重要論文《論國家語言資源》(2007),其實(shí)踐成果就是國家語委組建“國家語言資源監(jiān)測與研究中心”。國家語言資源監(jiān)測與研究中心2004年6月正式掛牌,并逐漸建立了平面媒體(北京語言大學(xué))、有聲媒體(中國傳媒大學(xué))、網(wǎng)絡(luò)媒體(華中師范大學(xué))、民族語言(中央民族大學(xué))、教育教材(廈門大學(xué))、海外華語(暨南大學(xué))等6個(gè)分中心和中國語言資源開發(fā)應(yīng)用中心(商務(wù)印書館)。
2005年7月,教育部、國家語委在烏魯木齊市召開“民族語言文字規(guī)范標(biāo)準(zhǔn)建設(shè)及信息化工作會議”,時(shí)任國家語委主任袁貴仁做了《樹立科學(xué)發(fā)展觀,開創(chuàng)民族語言文字規(guī)范標(biāo)準(zhǔn)建設(shè)及信息化工作的新局面》的書面講話,提出要“保護(hù)文化多樣性,開發(fā)民族語言資源”,認(rèn)為“語言資源是重要的信息資源和文化資源”。國家語言資源監(jiān)測與研究中心的建立,國家語委主任袁貴仁的這一講話,標(biāo)志著中國的語言資源意識逐漸明晰,語言資源理念在國家語言規(guī)劃中得到確立。
二、中國有關(guān)語言資源的實(shí)踐活動(dòng)
中國的語言資源理念及其學(xué)術(shù)發(fā)展,是由語言規(guī)劃的實(shí)踐帶動(dòng)的。了解21世紀(jì)中國有關(guān)語言資源的實(shí)踐活動(dòng),可以從一個(gè)側(cè)面更好地了解中國的語言規(guī)劃,也可以更好地了解中國的語言資源研究。
(一)國家語言資源監(jiān)測與研究中心
國家語言資源監(jiān)測與研究中心的工作,是通過它的分中心完成的。各分中心依照共同的理念和技術(shù)規(guī)范,采錄、經(jīng)營著“平面媒體、有聲媒體、網(wǎng)絡(luò)媒體、民族語言、教育教材、海外華語”的語料庫。采錄、維護(hù)這些語料庫就是對語言資源的保存。中心還通過語料庫發(fā)現(xiàn)語言使用特點(diǎn)、新的語言現(xiàn)象和一些重要的“實(shí)態(tài)”統(tǒng)計(jì)數(shù)據(jù),比如每年的漢字使用頻率、詞匯使用頻率、新詞語、流行語、網(wǎng)絡(luò)語言狀況等,許多數(shù)據(jù)常通過教育部新聞發(fā)布會和“漢語盤點(diǎn)”活動(dòng)向社會發(fā)布,并成為每年的《中國語言生活狀況報(bào)告》(綠皮書)的重要篇章。這些數(shù)據(jù)對于《通用規(guī)范漢字表》的研制、中小學(xué)語文課標(biāo)和漢語國際教育有關(guān)標(biāo)準(zhǔn)的制定、語文教材的編寫等,都發(fā)揮了一定作用。
2007年9月,語信司與北京語言大學(xué)共同主辦了“國家語言資源與應(yīng)用語言學(xué)”的高峰論壇,這也是國家語言資源監(jiān)測與研究中心的幾個(gè)分中心共同邀請國內(nèi)外學(xué)者參加的學(xué)術(shù)會議。這是國內(nèi)首次召開的語言資源的大型學(xué)術(shù)會議,討論議題除“國家語言資源建設(shè)、監(jiān)測與研究”之外,還有國家語言資源與語言服務(wù)、語言規(guī)劃、語言文字規(guī)范、語言文字社會應(yīng)用、母語教學(xué)、國際漢語傳播、民族地區(qū)漢語教學(xué)、語言信息處理的關(guān)系,研究范圍比較廣泛。會議收到論文50篇,擇28篇結(jié)集為《中國語言資源論叢》,由商務(wù)印書館出版。這也是中國第一部討論語言資源問題的論文集,至今仍發(fā)揮著學(xué)術(shù)影響。
(二)中國語言資源有聲數(shù)據(jù)庫
2006年前后,不少學(xué)者認(rèn)為,要保護(hù)國家語言資源,就需要了解語言資源的國情,語言普查是了解語言資源國情的最好舉措。1956年,根據(jù)國務(wù)院指示進(jìn)行了漢語和少數(shù)民族語言調(diào)查。1999年,教育部等11部委聯(lián)合開展了中國語言文字使用情況調(diào)查。這兩次調(diào)查對于了解語言國情起了較大作用,但都沒有達(dá)到“語言普查”的水平,特別是沒有采錄語料,不能了解語言及方言的話語情況。這一時(shí)期,還有學(xué)者專門了解國際上某些國家語言普查的情況,著手設(shè)計(jì)我國語言普查的方案。
后與有關(guān)部門協(xié)商,被告知在全國進(jìn)行語言普查的時(shí)機(jī)尚不成熟,于是國家語委另辟蹊徑,組織課題組研究“中國語言資源有聲數(shù)據(jù)庫”的建設(shè)問題。名為“有聲數(shù)據(jù)庫”,就是要強(qiáng)調(diào)口語與音頻,強(qiáng)調(diào)數(shù)據(jù)庫技術(shù);嵌入“語言資源”四字,是要彰顯、傳播語言資源理念;將語言普查的一些內(nèi)容體現(xiàn)在調(diào)查項(xiàng)目中。
參加研究的專家主要有曹志耘、戴慶廈、郭龍生、何瑞、黃行、李如龍、劉丹青、潘悟云、喬全生、魏暉、謝俊英、徐大明、張振興等先生。中國語言資源有聲數(shù)據(jù)庫建設(shè)領(lǐng)導(dǎo)小組辦公室,根據(jù)這些研究成果編寫了《中國語言資源有聲數(shù)據(jù)庫調(diào)查手冊》的漢語方言部分,曹志耘執(zhí)筆,顧黔、侯精一、劉俐李、孫茂松、汪平、楊爾弘、趙曉群先生等也參與了討論。這些研究成果反映在手冊中,也反映在李宇明的《論中國語言資源有聲數(shù)據(jù)庫的建設(shè)》(2010)論文中。
根據(jù)《中國語言資源有聲數(shù)據(jù)庫調(diào)查手冊》規(guī)定的管理規(guī)范和技術(shù)要求,2008年國家語委正式啟動(dòng)中國語言資源有聲數(shù)據(jù)庫建設(shè)。先試點(diǎn),后鋪開,江蘇承擔(dān)了有聲數(shù)據(jù)庫建設(shè)的試點(diǎn)工作,歷時(shí)年余。2009年江蘇正式啟動(dòng)有聲數(shù)據(jù)庫建設(shè),之后上海、北京、遼寧、廣西、山東、河北、福建、湖北等地,也陸續(xù)開展調(diào)研、建庫工作。中國語言資源有聲數(shù)據(jù)庫建設(shè),在學(xué)界和社會上普及了語言資源理念,培養(yǎng)了一支骨干隊(duì)伍,形成了一套管理規(guī)程和技術(shù)標(biāo)準(zhǔn),積累了一批語言資源數(shù)據(jù)。
(三)中國語言資源保護(hù)工程
在中國語言資源有聲數(shù)據(jù)庫建設(shè)的基礎(chǔ)上,2015年,教育部、國家語委印發(fā)了《關(guān)于啟動(dòng)中國語言資源保護(hù)工程的通知》,開啟了中國乃至世界最宏大的語言保護(hù)工程(以下簡稱語保工程)。到2018年底,語保工程在全國34個(gè)省域全面展開,參與高校和科研院所超過350所,參與專業(yè)人員達(dá)4500余名,進(jìn)行了1495個(gè)調(diào)查點(diǎn)的調(diào)查,所獲數(shù)據(jù)包括所有漢語方言和120多個(gè)語種。
語保工程在《中國語言資源有聲數(shù)據(jù)庫調(diào)查手冊》漢語方言部分的基礎(chǔ)上,制定了《中國語言資源調(diào)查手冊·漢語方言》,同時(shí)又制定了《中國語言資源調(diào)查手冊·民族語言》(按語族分冊,共計(jì)8冊)、《中國方言文化典藏調(diào)查手冊》等,設(shè)計(jì)了“語保攝錄機(jī)”“語保標(biāo)注軟件”等語言調(diào)查加工軟件,陸續(xù)推出“中國語言文化典藏”(20冊)、“中國瀕危語言志”(30冊,將于2019年底全部出版)等標(biāo)志性成果。
2018年9月,中國政府與聯(lián)合國教科文組織在長沙聯(lián)合召開首屆“世界語言資源保護(hù)大會”。會上,聯(lián)合國教科文組織及各國政府、相關(guān)學(xué)術(shù)機(jī)構(gòu)代表和與會專家學(xué)者討論并通過了《保護(hù)和促進(jìn)世界語言多樣性 岳麓宣言(草案)》。會后,聯(lián)合國教科文組織按照程序廣泛征求意見并形成宣言最終文本,于2019年1月18日通過其官網(wǎng)正式公布。2019年2月21日,中國教育部、聯(lián)合國教科文組織駐華代表處、中國聯(lián)合國教科文組織全國委員會、中國國家語委在中國共同舉行發(fā)布會,正式發(fā)布《岳麓宣言》。首屆“世界語言資源保護(hù)大會”能夠在長沙召開,是因?yàn)橹袊Z保工作得到了國際社會的認(rèn)可;《岳麓宣言》能夠制定,是得到了中國語言資源有聲數(shù)據(jù)庫和中國語保工程的理念及經(jīng)驗(yàn)的支撐。
(四)中文語言資源聯(lián)盟
大規(guī)模的語言資源是計(jì)算機(jī)進(jìn)行語言信息處理的基礎(chǔ)。根據(jù)徐波、孫茂松、靳光瑾(2003:218~224)的介紹,2003年,在“973計(jì)劃”的特別專項(xiàng)“中文語料庫建設(shè)”支持下,中國科學(xué)院自動(dòng)化所、清華大學(xué)、北京大學(xué)、中國科學(xué)院計(jì)算所、山西大學(xué)、上海交通大學(xué)、教育部語言文字應(yīng)用研究所等單位,共同承擔(dān)了“中文語言資源聯(lián)盟”(Chinese Linguistic Data Consortium,縮寫為CLDC)的首批資源建設(shè)。之后,中國中文信息學(xué)會專門成立“語言資源建設(shè)和管理工作委員會”,負(fù)責(zé)CLDC的資源建設(shè)及數(shù)據(jù)庫的運(yùn)行。
中文語言資源聯(lián)盟的建立,是借鑒美國“語言資源聯(lián)盟”(Linguistic Data Consortium,縮寫為LDC)的經(jīng)驗(yàn),目的是共建共享中文資源、促進(jìn)語言信息處理的技術(shù)進(jìn)步。提供資源者計(jì)有36家。中文語言資源聯(lián)盟的成立與發(fā)展,是面向語言信息處理的語言資源匯聚實(shí)踐,是語言資源共建共享模式在中國的實(shí)踐,反映著語言信息化的科學(xué)需求。
(五)語言資源高精尖創(chuàng)新中心
2015年10月,“北京高等學(xué)校高精尖創(chuàng)新中心建設(shè)計(jì)劃”正式啟動(dòng)。2016年5月,北京語言大學(xué)語言資源高精尖創(chuàng)新中心成立。這是中國第一家以世界語言資源的收集整理、開發(fā)利用為目的的研究機(jī)構(gòu),其主要學(xué)術(shù)目標(biāo)是:讓全世界的語言(7000余種)都在中國有一份保有本,幫助機(jī)器理解人類語言。
語言資源高精尖創(chuàng)新中心重點(diǎn)收集A、B兩類語言資源:A類是面向語言庫藏和展示的語言資源,主要是自然語言資源;B類是面向語言智能的語言資源,包括各種生語料、經(jīng)過加工標(biāo)注的熟語料、語言知識、社會常識等。就A類語言資源來說,目前語言資源高精尖創(chuàng)新中心正在實(shí)施“第三圈”戰(zhàn)略,即在中國語言資源有聲數(shù)據(jù)庫和語保工程的基礎(chǔ)上,在中國基本完成了方言圈(第一圈)、民族語言圈(第二圈)語料采集的情況下,集中精力采集中國跨境語言和邊境語言(第三圈)語料。并期望在不久的將來,完成“一帶一路”60余國的200余種主要語言的采集。
除了以上介紹的5項(xiàng)重大語言資源實(shí)踐活動(dòng)之外,中國還有許多語言資源庫的建設(shè)項(xiàng)目。例如20世紀(jì)末侯精一先生主持的《現(xiàn)代漢語方言音庫》,收錄了40種現(xiàn)代漢語方言音檔,由上海教育出版社于1995~1999年出版。錢乃榮(1995)評價(jià)說:“現(xiàn)代漢語方言音庫的建立結(jié)束了我國漢語方言的出版物僅停留于書面描寫各地方言現(xiàn)象的歷史?!痹偃鐑?nèi)蒙古也建有蒙古語和鄂溫克語、鄂倫春語、達(dá)斡爾語的語言資源庫。例子難以一一枚舉,可以說時(shí)至今日,中國已經(jīng)成為世界上推進(jìn)語言資源建設(shè)的最重要的國度。
三、中國有關(guān)語言資源的學(xué)術(shù)研究
關(guān)于語言資源的學(xué)術(shù)研究,前面已有多處涉及。下面就幾個(gè)問題做些專門討論。
(一)語言規(guī)劃實(shí)踐與語言資源研究
知網(wǎng)是一個(gè)很好的科技文獻(xiàn)數(shù)據(jù)庫,利用知網(wǎng)做文獻(xiàn)分析是當(dāng)前可選的一條路徑,盡管知網(wǎng)的文獻(xiàn)檢索也可能有缺陷,比如有些文獻(xiàn)未必被收錄,有些文獻(xiàn)因關(guān)鍵詞標(biāo)注也未必適合檢索。在知網(wǎng)中用“語言資源”作為主題和關(guān)鍵詞精確匹配檢索,截至2019年3月31日,檢索到文獻(xiàn)403篇,涉及作者370余人。從圖1看,1981年最早有文獻(xiàn)出現(xiàn),到2003年論文年發(fā)表量還在5篇以下,22年來總共發(fā)表論文只有17篇,這是學(xué)人較少涉足之地。2004年出現(xiàn)一個(gè)研究的小高峰,年發(fā)表論文達(dá)到7篇。2007年研究熱度明顯升高,年發(fā)表論文達(dá)到16篇;這一趨勢持續(xù)到2011年,年發(fā)表論文達(dá)到26篇;2007~2011年形成第二個(gè)高峰區(qū);2015~2017年出現(xiàn)第三個(gè)高峰區(qū),峰巔在2016年,年發(fā)表論文達(dá)到55篇。
這種情況表明:第一,20世紀(jì),“語言資源”領(lǐng)域幾乎還是一片處女地,它是21世紀(jì)才開始開發(fā)的學(xué)術(shù)領(lǐng)域。第二,語言資源研究與語言規(guī)劃實(shí)踐密切相關(guān)。2004年的小高峰,對應(yīng)于國家語言資源監(jiān)測與研究中心成立;2007年到2011年,正是“中國語言資源有聲數(shù)據(jù)庫”從醞釀到正式建設(shè)的時(shí)期;2015年到2017年,是語保工程開始建設(shè)的時(shí)期,也是語言資源高精尖創(chuàng)新中心的創(chuàng)立時(shí)期。研究高峰與實(shí)踐活動(dòng)的關(guān)節(jié)點(diǎn)大致對應(yīng),是因?yàn)閷?shí)踐活動(dòng)開始前總要做些研究,開始后又能帶動(dòng)研究。在中國,的確是語言規(guī)劃的實(shí)踐在推動(dòng)語言資源的研究,為研究提供需求、材料和用場;語言資源研究也為實(shí)踐提供了學(xué)術(shù)支撐;學(xué)術(shù)與實(shí)踐相互推動(dòng),是因?yàn)樵谡纭⑸鐣?、學(xué)界之間建造有一個(gè)現(xiàn)代化的“智力旋轉(zhuǎn)門”??梢灶A(yù)測,2019年也會是語言資源研究的大年,因?yàn)?018年在長沙召開了首屆“世界語言資源保護(hù)大會”,2019年春季正式發(fā)布了《岳麓宣言》。
(二)語言的資源性質(zhì)與語言資源類型
我國早期的語言資源研究,主要是論證語言具有資源的性質(zhì),確立語言資源的合理性。張普(2007)《論國家語言資源》用較大的篇幅論證語言是資源。先從資源說到資源科學(xué),再談自然資源和社會資源,繞這么大的彎子就是為了說明語言也是資源,是社會資源??梢姰?dāng)時(shí)要說“語言是資源”這么個(gè)道理還是多么困難。陳章太(2008)《論語言資源》也用了不少筆墨,來說明“語言是一種特殊的社會資源”。
在論證語言具有資源的性質(zhì)之后,研究者的精力便集中在列舉語言資源、為語言資源分類上。陳章太(2008)從廣狹兩個(gè)方面來看待語言資源:狹義的語言資源是指“語言信息處理用的各種語料庫和語言數(shù)據(jù)庫,以及各種語言詞典等”;廣義的語言資源是指“語言本體及其社會、文化等價(jià)值”。而他要討論的是廣義的語言資源,這可能說明兩個(gè)問題:第一,“語言資源”這一概念在當(dāng)時(shí)語言信息處理學(xué)界較多使用;第二,把語言資源推及語言本體,還具有較大新意。
張普(2007)把語言資源分為三類:語言資源類、言語資源類、語言學(xué)習(xí)資源類。把語言學(xué)習(xí)資源劃出一類,是考慮到了語言資源的用途。從學(xué)界開始關(guān)注語言資源,如邱質(zhì)樸(1981),就比較關(guān)注語言資源在教學(xué)中的應(yīng)用。張普先生又是數(shù)字化教學(xué)的研究者、提倡者,語言學(xué)習(xí)資源更易進(jìn)入他的研究視野。但是他把語言資源分為“語言資源類、言語資源類”表面上符合“語言、言語”的“抽象-具體”這一學(xué)界思維習(xí)慣,特別是慧眼獨(dú)到地強(qiáng)調(diào)了語言運(yùn)用所產(chǎn)生的語言資源,但實(shí)際上就語言數(shù)據(jù)庫建設(shè)來說,不可能拿“語言”來建庫,文字的或音頻的材料都只能是具體的“言語”。
王世凱(2009)是中國第一部論述語言資源的專著,在提出建立“語言資源學(xué)”的同時(shí),在著力探討語言資源的多種性質(zhì)的同時(shí),還把語言資源看作由底層資源(語音資源、詞匯資源、語法資源、語義資源、文字資源)和高層資源(修辭、語體、風(fēng)格)構(gòu)成的體系。這基本上是根據(jù)語言的結(jié)構(gòu)要素來劃分語言資源,同時(shí)考慮到文字和修辭、語體、風(fēng)格等。
魏暉(2015)認(rèn)為語言資源包括四大類:(1)語言本體(知識)資源,由語音、詞匯、語法和語義等構(gòu)成;(2)語言應(yīng)用資源,包括各種通用的、專用的、靜態(tài)的、動(dòng)態(tài)的、多語的、平行的語料庫,還包括與語料的加工處理相關(guān)的知識庫、數(shù)據(jù)庫、規(guī)范標(biāo)準(zhǔn)(庫)等;(3)語言學(xué)習(xí)資源;(4)人力資源,即掌握不同語種(包括外語)的人才。魏暉(2016)重申這一觀點(diǎn),并再次強(qiáng)調(diào)“人力資源是最核心的語言資源,也是最具能動(dòng)性的語言資源”。
很顯然,在語言資源的認(rèn)定和分類方面,學(xué)界意見至今并不一致,甚至還沒有建立語言資源的認(rèn)定標(biāo)準(zhǔn),也沒有找到一個(gè)較為合適的分類體系。本文認(rèn)為,語言資源基本屬性是其“有用性”,語言及其相關(guān)的事物有哪些作用,亦即哪些東西可以成為語言資源,還是一個(gè)需要探索的問題,特別是語言智能的發(fā)展一日千里,很多我們意識不到的東西都可能進(jìn)入語言資源的行列。綜合時(shí)賢的研究,就當(dāng)前的認(rèn)識水平看,語言資源可以包括3類:(1)口頭語言資源;(2)書面語言資源;(3)語言衍生資源,包括語言知識、語言技術(shù)、語言藝術(shù)、語言人才等。
自然語言的存在形態(tài)主要是口語和書面語,它們是最為基本的語言資源。就資源的收集、整理、建庫、保護(hù)而言,不存在語言和言語的對立,接觸到的都是言語類的語言資源?!把哉Z”是現(xiàn)實(shí)存在,“語言”存在于語言學(xué)中,存在于語言學(xué)家的大腦里和學(xué)術(shù)抽繹的操作中。就此而言,沒有必要區(qū)分“語言資源”和“言語資源”,或者說,只有“言語資源”沒有“語言資源”。
“口頭語言資源”和“書面語言資源”是對自然語言資源的再分類。在許多文獻(xiàn)中語言資源也就只指這兩類資源。其實(shí)“語言衍生資源”也非常重要:其一,語言知識、語言技術(shù)、語言人才等,在語言資源的收集整理、標(biāo)注入庫、分析研究、開發(fā)應(yīng)用等各個(gè)關(guān)節(jié)都在發(fā)揮作用;其二,語言藝術(shù)(包括書法、文學(xué),還有主要憑借語言的藝術(shù),如話劇、相聲、小品、笑話等)本身就是很有價(jià)值的語言資源。故而,語言資源應(yīng)當(dāng)包括語言衍生資源。
(三)語言資源的功能視角
語言資源的社會意義在于功能??创Z言資源必須建立“功能視角”,應(yīng)從功能的角度去認(rèn)識語言資源,去評價(jià)語言資源的建設(shè)工作,去開發(fā)利用語言資源。語言資源的功能是隨著社會的進(jìn)步而逐漸被開發(fā)、被認(rèn)識的。在我們的文化傳統(tǒng)中,文字和書面語比口語更受重視。但在近來以語言保護(hù)為首要任務(wù)的語言資源研究與實(shí)踐中,口語的語言資源意義得到了較多關(guān)注,而書面語的語言資源意義則反而關(guān)注較少,研究較少,至于語言知識、語言技術(shù)、語言藝術(shù)、語言人才等衍生性的語言資源,雖不同程度地被涉及,但尚缺乏認(rèn)真梳理。
就當(dāng)前語言資源利用的實(shí)踐來看,語言資源的功能域主要有3個(gè)方面:語言保護(hù)、語言信息處理、語言學(xué)習(xí)。
1.語言保護(hù)
語言保護(hù)是當(dāng)今全球的熱點(diǎn)話題,據(jù)專家預(yù)測,本世紀(jì)末90%的語言將瀕危甚至消亡。若從交際的角度看,這些語言的瀕?;蛳鲆苍S并不是嚴(yán)重問題;但是若從文化的角度看,語言的瀕?;蛳鰠s是文化的災(zāi)難,因?yàn)槊糠N語言都記載著某民族(部族)的歷史、經(jīng)驗(yàn)及世界觀,而這些精神財(cái)富絕大多數(shù)還沒有被現(xiàn)代人類社會所了解,沒有成為現(xiàn)代人類知識的一部分。語言保護(hù)就是與時(shí)間賽跑,搶救失而不可復(fù)得的人類精神資財(cái)。中國的百余種語言以及大量的漢語方言,也有許多處在瀕危狀態(tài)或是出現(xiàn)瀕危態(tài)勢,語言保護(hù)的任務(wù)也是急迫而沉重的。
語言保護(hù)有3個(gè)層次:第一個(gè)層次是“語言保存”。即通過書面記錄方式和錄音錄像方式,將語言(包括方言)記錄下來,并建立起數(shù)據(jù)庫、博物館,把這些“語言標(biāo)本”保存下來。當(dāng)前學(xué)者進(jìn)行的多是語言保存層面的工作。語言保存所涉及的語言資源,主要是口語資源,特別是瀕危語言的口語資源。其實(shí)古代書面文獻(xiàn)、民間語言藝術(shù)等,也具有重要的語言保存價(jià)值。進(jìn)一步研究會發(fā)現(xiàn),作為“語言樣本”的語言資源可以再分為兩種,一種是“展示本”,一種是“全息本”。展示本主要用于語言展示、語言教學(xué)、基本研究等,要求語言資源能夠反映出某語言的基本特征,比如基本的結(jié)構(gòu)特征、交際運(yùn)用特征和文化特征。全息本要求盡可能多地保存某語言的語言信息和文化信息,一旦有需要,可以在虛擬技術(shù)的幫助下利用這些信息“復(fù)活”該語言。這是語言保護(hù)最為浪漫的理想。
第二個(gè)層次是“語言活態(tài)保護(hù)”。即通過各種措施來延長語言的生命,維護(hù)語言的活力。由于語言活態(tài)保護(hù)必然會對語言使用者的生存、生活方式及生存、生活環(huán)境進(jìn)行不同程度的干預(yù),倫理學(xué)上的要求很高,工作的難度很大。國內(nèi)外在語言活態(tài)保護(hù)方面都做了一些探索,積累了一些經(jīng)驗(yàn),比如北美地區(qū)對印第安語的活態(tài)保護(hù),大洋洲對毛利語的活態(tài)保護(hù),中國對裕固語、貴州苗語的活態(tài)保護(hù)等。但總體上看成效并不明顯,前景并不清晰。
第三個(gè)層次是“語言資源的開發(fā)利用”。即對語言保存、語言活態(tài)保護(hù)的成果進(jìn)一步開發(fā),獲取語言保護(hù)的社會“紅利”?!凹t利”意識十分重要,它可激發(fā)語言保護(hù)的動(dòng)力,及時(shí)發(fā)揮語言保護(hù)的效力,不斷增加語言保護(hù)的實(shí)力,保證語言保護(hù)事業(yè)可持續(xù)發(fā)展。需要注意的是,語言保護(hù)“紅利”的獲取者,首先應(yīng)考慮語言資源的提供者,包括發(fā)音合作人及其所屬社團(tuán)。
2.語言信息處理
語言信息處理是當(dāng)前語言資源的最大用戶,也是當(dāng)下語言資源理念的積極提倡者和語言資源的積極建設(shè)者。在中國,中文語言資源聯(lián)盟的建立便是上述認(rèn)識的最佳“背書”。語言信息處理絕不只是科學(xué)技術(shù)之事,而是推進(jìn)社會進(jìn)步的重要力量;正是它的發(fā)展進(jìn)步,使當(dāng)今社會正在向“智能時(shí)代”邁進(jìn)。人工智能是智能時(shí)代最主要的技術(shù)力量,其核心是語言智能。機(jī)器獲取語言智能主要靠語言大數(shù)據(jù)的訓(xùn)練。語言大數(shù)據(jù)也就是語言資源,從語言智能的視角看,語言資源是生產(chǎn)資料的范疇,對人類的意義就更加不一般了。
語言保護(hù)所涉及的語言資源,主要保存的是以往的人類世界,是人類的歷史,是人類已有的經(jīng)驗(yàn)及世界觀;而語言信息處理所涉及的語言資源,是用于創(chuàng)造新的知識、發(fā)現(xiàn)新的世界的。語言保護(hù)是面向過去的,語言信息處理是面向未來的,雖然認(rèn)識既有世界對發(fā)現(xiàn)新世界會有幫助。
用于語言信息處理的語言資源,還可以進(jìn)一步劃分為兩種:一種是幫助解決“語言通”的,一種是幫助解決“信息通”的。語言通是讓機(jī)器能夠理解和使用語言,包括機(jī)器翻譯、機(jī)器寫作等。信息通是讓機(jī)器對各領(lǐng)域信息能夠加工處理,包括“社會計(jì)算”、科技文獻(xiàn)的二次加工等。當(dāng)然,語言通也需要機(jī)器有一定的專業(yè)知識和社會常識,亦即需要信息通的支持,信息通更需要在語言通的基礎(chǔ)上來進(jìn)行。用于語言通的語言資源和用于信息通的語言資源是有不同要求的,因此可以把用于語言信息處理的語言資源再行劃分。
3.語言學(xué)習(xí)
語言學(xué)習(xí)是人類最為重要的語言生活之一。隨著社會的發(fā)展,語言學(xué)習(xí)的任務(wù)越來越重,不僅要學(xué)習(xí)母語(特別是書面語),還要學(xué)習(xí)外語,甚至是多門外語。即使語言智能發(fā)展到相當(dāng)?shù)母叨?,機(jī)器翻譯可以滿足基本的翻譯需求,外語學(xué)習(xí)仍然是需要的,因?yàn)樗侨祟惾姘l(fā)展的素養(yǎng)。
語言學(xué)習(xí)必須依靠語言資源才能進(jìn)行,語言學(xué)習(xí)資源是語言資源研究者較早進(jìn)入的學(xué)術(shù)領(lǐng)域。傳統(tǒng)的語言學(xué)習(xí)資源有教科書、工具書、課外讀物、語言教師、必要的語言環(huán)境等。而今進(jìn)入到信息化的時(shí)代,智能學(xué)習(xí)、智慧學(xué)習(xí)、慕課、微課等新概念炫人耳目,構(gòu)建適合于“互聯(lián)網(wǎng)+”的語言學(xué)習(xí)資源,成為教育改革的時(shí)代命題。語言知識、語言技術(shù)、語言人才、語言課程、語言學(xué)習(xí)環(huán)境等,是新時(shí)代語言學(xué)習(xí)資源中的重要組塊。這方面的實(shí)踐已經(jīng)很多,但是真正的研究和應(yīng)用還是比較有限的。
(四)語言知識觀
語言資源的功能還有很多,但是有此三者,已經(jīng)足以說明語言資源的重大價(jià)值,足以說明語言資源建設(shè)的意義及其急迫性,足以說明語言資源研究及建立語言資源學(xué)的意義。
自從索緒爾建立了現(xiàn)代語言學(xué)之后,“語言是一個(gè)符號系統(tǒng)”便成為公理性的學(xué)術(shù)常識。但是,從語言資源的視角、特別是語言資源功能的視角看“語言”,語言就不只是一個(gè)“符號系統(tǒng)”,而更是一個(gè)“知識系統(tǒng)”。比如語言保護(hù),不應(yīng)只是記錄、保護(hù)語言符號,而是記錄、保護(hù)人類的語言知識體系及文化體系。語言學(xué)家傳統(tǒng)的語言調(diào)查,目的主要是揭示語言的符號系統(tǒng),而在揭示語言的知識系統(tǒng)、文化體系方面明顯不足。從“語言知識觀”的立場出發(fā),詞匯、語法、語用、篇章最為重要,人類的知識和思維運(yùn)作主要貯存在、表現(xiàn)在詞匯、語法、語用和篇章之中。由此來看,語言保護(hù)工作必須在語言調(diào)查方法、語言調(diào)查內(nèi)容等方面進(jìn)行大幅度改進(jìn)。
如果從語言信息處理的角度看語言,計(jì)算機(jī)理解人類語言,只理解語言的符號系統(tǒng)是完全不夠的;計(jì)算機(jī)從語言大數(shù)據(jù)中學(xué)到的也不僅僅是語言的符號體系,而是語言的知識體系甚至也包括文化體系。這也許就是計(jì)算機(jī)只學(xué)習(xí)語言學(xué)家給它的“規(guī)則”并不能夠?qū)崿F(xiàn)語言通的原因。語言信息處理也可以通俗地表述為“機(jī)器語言學(xué)習(xí)”,人類語言學(xué)習(xí)也是如此,現(xiàn)在人們強(qiáng)調(diào)外語學(xué)習(xí)要從“學(xué)外語”變成“用外語學(xué)”,也包含著這個(gè)道理。
四、結(jié) 語
語言的社會資源性質(zhì),是人類從20世紀(jì)70年代才開始逐漸認(rèn)識到的,澳大利亞在80年代率先把語言資源意識落實(shí)到國家語言規(guī)劃中。中國的語言信息處理學(xué)界2003年開始籌建“中文語言資源聯(lián)盟”,是語言資源建設(shè)最早的行動(dòng)者。2004年國家語委成立“國家語言資源監(jiān)測與研究中心”,語言資源理念開始進(jìn)入國家的語言規(guī)劃。之后,隨著“中國語言資源有聲數(shù)據(jù)庫”和“中國語言資源保護(hù)工程”的相繼開展,中國成為世界上在國家層面大力提倡語言資源理念、開展語言保護(hù)的最為突出的國家。2018年,中國與聯(lián)合國教科文組織在長沙共同召開首屆“世界語言資源保護(hù)大會”,并形成《岳麓宣言(草案)》,中國的語言規(guī)劃又一次為國際社會提供了公共產(chǎn)品。
中國語言資源研究是在語言規(guī)劃的實(shí)踐推動(dòng)下展開的,并與語言規(guī)劃的實(shí)踐形成了良性互動(dòng)。1981年到2003年可以看作語言資源的學(xué)術(shù)醞釀期,2004年、2007~2011年、2015~2017年出現(xiàn)3次學(xué)術(shù)高峰或高峰區(qū),語言資源已經(jīng)發(fā)展為重要的具有魅力的學(xué)術(shù)領(lǐng)域,語言資源學(xué)的學(xué)科建設(shè)提上日程。
早期的研究主要確定語言的資源屬性,之后較多地研究語言資源的類型。語言資源有哪些類型,學(xué)界認(rèn)識還很不一致,本文嘗試把語言資源分為口頭語言資源、書面語言資源和語言衍生資源(語言知識、語言技術(shù)、語言藝術(shù)、語言人才等)三類,并認(rèn)為要較好地解決語言資源分類問題,必須建立語言資源的功能觀。當(dāng)前語言資源最為重要的功能域是語言保護(hù)、語言信息處理和語言學(xué)習(xí),應(yīng)當(dāng)根據(jù)這些功能來考慮語言資源的分類、建設(shè)規(guī)格和評價(jià)標(biāo)準(zhǔn)。
從語言資源的角度,特別是語言資源功能的角度來看語言,語言就不僅僅是一個(gè)符號系統(tǒng),它更是一個(gè)“知識庫”,里面貯存著人類的語言知識體系及文化體系。只有樹立了“語言知識觀”,語言資源建設(shè)才能滿足語言保護(hù)和機(jī)器語言學(xué)習(xí)、人類語言學(xué)習(xí)的需要。
最后需要指出的是,語言資源的保護(hù)與集聚需要人類社會的合作,包括不同地區(qū)、不同國家、不同國際組織的合作,不同社會部門和不同學(xué)科的合作。為了保證這種合作的順利開展,需要制定一系列國際標(biāo)準(zhǔn),包括技術(shù)標(biāo)準(zhǔn)、工作標(biāo)準(zhǔn)和社會倫理標(biāo)準(zhǔn)。語言資源關(guān)涉到人類的知識庫存、精神家園和生產(chǎn)資料的集聚管理,必須加強(qiáng)學(xué)術(shù)研究,加大加快社會行動(dòng)。
參考文獻(xiàn)
陳章太 2008 《論語言資源》,《語言文字應(yīng)用》第1期。
范俊軍 2006 《聯(lián)合國教科文組織關(guān)于保護(hù)語言與文化多樣性文件匯編》,北京:民族出版社。
范俊軍,肖自輝 2008 《語言資源論綱》,《南京社會科學(xué)》第4期。
費(fèi)什曼 1973 《語言現(xiàn)代化和規(guī)劃與國家現(xiàn)代化和規(guī)劃的比較》(高建平譯),載周慶生主編(2001)。
國家民委民族問題研究中心 2007 《歐安組織民族問題資料匯編》(內(nèi)部資料),北京:民族出版社。
黃 行 2018 《中國語言資源多樣性及其創(chuàng)新與保護(hù)規(guī)劃》,載閆國華主編《語言科技與人類福祉——首屆中國北京國際語言文化博覽會論文集》,北京:外語教學(xué)與研究出版社。
李如龍 2008 《漢語方言資源及其開發(fā)利用》,《鄭州大學(xué)學(xué)報(bào)》(哲學(xué)社會科學(xué)版)第1期。
李宇明 2006 《關(guān)注語言生活》(語言生活熱點(diǎn)問題開欄寄語),《長江學(xué)術(shù)》第1期。
李宇明 2008a 《語言資源觀及中國語言普查》,《鄭州大學(xué)學(xué)報(bào)》(哲學(xué)社會科學(xué)版)第1期。
李宇明 2008b 《當(dāng)今人類三大語言話題》,《云南師范大學(xué)學(xué)報(bào)》(哲學(xué)社會科學(xué)版)第4期。
李宇明 2009 《公民語言能力是國家語言資源——序〈母語·文章·教育〉》,《中國大學(xué)教學(xué)》第2期。
李宇明 2010 《論中國語言資源有聲數(shù)據(jù)庫的建設(shè)》,《中國語文》第4期。
樓必安可(Lo Bianco) 1988 《澳大利亞的國家語言政策》,《語文建設(shè)》第5期。
錢乃榮 1995 《漢語方言研究中的新收獲——祝賀現(xiàn)代漢語方言音庫發(fā)行兼評〈上海話音檔〉》,《語文研究》第4期。
邱質(zhì)樸 1981 《試論語言資源的開發(fā)——兼論漢語面向世界問題》,《語言教學(xué)與研究》第3期。
邱質(zhì)樸 2000 《應(yīng)用語言學(xué)的新概念》,《鎮(zhèn)江師專學(xué)報(bào)》(社會科學(xué)版)第3期。
陶原珂 1996 《應(yīng)注意開發(fā)利用澳門社會的語言資源》,《學(xué)術(shù)研究》第4期。
王 輝 2007 《語言規(guī)劃的資源觀》,《北華大學(xué)學(xué)報(bào)》(社會科學(xué)版)第4期。
王 輝 2010 《澳大利亞語言政策研究》,北京:中國社會科學(xué)出版社。
王世凱 2009 《語言資源與語言研究》,上海:學(xué)林出版社。
魏 暉 2015 《國家語言能力有關(guān)問題探討》,《語言文字應(yīng)用》第4期。
魏 暉 2016 《文化強(qiáng)國視角的國家語言戰(zhàn)略探討》,《文化軟實(shí)力研究》第3期。
徐 波,孫茂松,靳光瑾 2003 《中文信息處理若干重要問題》,北京:科學(xué)出版社。
徐大明 2008 《語言資源管理規(guī)劃及語言資源議題》,《鄭州大學(xué)學(xué)報(bào)》(哲學(xué)社會科學(xué)版)第1期。
袁貴仁 2005 《樹立科學(xué)發(fā)展觀,開創(chuàng)民族語言文字規(guī)范標(biāo)準(zhǔn)建設(shè)及信息化工作的新局面》,《教育部通報(bào)》第17期,教育部辦公廳2005年9月2日印發(fā)。
張 普 2007 《論國家語言資源》,《民族語言文字信息技術(shù)研究——第十一屆全國民族語言文字信息學(xué)術(shù)研討會論文集》。另載張普(2012)。
張 普 2012 《張普應(yīng)用語言學(xué)論文集》,北京:北京語言大學(xué)出版社。
張 普,王鐵琨 2009 《中國語言資源論叢》,北京:商務(wù)印書館。
張政飚 2000 《西部語言資源重要性例議》,《中國語文》第1期。
趙 軍,徐 波,孫茂松,等 2003 《中文語言資源聯(lián)盟的建設(shè)和發(fā)展》,載徐波,孫茂松,靳光瑾主編《中文信息處理若干重要問題》,北京:科學(xué)出版社。
中國語言資源有聲數(shù)據(jù)庫建設(shè)領(lǐng)導(dǎo)小組辦公室 2010 《中國語言資源有聲數(shù)據(jù)庫調(diào)查手冊·漢語方言》,北京:商務(wù)印書館。
周慶生 2001 《國外語言政策與語言規(guī)劃進(jìn)程》,北京:語文出版社。
周慶生 2015 《語言生活與語言政策》,北京:社會科學(xué)文獻(xiàn)出版社。
Grin, F. 2003. Language planning and economics. Current Issues in Language Planning 4(1), 1–66.
Kaplan, R. B. & R. B. Baldauf. 1997. Language Planning from Practice to Theory. Clevedon: Multilingual Matters Ltd.
責(zé)任編輯:魏曉明