張滋暄
摘 要:在信息飛速發(fā)展的今天,我們引入了大數(shù)據(jù)這個(gè)廣義的概念,那么對(duì)于我的專業(yè),語(yǔ)言大數(shù)據(jù),可謂更是全新的一個(gè)名詞。在大數(shù)據(jù)的影響下,語(yǔ)言這門學(xué)問(wèn)的學(xué)習(xí)和傳播方式已經(jīng)在潛移默化的發(fā)生改變。語(yǔ)言學(xué)習(xí)者對(duì)于語(yǔ)言的認(rèn)知會(huì)影響學(xué)習(xí)者的學(xué)習(xí)的效果,大數(shù)據(jù)的飛速發(fā)展給語(yǔ)言學(xué)習(xí)者提供了更加快捷與系統(tǒng)的方式,豐富了語(yǔ)言信息獲得的方式,提高了語(yǔ)言學(xué)習(xí)者的學(xué)習(xí)效率和自我學(xué)習(xí)能力。
關(guān)鍵詞:語(yǔ)言大數(shù)據(jù);發(fā)展;應(yīng)用
中圖分類號(hào):H08 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2019)20-0194-02
0 引言
本文試圖通過(guò)論述回答兩個(gè)問(wèn)題:一是何為語(yǔ)言大數(shù)據(jù),即語(yǔ)言大數(shù)據(jù)應(yīng)該如何理解;二是如何運(yùn)用語(yǔ)言大數(shù)據(jù),即對(duì)語(yǔ)言大數(shù)據(jù)的研究和發(fā)展有何重要意義。這兩個(gè)問(wèn)題同時(shí)是本專業(yè)未來(lái)發(fā)展中進(jìn)一步探索的兩個(gè)關(guān)鍵問(wèn)題。在此,我通過(guò)兩年學(xué)習(xí)中得到的一些見解分享,還望予以雅正。
大數(shù)據(jù)正在以前所未有的廣度和深度影響著這個(gè)時(shí)代,諸多大數(shù)據(jù)分析的系統(tǒng)使我們的生活變得更加便利。語(yǔ)言是人類最為重要的交流思想、傳遞信息的工具,是人類生活中不可缺少的重要組成部分。大數(shù)據(jù)思維和實(shí)踐在語(yǔ)言研究及學(xué)習(xí)領(lǐng)域的應(yīng)用,有利于人類更進(jìn)一步地打開語(yǔ)言寶庫(kù),從而幫助人類更好地生活。
1 語(yǔ)言大數(shù)據(jù)概念的理解
本部分闡述何為語(yǔ)言大數(shù)據(jù),如何理解這個(gè)概念。后文中通過(guò)麻省理工學(xué)院的一項(xiàng)研究的研究方式引入本文對(duì)于語(yǔ)言大數(shù)據(jù)的前身的理解,隨后說(shuō)明語(yǔ)言學(xué)在大數(shù)據(jù)時(shí)代之下的新型的觀念,進(jìn)一步闡釋語(yǔ)言大數(shù)據(jù)的定義。
自工業(yè)革命以來(lái),人類逐漸由傳統(tǒng)的工業(yè)時(shí)代朝著信息化時(shí)代轉(zhuǎn)變。信息變得越來(lái)越廣泛,幾乎所有的事情都涉及各方面的信息,這使得人們迫切的需要利用工具來(lái)減輕負(fù)擔(dān)。而計(jì)算機(jī)的出現(xiàn)和使用大大的減輕了人們的負(fù)擔(dān),其可以幫助人類處理一些基本信息,例如翻譯、數(shù)據(jù)統(tǒng)計(jì)、抽取信息等,使得人們可以集中注意力來(lái)做一件事情,在此背景下自然語(yǔ)言和計(jì)算語(yǔ)言學(xué)應(yīng)運(yùn)而生,并發(fā)展的十分迅速。2016年初,麻省理工學(xué)院(MIT)的大腦與認(rèn)知科學(xué)系在國(guó)際頂尖期刊《美國(guó)科學(xué)院院報(bào)》上的一項(xiàng)語(yǔ)言學(xué)交叉研究利用已經(jīng)公開發(fā)表的依存樹庫(kù),對(duì)37種語(yǔ)言進(jìn)行了統(tǒng)計(jì)分析指出人類語(yǔ)言存在依存距離最小化這一傾向。此研究雖然存在一定缺陷,但卻依舊受到媒體的廣泛關(guān)注,而這一研究也充分體現(xiàn)了大數(shù)據(jù)研究方法在語(yǔ)言認(rèn)知研究中的重要作用。即在語(yǔ)言系統(tǒng)的運(yùn)作規(guī)律的過(guò)程中,運(yùn)用大量的數(shù)據(jù)來(lái)挖掘多種語(yǔ)言中存在的規(guī)律。
2 探究語(yǔ)言學(xué)研究與大數(shù)據(jù)思維的關(guān)系
本部分通過(guò)闡述大數(shù)據(jù)對(duì)語(yǔ)言學(xué)研究產(chǎn)生的重要影響,來(lái)進(jìn)一步分析語(yǔ)言大數(shù)據(jù)這一新興學(xué)科存在和發(fā)展的必要意義。信息時(shí)代在給當(dāng)今的語(yǔ)言研究帶來(lái)挑戰(zhàn)的同時(shí),也為實(shí)現(xiàn)新的語(yǔ)言研究轉(zhuǎn)變提供了新的契機(jī)。首先我們通過(guò)一組大數(shù)據(jù)與語(yǔ)言學(xué)相結(jié)合的實(shí)例說(shuō)起。
美國(guó)Mark Davies教授2013年建立的GloWbE語(yǔ)料庫(kù)規(guī)模19億詞,“Google Books:British English”語(yǔ)言數(shù)據(jù)高達(dá)340億詞,“Google Books:American English”語(yǔ)言數(shù)據(jù)高達(dá)1500億詞。
大數(shù)據(jù)思維方式與眾不同之處在于,其要求探索所得出的是“是什么”,從而能夠更好的幫助人們?nèi)ダ斫?。在信息蓬勃發(fā)展的時(shí)代,語(yǔ)言研究同樣需要轉(zhuǎn)變,轉(zhuǎn)變到尋找語(yǔ)言事實(shí)的“是什么”而不是“為什么”,通過(guò)了解語(yǔ)言之間的相互關(guān)系,能夠更好的理解和認(rèn)知語(yǔ)言研究,不斷的開闊我們的眼界,為我們帶來(lái)新的思路,從而對(duì)語(yǔ)言學(xué)習(xí)產(chǎn)生積極影響。通過(guò)數(shù)據(jù)方法的運(yùn)用,促使我們產(chǎn)生了一種感知維度,為我們提供了更加清晰、具體的研究方向,從而能夠更好的理解和認(rèn)識(shí)。根據(jù)所得的各種語(yǔ)言材料,能夠使我們展開更加深入的研究,探討語(yǔ)言的本質(zhì)特征,數(shù)據(jù)手段有助于更好地反映語(yǔ)言的真實(shí)狀態(tài)和本質(zhì)特點(diǎn)。
3 分析語(yǔ)言大數(shù)據(jù)在語(yǔ)言學(xué)以及日常生活中的應(yīng)用
本部分分為三個(gè)層次,通過(guò)理論與實(shí)例相結(jié)合來(lái)語(yǔ)言大數(shù)據(jù)在語(yǔ)言教學(xué)中非常廣泛的應(yīng)用,甚至推廣到日常的生活中,我們可以發(fā)現(xiàn)語(yǔ)言大數(shù)據(jù)已經(jīng)進(jìn)深入到我們的生活為我們提供了很多便利和新的思維生活方式,打破了傳統(tǒng)的局限性,獲得了更廣闊的視野,從而進(jìn)一步促進(jìn)語(yǔ)言大數(shù)據(jù)這一新興學(xué)科的發(fā)展[1]-[2]。
3.1 語(yǔ)言大數(shù)據(jù)在語(yǔ)言學(xué)研究中的應(yīng)用
語(yǔ)言學(xué)習(xí)者的認(rèn)知策略會(huì)影響學(xué)習(xí)者的學(xué)習(xí)效果,大數(shù)據(jù)技術(shù)的發(fā)展給英語(yǔ)學(xué)習(xí)者提供了更加快捷便利準(zhǔn)確的方式,豐富了知識(shí)的獲得方式,提高了語(yǔ)言學(xué)習(xí)的個(gè)性化和自主性。傳統(tǒng)的學(xué)習(xí)語(yǔ)言的過(guò)程是學(xué)習(xí)者坐在教室里通過(guò)教師的板書講課來(lái)實(shí)現(xiàn)的,這種教學(xué)方式下的學(xué)習(xí)者是被動(dòng)的。但隨著大數(shù)據(jù)時(shí)代的到來(lái)和當(dāng)代教學(xué)理念的優(yōu)化進(jìn)步,學(xué)習(xí)者應(yīng)該主動(dòng)的接受語(yǔ)言知識(shí),互聯(lián)網(wǎng)環(huán)境下,學(xué)習(xí)者有相對(duì)的自主權(quán),通過(guò)大數(shù)據(jù)提供的海量語(yǔ)言學(xué)文庫(kù),可以主動(dòng)的按照各自喜好或者是各自的長(zhǎng)處短處進(jìn)行有針對(duì)性的語(yǔ)言學(xué)習(xí),這能提高語(yǔ)言學(xué)習(xí)者的自主學(xué)習(xí)的能力,并能更好地適應(yīng)飛速發(fā)展的社會(huì)。
在語(yǔ)言大數(shù)據(jù)出現(xiàn)以前,語(yǔ)言學(xué)研究存在一個(gè)難以解決的困境。大量學(xué)者將研究目的定位探尋一定范圍內(nèi)語(yǔ)言事實(shí)的原因,但這種研究只能在一定范圍內(nèi)、一定是其解釋和說(shuō)明小部分語(yǔ)言事實(shí),以至于學(xué)者們陷入了建立成千上百種語(yǔ)言學(xué)理論和模型,也無(wú)法綜合全部語(yǔ)言建立一套完整的語(yǔ)言學(xué)研究體系,甚至無(wú)法將所有語(yǔ)言事實(shí)解釋清楚的困境。這種困境在語(yǔ)言大數(shù)據(jù)產(chǎn)生后得到了一定的解決。語(yǔ)言大數(shù)據(jù)深化了語(yǔ)言的研究,加強(qiáng)了對(duì)語(yǔ)言的客觀化、精細(xì)化的描述,使語(yǔ)言研究由隨機(jī)取樣或例子列舉轉(zhuǎn)變到盡量分析更多的語(yǔ)言數(shù)據(jù)。因此,語(yǔ)言大數(shù)據(jù)背景下的語(yǔ)言學(xué)研究能夠大范圍觀察語(yǔ)言事實(shí)的相關(guān)程度和演化過(guò)程,擴(kuò)展了研究的事業(yè)和應(yīng)用服務(wù)范圍,避免研究者的認(rèn)知偏見和語(yǔ)言感知誤差,甚至能夠預(yù)測(cè)語(yǔ)言現(xiàn)象或事實(shí)發(fā)展的趨勢(shì),這是傳統(tǒng)語(yǔ)言學(xué)做不到的。
3.2 語(yǔ)言大數(shù)據(jù)在語(yǔ)言教學(xué)上的應(yīng)用
在語(yǔ)言教學(xué)中,語(yǔ)言大數(shù)據(jù)從宏觀和微觀兩方面都發(fā)揮著重要作用。宏觀上,語(yǔ)言大數(shù)據(jù)能夠更好的利用語(yǔ)言,特別是在英語(yǔ)寫作的過(guò)程中,一般的研究只能夠從理論和技術(shù)層面出發(fā),而數(shù)據(jù)的利用則是從更深層次的角度出發(fā),探討語(yǔ)言數(shù)據(jù)的背后價(jià)值,不斷的發(fā)展和突破,推動(dòng)中華文化宣傳和發(fā)展,促使中華文化在世界范圍內(nèi)廣泛流傳。在微觀上,語(yǔ)言大數(shù)據(jù)有利于增強(qiáng)教師和學(xué)生的信息化融洽意識(shí),更好地促進(jìn)英語(yǔ)核心素養(yǎng)的提升,使英語(yǔ)學(xué)科朝著更加科學(xué)化、現(xiàn)代化的方向邁進(jìn)。在實(shí)際應(yīng)用中,語(yǔ)言大數(shù)據(jù)背景下的語(yǔ)言教學(xué),可以迅速及時(shí)地批改學(xué)生的作文,并對(duì)學(xué)生的英語(yǔ)綜合能力進(jìn)行跟蹤指導(dǎo)和改進(jìn),有利于學(xué)生的自主學(xué)習(xí),更能使師生交流更加順暢。與此同時(shí),大數(shù)據(jù)分析下的語(yǔ)言教學(xué)對(duì)尖子生和英語(yǔ)“學(xué)困生”這兩個(gè)群體的特殊學(xué)生提供了現(xiàn)實(shí)可操作性,使得分類培養(yǎng)和關(guān)注會(huì)更加方便。
在當(dāng)今計(jì)算機(jī)技術(shù)高速發(fā)展下,大數(shù)據(jù)預(yù)測(cè)的準(zhǔn)確性越來(lái)越高,教師對(duì)學(xué)生的評(píng)價(jià)也變得越來(lái)越具體,不在局限于主觀客,而是從大數(shù)據(jù)預(yù)算的角度出發(fā)。例如,在以往的計(jì)算中,由于數(shù)據(jù)量不夠具體,同時(shí)時(shí)間較短、所涉及的范圍也比較小,導(dǎo)致所得結(jié)論的準(zhǔn)確性不高。這使得教師難以作出精準(zhǔn)的評(píng)價(jià),因而他們只會(huì)客觀的參考結(jié)論,而不能將其作為最后的評(píng)價(jià)。
3.3 語(yǔ)言大數(shù)據(jù)在日常生活中的應(yīng)用
大數(shù)據(jù)化實(shí)際上是一種機(jī)器化,因?yàn)榇髷?shù)據(jù)的力量必須借助于機(jī)器才能發(fā)揮實(shí)現(xiàn),而日常生活中最接近機(jī)器的語(yǔ)言研究,就是機(jī)器翻譯系統(tǒng)的開發(fā)和應(yīng)用相信大家都用過(guò)百度或者有道翻譯,也相信會(huì)有大部分人對(duì)這些翻譯機(jī)器的翻譯能力并不是十分滿意。不過(guò),伴隨著大數(shù)據(jù)時(shí)代的來(lái)臨,語(yǔ)言大數(shù)據(jù)在促進(jìn)語(yǔ)言發(fā)展的同時(shí),也能更好地幫助機(jī)器翻譯系統(tǒng)產(chǎn)生更大的進(jìn)步。而拋開機(jī)器這一載體的支持,單純看語(yǔ)言大數(shù)據(jù)這一基于數(shù)據(jù)的語(yǔ)言分析對(duì)日常生活的影響的話,最為顯著的便是語(yǔ)言大數(shù)據(jù)對(duì)出版行業(yè)發(fā)展的影響。在數(shù)字出版的時(shí)代,利用大數(shù)據(jù)技術(shù),借助于多語(yǔ)種情感分析、知識(shí)圖譜等先進(jìn)技術(shù)捕捉全球熱點(diǎn)話題,分析全球出版業(yè)IP動(dòng)態(tài),檢測(cè)全球圖書、作者、出版社的信息,并能預(yù)測(cè)銷售趨勢(shì),對(duì)于出版行業(yè)的選題策劃以及營(yíng)銷評(píng)價(jià)分析等有著重要作用。此外大數(shù)據(jù)技術(shù)的應(yīng)用,將成為出版業(yè)轉(zhuǎn)型升級(jí)的重要工具,對(duì)出版管理、編務(wù)和營(yíng)銷產(chǎn)生深遠(yuǎn)影響。
4 有關(guān)語(yǔ)言大數(shù)據(jù)的余論
本部分包括有關(guān)語(yǔ)言大數(shù)據(jù)在當(dāng)今社會(huì)所產(chǎn)生的效應(yīng)和一些相關(guān)的余論,它所具備的一些特點(diǎn)和帶來(lái)的語(yǔ)言研究新觀。語(yǔ)言學(xué)是一門學(xué)科,但是同時(shí)也是一門科學(xué)。大數(shù)據(jù)的出現(xiàn)和廣泛應(yīng)用使我們體會(huì)到:語(yǔ)言學(xué)研究可以實(shí)現(xiàn)科學(xué)化數(shù)據(jù)化海量精準(zhǔn)化,但前提是采用科學(xué)的方法。顯然,科學(xué)的方法,需要我們付出更多的努力去學(xué)習(xí)與掌握。從長(zhǎng)遠(yuǎn)來(lái)看,對(duì)于語(yǔ)言的學(xué)科我們所要掌握了解的還有很多,那么僅憑我們的人腦和書本知識(shí)是完全不夠的,海量的信息需要我們?nèi)ジ爬偨Y(jié),最全面系統(tǒng)的方式就是借助大數(shù)據(jù)的平臺(tái)。當(dāng)然,離著我們預(yù)期的所能達(dá)到的“語(yǔ)言大數(shù)據(jù)高度成熟化”還有著很大的一段距離,這需要我們新時(shí)代每一個(gè)人的努力,共同用大數(shù)據(jù)與語(yǔ)言學(xué)相結(jié)合的思維去探索提升。語(yǔ)言的歷時(shí)研究對(duì)探究語(yǔ)言及其結(jié)構(gòu)的演變趨勢(shì)和機(jī)制有著重要的價(jià)值;語(yǔ)言的歷時(shí)研究對(duì)各個(gè)階段語(yǔ)料的分布、數(shù)量及其分析處理手段有著特定的要求。在計(jì)算機(jī)技術(shù)高速發(fā)展下,促使大數(shù)據(jù)蓬勃發(fā)展。語(yǔ)言數(shù)據(jù)的搜索、獲得、儲(chǔ)存變得越來(lái)越簡(jiǎn)單、方便?;诖髷?shù)據(jù)基礎(chǔ),促使語(yǔ)言研究探索更加清晰、具體,朝著語(yǔ)言的結(jié)構(gòu)、形態(tài)、語(yǔ)音乃至文化等方面發(fā)展,為語(yǔ)言研究打下來(lái)堅(jiān)持的基礎(chǔ),從而能夠朝著更層次的方向發(fā)展[3]。
5 結(jié)語(yǔ)
通過(guò)本文之前的分析,對(duì)于如何認(rèn)識(shí)和理解語(yǔ)言大數(shù)據(jù)、如何運(yùn)用語(yǔ)言大數(shù)據(jù)以及語(yǔ)言大數(shù)據(jù)所帶來(lái)的影響,想必我們對(duì)這一個(gè)新型概念已經(jīng)有了大致的理解。
綜上所述,大數(shù)據(jù)時(shí)代是一個(gè)需要每一個(gè)語(yǔ)言教育者和學(xué)習(xí)者不斷學(xué)習(xí)不斷完善對(duì)世界認(rèn)知的時(shí)代。語(yǔ)言大數(shù)據(jù)不僅僅是一個(gè)簡(jiǎn)單的將互聯(lián)網(wǎng)和語(yǔ)言學(xué)做加法的概念,而是一個(gè)大數(shù)據(jù)滲入語(yǔ)言學(xué)習(xí)研究,語(yǔ)言的進(jìn)步同時(shí)可以為大數(shù)據(jù)注入新的活力的復(fù)雜而有發(fā)展意義的概念。在大數(shù)據(jù)視野下,語(yǔ)言學(xué)研究將在更大范圍和規(guī)模上使用語(yǔ)言大數(shù)據(jù)進(jìn)行實(shí)證研究,由過(guò)去尋找語(yǔ)言事實(shí)背后的因果關(guān)系轉(zhuǎn)向追尋語(yǔ)言事實(shí)之間的相關(guān)關(guān)系。大數(shù)據(jù)對(duì)語(yǔ)言研究具有獨(dú)特的價(jià)值。我堅(jiān)信,隨著互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,我們語(yǔ)言大數(shù)據(jù)這一學(xué)科將會(huì)不斷地查漏補(bǔ)缺,為時(shí)代注入新的生機(jī)與活力。
參考文獻(xiàn)
[1] 張平,彭海燕.大數(shù)據(jù)時(shí)代的漢語(yǔ)研究應(yīng)對(duì)[J].求索,2015(3):139-142.
[2] 李華勇.大數(shù)據(jù)視野下的語(yǔ)言研究新觀[J].重慶交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2015(4):134-137.
[3] 李華勇.論語(yǔ)料庫(kù)語(yǔ)言學(xué)的學(xué)科地位[J].重慶理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)),2014(7):119-124.