李華勇
(四川文理學(xué)院外國(guó)語(yǔ)學(xué)院,四川達(dá)州 635000)
GloWbE語(yǔ)料庫(kù) (the Corpus of Global Web-Based English)是一個(gè)由來(lái)自20個(gè)國(guó)家的180萬(wàn)個(gè)網(wǎng)頁(yè)收集到的19億詞組成的英語(yǔ)語(yǔ)料庫(kù),由美國(guó)楊百翰大學(xué)的Mark Davies教授創(chuàng)建,并于2013年4月在國(guó)際互聯(lián)網(wǎng)上發(fā)布供語(yǔ)言研究者免費(fèi)使用。GloWbE語(yǔ)料庫(kù)的庫(kù)容是COCA的4倍、BNC的20倍。大庫(kù)容GloWbE語(yǔ)料庫(kù)的好處在于能夠檢索到更多數(shù)量的低頻字符串的形符(Token)數(shù),理論上而言,一個(gè)字符串的形符數(shù)量在BNC如果只有10~12次的話,在COCA有50~60次,那么在19億詞的GloWbE中就有250~300次,這些更多數(shù)量的低頻字符串的形符數(shù)能更全面地反映出它們的詳細(xì)變化規(guī)律和過(guò)程。GloWbE最主要的功能是能觀察到任何一個(gè)詞、短語(yǔ)或語(yǔ)法結(jié)構(gòu)在20個(gè)不同英語(yǔ)方言區(qū)國(guó)家的頻率分布情況,同時(shí)也可以比較任何兩組方言變體在不同國(guó)家的變化情況,還可以將檢索范圍限定在20個(gè)英語(yǔ)方言國(guó)家所在的一個(gè)或幾個(gè)國(guó)家范圍之內(nèi)。
GloWbE語(yǔ)料庫(kù)里的語(yǔ)料根據(jù)建設(shè)要求按不同比例選自不同的網(wǎng)站和博客頁(yè)面,同時(shí)采用不同的技術(shù)手段進(jìn)行詳細(xì)處理以盡量減少重復(fù)文本(duplicate texts),因此其收集到的語(yǔ)料基本能真實(shí)反映出所在國(guó)的英語(yǔ)方言實(shí)際使用狀況。
方言是語(yǔ)言的一種變體,一個(gè)國(guó)家的某個(gè)地區(qū)使用或特定階級(jí)的人使用,在有些單詞、語(yǔ)法及發(fā)音上不同于同一形式的其他語(yǔ)言[1]。英語(yǔ)方言(English dialects)是英語(yǔ)語(yǔ)言的一種變體,它在發(fā)音、詞匯、語(yǔ)法方面與標(biāo)準(zhǔn)英語(yǔ)(Standard English)有所不同;語(yǔ)言學(xué)家將世界范圍內(nèi)使用的英語(yǔ)劃分成6大英語(yǔ)方言區(qū):歐洲方言區(qū)(英國(guó)),北美方言區(qū)(美國(guó)、加拿大),大洋洲方言區(qū)(澳大利亞、新西蘭),拉丁美洲方言區(qū)(圭亞那、伯利茲城),亞洲方言區(qū)(新加坡、菲律賓)和非洲方言區(qū)(南非)。①http://en.wikipedia.org/wiki/List_of_dialects_of_the_English_language這六大方言區(qū)使用的英語(yǔ)在發(fā)音、詞匯、語(yǔ)法上各有區(qū)別,有自己的特點(diǎn)和存在相應(yīng)的變體,對(duì)這些特點(diǎn)和變體的研究,能進(jìn)一步了解英語(yǔ)在這些地區(qū)的變化特征和使用規(guī)律。以前對(duì)英語(yǔ)方言變體的比較研究主要限于美國(guó)和英國(guó)兩個(gè)主要方言區(qū)進(jìn)行,這些研究既有內(nèi)省式的理論探討也有基于語(yǔ)料庫(kù)的實(shí)證研究,但是,要想同時(shí)對(duì)世界上幾十個(gè)說(shuō)英語(yǔ)的國(guó)家的英語(yǔ)方言進(jìn)行基于各自真實(shí)語(yǔ)料的詳細(xì)比較和研究,在GloWbE發(fā)布以前幾乎是不可能完成的任務(wù)。下面就以具體的例子來(lái)詳細(xì)說(shuō)明GloWbE對(duì)這20個(gè)國(guó)家英語(yǔ)方言中的詞匯、短語(yǔ)、語(yǔ)法、語(yǔ)義和文化比較研究的作用。
由于GloWbE語(yǔ)料庫(kù)所收集的語(yǔ)料是來(lái)自20個(gè)主要說(shuō)英語(yǔ)的方言區(qū)國(guó)家,并且這些語(yǔ)料是按比例均衡分布在語(yǔ)料庫(kù)中的,因此,從檢索GloWbE得到的特定詞匯可以看出其在這20個(gè)國(guó)家的頻率分布情況,從而為觀察該特定詞匯在這20個(gè)方言區(qū)的使用情況提供詳細(xì)語(yǔ)料支持,避免內(nèi)省式研究所得出的不適合的結(jié)論。我們以詞fortnight為例,它在《牛津高階英漢雙解詞典(第七版)》中被解釋成:“(BrE)two weeks 兩星期”[2]803。從其中的說(shuō)明“(BrE)”可以看出該詞典認(rèn)為fortnight是一個(gè)主要在英國(guó)英語(yǔ)中使用的詞匯,而較少使用在美國(guó)英語(yǔ)(AmE)中。我們?cè)贕loWbE檢索界面的入口WORD(S)處輸入被檢索詞“fortnight”,顯示方式(DISPLAY)選圖標(biāo)(CHART),檢索范圍選忽略(Igore)即默認(rèn)這20個(gè)國(guó)家。然后運(yùn)行檢索引擎,檢索結(jié)果如圖1所示。
圖1 fortnight在GloWbE中20個(gè)英語(yǔ)方言國(guó)中的使用頻率分布情況
圖1中的第一行,是這個(gè)20個(gè)國(guó)家名字的縮寫(xiě),第二行是該詞在語(yǔ)料庫(kù)所在國(guó)子庫(kù)中出現(xiàn)的總頻數(shù),第三行是該詞經(jīng)過(guò)標(biāo)準(zhǔn)化處理的對(duì)應(yīng)的每百萬(wàn)詞的頻率(/MIL),第四行是第三行數(shù)據(jù)的圖標(biāo)化顯示,后面類(lèi)似表格含義與此相同。由圖1可見(jiàn),fortnight一詞在澳大利亞(AU)使用的頻率最高達(dá)9.73/MIL,排在第二和第三的分別是愛(ài)爾蘭(Ireland)7.76/MIL 和英國(guó)(GB)7.48/MIL,使用頻率最低的兩個(gè)方言區(qū)國(guó)家分別是美國(guó)(US)0.85/MIL和加拿大(CA)0.63/MIL。這一檢索結(jié)果與《牛津高階英漢雙解詞典(第七版)》把fortnight標(biāo)注成主要是在英國(guó)英語(yǔ)中使用有一定出入:如果主要在英國(guó)英語(yǔ)中使用的結(jié)論是與美國(guó)英語(yǔ)相對(duì)而言,是對(duì)的;但如果是與20多個(gè)主要英語(yǔ)方言使用國(guó)而言則是錯(cuò)的。因而,詞典對(duì)該詞條使用的范圍最好表述為“主要使用在澳大利亞英語(yǔ)和英國(guó)英語(yǔ)中,很少使用在美國(guó)英語(yǔ)中”,才符合fortnight的實(shí)際使用情況。
GloWbE可以對(duì)短語(yǔ)進(jìn)行檢索對(duì)比研究。例如,我們?cè)贕loWbE的檢索入口WORD(S)處輸入“on holiday”這一短語(yǔ),顯示方式選圖標(biāo),檢索范圍選忽略即默認(rèn)這20個(gè)國(guó)家。然后運(yùn)用檢索引擎,檢索結(jié)果如圖2所示。
圖2 on holiday在GloWbE中20個(gè)英語(yǔ)方言國(guó)中的使用頻率分布情況
從圖2可以看出,on holiday這一短語(yǔ)在英國(guó)英語(yǔ)和南非(ZA)英語(yǔ)中的使用頻率最高,分別為為 12.21/MIL 和 7.12/MIL,使用頻率最低的兩個(gè)國(guó)家是美國(guó)和加拿大,分別為0.99/MIL和1.32/MIL?!杜=蚋唠A英漢雙解詞典(第七版)》指出“holiday一詞是英式英語(yǔ),很少使用在美國(guó)英語(yǔ)中”[2]796,從這一說(shuō)明可以推理出 on holiday 這一短語(yǔ)也主要使用在英式英語(yǔ)中,很少使用在美式英語(yǔ)中。但是,經(jīng)過(guò)對(duì)GloWbE檢索后發(fā)現(xiàn),on holiday不僅在英式英語(yǔ)中使用頻率最高,在南非(ZA)和愛(ài)爾蘭(IE)中的頻率也相當(dāng)高,分別達(dá)7.12/MIL和6.89/MIL??梢?jiàn),《牛津高階英漢雙解詞典(第七版)》對(duì)on holiday使用范圍的表述是不準(zhǔn)確的:on holiday在美式英語(yǔ)中使用得極少這是事實(shí),但是其不僅在英式英語(yǔ)中使用得相當(dāng)多,在南非英語(yǔ)和愛(ài)爾蘭英語(yǔ)中的使用也相當(dāng)頻繁。
同理,我們對(duì)on holiday的對(duì)應(yīng)短語(yǔ)on vacation在GloWbe里也進(jìn)行了類(lèi)似的檢索,結(jié)果如圖3所示。
圖3 on vacation在GloWbE中20個(gè)英語(yǔ)方言區(qū)中的使用頻率分布情況
由圖3可見(jiàn),on vacation使用頻率最高的應(yīng)該是拉丁美洲的牙買(mǎi)加(JM),其次是加拿大(CA),再次才是美國(guó)(US)。在英國(guó)使用得比較少,僅1.26/MIL。因此,我們不能認(rèn)可《牛津高階英漢雙解詞典(第七版)》“on vacation,是美式英語(yǔ),很少在英國(guó)英語(yǔ)中使用”的表述。
GloWbE可以對(duì)英語(yǔ)相關(guān)句法/語(yǔ)法結(jié)構(gòu)進(jìn)行檢索對(duì)比和研究。比如我們想要觀察英語(yǔ)stop+someone+V-ing這一句法結(jié)構(gòu)在20個(gè)英語(yǔ)方言區(qū)國(guó)家的使用頻率的分布情況,只要在GloWbE中的檢索入口 WORD(S)處輸入[stop][p*][v?g*],顯示方式選圖標(biāo),檢索范圍選忽略即默認(rèn)這20個(gè)國(guó)家。然后運(yùn)行檢索引擎,檢索結(jié)果如圖4所示。
圖4:stop+someone+V-ing在GloWbE中的使用頻率分布情況
由圖4可以看出,stop+someone+V-ing這一句法結(jié)構(gòu)在英國(guó)(GB)英語(yǔ)中使用頻率最高,達(dá)11.45/MIL,其次主要使用在愛(ài)爾蘭(IE)、澳大利亞(AU)和新西蘭(NZ)這3個(gè)英語(yǔ)方言國(guó),在美國(guó)和加拿大英語(yǔ)中使用的頻率很低,分別為1.16/MIL和0.65/MIL。實(shí)際上 stop+someone+V-ing這一句法結(jié)構(gòu)是由stop+someone+from+V-ing結(jié)構(gòu)省略了其中的介詞from得到。對(duì)這一句法結(jié)構(gòu)中的from能不能省略,相關(guān)語(yǔ)法書(shū)明確指出from可以省略,并且語(yǔ)義和用法沒(méi)有什么差別,比如在《英語(yǔ)常見(jiàn)問(wèn)題解答大詞典》中就說(shuō)“現(xiàn)代語(yǔ)言學(xué)家們認(rèn)為stop sb.doing與stop sb.from doing兩個(gè)結(jié)構(gòu)意思是相同的,其中的from是可有可無(wú)的”[3]。事實(shí)果真如此嗎?我們用同樣的方法在GloWbE中檢索輸入WORD(S)輸入[stop][p*]from[v?g*]這一檢索語(yǔ)法,得到stop+someone+from+V-ing這一句法結(jié)構(gòu)在GloWbE中的使用頻率分布情況,如圖5。
圖5 stop+someone+from+V-ing在GloWbE中的使用頻率分布情況
由圖5可見(jiàn),stop+someone+from+V-ing這一句法結(jié)構(gòu)在英國(guó)(GB)、愛(ài)爾蘭(IE)、澳大利亞(AU)和新西蘭(NZ)的使用頻率差異不大,波動(dòng)范圍在5.67/MIL~8.56/MIL。這與圖4反映的stop+someone+V-ing主要使用在英國(guó)(GB)英語(yǔ)方言中形成了鮮明的對(duì)比。因此,從在20個(gè)英語(yǔ)方言區(qū)使用頻率來(lái)講,這兩個(gè)結(jié)構(gòu)中的from省略與否是有所區(qū)別的:省略from的使用情況主要是在英國(guó)英語(yǔ)方言中,頻率達(dá)到11.45/MIL,在愛(ài)爾蘭、澳大利亞和新西蘭英語(yǔ)方言國(guó)中使用頻率約在6/MIL左右,在其他的方言國(guó)中使用頻率很低;而不省略from的情況,在英國(guó)(GB)、愛(ài)爾蘭(IE)、澳大利亞(AU)和新西蘭(NZ)使用頻率相差不大。我們認(rèn)為相關(guān)英語(yǔ)語(yǔ)法書(shū)在對(duì)這兩個(gè)結(jié)構(gòu)進(jìn)行比較和解釋時(shí),最好能將其在不同方言區(qū)使用頻率情況的差異告訴學(xué)習(xí)者,以利于學(xué)習(xí)者認(rèn)識(shí)這兩個(gè)句法結(jié)構(gòu)在不同方言中的使用差異。
GloWbE可以對(duì)英語(yǔ)方言中語(yǔ)義進(jìn)行相關(guān)對(duì)比和研究。通過(guò)語(yǔ)料庫(kù)觀察詞的語(yǔ)義差異的傳統(tǒng)方法是通過(guò)檢索該詞的所有形符(token)或隨機(jī)抽樣(randomized)形符,然后研究其用法模式以考察其語(yǔ)意差異,耗時(shí)費(fèi)力[4]。但是如果使用架構(gòu)合理的語(yǔ)料庫(kù),就能簡(jiǎn)明和快速實(shí)現(xiàn)對(duì)詞語(yǔ)語(yǔ)義差異的考察。語(yǔ)料庫(kù)語(yǔ)言學(xué)中的一個(gè)核心觀念是“我們可以通過(guò)一個(gè)詞的伴隨詞知其語(yǔ)義”[5]。如果我們檢索找到一個(gè)詞的所有搭配(collocates)的歷史變化情況,這些搭配就能表明其語(yǔ)義的歷史變化情況。我們?cè)贕loWbE中的檢索入口WORD(S)處輸入[trunk].[nn* ],同時(shí)雙擊打開(kāi)搭配選框 (COLLOCATES),在里面輸入[nn*]和限定范圍為前后4個(gè)詞,顯示方式選列表(LIST),檢索范圍選United States和Great Britain,這樣就能檢索到美式英語(yǔ)和英式英語(yǔ)方言中所有與trunk搭配并與結(jié)點(diǎn)詞相距4個(gè)詞之內(nèi)的相關(guān)名詞,檢索結(jié)果如表1所示。
由表1可見(jiàn),在美國(guó)英語(yǔ)中,與trunk搭配最多的名詞是club、release和cars等8個(gè)詞,進(jìn)一步觀察這8個(gè)詞所在的語(yǔ)境(KWIC),可以得出trunk在這8個(gè)搭配中的語(yǔ)義是“汽車(chē)”或“汽車(chē)后備箱”;而在英國(guó)英語(yǔ)中,與trunk搭配最多的是roads、rotation和strength等8個(gè)詞,進(jìn)一步觀察這8個(gè)詞所在的語(yǔ)境,可以得出trunk在這8個(gè)搭配中的語(yǔ)義是“(公路)主干道”。由此可見(jiàn),同一個(gè)詞trunk在英國(guó)英語(yǔ)和美國(guó)英語(yǔ)這兩個(gè)方言區(qū)中的語(yǔ)義是有很大差異的。
表1 在美國(guó)英語(yǔ)方言和英國(guó)英語(yǔ)方言中,與trunk搭配的名詞對(duì)比
GloWbE還可以對(duì)這20個(gè)英語(yǔ)方言國(guó)家中的英語(yǔ)方言進(jìn)行文化方面的比較研究。一個(gè)國(guó)家的語(yǔ)言是該國(guó)文化的反映,因此,通過(guò)觀察一個(gè)國(guó)家的語(yǔ)言中的詞匯、搭配和表達(dá)方式就可以考察該國(guó)的特定文化現(xiàn)象、宗教信仰和國(guó)民的文化觀念等。GloWbE提供的這20個(gè)英語(yǔ)方言區(qū)國(guó)家,雖然英語(yǔ)是它們最主要的交流語(yǔ)言,但是它們使用的英語(yǔ)方言是有差異的,通過(guò)對(duì)它們使用的英語(yǔ)方言進(jìn)行相關(guān)檢索,可以發(fā)現(xiàn)這些國(guó)家在文化現(xiàn)象、宗教信仰和文化觀念方面的差異??梢?jiàn),GloWbE實(shí)現(xiàn)了由單獨(dú)對(duì)英語(yǔ)詞匯、短語(yǔ)、句法和語(yǔ)義的研究拓展到語(yǔ)篇和文化方面的研究,還實(shí)現(xiàn)了同時(shí)對(duì)這20個(gè)英語(yǔ)方言區(qū)國(guó)家的文化現(xiàn)象、文化觀念的對(duì)比,這是BNC、ANC、COCA和COHA等語(yǔ)料庫(kù)不能現(xiàn)實(shí)的,因?yàn)檫@些語(yǔ)料庫(kù)只以英式英語(yǔ)或美式英語(yǔ)為語(yǔ)料來(lái)源。在GloWbE中的檢索入口 WORD(S)處輸入[sex].[nn* ],同時(shí)雙擊打開(kāi)搭配選框,在里面輸入[j*]和限定范圍為前后4個(gè)詞,顯示方式選列表,檢索范圍Section A選 the United States、Great Britain 和 Canadian,檢索范圍Section B選 India、Pakistan和 Malaysia,分類(lèi)方式(Sorting)選然“頻率”(Frequency),后運(yùn)行搜索引擎后得到結(jié)果如表2。
表2 與sex搭配的形容詞在核心英語(yǔ)方言區(qū)與非核心方言區(qū)的差異① 運(yùn)行搜索引擎得到的結(jié)果,在GloWbE中真實(shí)的顯示方式是以列表的形式分左右兩大欄,每欄表格中包括與sex搭配最緊密、最常見(jiàn)的形容詞按Ration順序大小排列,共計(jì)各100個(gè);表中還分別顯示了這些形容詞在“美國(guó)/英國(guó)/加拿大”和“印度/巴基斯坦/馬來(lái)西亞”的形符頻數(shù)Token 1和Token2,以及它們對(duì)應(yīng)的標(biāo)準(zhǔn)化頻率PM1和PM2。限于篇幅,在表2中只列舉了兩類(lèi)方言區(qū)中與sex搭配最頻繁的前8個(gè)詞。
由表2可見(jiàn),在美國(guó)、英國(guó)和加拿大這些西方發(fā)達(dá)國(guó)家(即本文所說(shuō)的英語(yǔ)核心方言區(qū)),國(guó)民對(duì)性(sex)的態(tài)度與非核心方言區(qū)的國(guó)民對(duì)性的態(tài)度差異很大,如同性性交(gay sex)和隨意性關(guān)系(casual sexual)等,這些搭配方式反映出西方核心英語(yǔ)方言區(qū)國(guó)民對(duì)性的開(kāi)放程度和對(duì)非正常性交的接受程度。核心方言區(qū)這種獨(dú)特的性觀念和文化與20世紀(jì)60年代“性解放思潮”在美國(guó)風(fēng)行并擴(kuò)散到西方其他發(fā)達(dá)國(guó)家有密切的關(guān)系。性解放思潮是一種要求性行為絕對(duì)自由的資產(chǎn)階級(jí)思潮,②http://baike.baidu.com/view/1977647.htm否認(rèn)兩性關(guān)系的社會(huì)性,把肉體感官特別是性感官的快樂(lè)視為人生最大的快樂(lè)和幸福,視為自我解放和謀求幸福的唯一途徑。從倫理學(xué)上看,性解放思潮是極端利己主義和自由化在兩性關(guān)系方面的非道德化的表現(xiàn),其核心是享樂(lè)主義。而在印度、巴基斯坦和馬來(lái)西亞(即英語(yǔ)非核心方言區(qū)),從非法性交(illicit sex)、雙方同意條件下的性交(consensual sex)和美好的性(good sex)等的搭配可以看出他們對(duì)性的態(tài)度和觀念仍然比較傳統(tǒng),把性看成是一種男女雙方神圣的、私密的事。盡管在非核心方言區(qū)也出現(xiàn)了諸如“anal sex”之類(lèi)的搭配,但是這樣的搭配使用頻率是排在后面的,是居次要位置的,這可能是受西方性解放觀念和現(xiàn)在網(wǎng)絡(luò)媒體宣傳的影響,西方的一些開(kāi)放的性觀念逐漸向這些非核心英語(yǔ)方言區(qū)滲透的結(jié)果。盡管在核心方言區(qū)和非核心方言區(qū)人們對(duì)性的觀念存在著很大的差異,但是也有共同的東西:美好的性(great sex),這是人類(lèi)共享的認(rèn)知——性是美好的、令人愉悅的和給人帶來(lái)享受的??梢?jiàn),通過(guò)在GloWbE中對(duì)與sex搭配的形容詞的檢索,可以幫助人們從語(yǔ)言層面來(lái)觀察和認(rèn)識(shí)不同方言區(qū)的國(guó)民對(duì)性等相關(guān)文化觀念的差異,從而為從語(yǔ)料庫(kù)角度來(lái)研究文化現(xiàn)象打開(kāi)了一個(gè)新的窗口。
GloWbE語(yǔ)料庫(kù)的建立為英語(yǔ)方言變體的全面比較研究提供了新的工具和視角,實(shí)現(xiàn)了基于真實(shí)語(yǔ)料對(duì)英語(yǔ)變體從詞匯、短語(yǔ)、句法、語(yǔ)義到語(yǔ)言文化的各層面的跨國(guó)和跨區(qū)域比較研究。由于GloWbE語(yǔ)料庫(kù)中的語(yǔ)料基本真實(shí)地反映了這20個(gè)英語(yǔ)方言國(guó)家的語(yǔ)言實(shí)際使用情況,因此,基于GlowWbE的實(shí)證研究得出的結(jié)論能夠反映這20個(gè)國(guó)家的英語(yǔ)方言使用的實(shí)際情況和變化規(guī)律,比內(nèi)省式研究得出的結(jié)論更可靠,更符合語(yǔ)言變體使用的實(shí)際情況。
[1] [英]理查茲.語(yǔ)言教學(xué)及應(yīng)用語(yǔ)言學(xué)辭典[M].北京:外語(yǔ)教學(xué)與研究出版社,2002:133.
[2] Hornby A S.牛津高階英漢雙解詞典[M].7版.北京:商務(wù)印書(shū)館,2009:803.
[3] 趙振才.英語(yǔ)常見(jiàn)問(wèn)題解答大詞典[M].哈爾濱:黑龍江人民出版社,1999:1098.
[4] Davies,M.Expanding horizons in historical linguistics with the 400-million word Corpus of Historical American English[J].Corpora,2012(2):121 -157.
[5] Firth J R.Papers in Linguistics 1934-1951[M].Oxford:Oxford University Press,1957:179.