石立國 李 娥(武昌工學院 湖北 武漢 430065)
VOICE語料庫中隱性同意用語的調(diào)查研究
石立國李娥(武昌工學院湖北武漢430065)
作為一種全新研究方法,語料庫語言學開辟了一個新的研究領域,它的數(shù)據(jù)有別于以往研究中采用的直覺數(shù)據(jù),而是對實際使用的語言事實進行定性定量的描寫和概括,使研究更科學和準確。本文以VOICE語料庫為研究對象,數(shù)據(jù)統(tǒng)計語料庫的構(gòu)成和數(shù)據(jù)庫中的同意用語的收錄情況,提取出同意用語和隱性同意用語的全部數(shù)據(jù)并加以分類。
語料庫VOICE隱性同意用語
語料庫(corpus)即存放語言材料的倉庫或數(shù)據(jù)庫。這一術(shù)語常被語言學家用于描述大量的可用于語言研究的自然出現(xiàn)的語言數(shù)據(jù)。構(gòu)成數(shù)據(jù)庫的樣本可以是書面語也可以是口語,或是兩者相結(jié)合。語料庫語言學在20世紀50年代喬姆斯基(Chomsky)主義以前就誕生了,Boas和隨后的許多結(jié)構(gòu)主義語言學家從事過基于語料庫的科學研究。隨著計算機科技和網(wǎng)絡技術(shù)的發(fā)展和應用,基于網(wǎng)絡的電子數(shù)據(jù)語料庫開始蓬勃發(fā)展起來,由于計算機具有無可比擬的儲存和檢索能力,開始出現(xiàn)了超大規(guī)模的網(wǎng)絡語料庫,詞庫收錄高達一億詞次,同時各種詞庫檢索軟件也相繼出現(xiàn),供使用者更好地利用數(shù)據(jù)庫開展相關(guān)學術(shù)研究。
1996年,為了慶賀語料庫語言學的主要奠基人和倡導者里奇(Leech)六十誕辰,托馬斯(Thomas)等人啟動編纂關(guān)于語料庫語言學的研究論文集時說,“語料庫語言學已經(jīng)成為語言研究的主流?;谡Z料庫的研究不再是計算機專家的獨有領域,它正在對語言研究的許多領域產(chǎn)生愈來愈大的影響”。近年來,有關(guān)語料庫語言學的相關(guān)研究在逐年增加。
以喬姆斯基轉(zhuǎn)換生成語法的起始為節(jié)點,可將語料庫語言學的發(fā)展分為三個階段,即早期階段(20世紀50年代中期以前)、喬姆斯基的轉(zhuǎn)換生成語法階段(20世紀50年代中-70年代)和復蘇階段(20世紀80年代以后)。早期的語料庫語言學被廣泛應用于研究語言習得、方言、語義、句法和音系研究。喬姆斯基的《句法理論》(1957)及隨后的一系列研究成果的發(fā)表從根本上革新了語料庫語言學的早期研究狀況,完全否定了當時以笛卡爾經(jīng)驗主義為基礎建立的數(shù)據(jù)庫。20世紀80年代以來,語料庫語言學在相對沉寂了近20年后,開始復蘇,并得到迅速發(fā)展。表1為國外語料庫的發(fā)展狀況。
表1
筆者選取了2006-2015年發(fā)表在國內(nèi)10種外語類核心期刊上的關(guān)于語料庫的科研文章共366篇,這些期刊具有權(quán)威性、前沿性,研究成果能夠代表國內(nèi)外語界對語料庫的研究現(xiàn)狀。參考Biber(2000)和Kennedy(2000)提出的兩種分類方法,結(jié)合國內(nèi)研究的實際,將研究領域分為五大類:詞匯、語法、語篇、語用與話語分析和語域變異。以“語料庫”和上述五種分類為關(guān)鍵詞在中國知網(wǎng)上進行檢索,結(jié)果見表2。
表2
相比較李偉霞、宋岳禮(2010)針對上述期刊(1999-2009)所統(tǒng)計出的174篇文章來看,國內(nèi)關(guān)于語料庫的研究已經(jīng)有了長足的發(fā)展。對于語料庫在詞匯方面的應用研究仍是重點,這與現(xiàn)代計算機網(wǎng)絡技術(shù)的發(fā)展密切相關(guān),緊隨其后的是針對語法和語篇的研究,針對語用和語域變異的研究相對較少。因此,本文以不斷更新中的VOICE語料庫為研究對象,調(diào)查語用及話語分析中的同意用語。
VOICE(Vienna-OxfordInternationalCorpus ofEnglish)語料庫由奧地利維也納大學英語及應用語言學教授BarbaraSeidlhofer創(chuàng)立,該語料庫記錄了以英語為母語的使用者之間的自然、非腳本的面對面語言活動,致力于提供一個語言學平臺將英語作為混合語。于2013年1月更新的VOICE2.0版本容量達到1,023,196詞次,可以通過登錄網(wǎng)址http://www.univie.ac.at/voice/,免費使用,該語料庫還在不斷更新豐富中。
本文所選VOICE語料庫的數(shù)據(jù)來自五個語音類型。他們分別是交談(con)、討論(wsd)、會議(mtg)、小組討論(wgd))和專題討論(sed)。在這些語音類型中,交談類詞條有11,435個,討論類詞條有8991個,會議22,113個,小組討論5,621個,專題討論4,173個,共計52,333個詞條,分別來自14個語音文檔,語音錄音總時長為5小時20分11秒。
表3
我們對VOICE的5個子語料庫中的同意用語進行數(shù)據(jù)采集,并分別篩選出同意用語和隱性同意用語。表3中列出所選擇的14個語音文檔中的同意用語和隱性同意用語的詞頻。括號中的數(shù)字為隱性同意用語詞頻。
從表3中我們發(fā)現(xiàn),yeah作為同意用語和隱性同意用語共出現(xiàn)913次,其中可以確認為是同意用語的復現(xiàn)次數(shù)為439次,而且可以確定,Yeah在交談中出現(xiàn)頻率最高,很明顯yeah是最常見的表達贊同的用語。此外,排名前4的同意用語分別是:yeah,yes,right,exactly。
通過以上分析可以看出,國內(nèi)關(guān)于基于語料庫的研究已經(jīng)取得了很大的發(fā)展,但是對于話語分析還有待深入研究。對于母語為漢語的英語學習者而言,學習者接觸最多的就是各類英語教材,因此教材編寫的質(zhì)量,教材中的素材能否反映出以英語為母語的國家的人們在實際生活、工作和學習中使用英語的狀況就顯得十分重要。本文針對VOICE數(shù)據(jù)庫中同意用語和隱性同意用語的調(diào)查結(jié)果可為教材編寫者在編寫、修訂和完善教材時作參考,真正讓學生成為研究的受益者。
【責任編輯:桂靜】
[1]BiberD,ConradS&ReppenR.CorpusLinguistics:InvestigatingLanguageStructureandUse[M].北京:外語教學與研究出版社,2000.
[2]‘CorpusDescription’.TheVienna-OxfordInternationalCorpusofEnglish,accessedon10April2011,http://www.univie.ac.at/ voice/page/corpus_description
[3]KennedyG.AnIntroductiontoCorpusLinguistics[M].北京:外語教學與研究出版社,2000.
[4]何中清,彭宣維.英語語料庫研究綜述:回顧、現(xiàn)狀與展望[J].外語教學,2011(1).
[5]李偉霞,宋岳禮.近十年國內(nèi)外語語料庫實證研究回顧與思考[J].中國電力教育,2010(35).
[6]梁燕,馮友,程良坤.近十年我國語料庫實證研究綜述[J].解放軍外國語學院學報,2004(6).
【中國分類號】G64A
1008-8784(2016)03-100-3
2016-03-20
本文系湖北省教育科學“十二五”規(guī)劃課題2013年度立項課題“基于Voice語料庫的大學英語教材中同意用語研究”(項目編號:2013B208)的研究成果。
石立國(1984—),男,江蘇邳州人,武昌工學院講師,研究方向:跨文化交際、英語教學法;李娥(1982—),女,湖南岳陽人,碩士,武昌工學院外國語學院講師,研究方向:英語教育、英美文學。