胡玉秀
【摘要】雖然語法檢錯研究和應用已經(jīng)取得了一定的成果,但是目前的檢錯系統(tǒng)缺乏通用性,查錯能力也并不理想。文章通過語言學理論優(yōu)選論詞匯功能語法(OT-LFG)對中國英語學習者的英語冠詞習得過程進行分析解釋,利用OT-LFG理論框架中的評估器過濾機制為語法檢錯和修改提供理論支持及實踐基礎(chǔ)。
【關(guān)鍵詞】優(yōu)選論;詞匯功能語法;語法檢錯
一、引言
優(yōu)選論最初誕生于音系學領(lǐng)域,由音系學家A.Prince和認知科學家P.Smolensky于20世紀90年代初提出,并通過在應用中發(fā)現(xiàn)問題和解決問題不斷發(fā)展和完善,已經(jīng)拓展到幾乎所有的語言學領(lǐng)域,但優(yōu)選論在計算機句法學方面的介紹和研究成果還很少。因此,利用優(yōu)選論詞匯功能語法理論來研究其在英語語法錯誤檢測及修改上的應用不僅可以推動和拓展優(yōu)選論的發(fā)展及應用,幫助我們更深入地了解人類語言機制(language faculty,即人類是如何獲得語言知識系統(tǒng)的),而且將成為自然語言處理研究的理論支持和實踐基礎(chǔ),為自然語言處理研究和發(fā)展做出貢獻。
二、語法檢錯及優(yōu)選論的理論可行性
(一)語法檢錯
目前語法檢測已成為普通大眾應用最為普遍的自然語言處理技術(shù)之一,然而相關(guān)的研究卻相對貧乏。國內(nèi)相關(guān)的研究也不多見。Clement, Gerdes & Marlet(2011)分析這其中主要有兩個原因: 實際應用和語言學研究主導方向。首先,語法檢錯系統(tǒng)通常局限于某種語言,因此應用的通用性非常差;其次,一個更加深層次的原因是語言學作為一門語言科學,主要致力于自身學科的發(fā)展,少數(shù)的跨學科語言學如社會語言學、心理語言學以及外語教學也只是間接地對語法錯誤檢測有些研究。
另外,目前的自動檢測系統(tǒng)如微軟公司的Word系統(tǒng)只能進行單詞的拼寫檢查,以及相鄰單詞之間簡單關(guān)系的分析和檢查,而對于那些需要深入分析才能識別的錯誤無能為力。即使是目前開發(fā)的專門用于輔助寫作的系統(tǒng)如Whitesmoke, Grammarly, Ginger,也只能進行主要語法錯誤的簡單查錯和修改,對于那些需要考慮語義上下文關(guān)系的語法錯誤則不能全部識別。
(二)優(yōu)選論
優(yōu)選論的根本思想是,各語言間的不同根本原因是普遍性制約條件不同等級排列的結(jié)果。這些制約條件普遍存在于所有語言中,并且是可違反的(Kuhn, 2003: ix)。圖1清楚地展示了優(yōu)選論下語言的共性(Language Universality)和類型變化的特性(Language Variability)(Lam, 2004)。
在圖1中,制約條件A,B,C,D,E普遍存在于所有語言中,而這五個制約條件的不同排列產(chǎn)生了X語言和Y語言。因此,學習一種語言實際上是學習制約條件在目標語言中的排列。
(三)優(yōu)選論句語法
優(yōu)選論句法學,即優(yōu)選論詞匯功能語法(OT-LFG),是優(yōu)選論(OT)和詞匯功能語法(LFG)的結(jié)合體。LFG強調(diào)語法功能比如主語、謂語、賓語等和詞匯在語法中的核心地位,并且提出語言當中各個結(jié)構(gòu)如句法、語意、功能是平行存在并且相互對應的。這種對應關(guān)系通過成分結(jié)構(gòu)(constituent structure,簡稱c-structure)和功能結(jié)構(gòu)(functional structure,簡稱f-structure)之間的映射(mapping)來實現(xiàn)。LFG主要由詞庫、句法和語義解釋三部分組成。表示語義的謂詞論元結(jié)構(gòu)首先在詞庫里通過詞匯編碼而分配到一個語法功能。這種語義與語法功能之間的聯(lián)系在詞庫里是可以通過詞匯規(guī)則進行轉(zhuǎn)換的。當一個詞條最后取得正確的語法功能編碼以后,它就可以和其他表示語法意義的詞條一起構(gòu)成詞匯進入到句法部分。在OT-LFG中,LFG發(fā)揮著生成器的作用,也就是所有輸出項都是以LFG的成分結(jié)構(gòu)和功能結(jié)構(gòu)配對的形式出現(xiàn)的(見圖2)。
在OT-LFG中,輸入項為由功能結(jié)構(gòu)解析的所要表達的意思(a meaning parsed in f-structure),輸出項為成分結(jié)構(gòu)和功能結(jié)構(gòu)的成對出現(xiàn)。FDR與*FunctN為兩個制約條件。研究證明(Kaplan & Bresnan, 1995),在LFG中由成分結(jié)構(gòu)到功能結(jié)構(gòu)的運算在數(shù)學上是有定解的(decidable),而且所有的運算都只需要“合一”(unification)這種簡單的預算方式。合一運算是數(shù)理邏輯中“并”運算的一種適于自然語言處理的特殊形式。由于采用合一運算作為基本的運算方式,詞匯功能語法就可以十分方便地應用到自然語言處理中去。
優(yōu)選論在計算音系學上的研究不但證實了優(yōu)選論的基本假定和方法是可以形式化并應用到計算機語言學應用中的,而且證實了優(yōu)選論是計算上易于操作的(computationally tractable)(Eisner, 1997; Karttunen, 1998; Heiberg, 1999)。因此,需要有針對性研究,使其可以在計算句法學上得到應用??梢?,優(yōu)選論詞匯功能語法是一個既具有理論價值又有實際價值的研究方向。相信通過深入細致的研究工作,可以使其應用到語法錯誤檢測上,為實現(xiàn)準確地自動英語語法檢測與修改系統(tǒng)做出積極貢獻。
三、可行性路線探討
陳述了目前語法錯誤檢測的問題以及應用優(yōu)選論的理論可行性,這部分將以英語冠詞錯誤為例探討優(yōu)選論在語法檢錯中的應用路線。之所以選擇英語冠詞為例,不僅因為它的錯誤率高,而且因為它的多層次分析需求作為自然語言檢錯對象最有代表性,也因為研究證明優(yōu)選論對于語言中涉及多個界面的問題(interface problems)具有最有效的解釋力。
鑒于優(yōu)選論句法學的理論特點,本文建議采用優(yōu)選論詞匯功能語法的理論框架對英語名詞短語中冠詞的使用進行優(yōu)選論解釋和概括,在此基礎(chǔ)上分析中國英語學習者的英語冠詞使用錯誤,并通過優(yōu)選論的評估器過濾功能檢驗其在自然語言處理語法檢錯中的應用性。首先,通過自由寫作、中譯英練習以及英語冠詞使用填空題收集數(shù)據(jù),并對數(shù)據(jù)整理描述分析。具體可行性路線如下。
(一)應用優(yōu)選論詞匯功能語法對英語名詞短語中冠詞的使用進行優(yōu)選論描述性概括
在優(yōu)選論分析中,問題的描述性概括非常重要,它是承接數(shù)據(jù)與分析的必要中間步驟??梢栽诿~短語語義環(huán)境(Noun phrase semantic context)的幫助下進行優(yōu)選論描述性概括。
(二)基于名詞短語所指(noun phrase reference)語意分析設(shè)計中譯英練習
Huebner(1983)提出了名詞短語所指語義環(huán)境,在英語冠詞研究中廣為應用。他將名詞短語所指的語義通過兩個二元的特征分為四類(見圖3),一個特征是專一所指(±Specific Referent(±SR)),另一個特征是假定聽者知道所指(±Assumed Known to the Hearer(±HK)).
(三)將Master(1994)設(shè)計的冠詞診斷測試(Article diagnostic test)按名詞短語所指語義環(huán)境分類
此冠詞診斷測試是專門針對母語為非英語的學習者使用英語冠詞的情況研究而設(shè)計的,它包括所有的英語冠詞使用,分為兩部分:第一部分是由獨立的語義不相關(guān)句子構(gòu)成的;第二部分是一段敘述短文。測試中共有58個填空。結(jié)合Huebner(1983)的語義環(huán)境分類可將這58個語義分類,并用來收集英語冠詞使用數(shù)據(jù)。
(四)應用優(yōu)選論制約條件以及OT-LFG評估器對冠詞使用錯誤進行分析解釋
如上所述,優(yōu)選論的根本思想是語言間的不同是由于制約條件在不同語言中的排列不同所造成的,因而學習一門語言就是學習制約條件不同排列的過程。在這個過程中,存在于學習者語法體系中的制約條件的“錯誤”排列導致應用錯誤,在接觸顯性語言形式后學習者發(fā)現(xiàn)錯誤并激發(fā)制約條件的重新排列直至達到目標語言中的排列順序。接下來需具體研究是怎樣的排列順序?qū)е铝斯谠~使用的錯誤,進而達到錯誤過濾的目的。
(五)運用錯誤驅(qū)動下的制約條件降級演算模擬習得過程,以建立英語冠詞習得顯性語言形式小型數(shù)據(jù)庫
優(yōu)選論認為外語的習得過程即制約條件的降級過程。Tesar & Smolensky(1998)提出通過制約條件的降級演算系統(tǒng)學習者可以建立起來所學語言的制約條件等級體系。那么通過錯誤驅(qū)動下的制約條件降級演算模擬英語冠詞習得過程即可獲得包含英語冠詞使用錯誤的例子。糾正所得錯誤并與原有錯誤并列,從而建立小型的數(shù)據(jù)庫以促進英語冠詞習得過程。
四、結(jié)語
優(yōu)選論是自然語言處理研究中較新的語言學理論框架,基于普遍語法,可學性理論按照語言習得規(guī)律、過程提出的規(guī)則,其強大的通用性、解釋力將在句法研究中得到進一步檢驗和應用。在國內(nèi)同類研究中此理論框架在自然語言處理研究中甚少見到,因此此類研究對于自然語言處理研究領(lǐng)域和計算語言學領(lǐng)域?qū)⒕哂兄匾膯l(fā)作用,也將對句法理論語言學的發(fā)展做出重大的貢獻,具有較高的實際意義和學術(shù)價值。當然,本文僅對一類語法現(xiàn)象進行了可行性探討,對于哪些制約條件及什么樣的制約條件排列可以通過評估器解釋英語冠詞使用錯誤,學習者是怎樣通過制約條件的重新排列習得英語冠詞的,優(yōu)選論詞匯功能語法在語法檢錯上的應用是否可行等問題還有待各領(lǐng)域?qū)<覍W者的進一步考察。
【參考文獻】
[1]Clement, L., Gerdes, K.& Marlet, R.2011.A Grammar Correction Algorithm: Deep Parsing and Minimal Corrections for a Grammar Checker.LNAI 5591, pp.47-63.Springer–Verlag Berlin Heidelberg.
[2]Eisner, Jason.1997.Efficient Generation in Primitive Optimality Theory.In Proceedings of the ACL, Madrid, Spain.
[3]Heiberg, Andrea Janine.1999.Features in Optimality Theory.PhD Thesis, Universityof Arizona.
[4]Huebner, T.1983.A Longitudinal Analysis of the Acquisition of English.Ann Arbor, MI: Karoma.
[5]Kaplan, Ronald.& Bresnan, Joan.1995.Lexical Functional Grammar: A Formal System for Grammatical Representation.In Dalrymple, M., Kaplan, R.M., Maxwell, [18] J., & Zaenen, A.(Eds.) 1995.Formal Issues in Lexical-Functional Grammar.Palo Alto: CSLI, Stanford University.
[6]Karttunen, Lauri.1998.The Proper Treatment of Optimality in Computational Phonology.Rutgers Optimality Archive, ROA-258.
[7]Kuhn, Jonas.2003.Optimality-Theoretic Syntax: A Declarative Approach.Stanford: CSLI Publications, Centre for the Study of Language and Information.
[8]Lam, Olivia.2004.Aspects of the Cantonese Verb Phrase: Order and Rank.Unpublished MPhil Dissertation.The University of Hong Kong.
[9]Master, P. 1994. The effect of systematic instruction on learning the English article system.In T.Odlin (Ed.), Perspectives on Pedagogical Grammar,pp.229-252.New York: Cambridge University Press.