牛長(zhǎng)偉,程邦雄
(1. 中南財(cái)經(jīng)政法大學(xué) 國(guó)際教育學(xué)院,湖北 武漢430073; 2. 華中科技大學(xué) 中國(guó)語(yǔ)言研究所,湖北 武漢 430074)
從類(lèi)型學(xué)角度來(lái)看,漢語(yǔ)疑問(wèn)詞較為特殊,可表疑問(wèn)義,也可表非疑問(wèn)義,其詞義會(huì)隨其所處句法環(huán)境的變化而變化。不同語(yǔ)言間詞義的不對(duì)稱(chēng)為機(jī)器理解自然語(yǔ)言中的詞義排歧(word sense disambiguation)工作帶來(lái)了難題。
漢語(yǔ)語(yǔ)法領(lǐng)域很早就注意到了這類(lèi)詞的多義性。朱德熙將疑問(wèn)詞的用法分為疑問(wèn)用法和非疑問(wèn)用法,非疑問(wèn)用法有兩種:一是表示周遍性,即表示在所涉及的范圍之內(nèi)沒(méi)有例外,伴有“都、也”之類(lèi)副詞;二是指稱(chēng)不知道或者說(shuō)不出來(lái)的人、事物、處所、時(shí)間等[1]。呂叔湘將疑問(wèn)詞(不定指指代詞)的用法總結(jié)為三種:疑問(wèn)、虛指、泛指[2]。張斌又將疑問(wèn)詞的非疑問(wèn)用法分為任指、虛指和不定指[3]。張斌中的“不定指”一般都是對(duì)舉的,呂文將其歸為泛指。前人所總結(jié)的疑問(wèn)詞詞義大同小異,即:疑問(wèn)、任指和虛指,后兩種解讀也被稱(chēng)為全稱(chēng)解讀和存在解讀。以詞義復(fù)雜的謂詞性疑問(wèn)詞“怎么”為例,可表非疑問(wèn)用法——全稱(chēng)解讀(anyhow/anyway)、存在解讀(somehow/someway);也可表疑問(wèn)用法,作狀語(yǔ)時(shí)可詢(xún)問(wèn)方式(how)、原因(why),作謂語(yǔ)時(shí)詢(xún)問(wèn)狀況(what’s wrong with)、性狀(what)。如例1所示。
例1a. 怎么修都修不好。(全稱(chēng)解讀)
b. 學(xué)一門(mén)技術(shù)不怎么難。(存在解讀)
c. 你怎么去的?(詢(xún)問(wèn)方式)
d. 你怎么去了?(詢(xún)問(wèn)原因)
e. 你今天怎么了?(詢(xún)問(wèn)狀況)
f. 這是怎么一回事?(詢(xún)問(wèn)性狀)
例1中的“怎么”均受到了特定句法環(huán)境的約束才表現(xiàn)出相應(yīng)的解讀。自然語(yǔ)言中也存在多重句法環(huán)境約束的“怎么”,此時(shí)優(yōu)勢(shì)解讀將會(huì)被表現(xiàn)出來(lái),如例2所示。
例2是不是怎么修都修不好了?(全稱(chēng)解讀)
從目前基于統(tǒng)計(jì)的主流機(jī)器翻譯系統(tǒng)的識(shí)別率方面來(lái)看,上述7個(gè)句子的翻譯結(jié)果均存在不同程度的問(wèn)題。測(cè)試結(jié)果如表1所示。
表1 主流機(jī)器翻譯系統(tǒng)測(cè)試結(jié)果[注]該測(cè)試于2018年7月11日進(jìn)行。相關(guān)翻譯系統(tǒng)網(wǎng)址為:Baidu(http://fanyi.baidu.com/)、Google(https://translate.google.cn/)、SYSTRANet(http://www.systranet.com/translate/)、Ya Trans(http://fanyi.niutrans.com/)。
Google將例1(a)中表任指的“怎么”(anyhow/anyway)翻譯為“how”。Baidu、Google、SYSTRANet和YaTrans均未正確區(qū)分例1(c)和例1(d)中的“怎么”,例1(c)詢(xún)問(wèn)方式(how),(1d)詢(xún)問(wèn)原因(why),四大翻譯系統(tǒng)傾向于全翻譯為“how”。例1(f)和例2的翻譯也存在問(wèn)題。
我們認(rèn)為,研究“怎么”的詞義排歧模型將會(huì)有助于機(jī)器對(duì)該類(lèi)詞語(yǔ)詞義的識(shí)別。詞義排歧會(huì)涉及到上下文因素、語(yǔ)義因素、語(yǔ)境因素,甚至涉及到日常生活中的常識(shí)[4]。詞義排歧的方法有多種,基于詞典、規(guī)則、語(yǔ)料庫(kù)等多種方法,如基于詞典的詞義排歧方法[5]。然而在實(shí)際應(yīng)用的過(guò)程中,將各種方法綜合利用是比較理想的[6]。例如,苗海等就使用最大熵與規(guī)則相結(jié)合的方法來(lái)進(jìn)行詞義排歧工作,獲得很好的效果[7]。針對(duì)詞義較多、句法環(huán)境復(fù)雜的“怎么”,有指導(dǎo)的學(xué)習(xí)方法(supervised learning approaches)中的決策表分類(lèi)法(decision list classifiers)是一個(gè)理想的方法,用這個(gè)方法來(lái)處理“怎么”的詞義排歧工作,即根據(jù)共現(xiàn)詞的等價(jià)類(lèi)的不同制定決策表,然后利用這個(gè)決策表輸入目標(biāo)項(xiàng),確定其最佳的詞義[4]。
下面我們?cè)谙嚓P(guān)理論假設(shè)的基礎(chǔ)上,分析“怎么”的三類(lèi)語(yǔ)義解讀,即全稱(chēng)、存在和疑問(wèn)(方式、原因、性狀、狀況),總結(jié)三類(lèi)語(yǔ)義解讀所處的句法環(huán)境,通過(guò)測(cè)試其在復(fù)雜句法環(huán)境中的強(qiáng)勢(shì)解讀來(lái)構(gòu)建一個(gè)自上而下的詞義排歧模型,為制定決策表提供依據(jù)。最后通過(guò)實(shí)驗(yàn)來(lái)驗(yàn)證詞義排歧決策表的可行性。
“怎么”的三種語(yǔ)義解讀與其所處的句法環(huán)境有關(guān),總結(jié)各類(lèi)句法環(huán)境的特征就尤為重要。形式語(yǔ)義學(xué)派把疑問(wèn)詞看作自由變量(free variable),其表現(xiàn)何種解讀取決于約束(bind)它的算子(operator)。當(dāng)疑問(wèn)詞被全稱(chēng)算子、存在算子和疑問(wèn)算子約束時(shí),分別表全稱(chēng)解讀、存在解讀和疑問(wèn)解讀[8]。如例1(a)中的“怎么”被全稱(chēng)算子“都”約束,表全稱(chēng)解讀;例1(b)中的“怎么”處于否定句法環(huán)境中,表存在解讀;例1(c)~例1(f)中的“怎么”均被隱性疑問(wèn)算子[注]Huang認(rèn)為隱性疑問(wèn)算子是通過(guò)疑問(wèn)代詞在邏輯層面(LF)上的移位獲得的[9]。約束,表疑問(wèn)解讀。
總的來(lái)說(shuō),疑問(wèn)詞與受約算子間是一種約束關(guān)系。例1中各句子僅受單一算子約束,語(yǔ)義識(shí)別較為簡(jiǎn)單,但當(dāng)句中有多個(gè)算子時(shí),疑問(wèn)詞會(huì)優(yōu)先被哪種算子約束?這些受約算子間是一種怎樣的層級(jí)關(guān)系呢?這需要通過(guò)特定語(yǔ)句的測(cè)試來(lái)確定多重算子約束下的疑問(wèn)代詞的優(yōu)勢(shì)解讀。接下來(lái),根據(jù)這一理論假設(shè),我們來(lái)嘗試總結(jié)允準(zhǔn)“怎么”語(yǔ)義解讀的句法環(huán)境特征及其層級(jí)關(guān)系。
“怎么”被全稱(chēng)量化詞“都”及類(lèi)同算子“也”約束時(shí),表全稱(chēng)解讀。如例3所示。
例3a. 按住葫蘆漂起瓢,怎么都不好辦。(CCL[注]北京大學(xué)CCL語(yǔ)料庫(kù):http://ccl.pku.edu.cn:8080/ccl_corpus/。)
b. 客氏歪著腦袋,怎么也猜不出來(lái)。(CCL)
例3(a)中“怎么”可被理解為“各種辦法”,后半句意思是“通過(guò)各種辦法都不好辦”。例3(b)中“怎么”也可被理解為“各種辦法”,后半句意思是“通過(guò)各種辦法也猜不出來(lái)”。全稱(chēng)算子“都”和類(lèi)同算子“也”將“怎么”這一自由變量約束后,使之表現(xiàn)為全稱(chēng)解讀。這兩個(gè)算子雖被統(tǒng)稱(chēng)為全稱(chēng)類(lèi)算子[10],但對(duì)事件實(shí)現(xiàn)全稱(chēng)意義的路徑是不同的。袁毓林提到“都”是對(duì)一組最小事件加合表示全稱(chēng)意義,是總括式掃描(summary scanning);“也”是對(duì)一組最小事件的合取表示全稱(chēng)意義,是次第式掃描(sequential scanning)[11]。但需要注意的是,“都”和“也”的約束規(guī)則往往與其重讀與否有關(guān)。如例4所示。
例4a. 你們?cè)趺炊疾恢v煙臺(tái)話了?(CCL)
b. 你怎么也不替一下我?(CCL)
例4(a)中“都”關(guān)聯(lián)約束復(fù)數(shù)主語(yǔ)“你們”,“怎么”未被關(guān)聯(lián)約束,表疑問(wèn),詢(xún)問(wèn)原因,意思是“你們幾個(gè)人為什么都不講煙臺(tái)話了?”例4(b)中“也”關(guān)聯(lián)“你”,“怎么”未被關(guān)聯(lián)約束,表疑問(wèn),詢(xún)問(wèn)原因,意思是“別人不替我也就罷了,你為什么也不替一下我呢?”那么,該如何確立“都”和“也”的關(guān)聯(lián)項(xiàng)?文獻(xiàn)[12]曾討論過(guò)“都”的關(guān)聯(lián)次序和約束規(guī)則,即:當(dāng)“都”不被重讀時(shí),其傾向于左向關(guān)聯(lián)約束疑問(wèn)詞,疑問(wèn)詞表全稱(chēng)解讀;當(dāng)“都”被重讀時(shí),其傾向于左向關(guān)聯(lián)約束非疑問(wèn)成分,疑問(wèn)詞表疑問(wèn)解讀。其實(shí),“也”同樣適用于該關(guān)聯(lián)次序。若將例4(a)中的“都”和例4(b)中的“也”輕讀,“怎么”則表全稱(chēng)解讀(改為第三人稱(chēng)“他們/他”更好),意思是“就是不說(shuō)煙臺(tái)話了”、“就是不替一下我”。
“怎么”處于疑問(wèn)環(huán)境、真值不確定環(huán)境或否定環(huán)境時(shí),會(huì)表存在解讀。如例5所示。
例5a. 鼠標(biāo)怎么摔了一下嗎?
b. 是不是怎么修一下就好了?
c. 電視好像怎么閃了一下就不亮了。
d. 實(shí)在不怎么愛(ài)聽(tīng)。(CCL)
例5(a)(b)中“怎么”表存在解讀,意思是“以某種方式”,分別處于是非問(wèn)句和正反問(wèn)句中,同屬疑問(wèn)環(huán)境。例5(c)中“怎么”表存在解讀,處于非事實(shí)類(lèi)動(dòng)詞“好像”的轄域內(nèi)。這類(lèi)動(dòng)詞還有“仿佛、似乎”等。例5(d)中“怎么”被否定詞“不”統(tǒng)制[注]統(tǒng)制是生成語(yǔ)法學(xué)中的專(zhuān)有名詞。句法樹(shù)中,當(dāng)A節(jié)點(diǎn)和B節(jié)點(diǎn)互不支配(dominated),且支配A節(jié)點(diǎn)的第一個(gè)最大投射(maximal projection)也支配B節(jié)點(diǎn),那么,A節(jié)點(diǎn)就統(tǒng)制B節(jié)點(diǎn)。從句子語(yǔ)序上看,一般處于被統(tǒng)制成分前。[13],表存在解讀。呂叔湘認(rèn)為例5(d)中的“怎么”表示一定程度,略同于“很”而較輕,“怎么”的作用在于減弱“不”的力量,語(yǔ)氣比較委婉,沒(méi)有“實(shí)在不愛(ài)聽(tīng)”語(yǔ)氣堅(jiān)決。其實(shí),從形式語(yǔ)義學(xué)的角度來(lái)看,“表示一定程度”即是存在解讀,例5(d)中“怎么”的作用類(lèi)似于表存在解讀的疑問(wèn)詞“什么”,“我沒(méi)買(mǎi)什么東西”比“我沒(méi)買(mǎi)東西”顯得語(yǔ)氣要委婉。
“怎么”受隱性疑問(wèn)算子約束或處于[+WH]類(lèi)動(dòng)詞轄域內(nèi)時(shí),表疑問(wèn)解讀。如例6所示。
例6a. 你怎么去上海的?
b. 他問(wèn)我怎么去上海的。
按照形式學(xué)派理論,例6(a)中的“怎么”在邏輯層面(Logical Form)移位至Spec-CP位置后,才獲得疑問(wèn)解讀[9]。例6(b)中[+WH]類(lèi)動(dòng)詞“問(wèn)”要求其轄域內(nèi)必須具備疑問(wèn)環(huán)境(是非問(wèn)句、正反問(wèn)句、選擇問(wèn)句或特指問(wèn)句),“怎么”是疑問(wèn)詞,所以此處必須表疑問(wèn)義形成特指問(wèn)句才能滿足[+WH]類(lèi)動(dòng)詞的要求。這類(lèi)動(dòng)詞還有“問(wèn)、詢(xún)問(wèn)、打聽(tīng)、想知道”等。
例6(a)中“怎么”表疑問(wèn)解讀,詢(xún)問(wèn)方式。除方式外,“怎么”還可詢(xún)問(wèn)原因、狀況和性狀,如例1(d)~例1(f)。那么,四種疑問(wèn)解讀的句法環(huán)境有何不同呢?
“怎么”作謂語(yǔ)時(shí)詢(xún)問(wèn)狀況。呂叔湘總結(jié)了這種用法句末基本用“了、啦”[2]?!霸趺础弊鞫ㄕZ(yǔ)時(shí)詢(xún)問(wèn)性狀。呂叔湘將此用法總結(jié)為“怎么+(一)+量詞+名詞”,量詞常用“個(gè)、回”,名詞多為“人、東西、事”[2]?!霸趺础弊鳡钫Z(yǔ)時(shí),詢(xún)問(wèn)方式或原因。肖治野將詢(xún)問(wèn)方式的句法環(huán)境分為三類(lèi),即:①S+(是)+怎么+VP+的; ②S+怎么+VP; ③S+怎么+(個(gè))+V法。將“怎么”詢(xún)問(wèn)原因的句法環(huán)境也分為三類(lèi):①S+怎么+[Z]+VP; ②怎么+S+[Z]+VP,③怎么,S+[Z]+VP。肖文中“S”指主語(yǔ),“[Z]”可以是“不、就、才、又”等各類(lèi)副詞,也可以是表示時(shí)間、地點(diǎn)、比較、關(guān)涉等的各類(lèi)短語(yǔ)甚至小句[14]。具體總結(jié)如如表2所示:
表2 “怎么”表疑問(wèn)解讀所處句法環(huán)境特征
①彭可君曾提到“你怎么買(mǎi)魚(yú)?”中的“怎么”既可詢(xún)問(wèn)方式,也可詢(xún)問(wèn)原因[15]。我們認(rèn)為,該句中“怎么”分析為詢(xún)問(wèn)方式更符合語(yǔ)感。當(dāng)修改為“你怎么買(mǎi)魚(yú)了?”時(shí),句子“怎么”詢(xún)問(wèn)原因的意思才更加明確。感謝審稿專(zhuān)家增補(bǔ)例句。
通過(guò)以上三節(jié)的分析,我們來(lái)總結(jié)一下允準(zhǔn)“怎么”語(yǔ)義解讀的句法環(huán)境的特征,如表3所示。
表3 允準(zhǔn)“怎么”語(yǔ)義解讀的句法環(huán)境的特征
①當(dāng)一個(gè)句子中有兩個(gè)“怎么”時(shí),往往也表全稱(chēng)解讀,如“你想怎么做就怎么做?!贝藭r(shí),句中“怎么”直接輸出為全稱(chēng)解讀,對(duì)應(yīng)于英語(yǔ)中的“however”。感謝審稿專(zhuān)家增補(bǔ)例句。
“怎么”被全稱(chēng)類(lèi)算子“都、也”約束時(shí),表全稱(chēng)解讀;處于疑問(wèn)環(huán)境、真值不確定環(huán)境、否定環(huán)境中時(shí),表存在解讀;處于[+WH]類(lèi)動(dòng)詞轄域、被隱性疑問(wèn)算子約束時(shí),表疑問(wèn)解讀。上述“怎么”所表現(xiàn)的語(yǔ)義解讀僅是處于單一句法環(huán)境中,自然語(yǔ)言中“怎么”常處于多重句法環(huán)境中,其語(yǔ)義解讀表現(xiàn)如何?這是構(gòu)建“怎么”的詞義排歧模型需要解決的問(wèn)題。另外,“怎么”表疑問(wèn)解讀時(shí)的四種解讀也要通過(guò)“由簡(jiǎn)及繁”的原則來(lái)進(jìn)行詞義排歧。
本節(jié)測(cè)試多重句法環(huán)境下“怎么”的語(yǔ)義表現(xiàn)。操作方法是將表3中的句法環(huán)境自由組合,來(lái)確定“怎么”的優(yōu)勢(shì)解讀。由于隱性疑問(wèn)算子并無(wú)顯性標(biāo)記,無(wú)須將其引入復(fù)雜句法環(huán)境。我們將表3中的5種句法環(huán)境兩兩自由組合,然后根據(jù)語(yǔ)感來(lái)測(cè)試其優(yōu)勢(shì)語(yǔ)義解讀,如例7所示。
例7a. 怎么修都修不好了嗎?(①+②=全稱(chēng))
b.好像怎么修都修不好了。(①+③=全稱(chēng))
c.不是怎么修都修不好了。(①+④=全稱(chēng))
d. *我想知道怎么修都修好了。(①+⑤=*)
例8a.好像是不是怎么修一下就好了?(②+③=存在)
b. 實(shí)在不怎么好聽(tīng)嗎?(②+④=存在)
c. 我想知道你是不是怎么修了它一下才好的。(②+⑤=存在)
例9a.好像不怎么好聽(tīng)。(③+④=存在)
b. *我想知道他好像怎么摔了一下。(③+⑤=*)
例10*我想知道這首歌不怎么好聽(tīng)。(④+⑤=*)
例7(a)~例7(c)中“怎么”均表全稱(chēng)解讀,說(shuō)明在①~④中,全稱(chēng)解讀是強(qiáng)勢(shì)解讀,即①的層級(jí)高于②③④。例8(a)、例9(a)中“怎么”均表存在解讀,說(shuō)明在②③④中,三種句法環(huán)境是平行的。例7(d)、例8(c)、例9(b)和例10中“怎么”的語(yǔ)義解讀表現(xiàn)各異,“想知道”要求其轄域內(nèi)出現(xiàn)疑問(wèn)環(huán)境,除例8(c)中“是不是”(正反問(wèn)句)滿足疑問(wèn)環(huán)境外,其余3句均與疑問(wèn)環(huán)境沖突,所以不合格。
自此,可以得出①?②/③/④?⑤,即“全稱(chēng)類(lèi)算子約束”是第一層級(jí)的,“疑問(wèn)環(huán)境、真值不確定環(huán)境和否定環(huán)境”是第二層級(jí)的,“[+WH]類(lèi)動(dòng)詞轄域”是第三層級(jí)的。也就是說(shuō),當(dāng)句中的“怎么”被全稱(chēng)類(lèi)算子約束時(shí),表全稱(chēng)解讀;若不是,進(jìn)入下一步;若處于疑問(wèn)環(huán)境、真值不確定環(huán)境或否定環(huán)境中時(shí),表存在解讀;若不是,則表疑問(wèn)解讀。
當(dāng)“怎么”的詞義排歧至疑問(wèn)解讀時(shí),就需要識(shí)別“怎么”是詢(xún)問(wèn)狀況、性狀、方式,還是原因。在詞義排歧時(shí),應(yīng)遵循“由簡(jiǎn)及繁”的原則,也就是說(shuō),先操作容易識(shí)別的詞義,最后操作難識(shí)別的詞義。從表2中我們可以看出,“怎么”的四種疑問(wèn)解讀的句法環(huán)境“由簡(jiǎn)及繁”依次為“狀況→性狀→方式→原因”,可將最復(fù)雜的句法環(huán)境作為默認(rèn)值輸出。另外,“怎么”表方式時(shí),還可將其句法環(huán)境作進(jìn)一步簡(jiǎn)化,即“怎么+(個(gè))+VP+(*了)”。
綜合3.1和3.2,我們大致可以推導(dǎo)出“怎么”的詞義排歧模型,如圖1所示。
圖1 “怎么”的詞義排歧模型
圖1所示的“怎么”的詞義排歧模型涉及到“約束、環(huán)境、轄域”等語(yǔ)言學(xué)術(shù)語(yǔ),不利于機(jī)器識(shí)別。接下來(lái),我們將這類(lèi)立體化術(shù)語(yǔ)線性化,使機(jī)器通過(guò)對(duì)詞序的判斷,快速識(shí)別出通常情況下“怎么”的解讀。
全稱(chēng)類(lèi)算子約束:怎么+(……)+都/也;否定環(huán)境:①不/沒(méi)(有)+怎么;真值不確定環(huán)境:好像/仿佛/似乎+(……)+怎么;疑問(wèn)環(huán)境:①怎么+(……)+嗎,②V+否定詞+V+(……)+怎么。
我們將“怎么”詞義排歧決策表的缺省值設(shè)定為表詢(xún)問(wèn)原因的疑問(wèn)解讀,根據(jù)圖1和4.1中的區(qū)分條件,“怎么”的詞義排歧決策表如表4所示:如果在輸入語(yǔ)句中有全稱(chēng)類(lèi)算子,且在“怎么”之后,則輸出“全稱(chēng)”;若無(wú),就檢測(cè)下一項(xiàng)。如果“怎么”與表4中①~④有關(guān),則輸出“存在”;若不符,再檢測(cè)下一項(xiàng)。如果“怎么”屬于“怎么+了/啦”句式,則輸出“詢(xún)問(wèn)狀況”;若不屬于,則進(jìn)入下一項(xiàng)。如果“怎么”屬于“怎么+(一)+個(gè)/回+人/東西/事”句式,則輸出“詢(xún)問(wèn)性狀”;若不屬于,則進(jìn)入下一項(xiàng)。如果“怎么”屬于“怎么+(個(gè))+VP+(*了)”句式,則輸出“詢(xún)問(wèn)方式”;若都不屬于,則輸出缺省值——“詢(xún)問(wèn)原因”。
表4 “怎么”的詞義排歧決策表
為驗(yàn)證“怎么”的詞義排歧決策表,我們從CCL語(yǔ)料庫(kù)中隨機(jī)選定1 000個(gè)含有“怎么”的句子,用表4中的詞義排歧決策表來(lái)對(duì)這1 000個(gè)句子中“怎么”的語(yǔ)義解讀進(jìn)行判斷。驗(yàn)證步驟如下:
① 判斷句中是否存在表4中所提到的規(guī)則;
② 若存在表4中的規(guī)則,則依次輸出相應(yīng)的語(yǔ)義解讀;
③ 將②輸出的語(yǔ)義解讀與實(shí)際語(yǔ)義解讀作比較,確定輸出的語(yǔ)義解讀是否恰當(dāng)。
按上述驗(yàn)證步驟對(duì)1 000個(gè)句子進(jìn)行驗(yàn)證,結(jié)果如表5所示。
表5 “怎么”詞義排歧決策表的驗(yàn)證結(jié)果
表5中所示的“已識(shí)別”是指識(shí)別出的語(yǔ)義解讀與實(shí)際語(yǔ)義解讀一致,“未識(shí)別”是指識(shí)別出的語(yǔ)義解讀與實(shí)際語(yǔ)義解讀不一致。全稱(chēng)解讀中有4個(gè)未識(shí)別,是由于句子重音不同造成的,如例11(a),CCL未標(biāo)記重音,所以該類(lèi)句子被誤判為全稱(chēng)解讀。存在解讀中有4個(gè)未識(shí)別,是由于“要不”的原因,如例11(b),“要不”是“要不是的話”的簡(jiǎn)寫(xiě),由于“不”和“怎么”緊鄰,導(dǎo)致“怎么”誤判為存在解讀。其他解讀中有153個(gè)未識(shí)別,其中包括129個(gè)“怎么樣”,如例11(c);5個(gè)代指用法,如例11(d),“怎么”代指了某一動(dòng)詞;19個(gè)復(fù)句,如例11(e),“不管/無(wú)論”緊鄰“怎么”時(shí),解讀等同于全稱(chēng)解讀。
例11a. 爸,你怎么也迷信起來(lái)了?
b. 你們海鵬可勇敢了,要不怎么能當(dāng)司令。
c. 廟會(huì)上宣傳工作做得怎么樣?
d. 陳旅長(zhǎng)都不敢怎么我。
e.不管怎么說(shuō),周泉的心里總有一道陰影。
例11(a)的重音問(wèn)題,文本由于未標(biāo)記重音,暫且不予考慮。例11(b)和例11(d)僅占選取語(yǔ)料的0.4%、0.5%,也可暫不考慮。針對(duì)例11(c)和例11(e),可以對(duì)表4的詞義排歧決策表進(jìn)行如下改進(jìn):
① “怎么”輸入之前,先排除“怎么樣”的影響;
② “全稱(chēng)類(lèi)算子約束”增加區(qū)別條件,即“不管/無(wú)論+怎么”句式中,“怎么”也輸出全稱(chēng)解讀。
引言部分表1中提到了基于統(tǒng)計(jì)的主流機(jī)器翻譯系統(tǒng)在識(shí)別“怎么”的語(yǔ)義解讀時(shí)尚存改進(jìn)空間。除無(wú)限地?cái)U(kuò)大雙語(yǔ)平行語(yǔ)料外,運(yùn)用規(guī)則的方法也可識(shí)別出表1各句中“怎么”的語(yǔ)義解讀。例1(a)中“怎么”處于全稱(chēng)算子“都”前,輸出為全稱(chēng)解讀(anyhow/anyway);例1(b)中“怎么”在否定詞“不”之后,輸出為存在解讀(somehow/someway),邏輯上,“not+some(any)”即為no,表否定;例1(c)中“怎么”符合“怎么+(個(gè))+VP+(*了)”格式,輸出為詢(xún)問(wèn)方式(how);例1(d)中“怎么”不符合模型中的既有格式,最后輸出為詢(xún)問(wèn)原因(why);例1(e)中“怎么”符合“怎么+了/啦”格式,輸出為詢(xún)問(wèn)狀況(what’s wrong with);例1(f)中“怎么”符合“怎么+(一)+個(gè)/回+人/東西/事”格式,輸出為詢(xún)問(wèn)性狀(what);(2)中“怎么”處于“都”之前,在第一步就被輸出為全稱(chēng)解讀(anyhow/anyway),不受該句正反問(wèn)句類(lèi)疑問(wèn)環(huán)境影響。
本文選擇“怎么”作為謂詞性疑問(wèn)詞的代表來(lái)分析,是因?yàn)椤霸趺础笔窃擃?lèi)疑問(wèn)詞中用法最多且最復(fù)雜的一個(gè)。除本文分析的六種語(yǔ)義解讀外,“怎么”還有代指用法,由于出現(xiàn)比例極低,暫不考慮。本文通過(guò)總結(jié)“怎么”在漢語(yǔ)語(yǔ)法領(lǐng)域的相關(guān)研究成果,構(gòu)建了一個(gè)自上而下的基于規(guī)則的詞義消歧模型,然后根據(jù)自然語(yǔ)言中常見(jiàn)的情況,制定“怎么”的詞義排歧決策表,最后通過(guò)語(yǔ)料庫(kù)樣本數(shù)據(jù)驗(yàn)證了該決策表的可行性。