藍(lán)巖真 朱虹雨
摘 要:韓語復(fù)句通常由多類型“節(jié)”構(gòu)成,各類句式結(jié)構(gòu)相對復(fù)雜,各節(jié)之間存在不同層次與包含聯(lián)系,因此連接復(fù)句在進(jìn)行自動處理識別時通常需要依次分解為單句方能實現(xiàn)句子結(jié)構(gòu)的全面解析。文章主要探討了以語言知識為基礎(chǔ)的韓語復(fù)句自動識別對策,旨在有效解決復(fù)句處理識別問題。
關(guān)鍵詞:語言知識;韓語復(fù)句;自動識別;對策
中圖分類號:H55文獻(xiàn)標(biāo)識碼:A收稿日期:2017-12-06文章編號:2095-624X(2018)01-0063-01
從韓語語法角度出發(fā),含有單一主謂賓關(guān)系的句子被定義為單句,含有超過兩組以上單句的句子被稱作復(fù)句,但是在自動處理技術(shù)實際實施過程中,計算機(jī)通常難以準(zhǔn)確識別出句子當(dāng)中的主謂賓關(guān)聯(lián)和數(shù)量,導(dǎo)致韓語復(fù)句自動處理充滿挑戰(zhàn)。從語言知識角度出發(fā),韓語主要依靠豐富的詞尾、助詞等體系達(dá)成語法表達(dá)效果,致使韓語復(fù)句自動識別需要面臨“同型異質(zhì)”等語句歧義現(xiàn)象,影響自動識別結(jié)果的準(zhǔn)確性。
1.韓語復(fù)句語言特點
充分掌握韓語復(fù)句的語言特點是準(zhǔn)確解構(gòu)韓語復(fù)句的重要前提,為此必須從復(fù)句關(guān)系判別標(biāo)準(zhǔn)、潛在復(fù)句關(guān)系標(biāo)記入手,深入解析復(fù)句的構(gòu)成表現(xiàn)、連接詞尾等內(nèi)容,并結(jié)合各類復(fù)句的特征整理自動識別程序構(gòu)建思路。例如:“??? ?? ???./恩熙不是傻瓜?!痹摋l韓語從語法成分角度出發(fā),均隸屬補語從句類型,因此難以通過單純的復(fù)句關(guān)系對其進(jìn)行準(zhǔn)確標(biāo)記。而有些連語會存在明顯的邏輯先后聯(lián)系,在自動處理時必須注意連語銜接部分的準(zhǔn)確應(yīng)用。比如:“?? ? ?? ?? ??./樸永哲一回來,會議就開始了?!边@句話隸屬邏輯語義關(guān)系范疇,具有時間連貫語義特性,其功能與復(fù)句關(guān)系標(biāo)記等同。
2.語料來源與解構(gòu)分析
本文所采用的各類語料多源于韓國新聞?wù)Z篇等主流媒體的相關(guān)報道,如《東亞日報》等,解析語句約為50萬,主要采用U-Tagger詞法分析器進(jìn)行詞義標(biāo)注。在對復(fù)句進(jìn)行判定時,主要根據(jù)句子的構(gòu)成表現(xiàn)、句末存在終止性停頓、由若干小句構(gòu)成等特點進(jìn)行復(fù)句識別和處理。經(jīng)相關(guān)數(shù)據(jù)資料分析統(tǒng)計發(fā)現(xiàn),從結(jié)構(gòu)角度出發(fā),韓語復(fù)句可通過分析句式層級、分句包含數(shù)量等方式,降低復(fù)句自動處理復(fù)雜度,采用“化繁為簡、對癥處理”的模式將復(fù)雜復(fù)句解構(gòu)為簡單的相對應(yīng)分句,予以分層級和針對性處理,提高復(fù)句自動識別的有效性和準(zhǔn)確性。
3.個案解析
例如,“?? ?? ??? ?? ??.”分別采用有道、必應(yīng)、谷歌、人工等語言自動識別軟件對例句進(jìn)行處理,處理結(jié)果如下。有道:“下雨帶雨衣?!北貞?yīng):“去下雨,帶上雨衣?!惫雀瑁骸跋掠炅耍晕矣杏暌?。”人工:“下雨了,把雨衣帶上吧。”根據(jù)上述實踐結(jié)果可知,雖然必應(yīng)和谷歌均識別出了復(fù)句結(jié)構(gòu),但是在語義處理方面存在明顯缺陷,而有道雖然語義識別效果良好,但未能準(zhǔn)確判斷出復(fù)句結(jié)構(gòu)。這是因為在韓語復(fù)句軟件自動處理過程中,通常需要將句子拆解為若干個短語片段,再通過類比思路將各片段譯為目標(biāo)短語,最后將各個短語連接成句,通過語序調(diào)整得到譯文。經(jīng)過語料和案例分析后發(fā)現(xiàn),復(fù)句語義和結(jié)構(gòu)識別失誤與連接詞尾的缺省翻譯關(guān)聯(lián)密切。
4.程序設(shè)計思路與實施效果
經(jīng)上述復(fù)句解構(gòu)和語義解析后可知,在進(jìn)行韓語復(fù)句程序編寫時,必須重點關(guān)注句子語義、結(jié)構(gòu)和邏輯思路,從而進(jìn)行正確的解構(gòu)翻譯?;驹O(shè)計流程如下:首先,必須實施句子預(yù)判處理工作。譬如,對于單句,可在語言自動識別軟件直接輸入后進(jìn)行翻譯;對于復(fù)句,則需進(jìn)一步判斷句子的層級結(jié)構(gòu)和語義邏輯。其次,在連接詞尾處理方面,必須將句式中的各個連接詞尾重新設(shè)置為相應(yīng)的終結(jié)詞尾,并以連接詞尾的形式出現(xiàn)在譯句中。最后,根據(jù)中文單句翻譯結(jié)果和相應(yīng)的邏輯順序整合成全新的復(fù)句。實踐表明,采用此種方法能夠有效提高韓語復(fù)句自動識別技術(shù)的翻譯質(zhì)量,在有道和必應(yīng)在線軟件應(yīng)用中改進(jìn)效果更加明顯。
綜上所述,本文以韓語復(fù)句特點為切入點,對相關(guān)語言知識的理論基礎(chǔ)進(jìn)行了初步分析,并重點探討了基于語言知識的韓語復(fù)句自動識別對策,通過句子解構(gòu)、語義解析、邏輯判斷等方式,提高韓語復(fù)句自動識別的準(zhǔn)確性。
參考文獻(xiàn):
[1]黃丙剛.韓語因果復(fù)句在漢語中的對應(yīng)研究[J].東北亞外語研究,2016(3):49-54.
[2]劉 洋,畢玉德,李 健.基于句法知識的復(fù)句解構(gòu)對韓漢復(fù)句機(jī)器翻譯改進(jìn)芻議[J].洛陽師范學(xué)院學(xué)報,2017(2):49-54.