李婷婷 趙鐵軍 張春越
摘要:采用基于統(tǒng)計的方法實現(xiàn)日本人名的識別和翻譯系統(tǒng)。將人名的識別轉(zhuǎn)換成序列標(biāo)注問題,采用條件隨機場方法訓(xùn)練識別模型。訓(xùn)練語料在標(biāo)注時使用S/E(Starl/End)標(biāo)注風(fēng)格;利用人名在上下文中的關(guān)系、人名稱呼后綴詞和人名字典來設(shè)計特征模板。人名翻譯時將日本人名分為假名人名和漢字人名,漢字人名的翻譯通過建立日本人名常用漢字翻譯字典實現(xiàn):假名人名的翻譯通過Moses系統(tǒng)訓(xùn)練翻譯模型實現(xiàn)。該系統(tǒng)在人名的識別和翻譯測試中都取得了不錯統(tǒng)計結(jié)果。