馮志偉,1939年生,云南昆明人。先后在北京大學(xué)中文系和中國(guó)科學(xué)技術(shù)大學(xué)研究生院畢業(yè),專攻語(yǔ)言學(xué)和信息科學(xué)。1978年到法國(guó)格勒諾布爾理科醫(yī)科大學(xué)應(yīng)用數(shù)學(xué)研究所(IMAG)自動(dòng)翻譯中心(GETA)留學(xué),1981年回國(guó),在中國(guó)科技信息研究所計(jì)算中心從事機(jī)器翻譯研究工作;1986~1988年在德國(guó)夫瑯禾費(fèi)研究院新信息技術(shù)與通訊系統(tǒng)研究部(FhG)任客座研究員;1990~1993年在德國(guó)特里爾大學(xué)任客座教授;1996年在德國(guó)康斯坦茨技術(shù)學(xué)院國(guó)際術(shù)語(yǔ)學(xué)與應(yīng)用語(yǔ)言學(xué)中心(CiTal)任技術(shù)顧問(wèn)。現(xiàn)為國(guó)家語(yǔ)言文字工作委員會(huì)語(yǔ)言文字應(yīng)用研究所研究員,中國(guó)社會(huì)科學(xué)院研究生院教授,北京大學(xué)兼職教授。1991年獲國(guó)務(wù)院特殊津貼;1992年獲美國(guó)IBA金質(zhì)獎(jiǎng)?wù)?同年被列入英國(guó)BEST EUROPE專家?guī)?。主要專著有《?shù)理語(yǔ)言學(xué)》、《自動(dòng)翻譯》、《現(xiàn)代漢字和計(jì)算機(jī)》、《中文信息處理與漢語(yǔ)研究》、《數(shù)學(xué)與語(yǔ)言》、《自然語(yǔ)言機(jī)器翻譯新論》、《自然語(yǔ)言的計(jì)算機(jī)處理》、Chinesische Schriftzeichen-Vergangenheit und Gegenwart(《漢字的歷史和現(xiàn)狀》德文版)、《現(xiàn)代術(shù)語(yǔ)學(xué)引論》等。
2006年12月初,教育部語(yǔ)言文字應(yīng)用研究所的著名語(yǔ)言學(xué)家馮志偉先生從北京回云南家鄉(xiāng)掃墓、探親、訪友。在此之際,筆者有幸拜訪了這位蜚聲國(guó)內(nèi)外的學(xué)者。此前,筆者去過(guò)幾次北京,但由于馮先生退休后長(zhǎng)期在德、韓等國(guó)講學(xué),所以,都未謀面。八年闊別后,老朋友、老同行相見(jiàn),分外親熱,筆者和他進(jìn)行了多次長(zhǎng)談,又瀏覽了他惠贈(zèng)的新著,更加深入地了解了他這幾年的學(xué)術(shù)活動(dòng)與成就,遂成此文。
在我國(guó),像馮志偉這樣文理兼通的跨學(xué)科專家是比較少見(jiàn)的。
馮志偉是教育部語(yǔ)言文字應(yīng)用研究所的學(xué)術(shù)委員會(huì)委員,又是中國(guó)科學(xué)院自動(dòng)化研究所國(guó)家模式識(shí)別重點(diǎn)實(shí)驗(yàn)室的學(xué)術(shù)委員會(huì)委員,橫跨了語(yǔ)言學(xué)科和自動(dòng)化學(xué)科;他是中國(guó)語(yǔ)文現(xiàn)代化學(xué)會(huì)副會(huì)長(zhǎng),又是中國(guó)人工智能學(xué)會(huì)理事,橫跨了語(yǔ)文研究和人工智能研究;他是國(guó)家社會(huì)科學(xué)基金語(yǔ)言學(xué)科的評(píng)審委員,又是國(guó)家自然科學(xué)基金和北京市自然科學(xué)基金計(jì)算機(jī)學(xué)科的評(píng)審委員,橫跨了語(yǔ)言學(xué)科和計(jì)算機(jī)學(xué)科。在國(guó)外,他是德國(guó)特里爾大學(xué)(University Trier)文學(xué)院的教授,又是韓國(guó)科學(xué)技術(shù)院(KAIST)電子工程與計(jì)算機(jī)科學(xué)系(EECS)的教授,同樣也橫跨了文理兩科。在學(xué)術(shù)發(fā)展的歷史長(zhǎng)河中,語(yǔ)言學(xué)屬于人文科學(xué),計(jì)算機(jī)和自動(dòng)化屬于自然科學(xué)。語(yǔ)言學(xué)的基礎(chǔ)是語(yǔ)文,計(jì)算機(jī)和自動(dòng)化的基礎(chǔ)是數(shù)學(xué),在傳統(tǒng)的教育體系中,語(yǔ)文是文科的典型代表,數(shù)學(xué)是理科的典型代表,它們之間的區(qū)別涇渭分明。馮志偉能夠在性質(zhì)差異如此大的不同學(xué)科中取得重要成就,并成為這些學(xué)科的學(xué)術(shù)帶頭人,他確實(shí)是一位在信息時(shí)代這個(gè)特殊的環(huán)境下成長(zhǎng)起來(lái)的新型的語(yǔ)言學(xué)者。
一、北大十年:數(shù)理語(yǔ)言學(xué)之夢(mèng)
1939年4月15日馮志偉出生于昆明大東門(mén)外(今天長(zhǎng)春路東段)的一個(gè)小商人之家,下有弟妹六人,他排行在前。父母雖然文化不高、負(fù)擔(dān)很重,卻很有卓識(shí)遠(yuǎn)見(jiàn),除每天起早睡晚搞好土雜店的經(jīng)營(yíng)、節(jié)衣縮食來(lái)供養(yǎng)七個(gè)子女念書(shū)外,尚能嚴(yán)格教育和督促子女搞好學(xué)習(xí)。馮志偉自幼聰慧沉靜,善于思考,勤奮好學(xué)。他在長(zhǎng)春路東升小學(xué)讀書(shū)時(shí),就品學(xué)兼優(yōu),成績(jī)出眾,初高中都以第一名的高分考入全省著名的重點(diǎn)學(xué)?!ッ饕恢芯妥x,是昆明一中有名的頂尖學(xué)生,文理兼能,多次受到學(xué)校和任課教師的嘉獎(jiǎng)。這個(gè)學(xué)校曾培育了無(wú)數(shù)的英才,如獲諾貝爾獎(jiǎng)的著名物理學(xué)家楊振寧、著名哲學(xué)家艾思奇、著名史學(xué)家吳晗、著名出版家黃洛峰等等。馮志偉從初一到高三,年年名列前茅,他在默默地追趕著那些曾經(jīng)給昆明一中帶來(lái)聲譽(yù)的前輩老校友們。
1957年高中畢業(yè)時(shí),馮志偉才十八歲,是班上年齡最小的學(xué)生之一,卻以優(yōu)異的成績(jī)考入了北京大學(xué)地球化學(xué)專業(yè)。地球化學(xué)在1957年屬于國(guó)家重點(diǎn)發(fā)展的尖端學(xué)科之一,在地球科學(xué)里面,也是最先進(jìn)的學(xué)科。馮志偉非常熱愛(ài)這個(gè)專業(yè),當(dāng)時(shí)也沒(méi)有想從事其他學(xué)科的想法。他一心想研究化學(xué)元素在地球上的分布規(guī)律,興趣主要在稀有元素上。
他入學(xué)后對(duì)五光十色的礦物發(fā)生了濃厚的興趣,如醉如癡地觀察著不同結(jié)晶形狀的各種礦物,六方晶系的鉆石、方斜晶系的石墨……馮志偉深深地被大自然的奧秘吸引住了,他曾經(jīng)想研究礦物中最為人們喜愛(ài)的寶石,探索各種寶石成礦的規(guī)律。
就在馮志偉認(rèn)真學(xué)習(xí)地球化學(xué)的前后,國(guó)外興起了數(shù)理語(yǔ)言學(xué),建立起了完善的理論和方法,并在大學(xué)中開(kāi)設(shè)了數(shù)理語(yǔ)言學(xué)課程,從而使數(shù)理語(yǔ)言學(xué)作為一個(gè)獨(dú)立的學(xué)科出現(xiàn)在現(xiàn)代語(yǔ)言學(xué)的百花園中,日益芬芳、燦爛。
1956年,我國(guó)開(kāi)始注意到國(guó)外數(shù)理語(yǔ)言學(xué)的興起和發(fā)展,在國(guó)家科學(xué)研究的發(fā)展規(guī)劃中,確立了稱做“機(jī)器翻譯,自然語(yǔ)言翻譯規(guī)則的建立和自然語(yǔ)言的數(shù)學(xué)理論”的課題。這個(gè)課題包括兩部分:一部分是機(jī)器翻譯,另一部分是自然語(yǔ)言的數(shù)學(xué)理論,也就是今天所說(shuō)的“數(shù)理語(yǔ)言學(xué)”。
不久,我國(guó)語(yǔ)言學(xué)家劉涌泉在《中國(guó)語(yǔ)文》上發(fā)表了《談數(shù)理語(yǔ)言學(xué)》一文,非常簡(jiǎn)要地介紹了數(shù)理語(yǔ)言學(xué)這個(gè)新興學(xué)科的主要內(nèi)容和研究方法。但是,由于數(shù)理語(yǔ)言學(xué)研究要求研究者同時(shí)兼具語(yǔ)言學(xué)和數(shù)學(xué)的學(xué)科背景,而當(dāng)時(shí)我國(guó)的語(yǔ)言學(xué)界,還沒(méi)有這樣的學(xué)者,因此,雖然數(shù)理語(yǔ)言學(xué)與機(jī)器翻譯的研究同時(shí)列入了我國(guó)的科學(xué)研究發(fā)展規(guī)劃,實(shí)際上只開(kāi)展了機(jī)器翻譯的研究,并沒(méi)有開(kāi)展數(shù)理語(yǔ)言學(xué)的研究。由于缺乏文理兼通的人才,我國(guó)的數(shù)理語(yǔ)言學(xué)處在難產(chǎn)中。
北京大學(xué)為我國(guó)數(shù)理語(yǔ)言學(xué)的研究造就了這樣的人才。北京大學(xué)高舉五四“民主”和“科學(xué)”的大旗,學(xué)術(shù)空氣非常自由,圖書(shū)館藏書(shū)豐富,學(xué)生可以閱讀到各種最新的科學(xué)雜志,了解到國(guó)內(nèi)外最新的學(xué)術(shù)發(fā)展動(dòng)向。這種學(xué)術(shù)自由的氣氛大大地開(kāi)闊了學(xué)生的眼界,使他們有可能緊緊跟上國(guó)際學(xué)術(shù)發(fā)展的步伐。當(dāng)時(shí)正在北京大學(xué)地球化學(xué)專業(yè)研究化學(xué)元素分布規(guī)律的馮志偉,在圖書(shū)館館藏的1956年出版的美國(guó)《信息論》(IRE Transaction, Information Theory)雜志上,偶然看到了美國(guó)語(yǔ)言學(xué)家喬姆斯基(N.Chomsky)的論文《語(yǔ)言描寫(xiě)的三個(gè)模型》(Three models for the description of language),遂被喬姆斯基在語(yǔ)言研究中的新思想深深地吸引了。喬姆斯基追求語(yǔ)言描寫(xiě)的簡(jiǎn)單性原則,為了使用有限的手段描述變化無(wú)窮的自然語(yǔ)言,他在文章中建立了形式語(yǔ)言和形式文法的新概念,把自然語(yǔ)言和計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言置于相同的平面上,用統(tǒng)一數(shù)學(xué)方法進(jìn)行解釋和定義,提出了語(yǔ)言描寫(xiě)的三個(gè)模型。用數(shù)學(xué)方法描寫(xiě)的這三個(gè)模型既可以用于描寫(xiě)自然語(yǔ)言,又可以描寫(xiě)計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言,達(dá)到了“有限手段的無(wú)限運(yùn)用”的目標(biāo)。馮志偉預(yù)感到這種語(yǔ)言的數(shù)學(xué)描寫(xiě)方法,將會(huì)把自然語(yǔ)言和程序設(shè)計(jì)語(yǔ)言緊密地結(jié)合起來(lái),在信息的處理和研究中發(fā)揮出巨大的威力。他經(jīng)過(guò)反復(fù)考慮,下決心來(lái)研究數(shù)學(xué)方法在語(yǔ)言中的應(yīng)用這個(gè)問(wèn)題,并經(jīng)學(xué)校同意,從理科轉(zhuǎn)到中文系語(yǔ)言學(xué)專業(yè)從事語(yǔ)言學(xué)的學(xué)習(xí)。轉(zhuǎn)入語(yǔ)言學(xué)專業(yè)之后,馮志偉一面學(xué)好傳統(tǒng)語(yǔ)言學(xué)的各門(mén)課程和外語(yǔ),一面利用課余時(shí)間,繼續(xù)研究數(shù)理語(yǔ)言學(xué)的問(wèn)題,他盡量充分地利用北京大學(xué)圖書(shū)館豐富的藏書(shū)和最新的雜志,跟蹤國(guó)際上數(shù)理語(yǔ)言學(xué)發(fā)展的足跡,遂成為了班上名列前茅的學(xué)生。
1961年秋天,團(tuán)中央機(jī)關(guān)建立了這樣一個(gè)制度:團(tuán)中央書(shū)記處的每一位書(shū)記至少直接聯(lián)系一個(gè)團(tuán)支部,作為了解情況和結(jié)交青年朋友的一個(gè)渠道。1961年11月,北京市團(tuán)市委為團(tuán)中央第一書(shū)記胡耀邦選定北京大學(xué)59級(jí)語(yǔ)言專業(yè)團(tuán)支部作為聯(lián)系點(diǎn)。胡耀邦首先找這個(gè)班的團(tuán)支部書(shū)記和宣傳委員了解情況,問(wèn)他們:“你們同學(xué)中有學(xué)習(xí)特別專心的嗎?”他們回答介紹說(shuō):“我們班有個(gè)叫馮志偉的同學(xué)學(xué)習(xí)特別好,他已經(jīng)學(xué)了英語(yǔ)、俄語(yǔ)、德語(yǔ)和日語(yǔ),而且達(dá)到了相當(dāng)水平,但是好像不特別關(guān)心政治?!焙畋硎?“我希望找馮志偉同學(xué)親自談一談?!?/p>
團(tuán)中央第一書(shū)記邀請(qǐng)的消息傳到了北京大學(xué),同學(xué)們都非常激動(dòng)。1961年11月11日,北京大學(xué)團(tuán)委安排馮志偉和其他4名同學(xué)一起到住在富強(qiáng)胡同的胡耀邦家做客。晚飯后,他們乘公共汽車進(jìn)城,當(dāng)時(shí)北京的公交車數(shù)量嚴(yán)重不足,乘車的人很多,他們沒(méi)有擠上從頤和園路過(guò)北大開(kāi)往西直門(mén)的32路汽車,急中生智,干脆從北大乘車到起點(diǎn)站頤和園,再?gòu)念U和園乘車直奔北京市內(nèi),當(dāng)他們趕到富強(qiáng)胡同時(shí)已經(jīng)是晚上9點(diǎn)多鐘了。胡耀邦還在一直等待著同學(xué)們,等得有些著急了。
年輕的同學(xué)們?cè)跁?huì)客室坐下,胡耀邦給每個(gè)同學(xué)遞上了一個(gè)蘋(píng)果,依次詢問(wèn)每個(gè)人的姓名、籍貫。當(dāng)胡耀邦問(wèn)到馮志偉的時(shí)候,他說(shuō):“你就是那個(gè)學(xué)習(xí)特別用功的同學(xué)馮志偉嗎?你學(xué)習(xí)那么努力,挨批了沒(méi)有?”馮志偉笑著回答說(shuō):“其實(shí)我學(xué)習(xí)只是出于對(duì)語(yǔ)言學(xué)的興趣,自己只是想多學(xué)點(diǎn)東西而已。”
馮志偉對(duì)于外語(yǔ)的領(lǐng)悟很靈敏,到1961年底的時(shí)候,他已經(jīng)學(xué)會(huì)了4門(mén)外語(yǔ),而且能夠使用這4種外語(yǔ)閱讀數(shù)理語(yǔ)言學(xué)的外文文獻(xiàn)了。由于他對(duì)數(shù)理語(yǔ)言學(xué)有強(qiáng)烈的興趣,加之?dāng)?shù)理語(yǔ)言學(xué)是交叉學(xué)科,馮志偉除了學(xué)好中文系的語(yǔ)言學(xué)課程之外,還要自學(xué)數(shù)學(xué)和外語(yǔ)等不同的學(xué)科,時(shí)間比別的同學(xué)緊,沒(méi)有很多的時(shí)間來(lái)關(guān)心政治。而當(dāng)時(shí)學(xué)校的政治氣氛特別濃,不太主張學(xué)生讀書(shū),馮志偉就顯得有些古怪,明明是學(xué)中文的文科學(xué)生,一有空就做些數(shù)學(xué)題,還經(jīng)常讀點(diǎn)外文書(shū),這在當(dāng)時(shí)是很不合拍的。有的同學(xué)認(rèn)為馮志偉是在走“只專不紅”的道路,對(duì)他頗有微詞。所以,第一次見(jiàn)面,胡耀邦就已經(jīng)洞察秋毫,關(guān)切地問(wèn)馮志偉“挨批了沒(méi)有?”。
馮志偉坦率地向胡耀邦匯報(bào)了自己的想法,講述了自己學(xué)習(xí)數(shù)理語(yǔ)言學(xué)的動(dòng)機(jī)和過(guò)程。胡耀邦聽(tīng)后,正色地對(duì)馮志偉說(shuō):“事實(shí)將證明你的道路是正確的!”胡耀邦的話斬釘截鐵,擲地有聲。
胡耀邦還嚴(yán)肅地回過(guò)頭來(lái)對(duì)其他同學(xué)說(shuō):“外語(yǔ)學(xué)習(xí)是很重要的,我們需要對(duì)外交流,語(yǔ)言是很好的交流工具呀,懂了外語(yǔ)可以擴(kuò)大眼界?!蓖瑢W(xué)們專心地聆聽(tīng)著,默默地思考著,會(huì)客室的氣氛顯得特別肅穆。
接著,胡耀邦換了語(yǔ)氣,開(kāi)始和大家輕松地聊天。他告訴大家:“學(xué)生的主要任務(wù)是學(xué)習(xí)知識(shí)。我在高中的孩子寫(xiě)了篇作文,老師出題目說(shuō),問(wèn)‘什么是學(xué)生的主要任務(wù)?我的孩子寫(xiě)道:學(xué)生的主要任務(wù)是提高政治水平。”他笑著對(duì)同學(xué)們說(shuō):“現(xiàn)在不少人對(duì)學(xué)生的主要任務(wù)認(rèn)識(shí)不很清楚,其實(shí),道理很簡(jiǎn)單,學(xué)生的主要任務(wù)是學(xué)習(xí)?!?/p>
談話結(jié)束時(shí)已經(jīng)很晚了。同學(xué)們告別了胡耀邦,一路談?wù)撝慕虒?dǎo),總算趕上了末班車順利地回到了北京大學(xué)。
幾天后,胡耀邦又邀請(qǐng)同學(xué)們到他家做客,并且在院子里和同學(xué)們一起照相留影。
胡耀邦的親自接見(jiàn)和親切談話給了馮志偉極大的鼓舞,從此,他學(xué)習(xí)數(shù)理語(yǔ)言學(xué)更加理直氣壯了。
1964年,馮志偉大學(xué)畢業(yè),考上了北京大學(xué)語(yǔ)言學(xué)理論的研究生,經(jīng)導(dǎo)師岑麒祥教授同意,他的研究生畢業(yè)論文的題目定為《數(shù)學(xué)方法在語(yǔ)言學(xué)中的應(yīng)用》,是我國(guó)語(yǔ)言學(xué)研究中首次系統(tǒng)地、全面地來(lái)研究數(shù)理語(yǔ)言學(xué)這個(gè)新興學(xué)科的論文。
這樣,我國(guó)的數(shù)理語(yǔ)言學(xué)研究便首先在北京大學(xué)正式地開(kāi)展起來(lái)。北京大學(xué)中文系的著名語(yǔ)言學(xué)家王力先生和朱德熙先生都支持馮志偉的數(shù)理語(yǔ)言學(xué)研究,王力先生曾對(duì)馮志偉說(shuō):“語(yǔ)言學(xué)不是很簡(jiǎn)單的學(xué)問(wèn),我們應(yīng)該像趙元任先生那樣,首先做一個(gè)數(shù)學(xué)家、物理學(xué)家、文學(xué)家、音樂(lè)家,然后再做一個(gè)合格的語(yǔ)言學(xué)家?!敝斓挛跸壬鴮?duì)馮志偉說(shuō):“數(shù)學(xué)和語(yǔ)言學(xué)的研究都需要有邏輯抽象能力,在這一方面,數(shù)學(xué)和語(yǔ)言學(xué)有共同性。”北京大學(xué)的這些第一流的學(xué)者,總是站在科學(xué)的最前沿來(lái)看待學(xué)術(shù)的發(fā)展,他們的鼓勵(lì)給了馮志偉以巨大的力量。
但是這時(shí)候發(fā)生了一件事情,就是1966年的5月25日,第一張馬列主義的大字報(bào)貼到了北大飯廳的門(mén)口。馮志偉記得很清楚,那一天是5月25日,因?yàn)槟且惶焖ベI(mǎi)一本法文詞典,當(dāng)時(shí)的《法漢詞典》編得很不好,很簡(jiǎn)單,單詞太少了。馮志偉學(xué)過(guò)日文,可以閱讀日文文獻(xiàn),他的導(dǎo)師岑麒祥教授說(shuō):“你去買(mǎi)本《仏和詞典》吧!”(《仏和詞典》是《法日詞典》的日語(yǔ)寫(xiě)法),于是,馮志偉就到五道口的外文書(shū)店買(mǎi)了一本《仏和詞典》。中午時(shí)分,馮志偉剛剛在五道口外文書(shū)店旁邊的小飯館吃完中飯回到北京大學(xué),看到學(xué)校的大飯廳前人頭攢動(dòng)。他伸頭一看,大飯廳前面的墻上貼著大字報(bào)呢。上面寫(xiě)著“陸平、彭佩云你們要走往何方?”,言詞很激烈,陸平是北大的校長(zhǎng),彭佩云是北大的黨委書(shū)記(彭佩云現(xiàn)在是全國(guó)婦聯(lián)的領(lǐng)導(dǎo))他們倆當(dāng)時(shí)被認(rèn)為是北京市委的黑線人物,當(dāng)時(shí)彭真已被揪出來(lái)了。馮志偉一看到大字報(bào),就知道他的論文泡湯了,一場(chǎng)很大的革命就要來(lái)臨了。果然,過(guò)了幾天,《人民日?qǐng)?bào)》就發(fā)表了社論說(shuō),“這是一張馬列主義的大字報(bào)”,一下把火點(diǎn)起來(lái)了。北大進(jìn)入“文化大革命”的混亂狀態(tài),王力先生和朱德熙先生等等,都被打成反動(dòng)學(xué)術(shù)權(quán)威,馮志偉的數(shù)理語(yǔ)言學(xué)研究也隨之失去了支持,這個(gè)新興學(xué)科的研究被這場(chǎng)“革命”扼殺在了襁褓之中。馮志偉的數(shù)理語(yǔ)言學(xué)之夢(mèng)破滅了,他隨之離開(kāi)了北京大學(xué),被分配到云南邊疆的一所中學(xué)里教物理課。
二、邊疆教書(shū):“文革”浩劫中的艱苦探索
在云南邊疆的中學(xué)任教期間,馮志偉不信“讀書(shū)無(wú)用論”,不埋怨大材小用,更不考慮生活的艱苦和清貧,除身體力行,認(rèn)認(rèn)真真地教好學(xué)生,努力搞好本職工作外,還朝朝暮暮,年復(fù)一年,利用一切業(yè)余時(shí)間,密切地關(guān)注著國(guó)外學(xué)術(shù)發(fā)展的動(dòng)向。數(shù)理語(yǔ)言學(xué)仍然像磁石一樣強(qiáng)烈地吸引著他。在云南邊疆那樣閉塞的環(huán)境中,他設(shè)法利用業(yè)余時(shí)間,潛心研究數(shù)理語(yǔ)言學(xué)的問(wèn)題。在信息不足、資料缺乏的困難條件下,他閱讀了所能搜集到的各種關(guān)于數(shù)理語(yǔ)言學(xué)的資料。他懂得英、法、德、俄、日等五種外國(guó)語(yǔ),閱讀了散見(jiàn)于各種外文書(shū)刊中的數(shù)理語(yǔ)言學(xué)文獻(xiàn),緊跟著世界上數(shù)理語(yǔ)言學(xué)發(fā)展的步伐。就在“讀書(shū)無(wú)用論”甚囂塵上的時(shí)候,馮志偉總結(jié)了當(dāng)時(shí)國(guó)外數(shù)理語(yǔ)言學(xué)的成果,于1975年,以昆明五中教師的名義,寫(xiě)成了《數(shù)理語(yǔ)言學(xué)簡(jiǎn)介》的長(zhǎng)篇文章,在重慶的一家自然科學(xué)雜志《計(jì)算機(jī)應(yīng)用與應(yīng)用數(shù)學(xué)》上發(fā)表,向國(guó)內(nèi)計(jì)算機(jī)界和數(shù)學(xué)界詳盡地介紹了數(shù)理語(yǔ)言學(xué)的最新情況。這一篇文章猶如空谷之足音,使當(dāng)時(shí)被文化大革命封閉了世界學(xué)術(shù)進(jìn)展的中國(guó)學(xué)術(shù)界了解到國(guó)外信息時(shí)代已經(jīng)到來(lái)的最新動(dòng)態(tài)。馮志偉在這篇文章中興奮地告訴廣大讀者:“信息時(shí)代的到來(lái),使得語(yǔ)言學(xué)、數(shù)學(xué)和計(jì)算機(jī)科學(xué)結(jié)下了不解之緣,語(yǔ)言研究和計(jì)算機(jī)技術(shù)已經(jīng)到了非結(jié)合不可的地步了!”如今,我國(guó)計(jì)算語(yǔ)言學(xué)界的許多著名學(xué)者,就是從這篇文章中最早了解到語(yǔ)言學(xué)與數(shù)學(xué)的聯(lián)系,從而決心走上研究計(jì)算語(yǔ)言學(xué)道路的。他們當(dāng)時(shí)對(duì)馮志偉這個(gè)中學(xué)老師的名字極為驚嘆,沒(méi)有想到在云南邊疆的中學(xué)里竟然有這樣一位能夠洞察國(guó)際學(xué)術(shù)最新動(dòng)態(tài)的高手!
在云南邊疆的那些日子里,馮志偉利用業(yè)余時(shí)間潛心研究了漢字熵值的測(cè)定問(wèn)題。漢字的“熵”(entropy)是漢字所含信息量大小的數(shù)學(xué)度量。為了進(jìn)行語(yǔ)言文字的信息處理,必須知道文字的信息量,因此,也就必須測(cè)定文字的熵。這是信息時(shí)代語(yǔ)言文字處理應(yīng)該研究的基礎(chǔ)性問(wèn)題。近幾十年來(lái),國(guó)外學(xué)者已陸續(xù)測(cè)出一些拼音文字字母中的熵,而漢字?jǐn)?shù)量太大,各個(gè)漢字的出現(xiàn)概率各不相同,因此,要計(jì)算包含在一個(gè)漢字中的熵是一個(gè)十分復(fù)雜和繁難的問(wèn)題。
為了計(jì)算漢字的熵,首先需要統(tǒng)計(jì)漢字在文本中的出現(xiàn)頻度,由于20世紀(jì)70年代我們還沒(méi)有機(jī)器可讀的漢語(yǔ)語(yǔ)料庫(kù),哪怕小規(guī)模的漢語(yǔ)語(yǔ)料庫(kù)也沒(méi)有,馮志偉只得根據(jù)書(shū)面文本進(jìn)行手工查頻,他請(qǐng)了幾個(gè)志同道合的朋友,用手工幫助他進(jìn)行漢字頻度的調(diào)查。他給這些朋友每個(gè)人發(fā)了一箱卡片,請(qǐng)他們幫助統(tǒng)計(jì)在選定樣本資料中的漢字出現(xiàn)的頻度,并且把這些頻度記錄在卡片上。在朋友們的幫助下,馮志偉用了將近10年的時(shí)間,對(duì)數(shù)百萬(wàn)字的現(xiàn)代漢語(yǔ)文本(占70%)和古代漢語(yǔ)文本(占30%)進(jìn)行了手工查頻,從小到大地逐步擴(kuò)大統(tǒng)計(jì)的規(guī)模,建立了6個(gè)不同容量的漢字頻度表,最后根據(jù)這些不同的漢字頻度表,逐步地?cái)U(kuò)大漢字的容量,終于計(jì)算出了漢字的熵。
為了給漢字熵的測(cè)定建立一個(gè)堅(jiān)實(shí)的理論基礎(chǔ),馮志偉提出了“漢字容量極限定律”。他用數(shù)學(xué)方法證明:當(dāng)統(tǒng)計(jì)樣本中漢字的容量不大時(shí),包含在一個(gè)漢字中的熵隨著漢字容量的增加而增加,當(dāng)統(tǒng)計(jì)樣本中的漢字容量達(dá)到12366字時(shí),包含在一個(gè)漢字中的熵就不再增加了,這意味著,在測(cè)定漢字的熵時(shí),統(tǒng)計(jì)樣本中漢字的容量是有極限的。這個(gè)極限值就是12366字,超出這個(gè)極限值,測(cè)出的漢字熵再也不會(huì)增加了。在“漢字容量極限定律”的基礎(chǔ)上,馮志偉在包含12370個(gè)不同漢字的統(tǒng)計(jì)樣本的范圍內(nèi),初步測(cè)出了在考慮語(yǔ)言符號(hào)出現(xiàn)概率差異的情況下,包含在一個(gè)漢字中的熵為9.65比特。由此得出結(jié)論:從漢語(yǔ)書(shū)面語(yǔ)總體來(lái)考慮,在現(xiàn)代漢語(yǔ)和古代漢語(yǔ)的全部漢語(yǔ)書(shū)面語(yǔ)中,包含在一個(gè)漢字中的熵是9.65比特。20世紀(jì)80年代,我國(guó)北京航空學(xué)院計(jì)算機(jī)系劉源教授使用計(jì)算機(jī)統(tǒng)計(jì)漢字的頻度,并計(jì)算出漢字的熵為9.71比特。劉源教授使用計(jì)算機(jī)計(jì)算的結(jié)果與馮志偉手工測(cè)定的結(jié)果相差不大,足以說(shuō)明馮志偉對(duì)于漢字熵的測(cè)定是十分認(rèn)真的。馮志偉這項(xiàng)極為重要的科學(xué)研究說(shuō)明,由于漢字的熵大于8比特,所以,漢字不能使用8比特的單字節(jié)編碼,而要使用16比特的雙字節(jié)編碼。這項(xiàng)研究為漢字信息的計(jì)算機(jī)處理提供了基本的數(shù)據(jù),對(duì)漢字編碼、漢字改革和漢語(yǔ)的規(guī)范化都有重要的指導(dǎo)意義。
三、從北京到法國(guó):研制世界上第一個(gè)漢語(yǔ)到多種外語(yǔ)的機(jī)器翻譯系統(tǒng)
粉碎“四人幫”之后,迎來(lái)了科學(xué)的春天。高等學(xué)校開(kāi)始招生。毛澤東主席生前對(duì)于大學(xué)招生做過(guò)指示:“大學(xué)還是要辦的”,但接著他又指示:“我這里主要說(shuō)的是理工科大學(xué)還要辦”。毛澤東在他的指示中沒(méi)有說(shuō)文科大學(xué)還要辦。這樣,大學(xué)招生時(shí),首先恢復(fù)的是理工科大學(xué)招生,而文科沒(méi)有招生。馮志偉渴望著早日回到科學(xué)研究的崗位上去,他決定,既然文科不招生,那就報(bào)考理工科,于是,他報(bào)考了中國(guó)科學(xué)技術(shù)大學(xué)研究生院,毅然參加理工科大學(xué)的入學(xué)考試。1978年,原來(lái)畢業(yè)于北京大學(xué)中文系研究生的文科學(xué)生馮志偉,以優(yōu)異的理科成績(jī)考上了中國(guó)科學(xué)技術(shù)大學(xué)研究生院信息科學(xué)系的研究生,又開(kāi)始了理科的學(xué)習(xí),從云南邊疆回到了北京。
在中國(guó)科學(xué)技術(shù)大學(xué)研究生院學(xué)習(xí)期間,馮志偉很快就在理工科的雜志上發(fā)表了論文。1979年,《計(jì)算機(jī)科學(xué)》雜志創(chuàng)刊,他就在該雜志創(chuàng)刊號(hào)上發(fā)表了《形式語(yǔ)言理論》的長(zhǎng)篇論文,用嚴(yán)格的數(shù)學(xué)表達(dá)方式向計(jì)算機(jī)科學(xué)界說(shuō)明數(shù)理語(yǔ)言學(xué)中的形式化方法如何推動(dòng)了當(dāng)代計(jì)算機(jī)科學(xué)的發(fā)展,并且指出:在數(shù)理語(yǔ)言學(xué)研究中發(fā)展起來(lái)的形式語(yǔ)言理論,事實(shí)上已經(jīng)成為了當(dāng)代計(jì)算機(jī)科學(xué)不可缺少的一塊重要理論基石,計(jì)算機(jī)科學(xué)絕不可忽視形式語(yǔ)言理論。許多人認(rèn)為這篇文章一定是資深的計(jì)算機(jī)科學(xué)家寫(xiě)的,后來(lái),當(dāng)計(jì)算機(jī)界的一些專家了解到,這篇論文的作者竟然是文革前北京大學(xué)中文系的一名文科研究生的時(shí)候,感到非常驚訝。
不久,馮志偉被中國(guó)科學(xué)技術(shù)大學(xué)研究生院選送到法國(guó)格勒諾布爾理科醫(yī)科大學(xué)應(yīng)用數(shù)學(xué)研究所(IMAG)自動(dòng)翻譯中心(GETA)學(xué)習(xí),師從當(dāng)時(shí)國(guó)際計(jì)算語(yǔ)言學(xué)委員會(huì)主席、法國(guó)著名數(shù)學(xué)家沃古瓦(B.Vauquois)教授,并專門(mén)研究自動(dòng)翻譯和數(shù)理語(yǔ)言學(xué)問(wèn)題。沃古瓦教授是國(guó)際計(jì)算語(yǔ)言學(xué)委員會(huì)的創(chuàng)始人,是當(dāng)時(shí)國(guó)際計(jì)算語(yǔ)言學(xué)的領(lǐng)軍人物,他領(lǐng)導(dǎo)的GETA在機(jī)器翻譯的理論和實(shí)踐上都做出了出色的成績(jī)。馮志偉在GETA良好的學(xué)習(xí)環(huán)境中,可以了解到機(jī)器翻譯發(fā)展的最新情況,可以學(xué)習(xí)到當(dāng)代機(jī)器翻譯最前沿的技術(shù)。馮志偉喜歡數(shù)學(xué),而沃古瓦教授是數(shù)學(xué)家,他們都深知自然語(yǔ)言的形式理論對(duì)于構(gòu)建機(jī)器翻譯系統(tǒng)的重要性。
在法國(guó)留學(xué)期間,馮志偉的主要工作是進(jìn)行漢語(yǔ)與不同外語(yǔ)的機(jī)器翻譯研究。開(kāi)始時(shí),他使用的自然語(yǔ)言形式理論是喬姆斯基的短語(yǔ)結(jié)構(gòu)語(yǔ)法,他試圖使用短語(yǔ)結(jié)構(gòu)語(yǔ)法來(lái)進(jìn)行漢語(yǔ)的自動(dòng)分析。早在1957年,馮志偉就接觸到喬姆斯基的形式語(yǔ)言理論,他對(duì)喬姆斯基的理論是有深入了解的。喬姆斯基根據(jù)形式語(yǔ)法的原理,提出了短語(yǔ)結(jié)構(gòu)語(yǔ)法作為自然語(yǔ)言形式描述的一種手段,這種語(yǔ)法在自然語(yǔ)言處理中得到了廣泛的使用。國(guó)內(nèi)外的許多機(jī)器翻譯系統(tǒng)都采用喬姆斯基的短語(yǔ)結(jié)構(gòu)語(yǔ)法作為系統(tǒng)設(shè)計(jì)的基本理論依據(jù)。根據(jù)喬姆斯基的短語(yǔ)結(jié)構(gòu)語(yǔ)法,表示句子結(jié)構(gòu)的樹(shù)形圖中的每一個(gè)結(jié)點(diǎn)只有一個(gè)相應(yīng)的標(biāo)記,結(jié)點(diǎn)與標(biāo)記之間的這種關(guān)系是一種單值標(biāo)記函數(shù)的關(guān)系。這種單值標(biāo)記函數(shù)表示的語(yǔ)言特征是十分有限的,因而在機(jī)器翻譯中進(jìn)行漢語(yǔ)自動(dòng)分析時(shí),會(huì)出現(xiàn)大量的歧義問(wèn)題,難于區(qū)分句法結(jié)構(gòu)相同而語(yǔ)義結(jié)構(gòu)不同的漢語(yǔ)句子,這種分析法是短語(yǔ)結(jié)構(gòu)語(yǔ)法在分析漢語(yǔ)時(shí)一個(gè)致命的缺點(diǎn)。
當(dāng)時(shí),馮志偉在法國(guó)研制開(kāi)發(fā)機(jī)器翻譯系統(tǒng)的實(shí)踐中,就已敏銳地認(rèn)識(shí)到短語(yǔ)結(jié)構(gòu)語(yǔ)法的這種致命缺點(diǎn)。
有一天,沃古瓦教授和馮志偉討論漢語(yǔ)自動(dòng)分析的問(wèn)題。馮志偉坦率地向沃古瓦教授說(shuō):“喬姆斯基的短語(yǔ)結(jié)構(gòu)語(yǔ)法對(duì)于法語(yǔ)和英語(yǔ)的分析可能沒(méi)有多大問(wèn)題,可是,用這種語(yǔ)法來(lái)分析漢語(yǔ),幾乎寸步難行”。
沃古瓦教授用好奇的目光看著馮志偉,他希望馮志偉進(jìn)一步闡述自己的看法。馮志偉舉例作了如下說(shuō)明:
在漢語(yǔ)中可以說(shuō)“點(diǎn)心吃了”,實(shí)際上是“點(diǎn)心被吃了”,但漢語(yǔ)一般不用“被”字;漢語(yǔ)中還可以說(shuō)“張三吃了”,實(shí)際上是“張三把點(diǎn)心吃了”?!皬埲笔莻€(gè)名詞短語(yǔ)NP(Noun Phrase),“點(diǎn)心”也是個(gè)NP,“吃了”是個(gè)動(dòng)詞短語(yǔ)VP(Verb Phrase),這兩個(gè)句子的規(guī)則都是:S→NP+VP,其中,S(Sentence)表示句子,它們的層次相同,詞序相同,詞性也相同,但卻有截然不同的含義,一個(gè)是被動(dòng)句,一個(gè)是主動(dòng)句。我們?cè)趺磥?lái)解釋這樣的差異呢?如果使用短語(yǔ)結(jié)構(gòu)語(yǔ)法,用計(jì)算機(jī)來(lái)分析這兩個(gè)不同的句子,計(jì)算機(jī)最后做出來(lái)的肯定是一樣的樹(shù)形圖,它們的差別只是在葉子結(jié)點(diǎn)上的詞不一樣,整個(gè)樹(shù)形圖的上層都是同樣的S→NP+VP,這樣結(jié)構(gòu)相同的句子為什么會(huì)有不同的語(yǔ)義解釋,從而產(chǎn)生不同的含義呢?使用短語(yǔ)結(jié)構(gòu)語(yǔ)法顯然是解釋不了的,而中文里到處都是這樣的句子,因?yàn)橹形睦锏谋粍?dòng)關(guān)系有不同的表示方法,有時(shí)主動(dòng)和被動(dòng)在形式上沒(méi)有明顯的區(qū)別,可以從句子的上下文和意念上來(lái)加以區(qū)分。在這種進(jìn)退兩難的局面下,唯一的出路就是根據(jù)漢語(yǔ)語(yǔ)法的特點(diǎn)改進(jìn)喬姆斯基的短語(yǔ)結(jié)構(gòu)語(yǔ)法,設(shè)法使用一種新的方法來(lái)描述漢語(yǔ)。
沃古瓦教授耐心地聽(tīng)完了馮志偉的說(shuō)明,從沙發(fā)上站起來(lái)驚嘆地說(shuō):“漢語(yǔ)真是一種langue terrible(法語(yǔ):糟糕的語(yǔ)言)”。他說(shuō):“哪種語(yǔ)言能夠不分主動(dòng)和被動(dòng),‘人吃了和‘被人吃了怎么能是一樣?怎么這么亂?”
馮志偉向沃古瓦教授解釋道:其實(shí)中國(guó)人一點(diǎn)兒也不感覺(jué)到亂,中國(guó)人在說(shuō)話時(shí)分辨得很清楚,因?yàn)槲覀冎袊?guó)人知道在一般情況下,人是不能被吃的。所以“小王吃了”的語(yǔ)義不能是“小王被吃了”,而點(diǎn)心不吃東西,所以“點(diǎn)心吃了”必定是“點(diǎn)心被吃了”。漢語(yǔ)是靠詞匯的固有語(yǔ)義來(lái)解決語(yǔ)法問(wèn)題的,但是對(duì)于法國(guó)人來(lái)講,并不存在這樣的問(wèn)題。所以,我們不能按照法語(yǔ)的思考方法來(lái)處理這個(gè)漢語(yǔ)的問(wèn)題,我們必須另辟蹊徑!
沃古瓦教授是一個(gè)知識(shí)廣博、眼界開(kāi)闊的學(xué)者,他鼓勵(lì)馮志偉沿著這個(gè)思路繼續(xù)探索。他對(duì)馮志偉說(shuō):“喬姆斯基的短語(yǔ)結(jié)構(gòu)語(yǔ)法也不一定永遠(yuǎn)正確嘛!”
在馮志偉告別時(shí),沃古瓦教授興奮地說(shuō):“我相信,你一定能找出一種漢語(yǔ)自動(dòng)分析的新方法?!?/p>
這次和沃古瓦教授的談話使馮志偉深刻地認(rèn)識(shí)到,喬姆斯基的短語(yǔ)結(jié)構(gòu)語(yǔ)法在漢語(yǔ)自動(dòng)分析時(shí)確實(shí)遇到了極大的困難。這種困難甚至連沃古瓦教授這樣世界第一流的計(jì)算語(yǔ)言學(xué)家也承認(rèn)了。作為中國(guó)的科學(xué)工作者,他必須想出一種新的辦法,來(lái)克服短語(yǔ)結(jié)構(gòu)語(yǔ)法的缺點(diǎn)。不然,他現(xiàn)在進(jìn)行的漢語(yǔ)自動(dòng)分析就很難搞下去了。
馮志偉根據(jù)機(jī)器翻譯的實(shí)踐,提出了表示從屬關(guān)系語(yǔ)法的從屬樹(shù)(Dependence Tree)應(yīng)該滿足如下五個(gè)條件:(一)單純結(jié)點(diǎn)條件:從屬樹(shù)中,只有終極結(jié)點(diǎn),沒(méi)有非終極結(jié)點(diǎn),從屬樹(shù)中的所有結(jié)點(diǎn)所代表的都是句子中實(shí)際出現(xiàn)的具體的單詞;(二)單一父結(jié)點(diǎn)條件:在從屬樹(shù)中,除了根結(jié)點(diǎn)沒(méi)有父結(jié)點(diǎn)之外,所有的結(jié)點(diǎn)都只有一個(gè)父結(jié)點(diǎn);(三)獨(dú)根結(jié)點(diǎn)條件:一個(gè)從屬樹(shù)只能有一個(gè)根結(jié)點(diǎn),這個(gè)根結(jié)點(diǎn),就是從屬樹(shù)中唯一沒(méi)有父結(jié)點(diǎn)的結(jié)點(diǎn),這個(gè)根結(jié)點(diǎn)支配著其他所有的結(jié)點(diǎn);(四)非交條件:從屬樹(shù)中的樹(shù)枝不能彼此相交;(五)互斥條件:從屬樹(shù)中的結(jié)點(diǎn)之間,從上到下的支配關(guān)系和從左到右的前于關(guān)系之間是互相排斥的,如果兩個(gè)結(jié)點(diǎn)之間存在著支配關(guān)系,它們之間就不能存在前于關(guān)系。馮志偉提出的這5個(gè)條件比1970年美國(guó)計(jì)算語(yǔ)言學(xué)家羅賓孫(J.Robinson)提出的從屬關(guān)系語(yǔ)法的4條公理更加直觀,更加便于在機(jī)器翻譯中使用。
馮志偉在法國(guó)研究的另一個(gè)問(wèn)題是生成語(yǔ)法的公理化方法。馮志偉從公理化方法的角度來(lái)研究喬姆斯基的形式文法,他把喬姆斯基的形式文法同數(shù)學(xué)中的“半圖厄系統(tǒng)”(semi-Thue system)相比較,指出了喬姆斯基的形式文法,不過(guò)是數(shù)學(xué)中的公理系統(tǒng)理論在語(yǔ)言分析中的應(yīng)用而已,語(yǔ)言就是由文法這一公理系統(tǒng)從初始符號(hào)出發(fā)推導(dǎo)出的無(wú)限句子的集合;文法的規(guī)則是有限的,文法中的終極符號(hào)和非終極符號(hào)的數(shù)目也是有限的,可是,由于語(yǔ)言符號(hào)具有遞歸性,文法這一公理系統(tǒng)就能夠根據(jù)有限的符號(hào),通過(guò)有限的重寫(xiě)規(guī)則,遞歸地推導(dǎo)出無(wú)限的句子來(lái)。馮志偉的研究,從數(shù)學(xué)的基礎(chǔ)理論方面揭示了形式文法的實(shí)質(zhì)。
馮志偉根據(jù)他提出的MMT模型,于1981年完成了漢-法/英/日/俄/德多語(yǔ)言機(jī)器翻譯試驗(yàn),建立了FAJRA系統(tǒng)。在IBM-4341大型計(jì)算機(jī)上,把二十多篇漢語(yǔ)文章自動(dòng)地翻譯成英文、法文、日文、俄文、德文。這是世界上第一個(gè)漢語(yǔ)到多種外語(yǔ)的機(jī)器翻譯系統(tǒng),開(kāi)創(chuàng)了多語(yǔ)言機(jī)器翻譯系統(tǒng)之先河。
馮志偉的研究從理論和實(shí)踐上都改進(jìn)了短語(yǔ)結(jié)構(gòu)語(yǔ)法,受到了導(dǎo)師沃古瓦教授的贊賞。馮志偉急著想把他的成果應(yīng)用到中國(guó)的科技信息文獻(xiàn)的大規(guī)模翻譯方面,建立一個(gè)實(shí)用的機(jī)器翻譯系統(tǒng),因此,實(shí)驗(yàn)報(bào)告一寫(xiě)完,他就馬上離開(kāi)法國(guó)回到了祖國(guó)。
回到北京,馮志偉想到的第一件事情就是到北京大學(xué)拜見(jiàn)他的老師——著名語(yǔ)言學(xué)家王力先生,向王力先生匯報(bào)在法國(guó)學(xué)習(xí)的收獲。早年馮志偉在北京大學(xué)中文系開(kāi)始研究數(shù)理語(yǔ)言學(xué)的時(shí)候,王力先生就支持過(guò)馮志偉的研究,在北京大學(xué)求學(xué)期間,馮志偉曾經(jīng)認(rèn)真地聽(tīng)過(guò)王力先生講授的《古代漢語(yǔ)》《漢語(yǔ)史》《中國(guó)語(yǔ)言學(xué)史》《清代古音學(xué)》等課程,學(xué)習(xí)成績(jī)優(yōu)異,這些課程,為他后來(lái)的計(jì)算語(yǔ)言學(xué)研究奠定了堅(jiān)實(shí)的基礎(chǔ),馮志偉永遠(yuǎn)忘不了他的恩師王力先生。
1982年春天,馮志偉和他的老同學(xué)吳坤定(現(xiàn)為北京出版社編審)一起到北京大學(xué)燕南園去看望王力先生。一進(jìn)門(mén),王力先生就高興地請(qǐng)他們坐下。王力先生對(duì)馮志偉說(shuō):“聽(tīng)說(shuō)你到法國(guó)之后已經(jīng)改行學(xué)習(xí)自然科學(xué)了,現(xiàn)在,你有了很好的數(shù)理化基礎(chǔ),因此也就有了科學(xué)的頭腦,這些都是很寶貴的財(cái)富,在語(yǔ)言學(xué)研究中隨時(shí)用得著”。馮志偉向王力教授匯報(bào)了他在法國(guó)研究多語(yǔ)言機(jī)器翻譯的收獲。王力先生細(xì)心地聽(tīng)著,他對(duì)馮志偉說(shuō):“我前年在武漢開(kāi)的中國(guó)語(yǔ)言學(xué)會(huì)成立大會(huì)上曾經(jīng)說(shuō),我一輩子吃虧就吃虧在不懂?dāng)?shù)理化?,F(xiàn)在你懂得數(shù)理化,就不會(huì)像我這樣吃虧了,我相信你今后一定會(huì)做出更好的成績(jī)”。接著,王力先生又說(shuō):“20多年前我曾經(jīng)對(duì)你說(shuō)過(guò),我希望你學(xué)習(xí)趙元任先生。當(dāng)然,這是很難的。趙元任先生由哲學(xué)家、物理學(xué)家、數(shù)學(xué)家、文學(xué)家、音樂(lè)家做底子,最后才成為世界著名的語(yǔ)言學(xué)家的。我一輩子都想學(xué)他,但是,我的數(shù)理化基礎(chǔ)差,沒(méi)有學(xué)好。你現(xiàn)在到法國(guó)學(xué)習(xí)了自然科學(xué),已經(jīng)具備學(xué)習(xí)趙元任先生的條件了,我再一次提醒你,你要向趙元任先生學(xué)習(xí),而且一定要學(xué)得比我好”。王力先生這些語(yǔ)重心長(zhǎng)的話,給了馮志偉極大的鼓勵(lì),他決心按照王力先生的教導(dǎo),把數(shù)理化的知識(shí)和語(yǔ)言學(xué)的知識(shí)結(jié)合起來(lái),做一個(gè)信息時(shí)代的新型的語(yǔ)言學(xué)家。
從法國(guó)回國(guó)之后,馮志偉在中國(guó)科技信息研究所計(jì)算中心擔(dān)任機(jī)器翻譯研究組的組長(zhǎng)。在王力先生的鼓勵(lì)下,他利用當(dāng)時(shí)北京遙感技術(shù)研究所的IBM-4361計(jì)算機(jī),于1985年進(jìn)行了德-漢機(jī)器翻譯試驗(yàn)和法-漢機(jī)器翻譯試驗(yàn),建立了GCAT德-漢機(jī)器翻譯系統(tǒng)和FCAT法-漢機(jī)器翻譯系統(tǒng),檢驗(yàn)了MMT模型分析漢語(yǔ)和生成漢語(yǔ)的能力,試驗(yàn)結(jié)果良好??上в捎谫Y金缺乏,不能開(kāi)展更大規(guī)模的實(shí)驗(yàn),他要建立實(shí)用性機(jī)器翻譯系統(tǒng)的愿望沒(méi)有馬上實(shí)現(xiàn)。
1982年秋天,馮志偉應(yīng)北京大學(xué)的邀請(qǐng),在北京大學(xué)中文系漢語(yǔ)專業(yè)開(kāi)設(shè)了“語(yǔ)言學(xué)中的數(shù)學(xué)問(wèn)題”的選修課。這是國(guó)內(nèi)首次在高等學(xué)校全面地、系統(tǒng)地講述數(shù)理語(yǔ)言學(xué)的課程,受到學(xué)生們的歡迎。北京大學(xué)前任校長(zhǎng)、著名數(shù)學(xué)家丁石孫教授在他的專著《數(shù)學(xué)與教育》一書(shū)中,對(duì)馮志偉的這門(mén)課程作了如下的評(píng)價(jià):“1982年,北京大學(xué)中文系開(kāi)設(shè)了《語(yǔ)言學(xué)中的數(shù)學(xué)問(wèn)題》,這是給漢語(yǔ)專業(yè)學(xué)生開(kāi)的選修課程,許多同學(xué)對(duì)這門(mén)學(xué)科產(chǎn)生了很大的興趣。經(jīng)過(guò)一個(gè)學(xué)期的學(xué)習(xí),同學(xué)們初步認(rèn)識(shí)了現(xiàn)代數(shù)學(xué)的發(fā)展給語(yǔ)言學(xué)注入了生機(jī),覺(jué)得獲益匪淺,對(duì)語(yǔ)言學(xué)這門(mén)古老的學(xué)科分支的發(fā)展充滿了信心,而且這一舉動(dòng)沖擊了相當(dāng)多人的舊概念,使閉塞的中國(guó)學(xué)術(shù)界認(rèn)識(shí)到,即使在人文科學(xué)教育中,數(shù)學(xué)也在逐漸起作用。”在北京大學(xué)講稿的基礎(chǔ)之上,馮志偉寫(xiě)出了我國(guó)第一部數(shù)理語(yǔ)言學(xué)的專著,書(shū)名就叫做《數(shù)理語(yǔ)言學(xué)》,于1985年8月由上海知識(shí)出版社出版。接著,他又出版了《自動(dòng)翻譯》專著,深入地探討自然語(yǔ)言機(jī)器翻譯的理論和實(shí)踐問(wèn)題。這兩本專著的出版,受到了我國(guó)計(jì)算語(yǔ)言學(xué)界的歡迎。不少出國(guó)學(xué)習(xí)計(jì)算語(yǔ)言學(xué)的留學(xué)生,出國(guó)時(shí)都帶著這兩本書(shū),作為入門(mén)的向?qū)А?/p>
四、德國(guó)斯圖加特:建立世界上第一個(gè)中文術(shù)語(yǔ)數(shù)據(jù)庫(kù)
1985年,原文字改革委員會(huì)改名為國(guó)家語(yǔ)言文字工作委員會(huì),需要計(jì)算語(yǔ)言學(xué)方面的人材,馮志偉調(diào)入了國(guó)家語(yǔ)言文字工作委員會(huì)語(yǔ)言文字應(yīng)用研究所擔(dān)任計(jì)算語(yǔ)言學(xué)研究室主任,得以專門(mén)從事計(jì)算語(yǔ)言學(xué)的研究工作。與此同時(shí),理工科方面仍然很需要他,他也在中國(guó)科學(xué)院軟件研究所擔(dān)任兼職研究員。
根據(jù)中德科技合作協(xié)定,馮志偉受中國(guó)科學(xué)院軟件研究所的派遣,于1986年至1988年到德國(guó)夫瑯禾費(fèi)研究院新信息技術(shù)與通訊系統(tǒng)研究所(FhG)擔(dān)任客座研究員,從事術(shù)語(yǔ)數(shù)據(jù)庫(kù)的開(kāi)發(fā)。FhG在德國(guó)的斯圖加特(Stuttgart),是德國(guó)著名的工程研究院,在信息科學(xué)和術(shù)語(yǔ)數(shù)據(jù)庫(kù)方面的研究尤其出色。
術(shù)語(yǔ)是人類科學(xué)技術(shù)知識(shí)在自然語(yǔ)言中的結(jié)晶。術(shù)語(yǔ)數(shù)據(jù)庫(kù)是在計(jì)算機(jī)上建立的人類科學(xué)技術(shù)的知識(shí)庫(kù),馮志偉的這項(xiàng)研究屬于知識(shí)工程的研究,具有重要的意義。
當(dāng)時(shí)還沒(méi)有很好的漢字輸入輸出軟件,馮志偉克服了重重困難,在FhG使用UNIX操作系統(tǒng)和INGRES軟件,建立了數(shù)據(jù)處理領(lǐng)域的中文術(shù)語(yǔ)數(shù)據(jù)庫(kù)GLOT-C,并且把這個(gè)數(shù)據(jù)庫(kù)與FhG的其他語(yǔ)言的術(shù)語(yǔ)數(shù)據(jù)庫(kù)相連接,可以快速地進(jìn)行多語(yǔ)言術(shù)語(yǔ)的查詢和檢索,并且能夠處理漢字。這是世界上第一個(gè)中文術(shù)語(yǔ)數(shù)據(jù)庫(kù),具有開(kāi)創(chuàng)作用。
在FhG研究術(shù)語(yǔ)數(shù)據(jù)庫(kù)的過(guò)程中,馮志偉還接觸到多種語(yǔ)言的大量術(shù)語(yǔ),他驚異地發(fā)現(xiàn),幾乎在每一種語(yǔ)言中,詞組型術(shù)語(yǔ)的數(shù)量都大大地超過(guò)了單詞型術(shù)語(yǔ)的數(shù)量。他試圖從理論上對(duì)這樣的語(yǔ)言事實(shí)進(jìn)行解釋。
為此,他把數(shù)理語(yǔ)言學(xué)的理論應(yīng)用到術(shù)語(yǔ)數(shù)據(jù)庫(kù)的研究中,提出了“術(shù)語(yǔ)形成的經(jīng)濟(jì)律”。他證明了:在一個(gè)術(shù)語(yǔ)系統(tǒng)中,術(shù)語(yǔ)系統(tǒng)的經(jīng)濟(jì)指數(shù)與術(shù)語(yǔ)平均長(zhǎng)度的乘積恰恰等于單詞的術(shù)語(yǔ)構(gòu)成頻度之值,并提出了“FEL公式”來(lái)描述這個(gè)定律。
根據(jù)FEL公式可知,在一個(gè)術(shù)語(yǔ)系統(tǒng)中,提高術(shù)語(yǔ)系統(tǒng)經(jīng)濟(jì)指數(shù)的最好方法是在盡量不過(guò)大地改變術(shù)語(yǔ)平均長(zhǎng)度的前提下,增加單詞的術(shù)語(yǔ)構(gòu)成頻度。這樣,在術(shù)語(yǔ)形成的過(guò)程中,將會(huì)產(chǎn)生大量的詞組型術(shù)語(yǔ),使得詞組型術(shù)語(yǔ)的數(shù)量大大地超過(guò)單詞型術(shù)語(yǔ)的數(shù)量,而成為術(shù)語(yǔ)系統(tǒng)中的大多數(shù)。
FEL公式從數(shù)理語(yǔ)言學(xué)的角度,正確地解釋了為什么術(shù)語(yǔ)系統(tǒng)中詞組型術(shù)語(yǔ)的數(shù)目總是遠(yuǎn)遠(yuǎn)大于單詞型術(shù)語(yǔ)的數(shù)目的數(shù)學(xué)機(jī)理,它反映了語(yǔ)言中的省力原則和經(jīng)濟(jì)原則,這是我國(guó)學(xué)者對(duì)于數(shù)理語(yǔ)言學(xué)中著名的齊夫定律(Zipf's law)的新發(fā)展,并從術(shù)語(yǔ)的角度說(shuō)明了語(yǔ)言中的省力原則和經(jīng)濟(jì)原則是具有普遍意義的原則。
“術(shù)語(yǔ)形成的經(jīng)濟(jì)律”提出之后,國(guó)內(nèi)外的術(shù)語(yǔ)學(xué)界根據(jù)術(shù)語(yǔ)數(shù)據(jù)庫(kù)的事實(shí)進(jìn)行檢驗(yàn),檢驗(yàn)證明,在各種術(shù)語(yǔ)數(shù)據(jù)庫(kù)中,詞組型術(shù)語(yǔ)的數(shù)目確實(shí)都大于單詞型術(shù)語(yǔ)的數(shù)目。因此,馮志偉提出的“術(shù)語(yǔ)形成的經(jīng)濟(jì)律”是適應(yīng)于各種語(yǔ)言的一條普遍規(guī)律,是現(xiàn)代術(shù)語(yǔ)學(xué)的一條重要的基本定律。
語(yǔ)言是現(xiàn)實(shí)的編碼體系,術(shù)語(yǔ)形成的經(jīng)濟(jì)律反映了用詞作為語(yǔ)言材料進(jìn)行單詞型術(shù)語(yǔ)和詞組型術(shù)語(yǔ)的編碼時(shí)的經(jīng)濟(jì)律,這一經(jīng)濟(jì)律也可適用于語(yǔ)言編碼的其他領(lǐng)域。漢語(yǔ)在用單字組成多字詞的時(shí)候,有限數(shù)目的單字組成了為數(shù)可觀的多字詞,多字詞以增加自身的長(zhǎng)度為代價(jià)來(lái)保持漢語(yǔ)中原有單字的個(gè)數(shù)或者盡量不增加原有單字的個(gè)數(shù),體現(xiàn)了組字成詞這個(gè)編碼過(guò)程的經(jīng)濟(jì)律。多字詞也就是雙音詞或多音詞,著名語(yǔ)言學(xué)家呂叔湘先生指出,“北方話的語(yǔ)音面貌在最近幾百年里沒(méi)有多大變化,可是雙音詞的增加以近百年為甚,而且大部分是與經(jīng)濟(jì)、政治和文化生活有關(guān)的所謂‘新名詞??梢?jiàn)同音詞在現(xiàn)代主要起消極作用,就是說(shuō),要?jiǎng)?chuàng)造新的單音詞是極其困難的了。”呂叔湘先生在這里一方面指出了要?jiǎng)?chuàng)造新的單音詞(即單字)極其困難,一方面又指出了雙音詞(即雙字詞)的大量增加的現(xiàn)象,這正是組字成詞的經(jīng)濟(jì)律的生動(dòng)體現(xiàn)。
對(duì)漢字結(jié)構(gòu)及其構(gòu)成成分的統(tǒng)計(jì)與分析表明,在《辭?!?1979年版)所收的16295個(gè)字和GB2312-80國(guó)家標(biāo)準(zhǔn)《信息交換用漢字編碼字符集·基本集》收入,而《辭?!肺词盏?3個(gè)字中,簡(jiǎn)化字和被簡(jiǎn)化的繁體字(包括被淘汰的異體字和計(jì)量用字)以及未簡(jiǎn)化的漢字共有16339個(gè),它們是由675個(gè)不能再分解的末級(jí)部件構(gòu)成的,簡(jiǎn)化字和未簡(jiǎn)化的漢字(不包括被簡(jiǎn)化的繁體字、被淘汰的異體字和計(jì)量用字)共11837個(gè),它們是由648個(gè)不能再分解的末級(jí)部件構(gòu)成的。由少量的部件構(gòu)成大量的漢字,體現(xiàn)了部件構(gòu)成漢字這一編碼過(guò)程的經(jīng)濟(jì)律。
所以,馮志偉提出的術(shù)語(yǔ)形成經(jīng)濟(jì)律實(shí)際上乃是“語(yǔ)言編碼的經(jīng)濟(jì)律”,這是語(yǔ)言學(xué)中的一個(gè)普遍規(guī)律,它支配著語(yǔ)言編碼的所有過(guò)程。
馮志偉在研究FEL公式的同時(shí)還提出了“生詞增幅遞減律”。他指出,在一個(gè)術(shù)語(yǔ)系統(tǒng)中,每個(gè)單詞的絕對(duì)頻度是不同的,經(jīng)常使用的單詞是高頻詞,不經(jīng)常使用的單詞是低頻詞,隨著術(shù)語(yǔ)條目的增加,高頻詞的數(shù)目也相應(yīng)地增加,而生詞出現(xiàn)的可能性越來(lái)越小,這時(shí),盡管術(shù)語(yǔ)的條數(shù)還繼續(xù)增加,生詞總數(shù)增加的速率卻越來(lái)越慢,而高頻詞則反復(fù)地出現(xiàn),生詞的增幅有遞減的趨勢(shì)。這個(gè)“生詞增幅遞減律”不僅適用于術(shù)語(yǔ)系統(tǒng),也適用于閱讀書(shū)面文本的過(guò)程。人們?cè)陂喿x一種用自己不熟悉的語(yǔ)言寫(xiě)的文本時(shí),開(kāi)始總有大量不認(rèn)識(shí)的生詞,隨著閱讀數(shù)量的增加,生詞增加的幅度會(huì)逐漸減少,如果閱讀者能夠掌握好已經(jīng)閱讀過(guò)的生詞,閱讀將會(huì)變得越來(lái)越容易。
馮志偉在術(shù)語(yǔ)研究中還提出了“潛在歧義論”(Potential Ambiguity Theory,簡(jiǎn)稱PA論),指出了中文術(shù)語(yǔ)的歧義格式中,包含著歧義性的一面,也包含著非歧義性的一面,因而這樣的歧義格式是潛在的,它只是具有歧義的可能性,而并非現(xiàn)實(shí)的歧義。潛在的歧義能否轉(zhuǎn)化成現(xiàn)實(shí)的歧義,要通過(guò)潛在歧義結(jié)構(gòu)的“實(shí)例化”(instantiation)過(guò)程來(lái)實(shí)現(xiàn),“實(shí)例化”之后,有的歧義結(jié)構(gòu)會(huì)變成真正的歧義結(jié)構(gòu),有的歧義結(jié)構(gòu)則不然。這一理論是對(duì)傳統(tǒng)語(yǔ)言學(xué)中“類型-實(shí)例”(type-token)觀念的沖擊,深化了對(duì)于歧義格式本質(zhì)的認(rèn)識(shí)。近年來(lái),馮志偉又把PA論推廣到日常語(yǔ)言的領(lǐng)域,促進(jìn)了自然語(yǔ)言處理中的歧義消解的研究。
術(shù)語(yǔ)是記錄科學(xué)技術(shù)知識(shí)的基本單元,哪里有知識(shí),哪里就有術(shù)語(yǔ)。因此,術(shù)語(yǔ)的研究對(duì)于人類知識(shí)的系統(tǒng)處理,對(duì)于科學(xué)技術(shù)交流都有重要的價(jià)值。馮志偉把他研究術(shù)語(yǔ)的成果寫(xiě)成《現(xiàn)代術(shù)語(yǔ)學(xué)引論》一書(shū),于1997年出版,這是我國(guó)第一本關(guān)于術(shù)語(yǔ)學(xué)的專著。
五、德國(guó)特里爾:在馬克思的故鄉(xiāng)探索漢字的數(shù)學(xué)結(jié)構(gòu)
1990年至1993年,馮志偉被德國(guó)特里爾大學(xué)文學(xué)院聘任為客座教授。特里爾是一座有2000年歷史的古城,又是馬克思的故鄉(xiāng),馮志偉有機(jī)會(huì)經(jīng)常到馬克思的故居了解這位無(wú)產(chǎn)階級(jí)革命導(dǎo)師的光輝業(yè)績(jī)。
在特里爾大學(xué)文學(xué)院任教期間,馮志偉用德語(yǔ)給德國(guó)學(xué)生講授“漢魏六朝散文”“唐詩(shī)宋詞”“中國(guó)現(xiàn)代散文”“漢字的發(fā)展與結(jié)構(gòu)”“漢語(yǔ)拼音正詞法”“漢語(yǔ)詞匯史”“機(jī)器翻譯的理論和方法”等課程。為了講好課,他苦練德語(yǔ)口語(yǔ),認(rèn)真用德語(yǔ)備課,在上每一節(jié)課之前,他都要先用德語(yǔ)把講課的內(nèi)容自己對(duì)自己敘述一遍或多遍,直到能夠熟練地背誦為止,他把“備課”當(dāng)作了“背課”。由于馮志偉備課特別認(rèn)真,課堂教學(xué)效果很好,他的課受到德國(guó)學(xué)生的一致好評(píng)。馮志偉當(dāng)時(shí)的一些學(xué)生現(xiàn)在已經(jīng)成為德國(guó)知名的語(yǔ)言學(xué)家了。
在教學(xué)中他發(fā)現(xiàn),德國(guó)學(xué)生學(xué)習(xí)漢語(yǔ)時(shí),學(xué)說(shuō)漢語(yǔ)并不困難,困難的是學(xué)漢字。這是因?yàn)闈h字?jǐn)?shù)量多,結(jié)構(gòu)復(fù)雜。因此,他開(kāi)始研究如何教德國(guó)學(xué)生學(xué)習(xí)漢字的問(wèn)題。
他經(jīng)過(guò)反復(fù)的思考,把自己在法國(guó)留學(xué)時(shí)提出的MMT模型運(yùn)用到漢字結(jié)構(gòu)的教學(xué)中,提出了漢字結(jié)構(gòu)的括號(hào)式表示法,用這種方法可以把一個(gè)漢字按層次分解為若干個(gè)部件,構(gòu)成一個(gè)樹(shù)形結(jié)構(gòu),再把這樣的樹(shù)形結(jié)構(gòu)用括號(hào)表示出來(lái)。學(xué)生只要掌握了基本的漢字部件,就可以進(jìn)一步學(xué)會(huì)由這些部件構(gòu)成的整個(gè)漢字,以簡(jiǎn)馭繁,使?jié)h字便于理解和記憶。這樣的方法受到德國(guó)學(xué)生的歡迎。
馮志偉把他的研究結(jié)果寫(xiě)成了《漢字的歷史和現(xiàn)狀》一書(shū),用德文在特里爾科學(xué)出版社出版。德國(guó)特里爾大學(xué)韋荷雅(Dorothea Wippermann)博士1996年在《評(píng)馮志偉新著〈漢字的歷史和現(xiàn)狀〉(德文版)》一文中指出,馮志偉“在漢字研究中引入了現(xiàn)代的成分分析法。對(duì)于這種方法,直到現(xiàn)在為止,許多在專家圈子之外的普通人還很不熟悉,所知極少。這種分析法認(rèn)為,漢字是由不同的圖形成分組合而成的一個(gè)封閉的集合,其中的每一個(gè)較大的成分都可以進(jìn)一步被拆分為較小的成分,一直被拆分到單獨(dú)的筆畫(huà)為止。漢字結(jié)構(gòu)的這種多層次的多分叉的構(gòu)造圖形可以用樹(shù)形圖來(lái)表示,這樣一來(lái),便為揭示漢字總體結(jié)構(gòu)的研究提供了一種系統(tǒng)性的理論和方法。這種在中文信息處理中行之有效的成分分析法,對(duì)于漢字的研究和學(xué)習(xí),也提供了一種新的記憶手段”。
馮志偉在特里爾大學(xué)用德語(yǔ)講授了一系列的漢語(yǔ)語(yǔ)言學(xué)課程,并且用德語(yǔ)出版了語(yǔ)言學(xué)的專著,顯示了他的外語(yǔ)才能。在我國(guó)中文系出身的語(yǔ)言學(xué)家當(dāng)中,像馮志偉這樣通曉多門(mén)外語(yǔ)的人還不多。他不僅是一位善于深思的語(yǔ)言學(xué)理論家,而且還是一位勇于實(shí)踐的能操多種外國(guó)語(yǔ)的多面手。
在德國(guó)講學(xué)的那段時(shí)間里,有一次他到一位德國(guó)教授的家里做客,閑談中談到了德國(guó)著名詩(shī)人海涅 (Heinrich Heine)。馮志偉年輕時(shí)曾經(jīng)讀過(guò)海涅的詩(shī)歌和散文,當(dāng)這位德國(guó)教授談到海涅的《哈爾茨山游記》(Harzreise)時(shí),馮志偉情不自禁地用德語(yǔ)朗誦起來(lái):“Die Stadt G?ttingen, berühmt durch ihre Würste und Universit?t, geh?rt dem K?nige von Hannover”(哥廷根屬于漢諾威公國(guó),以它的香腸和大學(xué)而聞名于世)。這位德國(guó)教授感到非常驚訝,他萬(wàn)萬(wàn)沒(méi)有想到一個(gè)中國(guó)人竟然能夠如數(shù)家珍地背誦海涅的散文,懷疑地問(wèn)馮志偉:“你背誦的可能不準(zhǔn)確吧?”馮志偉很有信心地回答:“我認(rèn)為是準(zhǔn)確的,這是《哈爾茨山游記》的第一句話?!边@位德國(guó)教授從書(shū)架上找到了海涅的《哈爾茨山游記》來(lái)核對(duì),馮志偉的背誦確實(shí)一字不差,果然是《哈爾茨山游記》的第一句話。
馮志偉年輕時(shí)學(xué)習(xí)外語(yǔ)是非??炭嗟?。為了學(xué)習(xí)英語(yǔ),他就買(mǎi)來(lái)一本中型的英漢詞典,一頁(yè)一頁(yè)地記憶和背誦,背完一頁(yè)就撕去一頁(yè)。幾年來(lái),馮志偉先后撕完了英漢、俄漢、法漢、德漢、日漢等多部詞典,他就用這樣的笨方法,學(xué)會(huì)了多門(mén)外語(yǔ)。學(xué)習(xí)外語(yǔ)幾乎成了他的一種愛(ài)好。當(dāng)然,掌握了多門(mén)外語(yǔ),使他對(duì)語(yǔ)言現(xiàn)象的觀察有了若干個(gè)參照系,他有可能參照多種語(yǔ)言來(lái)研究某一種語(yǔ)言的特殊問(wèn)題。這大概也是馮志偉能夠在語(yǔ)言研究中取得成功的一個(gè)原因吧!
六、韓國(guó)大田:用英語(yǔ)講授自然語(yǔ)言處理技術(shù)
2001年,他應(yīng)邀到韓國(guó)科學(xué)技術(shù)院(Korean Advanced Institute of Science and Technology,簡(jiǎn)稱KAIST)電子工程與計(jì)算機(jī)科學(xué)系擔(dān)任教授。KAIST是韓國(guó)著名的理工科大學(xué),學(xué)生都是通過(guò)嚴(yán)格的考試和數(shù)學(xué)物理競(jìng)賽選出來(lái)的精英。他用英語(yǔ)給該系博士研究生開(kāi)了“自然語(yǔ)言處理-II”(Natural Language Processing-II,簡(jiǎn)稱NLP-II)這樣一門(mén)課。在備課中,他發(fā)現(xiàn)美國(guó)Colorado大學(xué)的Daniel Jurafsky和James Martin的新著Speech and Language Processing——An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition(《語(yǔ)音和語(yǔ)言處理–自然語(yǔ)言處理,計(jì)算語(yǔ)言學(xué)和語(yǔ)音識(shí)別導(dǎo)論》)是一本很優(yōu)秀的自然語(yǔ)言處理的教材,這本教材覆蓋面非常廣泛,理論分析十分深入,而且強(qiáng)調(diào)實(shí)用性和注重評(píng)測(cè)技術(shù),幾乎所有的例子都來(lái)自真實(shí)的語(yǔ)料庫(kù)。他常常想,如果能夠把這本優(yōu)秀的教材翻譯成中文,讓國(guó)內(nèi)的年輕學(xué)子們也能學(xué)習(xí)本書(shū),那該是多么好的事情!
2002年,在他回國(guó)參加的一次學(xué)術(shù)討論會(huì)上,電子工業(yè)出版社的編輯找到馮志偉,說(shuō)他們打算翻譯出版此書(shū)。這位編輯說(shuō),電子工業(yè)出版社已經(jīng)進(jìn)行過(guò)調(diào)查,目前國(guó)外絕大多數(shù)大學(xué)的計(jì)算機(jī)科學(xué)系都采用此書(shū)作為“自然語(yǔ)言處理”課程的研究生教材,他們希望馮志偉親自來(lái)翻譯這本書(shū),與電子工業(yè)出版社配合,推出高質(zhì)量的中文譯本。電子工業(yè)出版社的意見(jiàn)與馮志偉原來(lái)的想法不謀而合,于是,他欣然接受了這本長(zhǎng)達(dá)600多頁(yè)的英文專著的翻譯任務(wù),于2003年開(kāi)始進(jìn)行翻譯。
馮志偉雖然已經(jīng)通讀過(guò)這本書(shū)兩遍,對(duì)于這本書(shū)應(yīng)該說(shuō)是有一定的理解了,但是,親自動(dòng)手翻譯起來(lái),卻不像原來(lái)想象的那樣容易,要把英文的意思表達(dá)為確切的中文,下起筆來(lái),總有綆短汲深之感,大量的新術(shù)語(yǔ)如何用中文來(lái)表達(dá),也是頗費(fèi)周折和令人躊躇的難題。在韓國(guó)教授期間,馮志偉利用全部的業(yè)余時(shí)間進(jìn)行翻譯,晚上加班到深夜,連續(xù)工作了11個(gè)月,當(dāng)翻譯了14章(全書(shū)的三分之二)的時(shí)候,他不幸患了黃斑前膜的眼病,視力出現(xiàn)障礙,難于繼續(xù)翻譯工作,還剩下7章(全書(shū)的三分之一)沒(méi)有翻譯,“行百里者半九十”,這7章的翻譯工作究竟如何來(lái)完成呢?正當(dāng)馮志偉束手無(wú)策、一籌莫展的時(shí)候,中國(guó)科學(xué)院軟件研究所的一位年輕的副研究員表示愿意繼續(xù)他的工作,協(xié)助馮志偉完成本書(shū)的翻譯。這位副研究員把剩下的7章逐一翻譯成中文,通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)一章一章地傳給在韓國(guó)的馮志偉,馮志偉使用語(yǔ)音合成裝置,讓計(jì)算機(jī)把書(shū)面的文本讀出來(lái),馮志偉通過(guò)讀出來(lái)的語(yǔ)音進(jìn)行譯文的校正。語(yǔ)音合成技術(shù)使馮志偉克服了視力不濟(jì)的困擾,幫助他邁過(guò)了重重難關(guān)。2004年,在兩人的通力合作下,全書(shū)的翻譯總算大功告成了,由電子工業(yè)出版社以《自然語(yǔ)言處理綜論》的書(shū)名出版。
這本書(shū)的出版受到廣大讀者的歡迎,而馮志偉為此卻損害了自己的視力,以后,他不得不借助于語(yǔ)音合成裝置來(lái)閱讀了。
七、榮獲維斯特獎(jiǎng)
2006年6月30日,聯(lián)合國(guó)教科文組織奧地利委員會(huì)(Austrian Commission for UNESCO)、維也納市(City of Vienna)和國(guó)際術(shù)語(yǔ)信息中心(INFOTERM)給馮志偉教授頒發(fā)了維斯特獎(jiǎng)(Wüster Special Prize),以表彰他在術(shù)語(yǔ)學(xué)理論和術(shù)語(yǔ)學(xué)方法研究方面做出的突出貢獻(xiàn)。維斯特(Eugen Wüster,1898-1977)是奧地利著名科學(xué)家,是術(shù)語(yǔ)學(xué)和術(shù)語(yǔ)標(biāo)準(zhǔn)化工作的奠基人。維斯特獎(jiǎng)是專門(mén)為那些對(duì)于術(shù)語(yǔ)學(xué)和術(shù)語(yǔ)標(biāo)準(zhǔn)化工作有出色成就的科學(xué)家而設(shè)置的。
馮志偉獲得維斯特獎(jiǎng),說(shuō)明他數(shù)十年的努力終于得到了國(guó)際的承認(rèn)??上У氖?馮志偉的視力越來(lái)越差,當(dāng)他接受維斯特獎(jiǎng)的時(shí)候,已經(jīng)不能看清獎(jiǎng)?wù)律厦娴膱D案了,他為我國(guó)計(jì)算語(yǔ)言學(xué)和術(shù)語(yǔ)學(xué)而付出的代價(jià)確實(shí)太大了。
馮志偉今年滿七十歲,著述頗豐,多有建樹(shù),其內(nèi)容涉及不少領(lǐng)域,引起國(guó)內(nèi)外不少同行專家的廣泛關(guān)注和高度評(píng)價(jià)。他現(xiàn)在已在多家著名出版社出版了二十余部專著,翻譯國(guó)外重要論著數(shù)十篇(部),并用漢、英、法、德文等撰寫(xiě)了有代表性的重要學(xué)術(shù)論文百余篇,在國(guó)內(nèi)外許多著名刊物上發(fā)表。其著述不勝一一列舉。其代表作如:專著《數(shù)理語(yǔ)言學(xué)》《自動(dòng)翻譯》《現(xiàn)代語(yǔ)言學(xué)流派》《現(xiàn)代漢字和計(jì)算機(jī)》《中文信息處理與漢語(yǔ)研究》《數(shù)學(xué)與語(yǔ)言》《自然語(yǔ)言機(jī)器翻譯新論》《應(yīng)用語(yǔ)言學(xué)綜論》《應(yīng)用語(yǔ)言學(xué)新論》《計(jì)算語(yǔ)言學(xué)基礎(chǔ)》《計(jì)算語(yǔ)言學(xué)探索》《機(jī)器翻譯研究》《現(xiàn)代術(shù)語(yǔ)學(xué)引論》《自然語(yǔ)言的計(jì)算機(jī)處理》《漢語(yǔ)教學(xué)與漢語(yǔ)拼音正詞法》《漢字的歷史與現(xiàn)狀》(德文版),譯著《自然語(yǔ)言處理綜論》等等。他還主持和參與了若干個(gè)國(guó)家標(biāo)準(zhǔn)的制定,為我國(guó)標(biāo)準(zhǔn)化做出了貢獻(xiàn)。他又是《中國(guó)大百科全書(shū)》《計(jì)算機(jī)百科全書(shū)》《數(shù)學(xué)辭?!贰吨袊?guó)少年百科全書(shū)》等大型工具書(shū)的撰稿人,為這些權(quán)威性工具書(shū)寫(xiě)了不少重要條目。他還為一些當(dāng)代語(yǔ)言學(xué)名著的外文版寫(xiě)導(dǎo)讀,如《應(yīng)用語(yǔ)言學(xué)中的語(yǔ)料庫(kù)》《語(yǔ)言學(xué)中的數(shù)學(xué)方法》《譯者的電子工具》《人工智能在第二語(yǔ)言教學(xué)中的應(yīng)用》,幫助國(guó)內(nèi)讀者閱讀外文原著。
馮志偉在中國(guó)傳媒大學(xué)招收計(jì)算語(yǔ)言學(xué)專業(yè)方向的博士生,不少畢業(yè)的博士生在學(xué)術(shù)上取得了突出的成績(jī),他們已經(jīng)成為我國(guó)計(jì)算語(yǔ)言學(xué)的骨干力量。
馮志偉經(jīng)過(guò)數(shù)十年的艱苦努力,終于實(shí)現(xiàn)了他使用數(shù)學(xué)方法研究語(yǔ)言的愿望,并把語(yǔ)言學(xué)和計(jì)算機(jī)科學(xué)非常自然地結(jié)合起來(lái),取得了多方面輝煌的成就,為語(yǔ)言學(xué)、計(jì)算機(jī)等學(xué)科做出了重要貢獻(xiàn)。他的這些光彩、亮麗、豐碩的成果琳瑯滿目,異彩紛呈,多么令人欣慰、激動(dòng)呀!
過(guò)去的著名語(yǔ)言學(xué)家有的只懂社會(huì)科學(xué),不懂自然科學(xué);有的只懂古代漢語(yǔ)、現(xiàn)代漢語(yǔ)或普通語(yǔ)言學(xué),一般只著重研究漢語(yǔ)的語(yǔ)音、詞匯、語(yǔ)法或文字等某一個(gè)方面的問(wèn)題,研究的問(wèn)題和領(lǐng)域比較單一,即使一些佼佼者,至多也只懂得兩三門(mén)外語(yǔ),視野不夠開(kāi)闊,語(yǔ)言的縱橫向?qū)Ρ妊芯慷疾粔?有一定的局限性。而馮志偉先生卻懂得理科中的數(shù)學(xué)、物理、化學(xué)和計(jì)算機(jī)科學(xué),又懂得語(yǔ)言學(xué)中的古代漢語(yǔ)、現(xiàn)代漢語(yǔ)、普通語(yǔ)言學(xué)和文字學(xué)。深研過(guò)漢、英、法、德、俄、日等語(yǔ)言的語(yǔ)音、詞匯和語(yǔ)法,并把各方面的知識(shí)緊密地結(jié)合起來(lái)綜合應(yīng)用,在計(jì)算機(jī)上加以實(shí)現(xiàn),成為文理兼通的語(yǔ)言學(xué)專家。馮志偉教授不但能在計(jì)算機(jī)科學(xué)系講授理科的機(jī)器翻譯的方法和技術(shù)研究、自然語(yǔ)言處理的算法研究、計(jì)算語(yǔ)言學(xué)專題研究等艱深的博士課程,而且也能夠在中文系講授漢魏六朝散文、唐詩(shī)、宋詞、古代漢語(yǔ)、現(xiàn)代漢語(yǔ)、漢字的歷史與結(jié)構(gòu)等饒有風(fēng)趣的課程。他還能給學(xué)生們輔導(dǎo)英、德、法、俄、日等外國(guó)語(yǔ)課程。他的散文和詩(shī)歌也寫(xiě)得很好,他還是一位翻譯專家,出版過(guò)翻譯著作。這樣的人才是很罕見(jiàn)的。
然而,馮志偉對(duì)于他的這些成就卻看得很平淡,他很少對(duì)別人談起他的成就。除了平時(shí)喜歡喝白開(kāi)水和游泳之外,他幾乎沒(méi)有什么特殊的嗜好,他每日粗茶淡飯,過(guò)著非常簡(jiǎn)樸的生活。他從來(lái)不以為自己是什么“專家”,沒(méi)有任何架子,總是謙和地對(duì)待他的學(xué)生和周圍的同志。在北京大學(xué)中文系59級(jí)同學(xué)紀(jì)念冊(cè)上,他寫(xiě)下了這樣的人生感言:“先天不足,后天失調(diào);歲月蹉跎,艱辛備嘗;老當(dāng)益壯,窮且越堅(jiān);平生無(wú)悔,褒貶由之?!彼冀K認(rèn)為自己是一個(gè)很平常的普通人,對(duì)于別人的褒貶,他是看得很平淡的。他對(duì)生活的信條是:“在科學(xué)探索的過(guò)程中,我所知道的東西終究是有限的,而我不知道的東西始終是無(wú)限的,只要平生無(wú)悔就很好了!”
今年是2009年,從1957年馮志偉下決心來(lái)研究數(shù)學(xué)方法在語(yǔ)言學(xué)中的應(yīng)用這個(gè)問(wèn)題算起,他為我國(guó)計(jì)算語(yǔ)言學(xué)的開(kāi)創(chuàng)和發(fā)展嘔心瀝血地奮斗了整整五十二年的時(shí)間。由于長(zhǎng)期超負(fù)荷工作而積勞成疾,付出了他自己的健康,損害了他的視力,想到他這些不幸,我們就感到一陣陣辛酸。每當(dāng)我們回顧馮志偉在五十二年的科學(xué)研究中走過(guò)人生歷程時(shí),總有一種悲壯的感覺(jué)。
馮志偉先生,我們希望您珍惜自己的身體健康,保護(hù)您的視力,繼續(xù)為文科和理科的溝通,為我國(guó)科學(xué)技術(shù)事業(yè)的發(fā)展,做出更大的貢獻(xiàn)。
(張?jiān)谠?昆明 云南大學(xué)成人教育學(xué)院650091)