提 要 建設世界一流的語言學學科是“雙一流”建設的重要組成部分。世界一流學科建設的前提是讓世界知道。本文基于國際主流的引文數(shù)據(jù)庫,統(tǒng)計分析了中國語言學研究成果國際化的現(xiàn)狀與問題。數(shù)據(jù)表明,中國大陸目前的語言研究成果的國際發(fā)表無論是數(shù)量還是質(zhì)量均與世界一流高校仍有很大的差距。學科建設與學科的定位有關(guān),如果語言學是科學,那么我們就需要采用科學的方法來研究語言。作者團隊十幾年來的實踐表明,語言研究是可以科學化的,其成果也可以得到科學家的關(guān)注,但前提是我們需要采用科學共同體認可的方法來研究語言??茖W的研究方法也有助于成果的國際化。
關(guān)鍵詞 中國語言學;國際化;科學化;科學研究范式
中圖分類號 H002 文獻標識碼 A 文章編號 2096-1014(2018)01-0037-14
Two Critical Priorities for Linguistic Studies in China:
International Visibility and Scientific Approaches
Liu Haitao
Abstract Constructing world first-class linguistics discipline is an important mission for the ‘Double First-class Initiative, and the precondition for accomplishing this mission is to make it internationally known. Based on the data drawn from the major Databases of International Science Citation, this paper analyzes the current scenario and difficulties in internationalizing the output of Chinese linguistic research. The analysis shows that when it comes to international publications, there exists a huge disparity between Chinese Mainland and the rest of the world in terms of both quantity and quality, signifying that there is a long way to go in order for the best Chinese universities to catch up with their counterparts in the world. The success of discipline construction depends on disciplinary orientation. If linguistics is a science, then language should be studied through the means of scientific approaches. My own practical experience of leading a research team shows that it is feasible to apply scientific methods in conducting linguistic research, and our accomplishments have drawn a lot of attention from researchers in areas of natural sciences. This leads to an argument that Chinese linguists should strive to carry their studies in a scientific way that is widely accepted by the international academia. As a conclusion, the paper argues that in terms of research topic, we should choose the issues that are specific to China but with international significance; that is, the findings should have wider implications contributing to the international research literature. I believe that this is the only way to enable our research to reach out to the world and stand tall on the world platform, thus to achieve the goal of building world-class universities.
Key words linguistics in China; internationalization; scientization; scientific research paradigm
2015年10月24日,國務院頒發(fā)了題為《統(tǒng)籌推進世界一流大學和一流學科建設總體方案》的文件。文件為中國高校在未來一段時間制定了具體的努力目標:“到2020年,若干所大學和一批學科進入世界一流行列,若干學科進入世界一流學科前列……到本世紀中葉,一流大學和一流學科的數(shù)量和實力進入世界前列,基本建成高等教育強國?!?/p>
2017年9月21日,教育部、財政部、國家發(fā)展與改革委員會公布了“世界一流大學和一流學科建設高校及建設學科名單”。42所大學被列為一流大學建設高校,一流學科建設高校為95所。按照教育部學科分類含有語言學的一級學科有兩個學科:中國語言文學與外國語言文學,其中北京大學、北京師范大學、復旦大學、南京大學、華中師范大學、陜西師范大學為中國語言文學一流學科建設高校,北京大學、南京大學、北京外國語大學、上海外國語大學、湖南師范大學、延邊大學為外國語言文學一流學科建設高校。值得一提的是,名單中還有兩個與語言學有關(guān)的學科,即“語言學”與“現(xiàn)代語言學”,前者的入選高校為北京大學和北京師范大學,后者為北京大學、復旦大學、清華大學。如果按照數(shù)量來說,與語言有關(guān)的學科可能是本次“雙一流”建設入選最多的學科了。
由此可見,語言學的學科建設問題,特別是如何建立世界一流語言學學科的問題,已經(jīng)被提到相當?shù)母叨?。這可能也是本期以“中國語言學學科建設與發(fā)展”作為主題的原因之一。正如讀者在本期其他文章中所看到的那樣,一個學科的建設與發(fā)展涉及許多問題,我在這里主要圍繞“中國語言學成果的國際化”與“語言研究方法的科學化”談一點自己的看法。
一、中國語言學成果的國際化
語言學為什么要國際化?過去這么多年,我們不提倡國際化,不也挺好嗎?我們可以從很多方面來回答這個問題,例如,知識的傳播、學科的發(fā)展、國際學術(shù)話語權(quán)等。但在“雙一流”建設的背景下,可能只要一句話就夠了:世界一流首先得讓世界知道。國際化的實質(zhì)就是讓世界知道我們在做什么,讓國外的語言學家知道中國也有語言學家。因為,世界上很難找到不參加世界大賽的世界冠軍,同樣,也很難有世人所不知的世界一流。評價世界一流或?qū)W科國際化的指標有很多,這些指標的細節(jié)與優(yōu)劣不是本文討論的范圍。徐烈炯《中國語言學在十字路口》一書,在回答“中國國內(nèi)的語言學研究如何才能真正地和國際接軌?”這個問題時說“本學科世界一流刊物中,中國人發(fā)表文章的比例”,“如果在國際一流刊物上發(fā)不了一篇文章,那么這個學校(者)就不是國際水平”“是否接軌了,有多大差距,這條標準簡單、比較可靠”“對年青一代的希望,就是大家把到國際一流刊物上發(fā)表文章當作目標,逐步縮小差距”。(徐烈炯 2008: 251—252)徐先生提到的這條指標雖然簡單,但幾乎是國際學界通常采用的一個標準,不但易于查考,也便于我們自檢與世界一流的差距。
如果按照這個指標,我們先得確定什么是世界一流刊物。文獻(科學)計量學領(lǐng)域的進展(蔣穎 2013;邱均平等 2016),使得我們比以前更容易獲得這方面的可靠信息。目前,最常用的收錄高水平學術(shù)論文的引文數(shù)據(jù)庫是艾斯維爾的Scopus與科睿唯安的Web of Science(WOS),二者幾乎收錄了全球的主要學術(shù)期刊,上億篇學術(shù)文獻。盡管被這些數(shù)據(jù)庫收錄的期刊不一定全是本領(lǐng)域的一流刊物,發(fā)表在這些刊物的文章質(zhì)量也不可能篇篇都是一流。但從統(tǒng)計的角度看,這些刊物大多是本領(lǐng)域的一流刊物,發(fā)在這些刊物上的高質(zhì)量論文也更多一些。引文數(shù)據(jù)庫目前已經(jīng)成為研究人類知識產(chǎn)生與傳播的重要信息源,例如,2002年以來,基于科睿唯安的WOS數(shù)據(jù)庫,人們已經(jīng)成功預測了46位諾貝爾獎得主。
如果,引文數(shù)據(jù)庫可以作為研究學科國際化發(fā)表的資源。那么,我們首先感興趣的是在一段時間里一個學科中按照國家或地區(qū)發(fā)表論文的數(shù)量情況。表1為1996—2016年間,Scopus數(shù)據(jù)庫收錄的“語言及語言學”類中論文數(shù)量最多的20個國家及地區(qū)。
表1中的“篇均引用數(shù)”與“H指數(shù)”均反映了論文的質(zhì)量,前者為數(shù)據(jù)庫中所收錄文章的被引數(shù),后者為一個混合量化指標,一般用來評估研究人員或研究機構(gòu)的學術(shù)產(chǎn)出數(shù)量與學術(shù)產(chǎn)出水平(葉鷹等 2011)。例如,一個學者(或機構(gòu))的H指數(shù)為10,則表明該學者(或機構(gòu))至少發(fā)表了10篇論文,而且每篇論文至少被引用了10次。由表1可知,美國、英國、加拿大、德國、荷蘭、以色列等國,不僅產(chǎn)出的語言學論文多,而且質(zhì)量也高。而西班牙、波蘭、伊朗、巴西、中國大陸、中國臺灣等國家與地區(qū),雖然產(chǎn)出了一定數(shù)量的語言學論文,但質(zhì)量方面則遜色不少。值得一提的是,就“語言與語言學”所屬的“藝術(shù)與人文”大類來看,中國語言學家發(fā)表的國際論文是最多的,遠遠多于該大類中的其他小類,如考古、歷史、博物館學、音樂、哲學、宗教等,也高于“文學與文學理論”。這說明,在人文學科內(nèi)部,相比其他領(lǐng)域,中國語言學的國際化程度還是不錯的。
在對中國語言學國際化的總體情況有所了解后,我們可能想了解這些國際高水平論文都是誰寫的?是哪些大學的人寫的?主要發(fā)表在哪些期刊?所發(fā)表論文屬于哪些研究領(lǐng)域?
為了回答這些問題,我們選擇了科睿唯安的WOS中的SSCI(社會科學引文索引)以及A&HCI(藝術(shù)與人文引文索引)過去10年(2008—2017)的相關(guān)數(shù)據(jù)進行了詳細的統(tǒng)計分析。改用WOS的原因有二:一是這個數(shù)據(jù)庫的檢索工具更易于得到我們需要的數(shù)據(jù),二是WOS的期刊收錄原則比Scopus更嚴格,在學術(shù)評估中,也更常用。
SSCI中含有“語言學”類,A&HCI中含有“語言及語言學”類,目前二者在兩個小類收錄的期刊有200種左右。因為Scopus數(shù)據(jù)庫不收書評,所以,我們在這一部分的檢索,也只考慮了“論文”(ARTICLE)這種文獻類型。為了更全面地反映中國語言學的國際化情況,除中國大陸外,以下數(shù)據(jù)也包括了中國香港、臺灣及澳門地區(qū)。
高水平的研究者是一流學科建設的核心,因此,我們先來看一下過去10年被兩個引文數(shù)據(jù)庫收錄語言學相關(guān)論文最多的是哪些學者。
在過去10年里,中國(含港澳臺地區(qū))被SSCI收錄的“語言學”類論文有2845篇,被A&HCI收錄的“語言及語言學”類論文有2229篇。對比表2中SSCI與A&HCI的研究者,我們可以發(fā)現(xiàn),有些學者在兩個數(shù)據(jù)庫中的位次保持穩(wěn)定,這是由于他們所刊發(fā)的期刊同時被兩個數(shù)據(jù)庫收錄。我們也可以看出,SSCI“語言學”類的期刊,收錄了一些非傳統(tǒng)意義的語言學期刊,這導致我們一般認為不是語言學家的語言研究者也進入了榜單,這些學者以心理學家與教育學研究者為多。而A&HCI那一列的學者,則大多可以歸為傳統(tǒng)意義上的語言學家。就A&HCI里研究者的地區(qū)分布來看,除劉海濤與吳義誠目前工作在中國大陸高校(浙江大學)外,表2中的其他研究者均工作在中國港臺地區(qū)的學術(shù)機構(gòu)。由此可以看出,中國香港與臺灣地區(qū)的語言學研究者在學術(shù)成果的國際化方面,要優(yōu)于大陸學者。
SSCI與A&HCI均含有“語言學”類,這也為我們粗略比較社會科學與人文學科的國際化提供了可能的信息。我們首先從WOS中獲得了過去10年中國(含港澳臺地區(qū))研究者被這兩個系統(tǒng)收錄的論文總數(shù),分別是128 960(SSCI)與12 221(A&HCI)。從這兩個數(shù)字,已經(jīng)不難看出社會科學的國際化要遠遠高于人文學科。這一點,也可以從兩個領(lǐng)域發(fā)文最多的學者排序看出,SSCI中過去10年至少發(fā)文94篇才能進入中國(含港澳臺地區(qū))Top 500的名單,而同期A&HCI中國(含港澳臺地區(qū))發(fā)文最多的學者(劉海濤)只不過發(fā)了43篇。
數(shù)量不等于質(zhì)量,衡量論文質(zhì)量的各種文獻計量學指標的基礎(chǔ)大多是論文的被引數(shù)量。目前全球主要大學排行榜以及本次教育部一流學科的遴選均參考了科睿唯安的ESI(基本科學指標數(shù)據(jù)庫)??祁Nò捕ㄆ趯OS中的相關(guān)文獻進行統(tǒng)計,分別排出居世界前1%的高被引論文和前0.1%的熱點論文,并以此來評價相關(guān)機構(gòu)的學科實力。我們來看一下最近一個統(tǒng)計周期(2017年11月初發(fā)布)的相關(guān)情況。在SSCI數(shù)據(jù)庫中,大中華區(qū)共有1071篇高被引論文和37篇熱點論文,其中屬于語言研究的高被引論文有3篇,作者分別為中國臺灣地區(qū)學者、中國香港地區(qū)學者及中國大陸劉海濤團隊,語言研究熱點論文2篇,均為劉海濤團隊的成果。而A&HCI庫中,大中華區(qū)只有14篇高被引論文與3篇熱點論文,其中屬于語言研究類的高被引論文1篇(臺灣地區(qū)學者),熱點論文2篇(劉海濤團隊)。由此可以看出,與其他學科相比,語言研究很難產(chǎn)出符合現(xiàn)代文獻計量學指標的高質(zhì)量(高影響)論文,但也不是不可能的。
大規(guī)模引文數(shù)據(jù)庫的出現(xiàn),也使得對中國研究者在世界范圍內(nèi)的影響力進行客觀、系統(tǒng)的分析成為可能?;谌蜃畲蟮耐性u議學術(shù)論文數(shù)據(jù)庫Scopus,愛思唯爾連續(xù)3年(2014,2015,2016)發(fā)布了中國高被引學者(Most Cited Chinese Researchers)榜單,旨在將最具世界影響力的中國學者呈現(xiàn)給學術(shù)界和公眾。榜單中列出了1700多名各學科的高被引學者,其中包括3位語言(文學)領(lǐng)域相關(guān)的學者,他們是申丹(北京大學,人文學科,140,6),劉梅華(清華大學,社會科學,221,4),劉海濤(浙江大學,社會科學,411,12)。該榜單在制定時,已經(jīng)考慮了學科差異。盡管如此,語言學研究者入選的人數(shù)還是少得可憐。這一方面反映了學科的國際化程度不高、有影響力的成果不多,另一方面也對學科的科學性提出了挑戰(zhàn)。
盡管一流學科的建設離不開人,但只靠一兩個人是不行的,因為一個學術(shù)機構(gòu)只有一個能人是不行的,當然如果連一個行的人都沒有的機構(gòu)就更不行了。下面我們來看一下按照機構(gòu)排名的相關(guān)統(tǒng)計與分析。
從表3來看,無論是SSCI還是A&HCI,就語言學成果的國際化而言,大陸高校與港臺高校還是有一定差距的。除了表3列出的那些大陸高校外,在前25名中還有復旦大學、南京大學、上海外國語大學和中山大學。有趣的是,廣東外語外貿(mào)大學、浙江大學和中山大學外,這些高校大多在教育部的一流學科名單之中。這說明,論文這項指標還是可以說明問題的。
如果世界一流的前提是讓世界知道,那么引言中提及的有些高??赡苄枰哟髧H發(fā)表的力度,否則世界一流學科的建設就會僅僅成為一個口號。因為,我們很難想象,一個在相關(guān)領(lǐng)域論文國際發(fā)表數(shù)量進不了中國(含港澳臺地區(qū))前25的高校,能成為該學科的世界一流。說到這里,我們可能需要說一下為什么本文引言中提及的一流學科名單里面會有兩個令中國語言學家激動不已的、教育部學科目錄之外的學科“語言學”與“現(xiàn)代語言學”。激動的原因是,當全國語言學界都在上下呼吁教育部將“語言學”設為一級學科未果的時候,這個名單一下子增加了兩個語言學的學科,怎么能不讓人熱血沸騰。但現(xiàn)實往往是殘酷的。據(jù)悉,本次一流學科的遴選,也參考了QS學科排名結(jié)果。這一做法是可以理解的,如果學科的建設目標是世界一流,那么,拿一個世界性的學科排名作為參考是順理成章的。具體而言,如果有國內(nèi)高校出現(xiàn)在QS學科排名的前50,而且該學科又不宜合并進入已有的教育部學科目錄,那么就可能出現(xiàn)一些2012年教育部學科評估中不存在的學科。于是,“語言學”(Linguistics)與“現(xiàn)代語言學”(Modern Language)就這樣產(chǎn)生了。按照QS學科排名,北京大學的語言學排名世界第10,北師大的排名世界第47;北大的現(xiàn)代語言學排名世界第7,復旦排名第27,清華排名第33。這些高校均滿足世界前50的一流學科入選標準。對照表3,我們看到有些入選高校在語言學的國際發(fā)表方面并不都是那么突出的,那他們?yōu)槭裁磿M入世界前50呢?原因是QS對這兩個學科的排名,基本都是按照主觀打分來進行的。“現(xiàn)代語言學”是百分之百的主觀分,而“語言學”的主觀分也占了百分之九十。
如果我們關(guān)心的是學術(shù)成果的國際化,那么被WOS等國際知名檢索系統(tǒng)收錄只是第一步。因為,不少被收錄的期刊是區(qū)域性的,這種區(qū)域性不僅體現(xiàn)在研究對象上,也體現(xiàn)在作者與讀者分布以及刊物所刊登文章的語種上。表4為過去10年中國(含港澳臺地區(qū))被A&HCI收錄論文最多的15個期刊。
由表4可以看出,《語言暨語言學》《臺灣“中研院”歷史語言研究所集刊》《中國語言學報》3本期刊上發(fā)表的文章占到了過去10年中國(含港澳臺地區(qū))A&HCI論文的21%。這3本期刊不但都接受漢語與英語投稿,而且無論是從收文范圍還是其他方面來看,均可以認為是一種區(qū)域性期刊。例如,《語言暨語言學》過去10年發(fā)表論文的作者,有48%來自臺灣地區(qū),23%來自中國大陸;《中國語言學報》的作者則有53%來自中國大陸,16%來自臺灣地區(qū)。當然,我們無意否認這些期刊在推進中國語言學研究國際化方面所起到的巨大作用。這些區(qū)域性的期刊,也在一定程度上說明“本土”與“國際”并不是一對不可調(diào)和的矛盾。但如果考慮到語言學更關(guān)注的是人類語言的普遍規(guī)律的話,也許我們需要將目光或努力的方向放到更廣闊的世界。這一點,我們也可以從這兩本期刊的過去10年的篇均引用看出,《語言暨語言學》為1.54,最高引論文18次; 《中國語言學報》為0.67,最高引論文29次。
除了以研究漢語為主的區(qū)域性期刊之外,表4中所列較多的還有這樣一些領(lǐng)域:翻譯、英語、語言教學,以及一些普通語言學的期刊(Lingua與Language Sciences)??疾霺SCI論文的Top 25的期刊列表,我們發(fā)現(xiàn)了這樣幾個新面孔:SYSTEM、JOURNAL OF NEUROLINGUISTICS、BRAIN AND LANGUAGE、JOURNAL OF PSYCHOLINGUISTIC RESEARCH、TESOL QUARTERLY等。一般認為,與A&HCI相比,SSCI期刊論文的科學性可能會更高一些,由此可見一斑。除此之外,SSCI表單中的心理學、神經(jīng)科學等領(lǐng)域的期刊,不僅為語言學帶來了科學的方法,也為提高語言學期刊的低影響因子做出了貢獻。在科睿唯安每年發(fā)布的JCR(期刊引用報告)中,語言學類的期刊平均影響因子基本在0.5上下波動,但心理語言學及應用語言學類的期刊的影響因子多年來均處于榜單前列。由此可以看出,研究方向可能也是一個需要考慮的點。具體而言,過去10年中國(含港澳臺地區(qū))被這兩個數(shù)據(jù)庫收錄的論文,大多與哪些領(lǐng)域或研究方向有關(guān)呢?因為,從大的方面來看,本文討論的論文均屬于SSCI的“語言學”類和A&HCI的“語言與語言學”類。但是,一篇文章,依發(fā)表期刊、研究主題的不同,有的時候,會被歸入多個類。例如,你用傳統(tǒng)語言學的方法來研究句法,你的文章發(fā)表在“語言學”類的期刊,那么你的文章就被認為是“語言學”文章;但是如果你采用心理語言學的方法來研究句法,你的文章也可能同時被認為是一篇“心理學”的文章;如果你研究的是句法的教學,那么文章可能又被賦予“教育學”的標簽。通過對“語言學”類文章的研究方向的考察,可能有助于發(fā)現(xiàn)目前有哪些領(lǐng)域與語言研究有關(guān),也有利于我們從多(跨)學科的角度來理解語言研究現(xiàn)狀。
從表5可知,教育學、心理學、神經(jīng)科學、語言病理學、計算機科學等領(lǐng)域是與語言學關(guān)系最密切的幾個研究領(lǐng)域。 “亞洲研究”方向出現(xiàn)較多的原因,體現(xiàn)了中國(含港澳臺地區(qū))學者研究對象的特點。比如,筆者團隊2014年發(fā)表于《中國語言學報》上采用復雜網(wǎng)絡研究人類語言層級的文章,不僅是《中國語言學報》近10年來被引最多的文章,也是過去10年全球“亞洲研究”類文章被引數(shù)第二的文章(Liu & Cong 2014)。當然,我們不排除還有其他領(lǐng)域的期刊也發(fā)表過語言研究的論文,但表5中所列的學科方向,可能是本地區(qū)語言研究者最常進行的跨學科或交叉研究方向。A&HCI收錄的論文,涉及的學科要比SSCI的少,但沒有任何新的方向出現(xiàn)。這說明如果就傳統(tǒng)語言學領(lǐng)域而言,可與語言學交叉的學科還是比較固定的。在這里我們并沒有見到以探索自然界發(fā)展規(guī)律為目標的基礎(chǔ)學科,如物理、數(shù)學、化學與生物學等。
世界一流學科建設的前提是讓世界知道。但就目前中國大陸語言研究成果的國際發(fā)表來看,我們與港臺地區(qū)主要高校還是有一定差距的,更不要說與世界一流高校的差距了。然而,我們也應該看到,已經(jīng)有一些大陸高校中的研究者在國際論文發(fā)表的數(shù)量與質(zhì)量方面,取得了一定的成績。下一步,我們要做的是,在引進的同時,要更多的關(guān)注那些立足國內(nèi)做出不錯成績的研究者,總結(jié)經(jīng)驗,以點帶面,讓國內(nèi)學者的成果在世界上更廣為人知。這一點很重要,因為完全照搬國外的方法可能難以行得通。除此之外,研究問題的選取以及角度的切入,如何使得自己的研究更具普遍的學術(shù)意義與價值,可能也是一個需要面對的問題。正如王士元先生所說的那樣:“中國語言學比較吃虧的一點是,我們的眼里只有漢語。幾千年來,出現(xiàn)了很多很多種的語言,有些跟漢語很近,有些很遠。如果我們要了解語言的差異和共性,就不能只顧研究自己的語言。”(黃春宇 2017)
從這一部分基于引文數(shù)據(jù)庫的分析中,我們可以看到,在中國大陸理工科的研究成果已基本國際化的大背景下,社會科學領(lǐng)域的國際化也已經(jīng)走在了人文學科前面。按照目前的學科分類,語言學既可以算在社會科學里,也可屬于人文學科。中國語言學的國際化程度,在社會科學里面處于落后地位,但與人文學科的其他領(lǐng)域相比,則要好一些。這是否意味著,科學含量高的學科或成果更容易國際化呢?這是下一小節(jié)的主題。
二、語言研究方法的科學化
語言學家一般認為語言學是一門科學。下面是我隨手在語言學的書刊中摘錄的幾種說法:“語言學被當代許多學者公認為一門領(lǐng)先科學。”(伍鐵平 1991:116)“語言學是一門領(lǐng)先的科學,這早已成為國際語言學界和教育界的共識?!薄罢Z言學作為一門獨立的學科,并且是一門在人文學科中居于領(lǐng)先地位的科學,已經(jīng)得到社會的普遍認同。”(尹洪波 2010)然而,環(huán)顧四周,我們發(fā)現(xiàn)老百姓并不認為語言學家是什么科學家,而老百姓眼里真正的科學家也難以認同語言學家是自己的同行,更談不上什么“領(lǐng)先科學”了。為什么會這樣呢?喬曉春(2017)有理有據(jù)地解答了我們所關(guān)心的相關(guān)問題:為什么老百姓瞧不起社會科學學者?為什么未受過專業(yè)訓練的人也可以成為專家?為什么社會科學研究做得很容易,文章很高產(chǎn)?為什么社會科學更容易做得不科學?為什么中國社會科學不設院士?為什么將社會科學與人文學科歸為同類學科?我們認為,造成這些問題的一個根本原因,是對“科學”一詞的濫用。應該指出的是,我們從來也不認為,其他不帶“科學”標簽的學科,就比“科學”要低一等。只是想從邏輯上把這個問題理順一些,既然我們認為自己的學科是一門科學,那么毫無疑問就應該采用科學共同體一般認同的研究范式。換言之,如果語言學是科學,卻又不遵循科學的方法開展研究,在邏輯上恐怕難以成立。愛丁頓(Eddington 2009)認為:如果要對真實的語言現(xiàn)象做出有效的解釋,必須采用科學的方法。從某種程度上說,語言學的進步取決于研究者在多大程度上采用了科學家所公認的、標準的科學研究方法,即:觀察現(xiàn)象、提出假設、收集數(shù)據(jù)、驗證假設、得出結(jié)論。我們同意他的說法。但也清楚地知道,不是每一位語言學研究者,都同意他的說法。從語言學文獻中隨處可見的“科學”與“理論”不難看出,語言學家心里的“科學”很大程度上并不是科學共同體所說的“科學”,語言學家的“理論”也與科學家的“理論”不一樣?,F(xiàn)代計量語言學的奠基人阿爾特曼在為《計量語言學導論》寫的序里面說:人們經(jīng)常不假思索地使用“理論”這個詞,只是因為他們沒有與科學哲學家聊過這個話題(劉海濤 2017:2)。為什么我們要與哲學家聊天?因為,對于什么是科學、什么是理論、什么是科學研究范式等問題,科學哲學有專門的闡釋(Bunge 2016)。限于篇幅,我們在這里無意展開科學方法的討論。相比中國語言學的國際化而言,語言研究的科學化是一個世界性的普遍問題。因為,這不只是中國語言學家的事情,也是全世界語言學家追求的目標。
此前,我們將“國際化”簡化為在國際高水平期刊發(fā)表論文。沿著這一思路,“科學化”可能比國際化更簡單,即,盡可能在科學家認可的高水平期刊上發(fā)表研究語言的學術(shù)論文。如果一個學科在科學期刊上幾乎發(fā)表不了文章,那么它如何成為科學?為什么發(fā)不了?一個很重要的原因是我們沒有采用科學共同體認可的科學方法。因此,以科學方法開展研究是語言學走向科學殿堂的必經(jīng)之路。當然,語言研究應該采用科學方法的理由,不僅僅是我們想讓語言學更科學,還因為“學語言是給個人增加新知識,研究語言學是給全人類增加新知識”(徐烈炯 1988),“語言學的目標就是闡明人類與生俱來、但又說不清楚的有關(guān)語言的知識”(Plungyan 2011:102)。發(fā)現(xiàn)新知,是科學的基本目標。從這一點看,語言學就是科學。如果考慮到,沒有語言可能也沒有科學家,更沒有現(xiàn)在談論的科學,那么說它是一個領(lǐng)先科學又有何不可呢?但遺憾的是,真正意義的新知發(fā)現(xiàn)是與前引愛丁頓所說的科學方法(實證方法)密切相關(guān)的。目標明確,對象重要,但由于采用的不是一般意義的科學方法,所得到的結(jié)果很難得到認可,也難以起到一個基礎(chǔ)學科應有的作用。長此以往,被人瞧不起,是在所難免的。就語言學家而言,“不能把語言的人文性混同于語言學的人文性,語言學作為科學,甚至作為文科,值得強調(diào)的只有科學性” (朱曉農(nóng),即出)??傊?,如果語言學想從傳統(tǒng)的人文學科轉(zhuǎn)向生命或認知科學,那么,其研究方法也必須從內(nèi)省法轉(zhuǎn)為實證方法(Rickheit & Sichelschmidt 2007)。在語言研究中采用實證(或科學)方法的主要原因在于語言學是一種經(jīng)驗科學,這一點,朱曉農(nóng)(即出)說得很到位,“語言學不是形式科學,他是經(jīng)驗科學!我從沒見過哪門經(jīng)驗科學膽大到自稱或萎縮到自認和數(shù)學、邏輯學、電腦程序一樣是形式科學?!蓖ㄋ椎刂v,如果我們幾乎看不到其他領(lǐng)域的科學家在研究螞蟻的時候變成螞蟻,那么語言科學家為什么就非得變成螞蟻呢?退一步講,在語言學的眾多分支里面,至少不應該都采用研究螞蟻就得變成螞蟻的方法吧?
學科建設也與學科的定位有關(guān),如果語言學是科學,那么我們就需要在課程設置等方面引入相關(guān)的內(nèi)容。當然,在引入課程之前,我們得有一些真正意義的語言科學研究成果。語言研究的科學化,說起來不容易,做起來更難。下面,我們結(jié)合自己的研究談一點體會。
在進入科學世界之前,除了要對此前提到的科學方法有所了解之外,也需要讀一些最新的發(fā)表在科學期刊上面研究語言的文章,以便發(fā)現(xiàn)適宜的切入點。這樣一來,就難免會涉及當今很流行的詞語“跨學科”或“交叉學科”,對于語言學跨學科的必要性,我們非常贊同王士元的如下說法:“如果我們的目的是要真正理解語言是什么,那么我們就不能把自己的視野限制得太狹窄,就不能因已有的學科界限而墨守成規(guī)。不同學科之間的邊界猶如畫在沙灘的線條,隨著每一次先進知識的波濤到來,這邊界就會發(fā)生變化,甚至完全消失。人類的知識,特別是研究語言的知識,應該是彼此相連的,并且最終是相互貫通的(王士元 2002:1)?!蔽覀冋J為,對于現(xiàn)階段的語言學跨學科研究,應該是借用別的學科的方法來研究語言學問題(劉海濤,林燕妮 2018)。這不僅有可能解決本學科現(xiàn)有方法難以研究的問題,也有助于提升語言研究的科學化水平。
我們在這方面的第一個嘗試是采用復雜網(wǎng)絡方法研究人類語言。從大的背景來看,人類處于一個充滿復雜網(wǎng)絡的世界之中。近年來,復雜網(wǎng)絡研究不但在數(shù)理學科、生命學科和工程學科中起著越來越重要的作用,而且也開始滲透到人文和社會科學領(lǐng)域。對于語言學而言,盡管從索緒爾開始,就不斷有學者提出語言是一個系統(tǒng)、一種網(wǎng)絡的觀點,但卻一直沒有找到適宜的方法對此進行科學的研究(劉海濤 2011)。復雜網(wǎng)絡分析技術(shù)的盛行,使得我們可以很容易地獲得研究所需的資源與軟件工具。因此,我們在10年前,開始進入語言復雜網(wǎng)絡研究領(lǐng)域,今天我們團隊已成為世界上最好的語言復雜網(wǎng)絡研究小組之一。十幾年來,我們做過的主要研究有:
(1)提出了復雜網(wǎng)絡對語言學家是手段而不是目標的觀點,構(gòu)造并研究了兩種語體的句法復雜網(wǎng)絡,首創(chuàng)了用復雜網(wǎng)絡方法研究語體與語言類型的方法(Liu 2008a);(2)構(gòu)造了兩個隨機生成網(wǎng)絡與一個句法網(wǎng)絡,并研究了它們的網(wǎng)絡特征,結(jié)果表明,雖然句法對于語言網(wǎng)絡的特征有一定的影響,但用現(xiàn)有指標難以區(qū)分句法網(wǎng)絡與隨機網(wǎng)絡,為了采用句法復雜網(wǎng)絡研究更微觀的語言結(jié)構(gòu),還需要尋求其他的指標(Liu & Hu 2008);(3)首次構(gòu)建并研究了語義角色復雜網(wǎng)絡,發(fā)現(xiàn)語義網(wǎng)絡雖然是小世界和無尺度網(wǎng)絡,但語義網(wǎng)絡與句法網(wǎng)絡在層級結(jié)構(gòu)和節(jié)點度相關(guān)性方面存在明顯不同(劉海濤 2009);(4)構(gòu)造了15種語言的句法復雜網(wǎng)絡,并首次采用復雜網(wǎng)絡研究了語言類型(分類)問題,結(jié)果顯示,通過復雜網(wǎng)絡的主要參數(shù),可以對人類語言進行分類,其準確性與利用現(xiàn)代語序類型學主要指標進行的語言分類準確性相當。通過對15種語言的詞形網(wǎng)與詞目網(wǎng)的比較,發(fā)現(xiàn)句法復雜網(wǎng)絡可以反映語言的形態(tài)變化程度,為采用復雜網(wǎng)絡進行語序相對自由語言的分類提供了理論依據(jù)。該方法彌補了語序類型學在處理語序相對靈活語言時的不足,有助于解決語序靈活語言的分類問題(Liu & Xu 2011);(5)研究了作為多層級系統(tǒng)的人類語言結(jié)構(gòu)特征,發(fā)現(xiàn)各個層級的網(wǎng)絡模型反映了各層級系統(tǒng)的共性與聯(lián)系,并表明語言的多種特征與人類認知之間存在著密切聯(lián)系(Liu & Cong 2014);(6)構(gòu)建了12種斯拉夫語族語言和2種非斯拉夫語言的平行詞同現(xiàn)網(wǎng)絡,并對這些網(wǎng)絡的主要參數(shù)進行了分析研究,獲得了一個精細的斯拉夫語族語言分類,同時也發(fā)現(xiàn),文字形式難以影響語言的結(jié)構(gòu)與分類(劉海濤,叢進 2013)。以上研究大多發(fā)表于國內(nèi)外重要的自然科學刊物,其中,有關(guān)語義復雜網(wǎng)絡、漢語句法網(wǎng)絡中心節(jié)點的研究被EurekAlert!與PhysORG等世界知名科學新聞網(wǎng)報道。其中有兩項成果,分別獲得了教育部高等學校科學研究優(yōu)秀成果獎(人文社會科學)和浙江省第十八屆哲學社會科學優(yōu)秀成果獎二等獎。鑒于我們在此領(lǐng)域所做的大量高水平研究,國際著名的自然科學期刊《生命物理學評論》(Physics of Life Reviews,2014年影響因子9.478)主編邀請我們2014年為該刊撰寫了題為《用復雜網(wǎng)絡研究人類語言》的文章。這是世界上第一篇刊登于高水平學術(shù)期刊的有關(guān)語言復雜網(wǎng)絡的長篇文章,刊出不久后,便成為2015年ESI高被引論文和熱點論文,目前已是語言復雜網(wǎng)絡研究領(lǐng)域的重要參考文獻(Cong & Liu 2014)。世界知名語言復雜網(wǎng)絡學者Ferrer-i-Cancho(2014)在談及我們的這篇文章時說:“基于網(wǎng)絡方法,叢與劉正在定義未來的語言學,這種方法正充實、更新并統(tǒng)一理論語言學。”
我們有關(guān)語言復雜網(wǎng)絡的研究得到了科學家的認可,說明語言學研究也可以很科學,語言學家也是科學家。這些研究成果不但拓展了復雜網(wǎng)絡在人文、社會與生命科學等領(lǐng)域的應用,而且將語言研究與自然科學中的研究熱點聯(lián)系在了一起,有助于從更廣闊的視域理解人類及其語言,豐富了語言研究的科學手段與方法,對語言學的科學化具有重要的推動意義。然而,盡管我們研究的也是與人類語言相關(guān)的問題,但對于傳統(tǒng)的語言學家而言,由于方法上的差異,我們的研究似乎與他們眼中語言學有一些不一樣,甚至有些難于理解。為此,我們也在思考如何在語言研究中逐步加入科學的成分,即:從傳統(tǒng)的語言學問題出發(fā),經(jīng)過基于數(shù)據(jù)的實證方法,最終的成果不僅可以解決語言學家關(guān)心的問題,也能得到科學家的認可。這方面的代表性案例是我們十多年來對依存距離的研究。
依存距離指的是兩個有句法(依存)聯(lián)系的詞在句子中的線性距離。根據(jù)心理學家的研究,依存距離與人的認知機制,特別是工作記憶有關(guān)。如此一來,我們可以通過依存距離這種文本計量指標和句法標注的語料庫來研究認知與語言的關(guān)系(梁君英,劉海濤 2016)。10年來,我們在這方面發(fā)表的主要研究成果有:(1)研究了自然語言與隨機生成語言的依存距離分布,發(fā)現(xiàn)自然語言的依存距離符合分布規(guī)律,而隨機語言則沒有這樣的特點,自然語言的依存距離具有最小化的特點(Liu 2007);(2)采用了20種語言的語料,首次驗證了依存距離最小化是人類語言的一個普遍規(guī)律。同時也發(fā)現(xiàn),一種語言的依存距離可能也與語言類型有關(guān),加深了我們對Sapir-Whorf假說的理解(Liu 2008b);(3)研究了句長等因素對依存距離的影響。結(jié)果發(fā)現(xiàn):依存距離的概率分布不受句子長度的影響,漢語的平均依存距離總是高于英語;依存方向是一種比依存距離更可靠的語言分類指標(Jiang & Liu 2015);(4)采用了20種語言的真實語料,發(fā)現(xiàn)語序類型是一個連續(xù)統(tǒng),開辟了用大數(shù)據(jù)進行語言類型研究的新路子。這種方法解決了語序相對固定語言的分類問題(Liu 2010)。(5)近年來,我們常常會聽到下面這樣一種說法“語言是一種復雜適應系統(tǒng)”(王士元 2006),但在大多數(shù)語言學書刊里,這種說法只是一種隱喻。因為,對于任何系統(tǒng)來說,如果沒有設定的目標,系統(tǒng)很難運轉(zhuǎn)起來。語言如果是一種系統(tǒng),也應該如此。為此,我們以依存距離最小化作為語言系統(tǒng)的目標之一,通過計算機模擬與真實語料庫對比,結(jié)果發(fā)現(xiàn),在處理長句的過程中,語言系統(tǒng)會啟動一種自適應機制,并產(chǎn)生一種動態(tài)的語言單位(即組塊),從而實現(xiàn)了依存距離最小化這一人類語言系統(tǒng)的運作目標(Lu et al. 2016)。這篇文章發(fā)表在國際復雜適應系統(tǒng)的權(quán)威期刊上,得到了該領(lǐng)域?qū)<业恼J可,成為為數(shù)不多得到系統(tǒng)科學家認可的語言研究論文,由此,我們也進一步精確了我們對語言作為系統(tǒng)的看法,即:語言是一種人驅(qū)復雜適應系統(tǒng)(Liu 2014;劉海濤,林燕妮 2018)。
這些研究大多發(fā)表在語言學或認知科學期刊上,解決了語言學家關(guān)心的一些問題,因此也得到了較廣泛的關(guān)注。例如,發(fā)表在Journal of Cognitive Science與Glottometrics上的論文,均為這兩個期刊近10年來所刊文章被引最高的文章。我們有關(guān)依存距離的這些研究,不但為探索語言與認知、語言與思維的關(guān)系提供了更加堅實的實證基礎(chǔ),也對從語言行為中發(fā)現(xiàn)人類的認知規(guī)律以及從人類認知的角度解釋語言行為具有啟示意義。盡管我們的這些研究大多發(fā)表在語言學刊物上,但由于采用了一般意義的科學方法,因此也得到了科學界認可。Physics of Life Reviews的主編破例又邀請我們?yōu)樵摽珜懥讼嚓P(guān)文章(Liu et al. 2017)。這篇文章將復雜系統(tǒng)理論、認知科學理論、大規(guī)模真實語料統(tǒng)計分析以及心理語言實驗行為結(jié)合起來,揭示了依存距離在自然語言句法模式形成與演化過程中的作用,指出依存距離最小化是自然語言的一個普遍特征。主編為什么會破例邀請我們呢?因為,我們2014年發(fā)表在這本期刊上的文章的引用率不錯,對提升該刊的影響因子做了貢獻。而這篇文章同樣也在出版不久后,成為本輪(2017年11初)ESI高被引論文和熱點論文。同期,我們發(fā)表在Complexity上關(guān)于語言適應機制的研究(Lu et al. 2016)也成為ESI熱點論文(數(shù)學學科)。
我們十幾年來的實踐表明,語言研究是可以科學化的,其成果也可以得到科學家的關(guān)注,但前提是我們需要采用科學共同體認可的方法來研究語言。
三、結(jié) 語
世界一流學科的建設需要我們與世界高手同場競技。因此,語言學研究成果的國際發(fā)表是中國語言學走向世界的必由之路。我們在構(gòu)擬學科建設方案時,應該將這個問題放在重要的位置,否則世界一流就是一句空話。在研究問題的選擇上,需要仔細考慮如何從漢語中的特殊問題引向更具有普遍意義的語言學問題。在研究方法上,盡可能采用一般意義的科學方法。長此以往,我們才能更好地把自己的研究推向世界,讓世界知道中國人也可以做出好的語言研究成果,逐步實現(xiàn)建設世界一流學科的目標。
參考文獻
蔣 穎 2013 《人文社會科學領(lǐng)域文獻計量學研究》,北京:社會科學文獻出版社。
黃春宇 2017 《語言學家王士元:我們應當讓語言自然的演化》,《文匯報》,12月8日。
梁君英,劉海濤 2016 《語言學的交叉學科研究:語言普遍性、人類認知、大數(shù)據(jù)》,《浙江大學學報》(人文社會科學版)第1期。
劉 莉 2009 《我國社會科學研究國際化探究——SSCI論文的視角》,北京:中國社會出版社。
劉海濤 2017 《計量語言學導論》,北京:商務印書館。
劉海濤 2011 《語言網(wǎng)絡:隱喻,還是利器?》,《浙江大學學報》(人文社會科學版)第2期。
劉海濤 2009 《漢語語義網(wǎng)絡的統(tǒng)計特性》, 《科學通報》第14期。
劉海濤,叢 進 2013 《基于平行詞同現(xiàn)網(wǎng)絡的語言聚類》,《科學通報》第5、6期。
劉海濤,林燕妮 2018 《大數(shù)據(jù)時代語言研究的方法與趨向》,《新疆師范大學學報》(哲學社會科學版)第1期。
喬曉春 2017 《中國社會科學離科學還有多遠?》,北京:北京大學出版社。
邱均平,趙蓉英,董 克等 2016 《科學計量學》,北京:科學出版社。
吳 文,唐玉鳳 2017 《生物語言學》,北京:中國社會科學出版社。
伍鐵平 1991 《三論語言學是一門領(lǐng)先的科學》,《語言教學與研究》第3期。
王士元 2002 《王士元語言學論文集》,北京:商務印書館。
王士元 2006 《語言是一個復雜適應系統(tǒng)》,《清華大學學報》(哲學社會科學版)第6期。
徐烈炯 1988 《生成語法理論》,上海:上海外語教育出版社。
徐烈炯 2008 《中國語言學在十字路口》,上海:上海教育出版社。
葉 鷹,唐健輝,趙 星等 2011 《h指數(shù)與h型指數(shù)研究》,北京:科學出版社。
尹洪波 2010 《賦予語言學一級學科地位》,《中國社會科學報》,6月15日第8版。
朱曉農(nóng) 即出 《語音答問·結(jié)語》,上海:學林出版社。
Bunge, Mario. 2016. Doing Science: In the Light of Philosophy. New Jersey: World Scientific.
Jin, Cong and Haitao Liu. 2014. Approaching human language with complex networks. Physics of Life Reviews 11 (4), 598-618.
Dyer, William Edward. 2017. Minimizing Integration Cost: A General Theory of Constituent Order. PhD thesis, University of California, Davis.
Eddington, David. 2009. Linguistics and the Scientific Method. In D. Eddington (ed.), Quantitative and Experimental Linguistics. Muenchen: Lincom GmbH.
Ferrer-i-Cancho, R. 2014. Beyond description. comment on “Approaching human language with complex networks” by Cong & Liu. Physics of Life Reviews 11 (4), 621-623.
Futrell, Richard. 2017. Memory and locality in natural language. PhD thesis, Massachusetts Institute of Technology.
Gordin, Michael. 2015. Scientific Babel: The Language of Science from the Fall of Latin to the Rise of English. Chicago and London: University of Chicago Press.
Jiang, Jingyang and Haitao Liu. 2015. The effects of sentence length on dependency distance, dependency direction and the implications. Language Sciences 50, 93-104.
Liu, Haitao. 2007. Probability distribution of dependency distance. Glottometrics 15, 1-12.
Liu, Haitao. 2008a. The complexity of Chinese dependency syntactic networks. Physica A: Statistical Mechanics & Its Applications 387 (12), 3048-3058.
Liu, Haitao. 2008b. Dependency distance as a metric of language comprehension difficulty. Journal of Cognitive Science 9 (2), 159-191.
Liu, Haitao. 2010. Dependency direction as a means of word-order typology: a method based on dependency treebanks. Lingua 120 (6), 1567-1578.
Liu, Haitao. 2014. Language is more a human-driven system than a semiotic system. comment on modelling language evolution: examples and predictions. Physics of Life Reviews 11 (2), 309-310.
Liu, Haitao and Fengguo Hu. 2008. What role does syntax play in a language network? EPL, 83, 18002.
Liu, Haitao and Chunshan Xu. 2011. Can syntactic network indicate morphological complexity of a language? EPL, 93, 28005.
Liu, Haitao and Jin Cong. 2014. Empirical characterization of modern Chinese as a multi-level system from the complex network approach. Journal of Chinese Linguistics 42 (1), 1-38.
Liu, Haitao, Chunshan Xu, and Junying Liang. 2017. Dependency distance: a new perspective on syntactic patterns in natural languages. Physics of Life Reviews 21, 171-193.
Lu, Qian, Chunshan Xu, and Haitao Liu. 2016. Can chunking reduce syntactic complexity of natural languages? Complexity 21 (S1), 33-41.
Plungyan, V. A. 2011. Modern linguistic typology. Herald of the Russian Academy of Sciences 81 (2), 101-113.
Rickheit, Gert and Lorenz Sichelschmidt. 2007. Valency and cognition-a notion in transition. In Thomas Herbst, Katrin G?tz-
Votteler (eds.), Valency: Theoretical, Descriptive and Cognitive Issues. Berlin and New York: Mouton de Gruyter.