賀湘情,劉 穎
(清華大學(xué) 人文學(xué)院中國語言文學(xué)系,北京 100084)
計算風(fēng)格學(xué)是數(shù)理語言學(xué)的一個分支,其所建立的基礎(chǔ)是認(rèn)為寫作是個人將自己的思想用文字表達(dá)出來的一種活動,它隱含著作者個人獨特的獨立于表達(dá)內(nèi)容的表達(dá)方式,即編排自己的思想方式,其在文本中表現(xiàn)為可衡量的語言特征,即遣詞造句的習(xí)慣,且這種習(xí)慣常常是潛意識的,未被作者本人所察覺。
因此我們可以通過量化文本中的語言結(jié)構(gòu)單位來刻畫、研究語體、作品或作家的風(fēng)格,也就是說,與傳統(tǒng)的風(fēng)格學(xué)(又稱修辭學(xué))靠體悟式的歸納、自我內(nèi)省體驗去意會作品風(fēng)格所不同,計算風(fēng)格學(xué)建立的基礎(chǔ)是可供量化的語言學(xué)特征。對計算風(fēng)格學(xué)來說,其關(guān)鍵點在于提取出能代表或區(qū)分不同風(fēng)格的特征項,并且這些特征是可被量化統(tǒng)計且穩(wěn)定出現(xiàn)的。
計算風(fēng)格學(xué)的研究方法經(jīng)歷了從簡單地統(tǒng)計某些特定語言結(jié)構(gòu)單位的出現(xiàn)頻率,到引入t檢驗[1]、卡方檢驗[2]等假設(shè)檢驗統(tǒng)計量,再到使用典型相關(guān)分析[3]、主成分分析、因子分析[4]等多元統(tǒng)計方法的發(fā)展歷程,目前最前沿的研究方法是利用機(jī)器學(xué)習(xí)領(lǐng)域中的文本聚類和文本分類模型來實現(xiàn)計算機(jī)基于作品風(fēng)格的自動文本區(qū)分。
由于計算機(jī)無法直接處理文本數(shù)據(jù),因此利用機(jī)器學(xué)習(xí)的方法來進(jìn)行文本聚類就需要將原始文本轉(zhuǎn)化為由特征表示的結(jié)構(gòu)化數(shù)據(jù),以便于計算機(jī)的存儲、讀取和計算。目前使用最廣泛的文本表示模型是向量空間模型,其背后的概念即為將文本表示成向量空間中的向量,而能夠代表文本的特征項則為該文本向量的分量,因此挖掘出能代表作品風(fēng)格的特征項是最終實現(xiàn)計算機(jī)自動、準(zhǔn)確地區(qū)分出不同風(fēng)格作品的關(guān)鍵,這些特征的特點是在同一風(fēng)格的一系列作品中穩(wěn)定出現(xiàn),且能使其與其他作品區(qū)分開來。
目前已提出并證實能代表作品風(fēng)格的可計量的語言結(jié)構(gòu)特征可分為詞匯、句子、段落、語法、語義等五個層面。其中對詞匯層面的挖掘最為成熟、深入而透徹,包括高頻詞、虛詞[5]、單現(xiàn)詞、關(guān)聯(lián)詞、詞長、詞的形符類符比等;句子層面包括句長、標(biāo)點符號比例[6]、句類分布[7]、句式分布和句型分布[8]等;段落層面包括段落長、開端詞、末端詞、起始句、終結(jié)句、段落格式等;語法層面包括詞性[9]、依存語法關(guān)系[10]等;語義層面包括基于HowNet的語義類[11]、基于概念詞典的概念[12]以及基于哈工大同義詞詞林(擴(kuò)展版)的同義詞詞集[13]等。
綜上所述,我們不難發(fā)現(xiàn)目前基于風(fēng)格的特征挖掘在語音層面上還比較薄弱,然而語音是語言的物質(zhì)外殼,韋勒克和沃倫在其合著《文學(xué)原理》中就曾指出: “一件文學(xué)作品首先是一套聲音的系統(tǒng)”,人們在閱讀或?qū)懽鞯臅r候,即使沒有讀出聲來,也必定會在心中“默念”。得益于語言的音樂美,每個文學(xué)作品都有著自身的節(jié)奏和韻律,它們是構(gòu)成作品風(fēng)格的不可忽視的重要因素,尤其是在詩歌和散文這兩類文體中,和諧的語音、抑揚頓挫的語調(diào)以及語句變化的節(jié)奏本身就是審美對象。
本研究基于北大計算語言研究所所研發(fā)的《現(xiàn)代漢語語法信息詞典》開發(fā)了一個拼音轉(zhuǎn)化分析軟件,用于將文本轉(zhuǎn)換為現(xiàn)代漢語拼音,有效地解決了多音字標(biāo)音的問題,準(zhǔn)確率可達(dá)到98%以上。此外該軟件還能靈活地提取全文本以及位于詞首、詞尾、分句首、分句尾、句首、句尾的聲母、韻母和聲調(diào),以及分句句長和整句句長,從而作為向量特征來構(gòu)建文本向量,再利用基于KL散度(Kullback-Leibler Divergence, KLD)的層次聚類法對三位作家的文本進(jìn)行聚類以檢驗特征的有效性,并進(jìn)一步分析特征項能夠代表作品風(fēng)格的原因。
文本聚類是一種無監(jiān)督的機(jī)器學(xué)習(xí)方法,與文本分類不同的是,它無需預(yù)先對文本進(jìn)行人工類別標(biāo)注,也不需要訓(xùn)練過程,而是通過計算文本之間的距離來作為衡量它們之間相似度的標(biāo)準(zhǔn),最終將文本集合分組成多個類或簇,使得同一個簇中的文本具有較高的相似度,而不同簇之間的文本內(nèi)容差異較大。
層次聚類是文本聚類的算法之一,按照分類原理的不同,又可劃分為凝聚和分裂兩種方法[14],本文所采用的是凝聚型層次聚類法。該算法由樹狀結(jié)構(gòu)的底部開始逐層向上進(jìn)行聚合[15],即最初將每個樣本看作一個簇,然后根據(jù)距離最終將其合并為一個簇。
本研究采用KL散度(Kullback-Leibler Divergence, KLD),又稱相對熵來度量算任意兩個樣本之間的距離,同時采用離差平方和法來度量類與類之間的距離。對于歸一化的文本向量P(X1,X2,…,Xn)和Q(Y1,Y2,…,Yn),向量特征值的總和均為1,且對于任何n皆滿足Xn>0及Yn>0,因此文本P和Q之間的KL散度可定義為式(1)。
金明哲對其進(jìn)行優(yōu)化后獲得了更好的聚類效果,因此本文采用其所提出的公式(2)來計算文本之間的KL散度,KL散度越小,則代表樣本之間的相似度越高。
朱光潛曾在《談美·談文學(xué)》[16]中指出文學(xué)的情趣大半要靠聲音節(jié)奏來表現(xiàn),因此本研究定位于散文文體,從朱自清、汪曾祺和劉亮程3位作家的散文集中各選取了40篇作品。由于單個作品的字?jǐn)?shù)參差不齊,為確保語料大小的同一,我們根據(jù)字?jǐn)?shù)將每位作家的作品進(jìn)行組合,以確保合并后的文本字?jǐn)?shù)均保持在10 000字左右。合并之后劉、汪、朱3人的文本數(shù)分別為6、7、7。語料庫規(guī)模的詳細(xì)信息如表1所示。
表1 語料庫規(guī)模統(tǒng)計
中國古代的詩歌講究押韻以達(dá)到音韻的和諧,朗讀的順暢,而優(yōu)美的散文作品雖然并不苛責(zé)嚴(yán)格的押韻,卻同樣在韻腳的選擇上有所講究與經(jīng)營。本文所選取的三位作家分別是現(xiàn)代、現(xiàn)當(dāng)代和當(dāng)代散文家的杰出代表,其中朱自清和汪曾祺受過良好的傳統(tǒng)文化熏陶,古文功底深厚,因此其在散文創(chuàng)作中能有意識地傳承古典詩歌中的聲律元素,重視字句的聲音。劉亮程雖然沒有接受過系統(tǒng)的古文訓(xùn)練,但詩人出身的他曾在《對一個村莊的認(rèn)識》中自白道: “我努力讓自己像寫詩一樣寫每一篇散文”,其近乎詩化的散文語言也同樣是很講究韻律和節(jié)奏感的。
因此我們以句末字韻母出現(xiàn)的頻率及其n元組合作為特征來進(jìn)行文本聚類,其中前者可反映出3位作家在句中偏好于以何韻母結(jié)尾,從而推斷出其在韻腳的選用上有何異同;而后者則可折射出文本押韻的情況。
需要說明的是,所謂句末字韻母的n元組合是指基于文本每句的最后一個字的韻母所構(gòu)建n元語法模型,為了全面考察文本連續(xù)押韻和隔句押韻的情況,我們分別提取了二元、三元和四元語法模型中出現(xiàn)頻率排名前100位的組合來共同組成特征項,向量空間總維度為373維。文本聚類的結(jié)果如圖1所示,其中“z”指代朱自清,“w”指代汪曾祺,“l(fā)”指代劉亮程(下同)。
圖1 基于句末字韻母的n元組合的聚類結(jié)果
由圖1我們可以發(fā)現(xiàn)以文本句末的用韻作為特征能很好地將3位作家的作品區(qū)分開來,也就是說句末韻母的使用和押韻情況能成為區(qū)分作者風(fēng)格的有效特征。
3.2.1 句末字用韻
為了進(jìn)一步探明3位作家在句末韻母的使用和押韻上有何異同之處,其句末用字的韻母分布頻率圖如圖2所示。
圖2 三位作家句末用字韻母分布頻率圖
圖2是3位作家句末用字的韻母分布頻率圖,需要說明的是,由于韻母e和i的出現(xiàn)頻率遠(yuǎn)遠(yuǎn)高于其它,它們共同在劉、汪、朱3位作家句尾所使用的韻母中分別占據(jù)了38%、35%和48%的比例,因此為了作圖清楚,圖2便將其省略。
由圖2可以看出,3位作家句末字韻母的分布趨勢大致相同,與湯云航[17]對漢語本身韻母的出現(xiàn)頻率的統(tǒng)計結(jié)果相比,uo、iu、ong、ui、ei、ie、iong在句末的使用明顯少于其在普通話韻母中的出現(xiàn)概率,體現(xiàn)了句末用韻的獨特性。此外我們還可以看到,總的來說劉亮程較常在句尾使用u、ü、en、ing、eng等舌位較高的韻;而汪曾祺除了u之外,更多地使用an、ao、ian、ai、iao、uan等舌位較低的韻,朱自清則相比更傾向于使用a、ia這類開口度較大的韻,反映出不同作家的句末用韻偏好。
由于在漢語中不同的字可能共享一個韻,因此我們試圖將韻還原成字來進(jìn)一步探討其句尾用韻差異的原因。由于看單個的字可能沒有意義,因此我們首先以詞為單位將三位作家出現(xiàn)頻率位于前100位的句尾詞提取出來,再按照句末字的韻母加以歸類。以元音a、e、i、ü、u所對應(yīng)的字為例,結(jié)果如下表所示:
由表2我們可以看出,朱自清在元音a使用上的凸顯,主要歸根于其豐富的句末語氣詞的使用以及第三人稱代詞。此外就元音在發(fā)音上的響度而言,a的響度最高,最能抒發(fā)強(qiáng)烈的感情,這也正好契合了下文對其文中多用感嘆號的發(fā)現(xiàn)。
元音e不但在三位作家句尾韻中的出現(xiàn)頻率均最高,而且其所對應(yīng)的用字也大體一致,多為常用的助詞和語氣詞。元音i的出現(xiàn)僅次于e,不過其所對應(yīng)的用字在三位作家中存在明顯差異。劉亮程i韻的來源主要是粘附在詞根后面的詞綴“子”和表地點的“里”,且意象多為農(nóng)村日常生活中常見的實物;而汪、朱的來源則相對較廣,多為抽象名詞。元音ü所對應(yīng)的用字主要是加在動詞后面表示趨向的“去”,而u則多對應(yīng)“處、路、書”,特別的是汪文中的“豆腐”和“舒服”都是輕聲,而劉、朱則沒有。
3.2.2 基于句末字韻母的n元組合
韻母由韻首、韻腹、韻尾三部分,一般而言只要韻尾相同, 韻腹相同或者相近即可視為押韻。我們根據(jù)《中華新韻(十四韻)簡表》,分別提取了2元組合前100位,3元組合前50位和4元組合前50位中押韻的組合,表3列出了主要押韻組合。
表2 基于句末字元音的前100個句尾詞歸類表
表3 主要押韻組合
從表3我們可以看出,在相鄰兩句的押韻上,朱自清對韻腳的選擇較為單一,種類明顯不如劉、汪二人豐富,且一半都屬于“波”韻部(e、uo)。而劉、汪二人雖然韻腳的數(shù)量一致,但劉亮程除了反復(fù)使用“波”韻部外,其他韻腳所屬的韻部則較為分散,而汪曾祺則集中于“波”和“寒”(an、ian、uan)這兩個韻部上。
在相鄰三句的押韻上,主要統(tǒng)計了“一韻到底”(如“i i i”)和“隔句押韻”(如“e i e”這兩種形式。我們不難發(fā)現(xiàn)一韻到底只發(fā)生在“齊”韻部(i)和“波”韻部中,其余均為隔句押韻。而在隔句押韻中,劉亮程青睞押“i”韻,朱自清和汪曾祺則偏好押“e”韻,且朱自清中間插入的其他韻的形式更為豐富。
在相鄰四句的押韻上,主要統(tǒng)計了“一韻到底”(如“e e e e”)、“隔句押韻”(如“e i e i”和“回環(huán)押韻”(如“e i i e”)這3種形式。由上表可知雖然劉亮程回環(huán)押韻的形式較另兩位更多,但在數(shù)量的排名上比較靠后,因此與其對一韻到底和隔句押韻的使用相比,汪曾祺和朱自清在回環(huán)押韻上的使用更為突出。
散文的美除了韻律之外,還離不開節(jié)奏。所謂節(jié)奏,即是在一定時間間隔里的某種對立形式的反復(fù)。文章的節(jié)奏主要體現(xiàn)在頓歇上, 從語言結(jié)構(gòu)特征出發(fā),可通過統(tǒng)計分句長及其前后連續(xù)變化來抽取隱藏的節(jié)奏。所謂分句是指復(fù)句中相對獨立的單句形式,在本研究中通過檢測分號、逗號、冒號、頓號和破折號來加以識別。我們提取了所有單個分句長(以字?jǐn)?shù)為單位)以及分句長的2、3、4、5元組合的前196、117、55、46位為特征對文本進(jìn)行聚類,空間維度共443維,結(jié)果如圖3所示:
圖3 基于分句長的n元組合的聚類結(jié)果
由圖3可知,以分句長及其n元組合為特征能成功地將3位作家的文本區(qū)分開來,說明它們是行之有效的能夠反映作品風(fēng)格的特征。
3.3.1 分句句長
為進(jìn)一步比較3位作家在分句句長的連續(xù)使用上有何異同,其分句句長的頻率分布圖如圖4所示。
圖4 三位作家分句句長頻率分布圖
由圖4我們可以看出,總體來說,汪曾祺的分句長最短,并大量使用四字分句;其次是朱自清,主要集中地使用6~7字分句;劉亮程的分句最長,由6~9個字組成的分句最多,且9~20字長的分句也明顯多于其它兩位作家。
究其原因主要有以下幾個方面: 第一,汪曾祺受明清散文小品的影響較深,偏愛文言句式和四字格,并且并不受現(xiàn)代漢語主謂賓必須完整的語法限制,經(jīng)常省略主語和介詞,頗有古代文人寫意式白描手法的風(fēng)韻,從而流露出典雅簡潔的語言風(fēng)格;第二,汪曾祺有意識地追求“精準(zhǔn)”的表達(dá)手法,他曾在《小說筆談》中指出“語言的唯一標(biāo)準(zhǔn),是準(zhǔn)確”,因此致力于使用最合適的詞而較少使用修飾語。而朱自清處于“文言文”和“白話文”的交替時期,注重挑選和提煉口語;與此同時因在新文學(xué)運動中大量接觸歐美文學(xué),受到“翻譯體”的影響,又使其某些句子變長。故其分句長介于汪曾祺和劉亮程之間。而劉亮程接受的是規(guī)范的現(xiàn)代漢語語法訓(xùn)練,句子大多主謂賓齊全,雖然也力求簡潔的表達(dá),但相較另外兩位作者而言,仍不可避免得被拉長。
3.3.2 相鄰分句句長變化
從相鄰分句的句長變化圖來看,就主體而言3位作家的句長變化都較小,大多控制在4字以內(nèi),句長差小于等于4的情況分別在劉、汪、朱3人的文本中達(dá)到了66%、71%和75%的比例。然而細(xì)心觀察之后我們?nèi)阅馨l(fā)現(xiàn)同中存異,相對而言朱自清的句長變化最為平穩(wěn),節(jié)奏最為舒緩,多近似對偶句。劉亮程在字?jǐn)?shù)對仗工整方面(即句長差為0)的把握明顯不如汪、朱二人,尤其是汪曾祺最為講究句式長短的對齊。此外從句長差大于等于5字以上的頻率均高于汪、朱二人還可看出,劉亮程兼顧使用長短句的交錯,其文本的節(jié)奏更富于變化。
圖5 三位作家相鄰分句句長變化圖
整句是指能表達(dá)一個完整的意思的語言運用的基本單位,它由詞和短語構(gòu)成,在本研究中通過檢測句號、感嘆號、問號和省略號來加以識別。標(biāo)點符號除了用于標(biāo)明語氣之外,還可以起到標(biāo)識不同時間長短的停頓,從而實現(xiàn)不同的節(jié)奏感,反映不同的文本風(fēng)格??偟膩碚f標(biāo)點符號可分為點號、標(biāo)號和符號3大類,其中可用來表示停頓的包括所有點號和一部分標(biāo)號,它們是句號、問號、感嘆號、逗號、頓號、分號、冒號,以及引號、破折號、省略號。由于標(biāo)點符號還從另一方面折射了句子的編排結(jié)構(gòu),影響著句子的長度,因此我們以上文提到的10個標(biāo)點符號和整句句長為特征來對3位作家的文本進(jìn)行了文本聚類,向量空間維度共114維,結(jié)果如圖6所示。
由圖6我們可知以標(biāo)點符號和整句句長為特征能較好地將3位作家的文本區(qū)分開來, 它們是有效的特征。下面我們將具體地來看3位作家在句長和標(biāo)點符號方面有何差異。
圖6 基于標(biāo)點符號和整句句長的聚類結(jié)果
3.4.1 整句句長
圖7是3位作家的整句句長分布比例圖,為了顯示清楚,句長分布圖中我們只選取了句長在50字以內(nèi)(含50)的句子。由圖可知, 和分句句長一樣,汪曾祺的整句句長也最短,主要集中在8~17字。不同的是,朱自清反超劉亮程更多地使用長句,24字以上的句子所占的比例均大致處于領(lǐng)先地位,劉亮程的句長分布則介于兩者之間。
圖7 3位作家整句句長(分布50字以內(nèi))頻率分布圖
3.4.2 標(biāo)點符號
圖8是3位作家的標(biāo)點符號分布比例圖,為了顯示清楚,我們剔除了逗號和句號??偟膩碚f,逗號和句號的出現(xiàn)頻率占據(jù)著主導(dǎo)地位,它們共同在劉、汪、朱3位作家所使用的所有標(biāo)點符號中分別達(dá)到了91.3%、71.8%和73.9%的比重,由此也可看出劉亮程的標(biāo)點符號使用較為單一,主要集中在逗號、句號和頓號這3種上,語氣情感較為平和舒緩。
圖8 3位作家標(biāo)點符號使用頻率圖
相比之下,汪曾祺對引號和冒號的使用更為突出,這與其在散文中善于運用“對話”還原出日常生活的真實場景的寫作風(fēng)格有關(guān),而這一家常式的語言風(fēng)格也很好地解釋了其句子最短的原因。
朱自清則表現(xiàn)出特別偏好使用分號,而分號主要用于復(fù)句內(nèi)部并列分句之間的停頓,由此可反映出朱自清的句子結(jié)構(gòu)較為縝密,層級分明,故長句頗多。此外其在感嘆號、問號的使用上也有著更高的頻率,說明其在情感的表達(dá)上更為外露和激烈。
本文以朱自清、汪曾祺和劉亮程3位作家的散文作品為實驗對象,利用基于KLD的層次聚類法挖掘出了新的能夠代表作品風(fēng)格的特征。實驗結(jié)果表明句末用字韻母及其n元組合能夠反映文本韻律,分句句長的n元組合、標(biāo)點符號和整句句長能夠反映文本節(jié)奏,以其為特征能成功地將這3位作家的作品區(qū)分開來,證明了它們是能代表作品風(fēng)格的行之有效的特征,有望應(yīng)用于作者歸屬、基于作品風(fēng)格的自動文本分類等領(lǐng)域。
韻律方面,大體上劉亮程較常在句尾使用舌位較高的韻;而汪曾祺傾向于使用舌位較低的韻,朱自清則多使用開口度較大的韻。在相鄰兩句的押韻上,朱自清對韻腳的選擇較為單一,種類明顯不如劉、汪二人豐富。在相鄰3句的隔句押韻形式上,劉亮程青睞押“i”韻,朱自清和汪曾祺則偏好押“e”韻,且朱自清中間插入的其他韻的形式更為豐富。在相鄰四句的押韻上,汪曾祺和朱自清在回環(huán)押韻上的使用較為突出。
節(jié)奏方面,汪曾祺的分句長最短,并大量使用四字分句;其次是朱自清,劉亮程的分句最長。從相鄰分句的句長來看,朱自清的句長變化最為平穩(wěn),節(jié)奏最為舒緩,多近似對偶句;汪曾祺最為講究句式長短的對齊,對仗工整;劉亮程則兼顧使用長短句的交錯,其文本的節(jié)奏更富于變化。和分句句長一樣,汪曾祺的整句句長也最短,不同的是,朱自清反超劉亮程更多地使用長句。此外,劉亮程的標(biāo)點符號使用較為單一,主要集中在逗號、句號和頓號這3種上,語氣情感較為平和舒緩。相比之下,汪曾祺對引號和冒號的使用更為突出,折射出其口語化的特點。朱自清因偏好使用分號,故長句頗多,同時也多用感嘆號和問號,說明其在情感的表達(dá)上更為外露和激烈。
本研究的不足之處在于,只研究了散文文體,并未將其與一般文體進(jìn)行比較,未來還可進(jìn)一步探尋其它文體的相關(guān)規(guī)律。
[1] 趙岡,陳鐘毅.紅樓夢新探[M].北京: 文化藝術(shù)出版社,1991.
[2] 李賢平.《紅樓夢》成書新說[J].復(fù)旦學(xué)報(社會科學(xué)版),1987,5: 3-16.
[3] 陳芯瑩,李雯雯,王燕.計量特征在語言風(fēng)格比較及作家判定中的應(yīng)用——以韓寒《三重門》與郭敬明《夢里花落知多少》為例[J].計算機(jī)工程與應(yīng)用,2012,48(3): 137-208.
[4] 萬凱. 基于因子分析法的中文文本降維[D].廣州: 華南理工大學(xué),2012.
[5] 金奕江,孫曉明,馬少平.因特網(wǎng)上的寫作風(fēng)格鑒別[J].廣西師范大學(xué)學(xué)報(自然科學(xué)版),2003,21(1): 62-66.
[6] 常淑慧.基于寫作風(fēng)格的中文郵件作者身份識別技術(shù)研究[D].天津: 河北農(nóng)業(yè)大學(xué),2005.
[7] 李小鳳.疑問句在報道語體與藝術(shù)語體中的對比研究[D].廣州: 暨南大學(xué),2005.
[8] 邵長超.文藝語體和科技語體形謂句對比研究[D].廣州: 暨南大學(xué),2007.
[9] 于靈子.科技語體和藝術(shù)語體定語位置上的形容詞研究[D].廣州: 暨南大學(xué),2006.
[10] 萬晶.中文作者識別方法研究[D].長沙: 湖南大學(xué),2012.
[11] 武曉春,黃萱菁,吳立德.基于語義分析的作者身份識別方法研究[J].中文信息學(xué)報,2006,20(6): 61-68.
[12] 陳龍,范瑞霞,高琪.基于概念的文本表示模型[J].計算機(jī)工程與應(yīng)用.2008,44(20): 162-164.
[13] 朱牧.基于寫作風(fēng)格特征的論文剽竊檢查優(yōu)化方法研究[D].上海: 復(fù)旦大學(xué),2011.
[14] 馮曉蒲,張鐵峰.四種聚類方法之比較[J].微型機(jī)與應(yīng)用,2010,29(16): 1-3.
[15] 孫吉貴,劉杰,趙連宇.聚類算法研究[J].軟件學(xué)報,2008,19(1): 48-61.
[16] 朱光潛.談美·談文學(xué)[M].北京: 人民大學(xué)出版社,2013: 193-200.
[17] 湯云航. 普通話語音的統(tǒng)計分析[J].承德民族師專學(xué)報,1995,1: 66-76.