張 瑛
(中國傳媒大學(xué)文學(xué)院,北京 100024)
政務(wù)微博新聞?wù)Z體計量分析
張 瑛
(中國傳媒大學(xué)文學(xué)院,北京 100024)
從計量的角度分析了政務(wù)微博新聞的語言特點及語體特征。認為政務(wù)微博新聞雖然是新聞?wù)Z體的下位分支,但相對于傳統(tǒng)的新聞而言,其正式程度較低,語氣豐富,語言親切活潑,主要體現(xiàn)為詞匯密度較低,較多使用語氣詞,語句的破碎度較高等。
新聞;政務(wù)微博;計量;語體特征
隨著互聯(lián)網(wǎng)的迅速發(fā)展,微博的影響力已滲透至各個領(lǐng)域。政府部門也逐漸意識到微博在輿情監(jiān)測和輿論引導(dǎo)中的重要性,并紛紛開設(shè)政務(wù)微博。2013年10月,國務(wù)院辦公廳發(fā)布的《關(guān)于進一步加強政府信息公開回應(yīng)社會關(guān)切提升政府公信力的意見》中指出,“各地區(qū)各部門應(yīng)積極探索利用政務(wù)微博等新媒體,及時發(fā)布各類權(quán)威政務(wù)信息,尤其是涉及公眾重大關(guān)切的公共事件和政策法規(guī)方面的信息,著力建設(shè)基于新媒體的政務(wù)信息發(fā)布和與公眾互動交流新渠道”[1]。政務(wù)微博已經(jīng)成為政府部門發(fā)布新聞資訊的重要平臺,對政務(wù)微博新聞?wù)Z言特征的研究也越來越多,例如王林楓從話題和主位推進的角度研究政務(wù)微博新聞?wù)Z篇特點[2],趙巍從系統(tǒng)功能語言學(xué)語域的角度分析了政務(wù)微博的語場、語旨和語式[3],王宏則應(yīng)用費爾克勞夫的批評性語篇分析三維框架,從語篇、話語實踐和社會實踐三個角度研究了政務(wù)微博語篇[4]。這些研究多從質(zhì)化角度出發(fā),以分析政務(wù)微博語篇特點為主。然而,由于微博平臺限制和網(wǎng)絡(luò)語言環(huán)境的影響,政務(wù)微博新聞雖然下屬于新聞?wù)Z體,但它還具有一定網(wǎng)絡(luò)語體的特征,其語言特征較為復(fù)雜。為了更客觀地分析政務(wù)微博新聞的語言特點,本文使用計量的方法,基于真實語料,觀察了政務(wù)微博新聞在詞和句層面的使用,并分析這些特點所反應(yīng)的語體特征。
計量語體學(xué)認為“語言結(jié)構(gòu)在不同體裁的文本中的分布差異是客觀存在的”[5]25。因此,不少學(xué)者通過對大規(guī)模真實語料中各類語言特征進行統(tǒng)計,尋找其分布規(guī)律,并探尋這個規(guī)律產(chǎn)生的動因。本文從計量語體學(xué)視角出發(fā),基于語料與現(xiàn)代統(tǒng)計方法,考察政務(wù)微博新聞?wù)Z體的語言特征實際分布情況。筆者首先從10個政務(wù)微博①這10個政務(wù)微博分別是:江西省公安廳交警總隊、河北公安網(wǎng)、河南省青少年發(fā)展基金會、湖北民生、江蘇省公安廳、國家教育部、山東省公安廳交警總隊、微成都、重慶市人民政府新聞辦公室、微博江蘇。隨機各抓取了100篇,共1 000篇新聞作為研究樣本,構(gòu)建了政務(wù)微博新聞?wù)Z料,以下簡稱“語料”。語料規(guī)模為115 957字。
筆者首先使用國家有聲媒體語言資源網(wǎng)傳媒語料庫在線分詞標注系統(tǒng)②系統(tǒng)網(wǎng)址為http:∥ling.cuc.edu.cn/cucseg/,按照粗顆粒度③粗顆粒度與細顆粒度切分標準請參看《面向語言監(jiān)測的自動分詞標注規(guī)范研究報告》。對語料進行了切詞和詞性標注,提取了詞層面的相關(guān)數(shù)據(jù)。隨后,采用簡單的句法分析器對句層面的相關(guān)數(shù)據(jù)進行統(tǒng)計。在獲取數(shù)據(jù)之后,分析了政務(wù)微博新聞?wù)Z體用詞、用句特點及其所體現(xiàn)的語體特征。
丁金國曾指出計量語體學(xué)首先需要解決的問題就是“從自然語言中提取那些具有區(qū)別性的語體標記,這些標記的基本要求是可形式化”[6]。其次,這些可供計量的標記還必須具備“共時性、普遍性和層次性”。鑒于學(xué)者們目前仍然未能就提取哪些標記達成共識,本文以語言單位為標準,選用詞和句兩個層面的部分語言特征進行了統(tǒng)計。
1.詞符總體分布
對語料詞語和標點符號的整體使用情況進行了統(tǒng)計,包括詞型例比、標點符號比例及標點符號種類總數(shù)(見表1)。
表1 詞符總體分布
詞型例比(type to token ratio)是指詞總次數(shù)(詞例)與詞種類數(shù)(詞型)的比例,計算公式如下:
詞型例比反映了語篇詞匯的豐富程度。計算結(jié)果顯示語料的詞型例比為5.557 1。黃偉、劉海濤曾對《新聞聯(lián)播》和《實話實說》的詞型例進行統(tǒng)計,結(jié)果分別為2.962 4和5.541 8[5]26?!缎侣劼?lián)播》被認為是“書面語體的口頭表達形式”,而《實話實說》則被認為是口語體的典型代表。通過對比,政務(wù)微博新聞?wù)Z料的詞型豐富程度較低于《新聞聯(lián)播》,與《實話實說》相近。這說明政務(wù)微博新聞雖然屬于新聞?wù)Z體,本應(yīng)書面化程度較高,但實際上其更傾向于口語語體。
Ure將詞匯密度定義為語篇實詞數(shù)與詞匯總數(shù)之比,計算公式如下:
經(jīng)過計算,語料的詞匯密度為61.706 6%。Ure的研究表明,口語語體的詞匯密度約為40%[7];王彬等的研究表明,書面語體《新聞聯(lián)播》的詞匯密度高達87.16%[8]。通過數(shù)據(jù)對比,可以看出政務(wù)微博新聞?wù)Z體介于口語語體和書面語體之間雖屬于書面語體,但其書面化程度較低。
“標點符號是輔助文字記錄語言的符號,是書面語的有機組成部分,用來表示停頓、語氣以及標示某些成分(主要是詞語)的特點性質(zhì)和作用”[9],其具備標示意義和關(guān)聯(lián)命題的功能。表1顯示,語料中標點符號比重較高,并且種類繁多。這是由于政務(wù)微博新聞篇幅較短,通過標點符號可以有效地銜接語句,豐富篇章結(jié)構(gòu)和語句語氣。
值得注意的是,筆者將“@”號和雙“#”號納入了本文標點符號統(tǒng)計范圍。原因在于這兩個特殊符號由于微博平臺的特殊性,可在政務(wù)微博新聞中起到標示成分的作用。“@”具有標示專名的作用;雙“#”則與方頭括號“[]”功能相似,標示報道開頭的功用(見例1)。
例1 #春運安全提示#緊張的春運即將到來,在此提醒大家外出時注意安全,不要在候車室里睡覺或打盹,避免行李遺留或失竊,祝大家過一個平安快樂的春節(jié)!@微博河北@羅山交警(來自河北公安網(wǎng)新浪微博)
語料中“@”號和雙“#”號使用頻次較高,分別出現(xiàn)237次和247次。“@”號和雙“#”號在政務(wù)微博新聞中具有互動性功能,“@”號可提示相關(guān)其他用戶閱讀該條新聞,雙“#”號可將該新聞與同話題新聞形成鏈接??梢?政務(wù)微博新聞與傳統(tǒng)新聞有所不同,具有一定的互動性,而這一特性較多出現(xiàn)在口語語體中。
2.詞層面數(shù)據(jù)分析
參照《現(xiàn)代漢語語法信息詞典》詞類劃分標準[10],排除前接成分、后接成分、語素和非語素字這四類非詞,將詞類劃分為21個類別,并統(tǒng)計了不同詞類詞語在政務(wù)微博新聞?wù)Z料中使用的比值、均值以及標準差(見圖1)。從詞類的使用總比值可以看出,語料中大量出現(xiàn)名詞和動詞。這是由于名詞和動詞承載的信息量較高,能夠有效地表述新聞事件,符合了政務(wù)微博新聞的信息傳播需求。習用語、縮略語和成語都屬于慣用語。語料中,習用語和縮略語的使用總比值較高,成語的使用總比值相對而言較低。習用語多出現(xiàn)于口語中,而成語多出現(xiàn)于書面語。這間接說明,政務(wù)微博新聞更傾向于使用具有口語色彩的詞匯??s略語是一種經(jīng)濟的語言表達形式,政務(wù)微博新聞通常篇幅簡短,使用縮略語可以有效提高新聞信息量。語氣詞、嘆詞和擬聲詞都屬于口語色彩較濃的詞語,較少在新聞?wù)Z體中出現(xiàn)。然而,語料中語氣詞的使用總比值并不算低,明顯高于嘆詞和擬聲詞,可以推斷政務(wù)微博新聞?wù)Z氣較為豐富。
圖1 政務(wù)微博新聞?wù)Z料詞類統(tǒng)計
3.句層面數(shù)據(jù)分析
在語句層面,筆者對語料的句子破碎度,句長分布和句類比值進行了統(tǒng)計,分析了語料在句子中的使用特點。
(1)破碎度?!捌扑槎?是指一句話中停頓的次數(shù),即一句話的零散程度”[11]47。一般而言,書面語體語句流暢,句內(nèi)停頓較少,破碎度較低,而口語語體語句中插入語較多,常出現(xiàn)停頓,破碎度較高。破碎度的計算公式如下:
黃伯榮、廖序東指出,“點號主要表示語句中的各種停頓”[12]147,并將點號分為句末點號和句內(nèi)點號(見表2)。
表2 7種點號的名稱和形狀[12]
筆者認為,句末點號數(shù)量反映了語料中的總句數(shù),句內(nèi)點號反映了句中的停頓。所以,以句末點號和句內(nèi)點號為標記,筆者對語料中句子進行了切分和統(tǒng)計,并按照公式3計算得出的破碎度為2.73。闞明剛的研究表明,書面語體破碎度為2.6,口語語體破碎度為2.9[11]47。以此為參考,筆者認為,語料的破碎度表明政務(wù)微博新聞?wù)Z體介于書面語體與口語語體之間。
(2)句長。小句通常是指最小的獨立性語法單位,包括單句和復(fù)句中的分句。句子則是表達完整意、體現(xiàn)說人意圖的語法單位,包括單句和復(fù)句。筆者對語料中小句句長的分布和句子句長分布進行了統(tǒng)計,得出分布圖(如圖2所示)。
句長影響著信息傳播的經(jīng)濟性。長句由于含有更多的修辭成分,可以更為準確、清晰地描述事物、陳述事實和表達思想,往往承載著更大的信息量;短句修辭成分較少,語言結(jié)構(gòu)簡單,但是語義簡潔明了,節(jié)奏更為輕快活潑。長句較多出現(xiàn)于書面語體,而短句較多出現(xiàn)于口語語體。從圖2中可以看出,語料小句和句子句長多為50字以上。這表明政務(wù)微博新聞仍然以信息傳播為主要目的,句長分布具有一定的書面語體特征。圖2中無論是小句還是整句,其50字以下的句長分布都較為均衡。可見,政務(wù)微博新聞較注重長短句交替使用,使用各種長度的句子來豐富語篇的語句型式。
圖2 政務(wù)微博小句和句子句長分布圖
(3)句類。句子按照預(yù)期功能劃分可以得出——四個不同的句類,即陳述句、疑問句、祈使句和感嘆句。筆者對語料中這四個句類的使用比值進行了計算(見表3)。
表3 政務(wù)微博新聞不同句類使用比值 %
句類中,陳述句用于敘述和說明事實,疑問句的主要交際功能是提出問題、詢問情況,感嘆句的特點在于可表現(xiàn)情感,祈使句用于表示命令、禁止及勸阻等。通過表3中的數(shù)據(jù),可以看出陳述句在語料中比值較高。對于新聞?wù)Z體而言,其主要目的在于傳播消息。陳述句用于提供確切的信息內(nèi)容,而疑問句中信息具有不確定性,感嘆句和祈使句情感色彩濃厚,不符合新聞?wù)Z體對客觀性的要求,較少被使用。然而,黃偉、劉海濤曾對140篇《新聞聯(lián)播》中陳述句和疑問句的平均使用總比值進行統(tǒng)計,結(jié)果分別為99.62%和0.22%。通過數(shù)據(jù)對比,可以推測政務(wù)微博新聞中雖以陳述句為主,但其疑問句、感嘆句和祈使句的使用比值要高于典型新聞。這說明,政務(wù)微博新聞?wù)Z氣比典型新聞要豐富得多。眾所周知,政務(wù)微博新聞雖然是一種新聞資源,但更是政府部門與公眾共享信息的新方式。為了樹立親民形象,避免流露過于正式化的“官腔”,政務(wù)微博新聞往往會采用更豐富的語氣,使新聞顯得更加生動活潑。政務(wù)微博新聞的書面化程度也隨之降低。
通過對政務(wù)微博新聞?wù)Z料進行計量分析,得出政務(wù)微博新聞具有書面語體的特征,例如:詞匯密度高于口語語體,極少使用嘆詞和擬聲詞,較多使用長句。同時,政務(wù)微博新聞雖然是新聞?wù)Z體的下位語體,但相對《新聞聯(lián)播》為代表的典型新聞而言,其書面化程度較低,具有較多的口語語體特征,在詞層面主要體現(xiàn)為詞型例比較高,詞匯密度較低,較多地使用語氣詞;在句層面體現(xiàn)為句子破碎度較高,疑問句、感嘆句和祈使句的使用比值較高。分析結(jié)果表明,政務(wù)微博新聞?wù)Z體正式程度低于典型新聞,語氣豐富,語言更加親切生動。基于計量的語體有助于人們更加客觀地分析政務(wù)微博新聞的語言特點,并從語言學(xué)的角度解釋這些使用特點產(chǎn)生的原因。如何選擇適當?shù)恼Z料和標注體系,添加語義、語用等深層統(tǒng)計數(shù)據(jù)提高分析質(zhì)量,將是今后值得繼續(xù)深入研究的課題。
[1] 關(guān)于進一步加強政府信息公開回應(yīng)社會關(guān)切提升政府公信力的意見[EB/OL].中央政府門戶網(wǎng)站http:∥www. gov.cn/zwgk/2013- 10/15/content_2506664.htm
[2] 王林楓.政務(wù)微博發(fā)布的新聞消息的語篇特點研究[J].赤峰學(xué)院學(xué)報:漢文哲學(xué)社會科學(xué)版,2012,33(11):150 -153.
[3] 趙巍.語域理論視角下的中國政務(wù)微博研究[J].吉林省教育學(xué)院學(xué)報,2013,322(29):98- 100.
[4]王宏.中國政務(wù)微博批評話語分析[D].海口:海南大學(xué),2013.
[5] 黃偉,劉海濤.漢語語體的計量特征在文本聚類中的應(yīng)用[J].計算機工程與應(yīng)用,2009,45(29):25- 27,33.
[6] 丁金國.基于語料庫的語體風格研究:兼論量化與質(zhì)化的關(guān)系[J].煙臺大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2009,2(22): 114- 120.
[7]Ure J.Lexical Density and Register Differentiation[M]∥Perren G E,Trim J L M(eds).Applications of Linguistics:Selected Papers of the Second International Congress of Applied Linguistics.Cambridge:Cambridge University Press,1971:443- 452.
[8] 王彬,王依然,文采菊,等.基于標注語料庫的《新聞聯(lián)播》語言特征統(tǒng)計分[M]∥第三屆學(xué)生計算語言學(xué)研討會論文集,2006:285- 290.
[9]GB/T 15834- 2011.標點符號用法[S].北京:中國標準出版社,2012.
[10]俞士汶.現(xiàn)代漢語語法信息詞典詳解[M].北京:清華大學(xué)出版社,2003.
[11] 闞明剛.幾個語體參數(shù)的定量對比研究:以新聞報道和訪談對話為例[J].語文學(xué)刊,2011(9).
[12]黃伯榮,廖序東.現(xiàn)代漢語[M].北京:高等教育出版社, 2007:148.
【責任編輯 王立欣】
Quantitative Analysis on News Style of Microblog of Government Affairs
Zhang Ying
(School of Chinese Language&Literature,Communication University of China,Beijing 100024,China)
The linguistic features and stylistic features of news on government affairs microblog. Although the news on the government affairs microblog is a subgenre of news style,it is much different from traditional news.It is more oral,less official and gets more various moods.It has lower lexical density,more modal particles,and a high degree of fragmentation in sentences,etc.
news;microblog of government affairs;computation;stylistic feature
H 0
A
2095-5464(2014)04-0538-04
2014- 03- 17
河北省科技廳項目(144576690)。
張 瑛(1987-),女,湖北京山人,中國傳媒大學(xué)博士研究生。