布合力齊姑麗?瓦斯力 溫且姆?薩迪克 熱依漢古麗?薩迪克 木合塔爾?沙地克
摘 要:文本對(duì)常用字的詞性、拼音和韻母進(jìn)行基于統(tǒng)計(jì)的多維度對(duì)比分析,得出詞性、韻母與聲調(diào)的關(guān)系不太明顯,但近20%的拼音只發(fā)音同一個(gè)聲調(diào),其它80%拼音中占比最高的聲調(diào)分別為二聲和四聲。
關(guān)鍵詞:詞性 拼音 韻母 聲調(diào)
中圖分類號(hào):H1文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-9082(2019)11-0-01
《現(xiàn)代漢語常用字表》由國(guó)家語言文字工作委員會(huì)、國(guó)家教育委員會(huì)于1988年發(fā)布,共收字3500個(gè)。其中的常用字部分,共2500字,覆蓋率為97.97%。[1]學(xué)國(guó)家通用語言文字(以下簡(jiǎn)稱國(guó)語)是每個(gè)中國(guó)人的神圣職責(zé),聲調(diào)是國(guó)語靈魂的所在。教育部、國(guó)務(wù)院扶貧辦、國(guó)家語委印發(fā)的《推普脫貧攻堅(jiān)行動(dòng)計(jì)劃(2018-2020年)》指出,到2020年,實(shí)現(xiàn)貧困家庭新增勞動(dòng)力人口應(yīng)全部具有國(guó)家通用語言文字溝通交流和應(yīng)用能力,現(xiàn)有貧困地區(qū)青壯年勞動(dòng)力具備基本的普通話交流能力,當(dāng)?shù)仄胀ㄔ捚占奥拭黠@提升,初步具備普通話交流的語言環(huán)境。國(guó)語的基本功能是表達(dá)和交流。國(guó)語的推廣普及程度不高是南疆脫貧攻堅(jiān)的一大短板。國(guó)語普及率低且發(fā)音不準(zhǔn)嚴(yán)重影響了貧困地區(qū)與外部世界的交流。這一障礙,已成為制約扶貧開發(fā)、技術(shù)培訓(xùn)等活動(dòng)的重要因素。堅(jiān)決做好國(guó)語的推廣普及工作也就成為脫貧攻堅(jiān)的一項(xiàng)重要而緊迫的任務(wù)。鑒于少數(shù)民族學(xué)國(guó)語的弱點(diǎn)和難點(diǎn),本文對(duì)常用的2500漢字的詞性、拼音和韻母進(jìn)行基于統(tǒng)計(jì)的多維度漢字特征對(duì)比分析,致力于發(fā)現(xiàn)與聲調(diào)的關(guān)系,助于正確發(fā)音。
一、詞性與聲調(diào)的關(guān)系
2500個(gè)常用字中共有22個(gè)詞性,其中前五個(gè)詞性占88.92%,分別為:名詞1007個(gè)(其中一聲248個(gè)、二聲302個(gè)、三聲149個(gè)、四聲303個(gè)、輕聲5個(gè))、動(dòng)詞794個(gè)(其中一聲202個(gè)、二聲145個(gè)、三聲138個(gè)、四聲309個(gè)、輕聲0個(gè))、狀態(tài)詞178個(gè)(其中一聲47個(gè)、二聲34個(gè)、三聲43個(gè)、四聲53個(gè)、輕聲1個(gè))、形容詞161個(gè)(其中一聲32個(gè)、二聲38個(gè)、三聲42個(gè)、四聲53個(gè)、輕聲0個(gè))、副詞83個(gè)(其中一聲18個(gè)、二聲15個(gè)、三聲15個(gè)、四聲35個(gè)、輕聲0個(gè)),名詞中二聲四聲較多,動(dòng)詞中四聲最多,狀態(tài)詞中一聲四聲較多,形容詞中三聲四聲較多,副詞中四聲最多。
分析發(fā)現(xiàn),只發(fā)音同一個(gè)聲調(diào)的詞性共有3個(gè),牽涉到9個(gè)漢字:
1.只發(fā)音一聲的詞性有2個(gè),分別為:擬聲詞、前接分詞,牽涉到3個(gè)漢字;
2.只發(fā)音輕聲的詞性有1個(gè),是語氣詞,牽涉到6個(gè)漢字。
一聲發(fā)音率達(dá)到50%及以上的詞性共有3個(gè),分別為:處所詞、擬聲詞、前接分詞,牽涉到5個(gè)漢字;二聲發(fā)音率達(dá)到50%及以上的詞性共有2個(gè),分別為:非語素字、語素詞根,牽涉到5個(gè)漢字;三聲發(fā)音率達(dá)到50%及以上的詞性有1個(gè),是區(qū)別詞,牽涉到4個(gè)漢字;四聲發(fā)音率達(dá)到50%及以上的詞性有1個(gè),是連詞,牽涉到6個(gè)漢字;輕聲發(fā)音率達(dá)到50%及以上的詞性有1個(gè),是語氣詞,牽涉到6個(gè)漢字。
二、拼音與聲調(diào)的關(guān)系
2500個(gè)常用字中共有387種拼音(忽略聲調(diào)),前5個(gè)拼音每個(gè)均含30個(gè)以上漢字,分別為:shi含40個(gè)漢字(其中一聲7個(gè)、二聲7個(gè)、三聲4個(gè)、四聲21個(gè)、輕聲1個(gè)), ji含36個(gè)漢字(其中一聲11個(gè)、二聲7個(gè)、三聲3個(gè)、四聲12個(gè)、輕聲0個(gè)), zhi含33個(gè)漢字(其中一聲10個(gè)、二聲7個(gè)、三聲6個(gè)、四聲10個(gè)、輕聲0個(gè)), yi含32個(gè)漢字(其中一聲4個(gè)、二聲6個(gè)、三聲6個(gè)、四聲10個(gè)、輕聲0個(gè)), jian含31個(gè)漢字(其中一聲10個(gè)、二聲0個(gè)、三聲8個(gè)、四聲13個(gè)、輕聲0個(gè))。
分析發(fā)現(xiàn),只發(fā)音同一個(gè)聲調(diào)的拼音共有77個(gè),牽涉到125個(gè)漢字。
1.只發(fā)音一聲的拼音共有19個(gè),分別為:gen、bin、zun、diu、zhua、keng、shuan、ha、zhui、shuo、nie、en、zuan、weng、pou、sen、hei、pie、ca,牽涉到22個(gè)漢字;
2.只發(fā)音二聲的拼音共有23個(gè),分別為:jue、rong、mang、ze、lin、nan、heng、ning、ceng、teng、qun、tuan、za、bie、qiong、ang、nuo、zei、hang、shei、neng、nin、nang,牽涉到48個(gè)漢字;
3.只發(fā)音三聲的拼音共有12個(gè),分別為:ken、sao、nv、ka、fou、leng、ruan、zen、lia、gei、zhun、nuan,牽涉到15個(gè)漢字;
4.只發(fā)音四聲的拼音共有21個(gè),分別為:ce、lie、kuo、mie、kuai、ruo、qia、zang、lve、rui、ri、nei、se、shun、te、run、cou、cuan、cuo、nen、beng,牽涉到38個(gè)漢字。
5.只發(fā)音輕聲的拼音共有2個(gè),分別為me、ne,牽涉到2個(gè)漢字。
一聲發(fā)音率達(dá)到50%及以上的拼音共有75個(gè),牽涉到188個(gè)漢字;二聲發(fā)音率達(dá)到50%及以上的拼音共有85個(gè),牽涉到257個(gè)漢字;三聲發(fā)音率達(dá)到50%及以上的拼音共有40個(gè),牽涉到65個(gè)漢字;四聲發(fā)音率達(dá)到50%及以上的拼音共有105個(gè),牽涉到366個(gè)漢字;輕聲發(fā)音率達(dá)到50%及以上的拼音共有5個(gè),牽涉到6個(gè)漢字。
三、韻母與聲調(diào)的關(guān)系
2500個(gè)常用字有37個(gè)韻母,前5個(gè)韻母每個(gè)均含100個(gè)以上漢字,分別為:i含302個(gè)漢字(其中一聲72個(gè)、二聲67個(gè)、三聲46個(gè)、四聲115個(gè)、輕聲2個(gè))、u含206個(gè)漢字(其中一聲39個(gè)、二聲40個(gè)、三聲48個(gè)、四聲79個(gè)、輕聲0個(gè))、ian含135個(gè)漢字(其中一聲31個(gè)、二聲33個(gè)、三聲21個(gè)、四聲50個(gè)、輕聲0個(gè))、an含131個(gè)漢字(其中一聲30個(gè)、二聲28個(gè)、三聲27個(gè)、四聲46個(gè)、輕聲0個(gè))、ao含116個(gè)漢字(其中一聲24個(gè)、二聲21個(gè)、三聲31個(gè)、四聲40個(gè)、輕聲0個(gè))。
分析發(fā)現(xiàn),只發(fā)音同一個(gè)聲調(diào)的韻母有1個(gè),一聲,是ueng,牽涉到1個(gè)漢字。
一聲發(fā)音率達(dá)到50%及以上的韻母有1個(gè),牽涉到1個(gè)漢字;二聲發(fā)音率達(dá)到50%及以上的韻母共有2個(gè),牽涉到10個(gè)漢字;三聲發(fā)音率達(dá)到50%及以上的韻母沒有;四聲發(fā)音率達(dá)到50%及以上的韻母有1個(gè),牽涉到7個(gè)漢字;輕聲發(fā)音率達(dá)到50%及以上的韻母沒有。
結(jié)論
分析發(fā)現(xiàn),詞性、韻母與聲調(diào)間的關(guān)系不太明顯,但是拼音與聲調(diào)間的關(guān)系比較突出。2500個(gè)常用字共有387種拼音,只發(fā)音同一個(gè)聲調(diào)的拼音占比19.9%,牽涉的漢字占比5%。同一聲調(diào)發(fā)音率達(dá)到50%及以上的拼音有310,占比80.1%,牽涉到的漢字有882個(gè),占比35.28%。另外,一聲字有613個(gè)、二聲字有587個(gè)、三聲字有444個(gè)、四聲字有839個(gè)、輕聲字有17個(gè)。387個(gè)拼音中,占比最高的聲調(diào)分別為二聲和四聲,2500個(gè)漢字中,占比最高的聲調(diào)分別四聲和二聲??傊?,記住好占比近20%的只發(fā)音同一個(gè)聲調(diào)的拼音的同時(shí),發(fā)音其它占比80%以上的拼音時(shí),若不知怎么發(fā)音,不妨先按占比最高的聲調(diào)來發(fā)音,正確率可達(dá)近60%,[2]對(duì)理解和表達(dá)不會(huì)有太多的影響。
參考文獻(xiàn)
[1]木合塔爾·沙地克,布合力齊姑麗·瓦斯力,漢字的大數(shù)據(jù)分析與可視化[J].中文信息,2018(5):167-168.
[2]木合塔爾·沙地克,布合力齊姑麗·瓦斯力,用Python數(shù)據(jù)分析方法進(jìn)行漢字聲調(diào)頻率統(tǒng)計(jì)分析[J].電腦知識(shí)與技術(shù),2017,17(35):13-14.