• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      手寫漢字正確性評價綜合方案實現(xiàn)及效果測試

      2019-10-08 03:21姜杰吳菊英韓青李藝
      電化教育研究 2019年9期
      關鍵詞:漢字書寫

      姜杰 吳菊英 韓青 李藝

      [摘? ?要] 漢字書寫評價與指導的信息化需求,促進了書寫質量智能評價技術方案的研究以及付諸教學實踐。既有“關鍵筆畫+逐步蔓延”方案經(jīng)歷了三年的書寫教學實驗后,研究站在漢字歷史、文化以及日常書寫識讀立場上,確立了新的書寫正確性綜合判定思想以及書寫細節(jié)糾錯的評價目標。研究優(yōu)化先前正確性評價指標體系,采取筆畫類型、空間關系等構字要素邏輯地位等同評價策略,設計了基于綜合特征匹配的漢字書寫正確性評價方案。針對該綜合匹配方案,根據(jù)實效進行了筆畫形態(tài)、相對位置等正確性評價指標特征權重的調整。為驗證面向教學應用的效果,設計了“惡意書寫場景”下的新舊方案的對比測試,結果表明,綜合方案對錯字的判定率相較于舊方案的93%進一步提高到97.5%,并在錯誤細節(jié)發(fā)現(xiàn)上有質的突破,達到89.9%;設計了“數(shù)據(jù)真實”情境下的一般性測試,結果表明,綜合方案在漢字書寫教學實踐數(shù)據(jù)抽樣樣本的正確性評判與人工評判的一致性上達到98.22%,可以更好地支持新一階段漢字書寫教學信息化實踐的應用需求。

      [關鍵詞] 漢字書寫; 綜合特征匹配; 正確性評價; 效果測試

      [中圖分類號] G434? ? ? ? ? ? [文獻標志碼] A

      [作者簡介] 姜杰(1977—),男,江蘇揚州人。講師,博士,主要從事教育信息化、文字計算研究。E-mail:jiangjie @foxmail.com。

      一、引? ?言

      我國政府非常重視漢字書寫教育,相關部委近年來發(fā)布的《國家中長期語言文字事業(yè)改革和發(fā)展規(guī)劃綱要》《教育部關于在中小學加強寫字教學的若干意見》等多項文件[1-2]中,皆反復強調漢字書寫教育的重要性,甚至提出增設相應課程的要求,其中就包括硬筆漢字書寫部分。而與之相對應,實踐過程中書法師資缺乏等因素使得漢字書寫教育一直處于困境之中,無法獲得較高效率的發(fā)展。在這一需求的刺激下,既有研究者圍繞漢字結構與計算提出種種非常有建構意義的模型,推動了技術的進步;也有部分企業(yè)開展了智能漢字書寫評價產品的研發(fā)與市場化,旨在為學生漢字書寫提供智能化指導,借此緩解師資力量不足的矛盾。考察所有這些技術或產品,硬筆漢字書寫正確性的評價,是書寫質量評價技術的基礎與核心。在所有這些研發(fā)主體群落中,本團隊在手寫硬筆漢字正確性評價方面的工作最有實效,也最有代表性。

      二、相關研究基礎和進展情況

      (一)其他團隊相關研究

      在針對文字(漢字)結構計算的相關領域中,有一些研究在CDL(字符描述語言)、SCML(結構化字符描述語言)基礎上,開始對構字元素與規(guī)則進行標識與計算,如設計了漢字結構碼對傳統(tǒng)書法規(guī)則進行量化[3]等,用數(shù)學領域中的拓撲學理論對漢字的拓撲結構進行分析[4]等,該類型的研究在文字表征基礎上對構字元素的識別與測量,與本研究僅在對文字表征的基礎研究層面有相似相通之處。

      指向漢字書寫質量評價的相關研究方案中,部分以筆畫匹配為手段對漢字書寫筆順進行識別、判斷與展示,研究主要指向筆順特征的評判[5];部分限定了正確筆順前提[6],或正確筆畫起落點空間位置前提[7],或有限書寫格式前提[8],抑或同時限定諸如形體結構及筆畫等多個前提,方能準確判定漢字書寫正誤,其研究成果實現(xiàn)的限制條件過多;部分研究將正確與美觀整合在一起進行字體結構的綜合評分[9],或對對稱性、緊湊性和勻稱性等結構規(guī)范性方面開展評價[10],其“正確”概念界定不明;亦有研究提出了與本研究目標相近的筆畫書寫、筆畫順序以及筆畫關系正誤判斷,但其筆畫空間關系細化中缺乏相交相接概念,且方案中以節(jié)點及邊替換的方法,對于較為復雜且書寫自由度較大的漢字來說,判斷準確度很差,遠不能談及實用[11]。

      從技術方法上考察,上述相關研究大都用到筆畫類型特征識別與判別、筆畫空間拓撲關系判別、特征向量距離計算、關系矩陣計算、模板匹配等其中的某種方法或多種技術方法的組合來實現(xiàn)特定目標。同時,研究方案和技術方法的最終驗證大都采用實驗數(shù)據(jù)來測試檢驗,較少見到應用服務(產品)形態(tài)的檢驗,更罕見一定時間跨度和實踐規(guī)模下面向應用問題驅動的迭代更新研究。

      (二)本團隊的既有解決方案

      借鑒并突破國內外的相關研究,本研究團隊完成了漢字書寫描述語言(WDL)設計[12]、GB2312楷體書寫字庫構建等相關基礎研究工作,確立了基于正確性和工整性評價兩層體系的書寫質量評價方案。其中正確性評價的目標,是對用戶書寫樣本字給出嚴格意義上的整體判定;其技術實現(xiàn),是基于“關鍵筆畫+逐步蔓延”思路的模板匹配方案,即在統(tǒng)一建立的漢字筆畫元素與結構描述標準的基礎上,采集用戶手寫字信息并將其與標準模板相匹配完成正確性判斷的方案[13]。該方案以自動化分析、提取標準模板字筆畫、部件、整字三層構字特征為基礎,輔助以半人工方式對模板字中諸如唯一類型筆畫、特殊復雜筆畫等關鍵性判別筆畫進行標注,完成基于標準模板字的正確性特征標記集。對用戶樣本字的正確性評價的過程,即以對應模板字的正確性特征標記集為查找、配對標準,首先匹配確認關鍵性筆畫(或筆畫集),再進一步查找匹配與之具有嚴格交關系特征以及具有明確位置關系特征的筆畫元素;后續(xù)不斷以確認完成的筆畫元素為基礎,配合筆畫類型與筆畫間拓撲關系等特征蔓延匹配剩余的待匹配筆畫,直至完成樣本字與標準模板字所有筆畫的匹配,在此基礎上,完成手寫漢字的正確性判斷。

      三、綜合匹配正確性評價方案構思

      (一)正確性評價技術思想討論

      原“關鍵筆畫+逐步蔓延”的正確性評價方案(下文簡稱:“原方案”)投入實驗后,參加實驗的學生及教師普遍反映該方案在正確性評價方面是有效的[14-15],就是說,基本上步入了“可用”的范圍。但是,由于實際漢字書寫學習中需要指出在筆畫及部件層次的各種錯誤細節(jié),如一個短撇寫成短橫、橫折寫成了橫折鉤、不該交的位置寫成了交等,針對這些情況,該方案很容易陷入判斷困境,只好要求用戶再次書寫??傮w上說,針對真實的應用需求,原方案在正確性評價精準程度方面依然有一定的局限性。

      研究團隊一方面在繼續(xù)優(yōu)化原方案,另一方面開始了對原方案合理性的質疑,試圖尋找關于手寫漢字正確性計算的更加合理的理解和解釋??疾鞚h字的發(fā)明及歷史上的演進,我們發(fā)現(xiàn),“筆畫形態(tài)”“關鍵筆畫”及個別“重要特征”在構成漢字上并不具有邏輯在先的地位,相反,筆畫相對位置有時卻可以被認為有更高的“權重”,如圖1所示。

      在這些漢字的演化過程中,筆畫層次的部分特征雖然得以保留,但演化過程更忠誠于其相對位置關系。至少可以認識到,所有漢字構成特征中的各個“分項”,包括筆畫形態(tài)、筆畫交接關系、筆畫相對位置等,并沒有任何一個是“邏輯在先”的,只能是權重上的差異。再進一步考察當代漢字應用場景,如諸多變形的美術字以及創(chuàng)意類字體,其筆畫乃至部件的形態(tài)發(fā)生了異化與變形后,但只要其相對位置關系正確,并不會產生太多識讀層面上的歧義。

      總結原有正確性評價方案目標與方案思想的局限,研究團隊對新階段正確性評價方案有了更新的認識與定位。首先,在正確性的評判思想上,站在漢字歷史、文化和應用的立場上進行評判,亦即在尊重書法藝術對文字筆畫形體和結構適度創(chuàng)作性表達基礎上,在適應漢字書寫與識讀的實際應用場景的基礎之上,采取允許適度“意達形變”的評判規(guī)則;其次,功能目標上,超越原有整體通過與否的簡單判定,站在精確定位錯誤對象、精準判斷錯誤類型的書寫指導需求服務之上,在正確性評判的同時開展細節(jié)糾錯型評價。

      與新階段正確性評價方案思想、目標相適應,突破既往的“筆畫類型邏輯在先,其余諸如空間拓撲等筆畫間關系邏輯在后輔助判斷”的技術方案,研究團隊采用了筆畫類型、空間關系等要素邏輯地位等同,并根據(jù)實效進行特征權重調整的綜合匹配正確性評價技術方案(下文簡稱:綜合方案)。

      (二)綜合方案的指標體系框架

      原方案從書寫入手,以書寫所得字的形態(tài)結構以及書寫過程的運筆筆順兩方面構建正確性指標體系。首先由書寫徑跡得其筆畫形態(tài),再通過筆畫間關系構成部件,最終由部件通過部件關系(亦或構成更復雜形態(tài)的部件)完成整字構建。筆畫間關系是指筆畫方位關系、筆畫組合關系(交接鄰)及筆畫長短關系,部件間關系以方位關系特征指標為主[16],其指標體系框架見表1。

      綜合方案指標體系,立足于既有指標體系,依據(jù)方案思想與目標,作了體系框架和內容的調整,見表2。在體系框架上,取消構字中間層的部件指標體系,究其原因,其一,部件本身是基于筆畫形態(tài)和筆畫間關系而形成的筆畫關系組合體,從識別角度考察是用戶書寫筆畫所得之組合的整體表征,從計算方法考察是正確筆畫匹配映射之后基于模板字部件關系標注的加工結果,部件本身不存在超越筆畫及組合關系的正確性判斷需求。其二,多個部件之間以方位為主的拓撲關系的計算與正確性評判,其可以通過部件間的筆畫關系計算得來;同理,原來整字層面一些特征的正確性判定,亦可通過筆畫特征及組合關系計算判斷。其三,構字元素的計算方法上,扁平單一的筆畫元素與關系層面的計算相較于多層結構元素與關系的計算在效率、復雜度、可靠度方面均有較大的優(yōu)勢。在體系內容歸屬上,筆畫數(shù)量特征、筆順特征調整到整字特征指標體系之下,因這兩類特征雖可直接關聯(lián)到具體筆畫,但只有從全體筆畫層面考察與評判才有意義。

      四、綜合方案的實現(xiàn)與性能優(yōu)化實驗

      (一)正確性判定實現(xiàn)流程與特征權重分配實驗設計

      綜合匹配方案的正誤判定,以用戶樣本字與模板字各指標項特征相似度加權來綜合評判。方案實現(xiàn)的主要步驟是:首先,對筆畫走向特征、筆畫長度比特征、筆畫絕對位置特征、相對位置特征,以及交關系等多個指標項分別求解特征相似度矩陣;而后,在此基礎上進行各特征相似度矩陣的權重加權求和計算與匹配判定。通常情況下,樣本字與模板字相對應的筆畫能以高于匹配度閾值或明顯高于其他筆畫匹配度數(shù)值的方式顯現(xiàn),從而實現(xiàn)筆畫匹配;對于仍然無法匹配的易混淆筆畫(或筆畫集),則須進行附加的兩兩之間筆畫鄰方位關系的匹配運算,達到最終正確與否的判定,其主要流程如圖2所示。

      綜合方案中,各指標項權重比例分配通過權重實驗檢驗優(yōu)化,并可在后期教學實踐中微調,權重實驗設置與效果檢驗,主要考慮下面幾方面因素:其一,評價方案思想對不同指標項寬容程度,即正確性認識與理解的差異,賦予不同指標項特征的正確與否判定權設置;其二,評價方案的實施目標性質,即考試考級目標的整體評判,亦或指導教學目標的細節(jié)糾錯等;其三,正確性評價所施教對象的漢字書寫水平與需求,此項主要以漢字是否為第一母語文字為依據(jù),區(qū)分筆畫形態(tài)、書寫過程等特征項嚴判程度。

      權重分配實驗是對綜合方案的優(yōu)化測試。實驗設計的測試樣本字集的選擇考慮了以下幾個方面:其一,字集基礎要求應該是包含各種典型筆畫及結構,以使實驗對各種情況有較好的覆蓋;其二,測試字集的信度要求,字集應該有一定的數(shù)量,以獲得有信度的統(tǒng)計結果,所謂數(shù)量的考量不僅僅是總體數(shù)量,亦應該考慮關于筆畫及結構的每個類的數(shù)量;其三,必須是真實對象的手寫字,這樣才對將來的手寫字判斷應用有直接的針對性,團隊在此方面有豐富的積累,即來自若干年基于原方案的教學實驗所積累的學生手寫字;其四,由于此時進行的是針對系統(tǒng)基礎性優(yōu)化,所選手寫字應該相對較為“工整”,所謂“工整”的基礎條件是,關于該字是否正確應該有明確的判斷而不至于無法分辨;其五,所選例字中應該有一定比例的錯字,可以初步順便檢驗系統(tǒng)對錯字的檢出率以及可否發(fā)現(xiàn)錯誤細節(jié),而實際上,團隊前期實驗中所積累的用戶手寫字中,恰好有一定比例的錯字,可以用于支持本基礎性測試。

      根據(jù)上述權重分配與測試字集設計需求,由研究團隊中負責書寫教學實施、跟蹤的研究者(非開發(fā)者)從實驗積累用戶字中篩選1000個字組成測試樣本字集。實驗對各指標項特征相似矩陣進行多輪次、不同權重配比方案下的綜合正誤判定結果進行統(tǒng)計,并與專家人工的判定作一致性對比。實驗對比結果顯示,筆畫形態(tài)特征、筆畫長度比特征、筆畫絕對位置特征、筆畫相對位置特征、筆畫交關系特征,這些指標項權重按1:1:0:7:1配比時,可獲得最高62%的專家人工判定一致性,以此權重配比為基礎,對混淆未能匹配的剩余筆畫集進行鄰關系特征附加判定,可實現(xiàn)最高98%的總體判斷正確率。

      猜你喜歡
      漢字書寫
      談在網(wǎng)絡閱卷環(huán)境下培養(yǎng)高中生漢字書寫興趣
      初中階段規(guī)范漢字書寫的策略分析
      小學語文與漢字書寫教學初探
      建設寫字與書法教育特色學校的策略研究
      漢字書寫,讓傳統(tǒng)延續(xù)美麗
      弘揚傳統(tǒng)文化抓實漢字書寫基本功
      初級階段漢語國際教育漢字書寫偏誤研究
      探究小學語文教學中應加強漢字書寫能力的培養(yǎng)
      初中語文教學加強漢字書寫的有效策略
      如何提高低年級學生漢字書寫能力
      将乐县| 大英县| 正镶白旗| 荆门市| 顺义区| 墨竹工卡县| 伽师县| 时尚| 八宿县| 洛隆县| 尚志市| 仲巴县| 磴口县| 文水县| 和田县| 永福县| 象山县| 沾益县| 昌乐县| 京山县| 凤山县| 仁寿县| 平和县| 德阳市| 梅河口市| 沙坪坝区| 阿荣旗| 博乐市| 商南县| 宣城市| 万山特区| 都匀市| 华容县| 枣庄市| 泸溪县| 长垣县| 扎兰屯市| 永济市| 柳州市| 芜湖县| 黑龙江省|