劉洋++黃欣
摘 要
在網上閱卷系統(tǒng)中,需要將紙質的試卷和答題卡掃描成數(shù)字化圖像數(shù)據(jù),以此提取考生答題及其個人的信息特征。本文針對掃描后的數(shù)字化圖像數(shù)據(jù),運用Hough變換,提出一種新的圖像傾斜角檢測算法,以此為基礎,對網上閱卷系統(tǒng)進行重新設計,將系統(tǒng)核心功能分為答題卡圖像信息預處理和答題卡信息識別兩大模塊。該系統(tǒng)的設計,能夠有效地降低評卷誤差,提高系統(tǒng)的檢測率,促進了評卷的科學化和規(guī)范化。
【關鍵詞】圖像識別 網上閱卷系統(tǒng) 圖像處理技術 Hough變換
1 引言
網上閱卷是借助計算機網絡技術,將紙質的試卷和答題卡通過電子掃描技術和圖像處理技術轉化為數(shù)字化的形式,呈現(xiàn)給特定的教師進行評閱,已經成為高效、準確、公平的現(xiàn)代化閱卷方式。較之傳統(tǒng)閱卷方式,網上閱卷具有很多優(yōu)點,比如成績“多評制”、全程計算機管理、實時高效監(jiān)控和管理閱卷的質量和進度、實現(xiàn)了考試信息的數(shù)字化和閱卷工作的科學化管理。本文針對掃描后的數(shù)字化圖像數(shù)據(jù),提出了一個新的基于圖像邊緣檢測的傾斜角檢測算法,以此為基礎對網上閱卷系統(tǒng)進行設計,構建了基于圖像識別的網上閱卷系統(tǒng)。
2 相關技術
2.1 網上閱卷的核心分析
網上閱卷的流程與傳統(tǒng)閱卷非常相似,有所不同的是需要對圖像化的試卷進行切割處理,以便實現(xiàn)任務的分發(fā)和指配。其核心流程如圖1所示。
下面對這些核心步驟進行說明:
2.1.1 圖像數(shù)字化
在網上閱卷中,通過網絡傳輸?shù)氖菙?shù)字化的圖像信息,所以,首先需要借助掃描設備對紙質的考生試卷和答題卡進行掃描,生成數(shù)字化的圖像信息。
2.1.2 圖像預處理
為了后續(xù)的處理,需要對圖像進行預處理,包括消除圖像中無關的信息、增強圖像信息的可檢測性等。
2.1.3 獲取圖像信息
通過對圖像進行分析處理,以確定不同圖像信息代表不同的考試信息數(shù)據(jù)。
2.1.4 信息處理
在上述工作的基礎上,對圖像信息進行加工、匹配、整理,完成圖像信息的處理。
2.1.5 特征提取
通過閱卷系統(tǒng)建立的標識信息,從而正確地獲取試卷信息和答題卡信息等之間的對應,實現(xiàn)圖像信息的特征提取。
2.2 數(shù)字圖像處理
數(shù)字圖像處理是計算機研究領域一個非常重要的內容,主要是對圖像進行去噪、增強、復原等操作所涉及到的具體技術和方法,其主要目的是提高圖像的視感質量、獲取圖像的特殊信息以及圖像的編碼壓縮。在實際應用中,數(shù)字圖像處理常用的方法有:圖像編碼壓縮、圖像增強和旋轉、圖像分割、和圖像識別等。
3 圖像邊緣檢測算法的設計
將答題卡通過掃描生成數(shù)字圖像后,數(shù)字圖像或多或少會產生一定角度的傾斜,為了確保后續(xù)工作的正確性,需要對數(shù)字圖像進行傾斜角度檢測和圖像矯正處理。目前,在圖像傾斜角檢測上,應用較多的是以Hough變換為基礎的系列優(yōu)化算法,在功能和性能上都有不錯的表現(xiàn)效果。為了最大程度的保證邊緣點的平滑,本節(jié)提出基于圖像邊緣檢測的傾斜檢測算法,以達到優(yōu)化圖像矯正流程的目的,能夠滿足實際應用的要求。
3.1 基于圖像邊緣檢測的傾斜檢測研究
本節(jié)在基于垂直邊緣提取的Hough優(yōu)化算法和基于鄰域統(tǒng)計分析的Hough優(yōu)化算法的基礎上,結合兩種算法的優(yōu)點,實現(xiàn)圖像邊緣的傾斜檢測。
3.1.1 圖像的邊緣檢測
邊緣檢測主要目的是利用導數(shù)及微分的性質,確定圖像上的一組曲線,即圖像的邊緣,該邊緣是圖像上那些在亮度上急劇變化、中間有間斷的像素點所形成的集合,通過此邊緣可以提取圖像的一些關鍵信息,比如圖像表面方向的不連續(xù)等,在一定程度上簡化了圖像的處理過程。以答題卡定位區(qū)域為例,如圖2所示。
通過對該區(qū)域的分析就可以判定考生個人信息和其答題區(qū)域。通過對圖像的邊緣進行檢測,可以大大降低計算量,有效彌補基于鄰域統(tǒng)計分析的Hough優(yōu)化算法計算量大的缺點。
3.1.2 圖像的邊緣檢測方法
圖像邊緣檢測的步驟一般包含濾波、增強、檢測、定位。從目前的檢測方法來看,大部分基于圖像亮度之上的導數(shù)計算,以此來判定圖像中的邊緣位置。該方法對于圖像邊緣的檢測跟設定的閥值有關系,閥值大小會影響到判定結果。事實上,邊緣檢測是通過算法來提取圖像中對象和背景間的交界線,通過圖像灰度分布的梯度來獲得邊緣檢測算子。以下是幾種常見的圖像邊緣檢測算子:
(1)Roberts算子:Roberts 算子是一種最簡單的算子,適用于邊緣明顯且噪聲較少的圖像分割,對具有陡峭的低噪聲的圖像效果最好,但處理后結果邊緣不是很平滑。
(2)Prewitt算子:利用像素點上下、左右鄰點的灰度差,在邊緣處達到極值檢測邊緣,去掉部分偽邊緣,對噪聲具有平滑作用。該算子對噪聲有抑制作用,但對邊緣的定位仍不夠理想。
(3)Sobel算子:是一個離散的一階差分算子,對靠近中心的點加權以突出邊緣點。該算子通過梯度與差分原理實現(xiàn),用來運算圖像亮度函數(shù)的梯度的近似值。當精度要求很高時,該算子提取的圖像輪廓仍然不甚理想。
(4)Canny算子:是一個多階段的優(yōu)化算子,在濾波、增強和檢測方面要優(yōu)于其他的算子,是一種既能抗噪又能保持弱邊緣的算子,但實現(xiàn)起來較為麻煩。
3.2 基于圖像邊緣檢測的傾斜檢測算法
3.2.1 矩形連通域檢測
在檢測圖像的傾斜角度時,需要提取一個典型的定位塊,以此定位塊來分析整個答題卡的傾斜角度。這里采用鄰域跟蹤法識別出一個完整的矩形連通區(qū)域,其工作過程如下:
(1)以從上到下和從左到右的順序以此掃描二值化圖像,這里令起始邊界點為W(x0,y0),以此點為基礎跟蹤下一個邊界點。為了下面描述的方面,這里假定首次跟蹤鄰域方向為d=0。
(2)在W的鄰域內判斷是否有跟W同像素的點(這里假定W為黑色像素),如果沒有,調整跟蹤方向d=(d+1) mod 8,如果有,則該點為下一個邊界點。在跟蹤方向的選定上,如果(d mod 2)==0,則調整方向d=(d + 6) mod 8;否則,d=(d + 7)mod 8。
(3)重復步驟(2),直到找到四個矩形邊界點為止,那么該矩形塊就是一個完好的定位塊。
3.3 矩形邊緣Hough檢測
利用Hough變換,能快速實現(xiàn)傾斜角的檢測和圖像矯正。其思想是把圖像平面上的點對應到參數(shù)平面上的線,對原始圖像子抽樣處理和邊緣線提取,最后通過統(tǒng)計特性來解決問題。
3.4 圖像傾斜矯正
通過Hough變換找到圖像傾斜角度θ后,就可以進行坐標的變換,實現(xiàn)圖像傾斜的矯正。其變換公式為:
4 基于圖像掃描識別的網上閱卷系統(tǒng)的處理流程設計
作為網上閱卷系統(tǒng)而言,要在短時間內實現(xiàn)大批量的閱卷,這對系統(tǒng)要求很高,需要具備準確性、穩(wěn)定性、可靠性、易用性、實時性和安全性等特征。在功能上,要求對掃描后的數(shù)字化圖像文件進行存儲、切割,以便實現(xiàn)試卷的評閱。本文側重網上閱卷系統(tǒng)的基礎數(shù)據(jù)收集部分,主要是通過圖像識別完成對掃描后的數(shù)字化圖像數(shù)據(jù)的加工處理,這也是網上閱卷系統(tǒng)的核心。因此,可以將系統(tǒng)分為兩大核心模塊,分別是答題卡圖像信息預處理和答題卡信息識別,二者在業(yè)務流程上是相互關聯(lián)的。在圖像存入緩存后,流程會轉向答題卡圖像預處理,預處理完成之后才轉向答題卡信息識別模塊處理,需要說明的是,二者處理完后都需要進行異常的檢測。
其中,答題卡圖像預處理包括一系列的過程,比如圖像的灰度化處理、二值化處理、去噪處理和圖像矯正,以增強答題卡圖像特征信息可分辨能力和可提取能力,預處理的結果最終得到一幅經過Hough變換后的二值化圖像;而答題卡信息識別主要是利用圖像定位技術,根據(jù)答題卡模板中的設置對答題卡圖像進行區(qū)域分割,以便完成考生基本信息識別、客觀題識別、主觀題識別等操作。
5 結束語
本文對基于圖像識別的網上閱卷系統(tǒng)進行了設計,包括算法和系統(tǒng)兩個方面的設計。通過圖像識別和圖像處理技術,可以準確地對掃描后的數(shù)字化圖像數(shù)據(jù)進行切割,高效完成答題卡及試卷上不同信息的識別。由于網上閱卷系統(tǒng)主要是對數(shù)字化圖像數(shù)據(jù)進行處理,所以本文運用Hough變換,提出了一種基于圖像邊緣檢測的傾斜角檢測算法,以此為基礎設計系統(tǒng)的業(yè)務處理流程。該系統(tǒng)的設計,使得閱卷工作更加規(guī)范化、制度化、科學化、現(xiàn)代化,有效提高閱卷的效率和準確性。
參考文獻
[1]滕今朝,邱杰.利用Hough變換實現(xiàn)直線的快速精確檢測[J].中國圖象圖形學報,2008(02).
[2]李清.基于圖像識別的網上閱卷系統(tǒng)的設計實現(xiàn)與優(yōu)化[D].長春:東北師范大學,2013.
[3]張站,劉政怡,吳建國等.基于圖像識別的閱卷系統(tǒng)的設計與實現(xiàn)[J].微型機與應用,2011(04).
[4]楊青燕,彭延軍.基于灰度圖像的答題卡識別技術[J].山東科技大學學報(自然科學版),2009(03).
作者單位
1.長春工業(yè)大學信息化建設工作辦公室 吉林省長春市 130012
2.中國移動通信集團吉林有限公司長春分公司 吉林省長春市 130000
電子技術與軟件工程2016年19期