摘 要:文章介紹2018年出版的第4版《圖像工程》系列教材的編寫思路和特色。首先具體討論了該版系列教材編寫中的總體規(guī)劃和考慮,包括所覆蓋的內(nèi)容范圍和結構安排層次,以及擬對應的課程和對教學的思考。接下來介紹了各冊書內(nèi)容的選取和安排,包括選材原則、各冊內(nèi)容劃分,冊內(nèi)單元劃分、單元內(nèi)具體內(nèi)容的概況,并與國外同類圖書在選材方面從科研角度進行了對比。最后從方便教學和讀者出發(fā),列舉了總的編寫特點和一些具體措施,包括章節(jié)設置和安排,習題及解答、彩色圖片、資源提供等。
關鍵詞:教材建設;圖像工程;圖像處理;圖像分析;圖像理解
中圖分類號:G640 文獻標志碼:A 文章編號:2096-000X(2018)19-0124-04
Abstract: This article introduces the compilation ideas and features of the fourth edition of "Image Engineering" series published in 2018. First, the overall planning and consideration in the writing of this version of the teaching materials are discussed in detail, including the scope and structure of the covered contents, as well as the corresponding courses and reflections on teaching. Next, the selection and arrangement of the contents of each book in this series are introduced, including the principle of material selection, the division of the contents in each book, the division of units within a book, and the outline of the specific contents of units. It is also compared with similar books of foreign countries from the perspective of scientific research in material selection. Finally, from the perspective of convenient for teaching and readers, it lists the general writing features and some specific measures, including chapter setting and arrangement, exercises and answers, color pictures, and resource provision.
Keywords: textbook construction; image engineering; image processing; image analysis; image understanding
一、概述
圖像工程是一門系統(tǒng)地研究各種圖像理論、技術和應用的交叉學科,是一個將數(shù)學、光學等基礎科學的原理結合在圖像應用中積累的實踐經(jīng)驗而發(fā)展起來的,將各種圖像技術集中聯(lián)系起來的,對整個圖像領域進行全面研究和應用推廣的新學科[1]。
圖像工程的研究方法與數(shù)學、物理學、生理學、心理學、電子學、計算機科學等學科相互借鑒,它的研究范圍與模式識別、智能系統(tǒng)、計算機視覺、計算機圖形學等專業(yè)互相交叉,它的研究進展與人工智能、神經(jīng)網(wǎng)絡、遺傳算法、模糊邏輯等理論和技術密切相關,它的發(fā)展應用與生物醫(yī)學、通信網(wǎng)絡、文檔處理、機器人自動化、遙感、測繪和軍事偵察等許多領域緊密結合[1]。
圖像工程技術所涉及的內(nèi)容跨越教育部學科目錄中的多個一級學科下的二級學科,包括“信息與通信工程”一級學科下的“信號與信息處理”二級學科,“控制科學與工程”一級學科下的“模式識別與智能系統(tǒng)”二級學科,以及“信計算機科學與技術”一級學科下的“計算機應用技術”二級學科。
《圖像工程》教材是對各種典型圖像技術的原理和方法的進行綜合介紹的一套教材。該教材從1999年第一版出版以來,逐漸更新擴展,得到了廣泛的重視和關注。前三版的累積印刷量已達到20多萬冊,在高校得到了廣泛的使用。
2018年,《圖像工程》系列教材出版了第4版。該版包括了上、中、下三冊,還有一個合訂本[2-5]。
下面,分總體規(guī)劃和思路,內(nèi)容選取和結構,方便教學和讀者對第4版的特色進行介紹。
二、總體規(guī)劃和思路
本節(jié)首先介紹對教材的整體考慮。
(一) 覆蓋范圍
《圖像工程》教材希望比較全面地覆蓋各種圖像技術。圖像技術在廣義上是各種與圖像有關的技術的總稱。計算機圖像技術包括利用計算機和其他電子設備進行和完成的一系列計算工作,例如圖像的采集、獲取、編碼、存儲和傳輸,圖像的合成和產(chǎn)生,圖像水印的嵌入和提取,圖像的顯示和輸出,圖像的變換、增強、恢復、修復和投影重建,圖像的分割,目標的檢測、跟蹤、表達和描述,目標特征的提取和測量,序列圖像的校正,3-D景物的重建復原,圖像數(shù)據(jù)庫的建立、索引和抽取,圖像的分類、表示和識別,圖像模型的建立和匹配,圖像和場景的解釋和理解,以及基于它們的判斷決策和行為規(guī)劃等[6]。另外,圖像技術還可包括為完成上述功能而進行的硬件設計及制作等方面的技術。
(二) 內(nèi)容層次
《圖像工程》教材所覆蓋的內(nèi)容可以分為三個層次。從信號處理的角度看,對圖像的加工可能有不同的需求,也需要有不同的輸出。首先,圖像是用來“看”的,提高圖像的視覺質(zhì)量應是基礎的要求,這是(狹義的)圖像處理所要解決的問題,圖像處理的輸出應是視覺質(zhì)量有改善的圖像。其次,人們常常對圖像中的特定目標更感興趣,對目標進行檢測和提取,測量它們的定量指標非常有用,這是圖像分析所要解決的問題。圖像分析的輸出應是對圖像中感興趣目標的描述數(shù)據(jù)。最后,圖像是對客觀世界的反映,所以要通過對圖像內(nèi)容含義的理解得出對原來客觀場景的解釋,從而指導和規(guī)劃行動,這是圖像理解所要解決的問題。圖像理解的輸出應是更為抽象的場景描述。
(三) 對應課程
第4版《圖像工程》教材根據(jù)圖像工程的三個內(nèi)容層次分為三冊,即上冊“圖像處理”、中冊“圖像分析”和下冊“圖像理解”。這樣,每冊對應一個圖像工程的層次,可用于不同類型的教學工作。其中:1. 上冊“圖像處理”可用以開設本科生專業(yè)基礎課,48~64學時。2. 中冊“圖像分析”可用以開設本科生專業(yè)基礎課或研究生專業(yè)選修課,32~48學時。3. 下冊“圖像理解”可用以開設研究生專業(yè)選修課,32~48學時。
(四)教學考慮
從教學的角度考慮,第4版的三冊《圖像工程》教材有如下共同特點:1. 盡快進入主題:三冊書都從各自的第2章開始介紹課程正式內(nèi)容,都把先修或預備內(nèi)容分別安排在需先修部分的同一章之前,沒有安排專門的基礎知識章。這樣從教學角度來說,更加實用,也突出了課程主線的內(nèi)容。2. 內(nèi)容模塊化:三冊書的正式內(nèi)容都分別結合進4個相關的學習單元,每個單元都圍繞一個主題(自成體系,見下節(jié)),如圖1所示。這樣既加強了全書的系統(tǒng)性和結構性,也有利于復習考核。3. 結構一致:三冊書均包含15章正文和一個附錄,它們結構相同,長度相近,均可用于一次授課。每章都有一節(jié)“總結和復習”,包括“各節(jié)小結和文獻介紹”及“思考題和練習題”。4. 提供主題索引:各冊書后均仍有主題索引(并給出了英文),這樣既方便在書中查找有關內(nèi)容,又方便在網(wǎng)上查找有關文獻和解釋。事實上,該教材也是許多科研工作的參考材料,主題索引是很有需求的。
三、各冊書內(nèi)容選取和安排
其次介紹對內(nèi)容的具體選取思路和結果。
(一)選材原則
第4版保留了上一版中有代表性的經(jīng)典內(nèi)容,還參考了許多新的文獻充實了近年的一些最新研究成果和得到廣泛使用的典型技術,以適應圖像技術的飛速發(fā)展。
第4版結合了作者的一些研究工作和成果以及這些年來的教學教案和教學實踐,增加了許多例題,其中有些是介紹一些新的選學內(nèi)容,有些則從其他的角度來補充解釋已有的概念和方法。這些例題可根據(jù)課時安排、學生基礎等選擇使用,比較靈活。
(二)圖像處理內(nèi)容
第4版上冊在保持上一版主要內(nèi)容的基礎上,還增加了一章“圖像去霧”,增加了一節(jié)“圖像認證和取證”,還增加了對“圖像質(zhì)量”“最大似然-最大期望重建算法”“基于稀疏表達的超分辨率重建”和“基于局部約束線性編碼的超分辨率重建”等內(nèi)容的介紹。
第4版上冊分為4個單元,每個單元有3~4章,如圖2所示。
第1個單元介紹圖像增強技術,既包含頻域圖像增強,也包含空域圖像增強。后者還分為基于點操作的方法和基于模板操作的方法。
第2個單元介紹圖像恢復技術,既包含了傳統(tǒng)的無約束恢復和有約束恢復方法,也包含了近期對圖像的修補方法,還包含了針對大氣霧霾進行消除的技術。另外,還介紹了從投影重建圖像這類特殊的圖像恢復技術。
第3個單元介紹圖像編碼技術,既包含了基本的編碼定理及典型的熵編碼、預測編碼和(離散余弦和小波)變換編碼方法,還討論了符號編碼、準無損編碼、基于內(nèi)容的編碼等特殊方法。
第4個單元介紹拓展圖像技術,既包含有關圖像信息安全的數(shù)字水印技術、圖像認證和取證技術以及圖像信息隱藏技術,也包含從灰度圖像處理向彩色圖像處理的拓展、從靜態(tài)圖像處理向視頻圖像處理的拓展以及從單尺度圖像處理向多尺度圖像處理的拓展。
(三)圖像分析內(nèi)容
第4版中冊在保持上一版主要內(nèi)容的基礎上,還增加了一章“顯著性和屬性”,增加了兩節(jié)“從像素單元到目標單元”和“不變量交叉比”,還增加了對“方向微分算子”、“二階導數(shù)檢測角點”、“哈里斯興趣點算子”和“隨機樣本共識”等內(nèi)容的介紹。
第4版中冊分為4個單元,每個單元有3 ~ 4章,如圖3所示。
第1個單元介紹圖像分割技術,既包含了分割定義及方法分類等基礎,也包含了對一些典型實用算法的介紹和分割高維、運動、彩色圖像的擴展方法,以及對圖像分割技術的全面評價比較等。
第2個單元介紹表達描述技術,既包含對目標的表達和描述方法,還包含了對目標特征測量影響因素的討論和對測量2的分析。
第3個單元介紹特性分析技術,既包含對紋理特性、形狀特性和運動特性的詳細分析,也包含對目標顯著性和屬性的分析方法。
第4個單元介紹一些相關的數(shù)學工具,既包含了數(shù)學形態(tài)學方法,分別針對二值圖像和多值(灰度)圖像;也包含對圖像模式進行識別的方法。
(四) 圖像理解內(nèi)容
第4版下冊在保持上一版主要內(nèi)容的基礎上,還增加了一章“壓縮感知與成像”,增加了兩節(jié)“圖像和視頻檢索原理”和“主體與動作聯(lián)合建?!?,還增加了對(圖像理解)“基本概念和定義回顧”、 (高層次)“圖像技術發(fā)展情況”、(目標匹配)中的“對應點匹配”“壓縮感知圖像融合”和“綜合特征檢索”等內(nèi)容的介紹。
第4版下冊分為4個單元,每個單元有3~4章,如圖4所示。
第1個單元介紹圖像采集技術,既包含了對采集立體信息的攝像機設備的原理及其標定方法的介紹、也包含了近年在成像方面得到廣泛應用的壓縮感知理論,還包含了對3-D景物的表達描述方法等。
第2個單元介紹3-D景物重建技術,既包含立體視覺的方法,也包含從多種深度線索恢復3-D景物的方法。前者可分為基于雙目的方法和基于多目的方法,而后者又可分為基于單幅圖像的方法和基于多幅圖像的方法。
第3個單元介紹場景解釋技術,既包含對對場景知識和過程知識的表達和推理,也包含對像素層之上的目標層和概念符號層的廣義匹配方法,還包含了幾種典型的場景分析和語義解釋技術,如模糊理論、遺傳算法、語義標記和概率隱模型等。
第4個單元介紹三個相關方向的研究示例,既包含得到廣泛應用的多傳感器圖像信息融合,也包含得到深入研究的基于內(nèi)容的圖像和視頻檢索;還包含得到密切關注的時空行為理解。
(五)內(nèi)容對比
相比于國內(nèi)外同類的教材圖書(如[7],[8]),《圖像工程》教材與最新科研成果結合比較快,將許多內(nèi)容引進教材也比較早。除前面介紹的第4版新增內(nèi)容外,前幾版也比多數(shù)教材除基本的典型內(nèi)容外還較早加入了許多新內(nèi)容:1. 1999年~2002年出版的第1版《圖像工程》教材已加入了:投影重建,分割評價,3-D邊緣檢測,16-鄰域,特征測量誤差,多目立體匹配,特征內(nèi)容匹配,圖像代數(shù),基于內(nèi)容的圖像和視頻檢索等。2. 2005年~2007年出版的第2版《圖像工程》教材已加入了:半調(diào)和抖動,形態(tài)變換,拉東變換,蓋伯變換,圖像水印,數(shù)字化模型,距離變換,SUSAN檢測算子,分形,體視學和圖像分析,共聚焦顯微鏡3-D成像,廣義匹配,多傳感器圖像信息融合,人臉和表情識別等。3. 2012年~2013年出版的第3版《圖像工程》教材已加入了混合濾波,圖像修復,準無損編碼,全彩色濾波和消噪,視頻圖像處理,超分辨率技術,圖割分割法,均移聚類,局部二值模式,背景建模,運動目標跟蹤,圖像識別,SIFT算子,SURF算子,場景分析和語義解釋,時空行為理解等。
總的來說,相比于國外同類的教材圖書,《圖像工程》教材更符合我國教育體系,與國內(nèi)高校相應選修課程結合更密切,引入新的相關科研進展更及時,同時也比較適合我國大學學期和課程的長度需要。
四、方便教學和讀者
從教學和學習的角度也有一些考慮和措施。
(一)總體考慮
第4版在編寫的方針上,仍力求具有理論性、實用性、系統(tǒng)性、實時性,比較適合專業(yè)教學的需求。
第4版在內(nèi)容敘述上,仍力求理論概念嚴謹,論證簡明扼要。另外,也提供了許多例題,以方便讀者選擇學習。
第4版結合了作者的一些研究工作和成果以及這些年來的教學教案,力求使對概念的介紹和解釋能比較清晰和生動。
總體來說,第4版的內(nèi)容覆蓋面更廣,介紹更全面細致,整體篇幅比第3版有約20%的增加,使教學和學習有一定的靈活性。
(二)具體措施
另有幾個方便教學和讀者的具體細節(jié):1. 在每個單元里,對其中所包含的各章都有專門的概括介紹。這既可以提供該單元的總體情況,也可以幫助讀者根據(jù)需要選擇學習。2. 從深入學習和開展科研的角度出發(fā),在每章結尾處都有各節(jié)小結以及為讀者擴大視野和進一步研究而提供的一些相關參考文獻的介紹,以幫助讀者有的放矢地進行檢索和查閱。3. 各章均提供了相等數(shù)量的練習題。每章都對少部分練習題給出了解答(統(tǒng)一在書末給出),這樣使教師可以更方便靈活地選擇布置。更多的習題和其余的習題解答將會放在出版社網(wǎng)站上,除會提供給使用教材的教師,也便于進一步及時補充和改進。4. 第4版還增加了一項新的舉措。書中使用的圖片有一些是彩色圖片,但在書面印刷后均成為了黑白圖片。但第4版在這些圖片旁增加了一個二維碼,讀者可以通過手機掃描圖片旁的二維碼,調(diào)出存放在出版社網(wǎng)站上的對應彩色圖片,從而獲得更多的信息和更好的觀察效果。5. 第4版還在出版社網(wǎng)站上提供了一些相關教學和學習的資源。這包括教師用的講稿、發(fā)給學生的講義、輔助教學的演示(Flash)和再印刷時的修改表。
五、 結束語
本文介紹了新一版《圖像工程》系列教材的編寫思路和特色。書的出版只表示總體規(guī)劃和具體措施的實體實現(xiàn),但是否能滿足教學需求和達到教學目的還需要在實踐中檢驗。目前,這三冊教材已分別安排供三門課使用:“圖像處理”——本科生專業(yè)基礎課,48學時;“圖像分析”——高年級本科生和研究生專業(yè)選修課,32學時;“圖像理解”——研究生專業(yè)選修課,32學時。在接下來的教學中,將驗證其內(nèi)容范圍和結構安排的合理性??赡苄枰贫ㄏ鄳摹霸u價量表”來評價所設計措施有效性[9]。另外,還將考慮與不同的教學模式的結合[10],使教材能發(fā)揮最大的作用和實現(xiàn)最好的效果,并為進一步改善提高積累經(jīng)驗和素材。
參考文獻:
[1]章毓晉.中國圖象工程:1995[J].中國圖象圖形學報,1996,1(1):78-83.
[2]章毓晉.圖像工程(上冊)——圖像處理(第4版)[M].北京:清華大學出版社,2018.
[3]章毓晉.圖像工程(中冊)——圖像分析(第4版)[M].北京:清華大學出版社,2018.
[4]章毓晉.圖像工程(下冊)——圖像理解(第4版)[M].北京:清華大學出版社,2018.
[5]章毓晉.圖像工程(合訂本)(第4版)[M].北京:清華大學出版社,2018.
[6]章毓晉.英漢圖像工程辭典(第2版)[M].北京:清華大學出版社, 2015.
[7]Gonzalez R C, Woods R E. Digital Image Processing, 2nd Ed. UK Cambridge: Pearson,2002.
[8]Gonzalez R C, Woods R E. Digital Image Processing,3rd Ed. UK Cambridge: Pearson,2008.
[9]史蒂文斯,利維(美).評價量表:快捷有效的教學評價工具,第2版[M].陳定剛,譯.廣州:華南理工大學出版社,2014.
[10]喬伊斯,韋爾,卡爾霍恩(美).教學模式(第8版)[M].蘭英,等譯.北京:中國人民大學出版社,2014.