張笑笑
沈琳琳,深圳大學計算機與軟件學院教授,廣東省教育廳中英合作視覺信息處理實驗室主任、深圳大學計算機視覺研究所所長、博士生導師、英國諾丁漢大學計算機學院榮譽教授。上海交通大學學士、碩士,英國諾丁漢大學博士。
作為負責人主持國家自然科學基金項目、廣東省自然科學基金項目和深圳市科技計劃項目20余項,作為第一發(fā)明人獲發(fā)明專利2項。發(fā)表學術論文100余篇,其中SCI檢索50篇,EI檢索80篇。據(jù)Google Scholar,論文總被引用次數(shù)2032,H指數(shù)20。擔任《ISRN Signal Processing》編委,《IEEE Trans. on Image Processing》《IEEE Trans. on Multimedia》《Pattern Recognition》《Image & Vision Computing》和《Computer Vision & Image Understanding》等國際重要期刊的審稿人。
現(xiàn)為廣東省高?!扒О偈こ獭迸囵B(yǎng)對象,深圳市高層次“地方領軍人才”,深圳市海外高層次人才,深圳市十佳青年教師。曾獲2008年深圳市科技創(chuàng)新獎、2012年深圳市自然科學獎、2013年廣東省科學技術獎、2015年中國電子學會科學技術獎、2010年國際期刊《Image and Vision Computing》最多他引論文獎。2015、2016連續(xù)2年被愛思維爾出版社評為計算機學科“中國高被引學者”。
專家簡介:
2016年3月,AlphaGo和李世石的世紀大戰(zhàn)點燃了大眾對“人工智能”的熱情和討論,“機器學習”“深度學習”等專有詞匯一時間傾瀉而來,它們之間到底有何區(qū)別?
深圳大學計算機與軟件學院教授沈琳琳介紹說,人工智能是一個愿景和目標,機器學習是人工智能范疇下的一種工具,深度學習則是機器學習里面一個分支,強調(diào)的是所使用的模型。交談中,沈琳琳無不流露出對這個新興領域的喜愛。而他主攻的圖像處理和模式識別就屬于人工智能的重要組成部分。
結緣“Gabor小波”
20世紀初,一個名叫Dennis Gabor的人提出了“Gabor函數(shù)”的概念,從此人們用他的名字來命名使用該函數(shù)的小波,即Gabor小波。那時,Gabor小波還只是一維的,也并沒有應用于識別領域;后來經(jīng)過發(fā)展,它提升為二維。直到1994年,英國劍橋大學約翰·道格曼使Gabor小波的發(fā)展產(chǎn)生了質(zhì)的飛躍。他用Gabor函數(shù)跟貓的視覺皮層的響應函數(shù)做比較,觀察貓在看東西時皮層是如何興奮的,以及神經(jīng)元興奮響應的函數(shù)。研究后他發(fā)現(xiàn),二者很像,這說明用Gabor小波函數(shù)分析圖像是有生理基礎的,于是他開發(fā)了第一個虹膜掃描及辨識的算法,并申請了專利。
“Gabor小波應用的很成功!”2002年,沈琳琳受英國政府海外研究獎學金資助遠赴諾丁漢大學攻讀博士,主要從事人臉識別研究,那時他用到最多的方法就是Gabor小波函數(shù),“用這種方法來提取特征,人臉識別準確率很高”。初獲成功點燃了沈琳琳的興趣,他開始閱讀大量的文獻,隨著研究的深入,他發(fā)現(xiàn)Gabor小波性能很好,但問題同樣存在——計算量比較復雜,特征維度很高——計算效率低?!爱敃r我做了一個重要的工作就是找到一個方法,通過特征選取,把不重要的去掉,使特征維度縮短,從而加快提取的速度,最終達到又準又快?!彼麑Σ捎肎abor特征的二維人臉識別方法進行了全面、深入的總結,對不同方法的思想、原理及其優(yōu)缺點進行了歸納分析,通過互信息和Boosting算法對小波的位置、中心頻率以及方向進行選擇,最后只采用其中關鍵的數(shù)百個特征進行識別,從而在準確性降低很少的情況下大大提高了識別系統(tǒng)的效率。研究成果“A review on Gabor wavelets for face recognition”發(fā)表于《Pattern Analysis and Applications》雜志,目前據(jù)Google統(tǒng)計被引用次數(shù)已達362次;研究成果“MutualBoost learning for selecting Gabor features for face recognition”發(fā)表在《Pattern Recognition Letters》,目前據(jù)Google統(tǒng)計被引用次數(shù)已達101次。
博士期間,沈琳琳獲得了“國家優(yōu)秀自費留學生”獎勵。畢業(yè)后,他進入英國諾丁漢大學醫(yī)學院擔任Research Fellow。諾丁漢大學因核磁共振儀而聞名。2003年,美國伊利諾大學香檳分校化學系教授保羅·勞特伯與英國諾丁漢大學教授彼得·曼斯菲爾因在核磁共振成像技術方面貢獻重大,獲得諾貝爾生理學或醫(yī)學獎。沈琳琳也自然投入到大腦核磁共振(MRI)圖像處理和基于MRI圖像的大腦疾病分析研究工作中,參與多個基于Gabor小波的醫(yī)學圖像處理項目。所謂的“核磁共振成像”就是將人體置于特殊的磁場中,用無線電射頻脈沖激發(fā)人體內(nèi)氫原子核,引起氫原子核共振,并吸收能量。在停止射頻脈沖后,氫原子核會按特定頻率發(fā)出射電信號,并將吸收的能量釋放,被體外的接受器收錄,經(jīng)電子計算機處理獲得圖像。這是前期工作,而沈琳琳所要做的是后期處理,“拿到核磁共振的圖像后,我需要做一些圖像處理,醫(yī)生再在這基礎上比較正常和患某種疾病的大腦的異同,分析疾病的原理?!?/p>
從二維到三維
提到圖像處理,一定離不開“模式識別”。模式識別是一個大領域,可識別的內(nèi)容有很多,比如圖像、語音等?!皥D像的來源很廣泛,如攝像頭拍照、醫(yī)學X光掃描等,但不論設備是什么,最后得出的都是圖像”。得到圖像后,下一步就要開始理解圖像。如何理解?這涉及到“人是如何看圖像的”。早期,犯罪嫌疑人在紙上印下自己的指紋印,由法官憑借肉眼判斷兩個指紋是否為同一人。這是最原始的識別。隨著科技的日新月異,技術愈發(fā)可以解放人力,簡言之,沈琳琳的研究內(nèi)容就是設計一個“機器”取代人眼,從而把圖像內(nèi)容識別出來。這需要他學習人類觀察事物的方法,掌握不同領域的專業(yè)知識作為基礎??v觀全局,這其實是一個輸入和輸出的過程,沈琳琳的任務就是中間過程中的轉化連接。endprint
后來,他在對Gabor小波抽取信號特征機理進行深入研究的基礎上,結合核方法、信息理論和支持向量機,構建了高效而魯棒的人臉、掌紋、指紋以及硬幣識別系統(tǒng)。
“我想把所做的研究與實際產(chǎn)業(yè)進一步結合,在英國只是做純粹的研究,產(chǎn)業(yè)結合沒有太多的機會,而且文化不同,結合的難度也比較大?!庇谑牵?006年沈琳琳結束海外漂泊,回國加入深圳大學計算機與軟件學院。
一個人在國外,遠離親人又面臨著文化差異,困難程度可想而知,沈琳琳堅持了過來?;貒螅琅f舉步艱難。由于錯過了申請碩士生導師的時間,沈琳琳沒有自己的學生,做事情都只能靠自己,一個人寫申請書,一個人做研究,一個人敲代碼,“開頭很難”,話語間仍能體會他當時的艱辛與酸楚?!白隹蒲凶钪匾氖菆猿帧保驗槭冀K如一的信仰,沈琳琳咬牙度過了最難的開創(chuàng)期。
在深圳大學,沈琳琳延續(xù)了在國外的研究內(nèi)容,希望對一些固有問題提出新的解決方法?!氨热缬姓趽?、光照暗,人臉識別就會受到影響,準確率低”。他的第一個項目國家自然基金項目“基于過完備感知模型和稀疏表示的有遮擋人臉識別研究”意在解決這一問題。“但是這個方法解決問題的同時自己本身也存在一些問題——字典計算量比較大,不容易找出解”,對此他申請了第二個國家自然基金項目“過完備字典自適應優(yōu)化理論及應用研究”。就這樣,沈琳琳受“問題驅動”意識影響,不斷地發(fā)現(xiàn)問題、尋找解決方法。
當時Gabor小波還主要用于二維圖像,“在二維圖像上效果那么好,能不能用到三維圖像上?”于是沈琳琳開拓性地將三維Gabor小波應用于三維大腦核磁共振圖像配準以及高光譜遙感影像分類領域。他提出了一種基于三維Gabor小波的配準性能評判方法,即通過對配準后三維MRI圖像的局部結構進行分析,可以快速、客觀地給出性能指標。方法能廣泛應用于配準算法的選擇、參數(shù)選取,最終推動基于三維MRI圖像的大腦疾病分析技術的進步。研究成果發(fā)表在當時影響因子為4.3的JCR 1區(qū)期刊《Medical Image Analysis》上。后期,他又通過三維Gabor小波和高光譜數(shù)據(jù)的卷積,抽取影像每個像元在空間-光譜聯(lián)合空間內(nèi)的局部變化特性。實驗發(fā)現(xiàn),“多個不同小波抽取的特征在融合后,能夠很好地代表象元在三維空間內(nèi)的局部信號變化”。后續(xù)工作對三維Gabor特征進行了進一步篩選,在保持高準確率的同時,大大提高了系統(tǒng)效率。研究成果陸續(xù)發(fā)表在影響因子為3.5的JCR 1區(qū)期刊《IEEE Transactions on Geoscience and Remote Sensing》。
夢想照進現(xiàn)實
隨著工業(yè)合作的深入發(fā)展,沈琳琳有越來越多的機會實現(xiàn)產(chǎn)業(yè)化愿景。2011年,沈琳琳收到一份邀請。這是一家生產(chǎn)醫(yī)用顯微鏡和硬件的公司,其產(chǎn)品主要銷售給醫(yī)院用做疾病診斷,比如驗血——加入抗原、抗體后在顯微鏡下觀察不同的反應,以判斷是否可能出現(xiàn)某種疾病。過去,整個過程都依靠人工使用顯微鏡,這樣就造成檢測員工作量很大,準確率和效率也都受到不同程度影響,因此,他們就提出能否有一個軟件自動把反應類型分類。
“他們有需求,我們就合作”,沈琳琳接受了這個挑戰(zhàn)。殊不知,那時世界上做這類研究的人還很少,因為做細胞圖像有一個特點——沒有數(shù)據(jù)做不了研究。沈琳琳因為和公司合作,就有了獲取圖像數(shù)據(jù)的來源,這樣,他才能順利地做下去。
兩年后,檢驗成果的時刻終于來到。IEEE國際圖像處理會議(ICIP)組織了一場“國際熒光細胞圖像分類大賽”,沈琳琳延續(xù)先前工作,在詞袋框架下對基于灰度排序的局部特征字典進行了研究,通過聚類對密集采樣獲得的局部紋理特征字典進行學習,將在該字典上的表示用直方圖統(tǒng)計代表整體圖像,最后和空間金字塔方法相結合用于對顯微鏡觀察到的HEp-2細胞熒光圖像進行自動分類。比賽最后,沈琳琳的算法擊敗了來自美國、澳大利亞、日本、法國和意大利著名大學的13支參賽團隊,以最高的準確率獲得冠軍。研究成果也發(fā)表于模式識別領域知名期刊《Pattern Recognition》 。
漸漸地,沈琳琳的工作走上正軌,他也有了自己的學生。說起他的第一個研究生,沈琳琳記憶頗深。“他是??粕究粕A不是很好”,但通過3年的努力,最后拿到了一家互聯(lián)網(wǎng)名企公司的錄取單。擁有這樣傲人的成績,除了學生自身的刻苦,沈琳琳也功不可沒。作為老師,他總是更多的投入精力和時間去訓練學生,通過帶他們做科研、做項目提升技術水平。授人以魚不如授人以漁,“在培養(yǎng)其技術能力的基礎上要有針對性的培養(yǎng)他們獨立思考,不是把技術簡單的告訴他,而是教會他如何獲得這個技術,如何思考、如何解決問題”,表達與溝通也是他看重的能力。傳道授業(yè),沈琳琳可謂是用心良苦。
回憶起當年在上海交大讀碩士,沈琳琳感概道,“那時還沒有數(shù)據(jù)庫,網(wǎng)絡也不發(fā)達,查論文很麻煩,只能去圖書館打印”。后來讀博士,一切就都變得方便,他有機會接近最新技術,同國際學者交流接觸。以至于到如今,沈琳琳更加珍惜這個時代所創(chuàng)造的機會,可以讓像他一樣有追求有激情的科研者踐行自己的科學夢。未來,沈琳琳期盼有一個更大的突破——和公司達成合作,產(chǎn)品能有更多人使用。
電話那端,沈琳琳的聲音有些低沉,甚至有些疲憊。在沈琳琳看來,科研就是一條一旦選擇了就不能停下腳步的路,唯有源源不斷地探尋下去,才可能看到彼岸的縷縷曙光。然而在路途中,會經(jīng)歷獨孤、困苦、失望,也會有欣喜與激動。這一切都需要自己默默承擔下,“在未來的某一天,一定會感謝當年努力奮斗過的自己。endprint