(接上期)
二、本項構(gòu)想的建設(shè)內(nèi)容、建設(shè)目標(biāo)及擬解決的關(guān)鍵問題
1.建設(shè)內(nèi)容
本構(gòu)想擬研究的主要內(nèi)容包括以下六個方面:
(1)生物視覺信息的共軛關(guān)系。任一視覺圖像信息的構(gòu)成都有其共軛的物理元素,有些是眼睛即時看到的,有些是眼睛曾經(jīng)看到的,有些是眼睛將要看到的,尤其是數(shù)字語言的出現(xiàn),使得這一研究領(lǐng)域更加復(fù)雜化。但如果我們集中尋找一種共同有效的元素,而不是分散地研究,就可以使問題得到簡化和明了,使討論更加集中和深入。也就是說任何生物視覺信息都有其共軛的物象,它們是嚴(yán)格與特定對象相適應(yīng)的,對其共扼關(guān)系的研究是建立生物視覺信息模型的基礎(chǔ)。
(2)視覺界面的主要屬性。視覺界面具有與生俱來的生物特性,又兼?zhèn)淞宋锢砼c心理的雙重表征特性,而視覺界面語言既有指涉性、象征性、類比性特征,又具有痕跡性特征。對視覺界面主要屬性的研究是確立可分類的視覺系譜的依據(jù)。
(3)視覺系譜軸的量度標(biāo)準(zhǔn)。前文已經(jīng)提到的視覺系譜軸均為定性指標(biāo),需要將其精確量化方可轉(zhuǎn)化為一個數(shù)學(xué)問題,這是運用計算機視覺理論和方法求解的前提。這里擬研究的系譜軸包括顏色系譜軸(Color Paradigm)、運動系譜軸(Motion Paradigm)、形狀系譜軸(Form Paradigm)和場深系譜軸(Depth Paradigm)。根據(jù)分類和識別的需要,系譜軸量化工作包括以下幾點:
1)研究同一個系譜軸里的各單元的共同之處,確定使它們同屬于一個系譜軸所共有的性質(zhì),包括物理、生理和心理特征,抽象出其固定不變的物理成分和其凸顯本質(zhì)特征的因子;
2)研究系譜軸里每一個單元與其他單元的關(guān)系,嚴(yán)格劃分出相互之間的界限,保證系譜軸將生物視覺類型的劃分產(chǎn)生的高維識別空間具備嚴(yán)謹?shù)臄?shù)學(xué)形式;
3)研究各個軸線的刻度標(biāo)準(zhǔn),使得視覺識別空間模型中的任意對象都有其特定的位置,具備可進行數(shù)值量化的識別特征。
(4)視覺毗鄰軸的量度標(biāo)準(zhǔn)。視覺毗鄰軸的構(gòu)建是為了輔助視覺系譜軸進行目標(biāo)識別。本項目的研究方法不同于一般的視覺處理建模,它融入了大科學(xué)(Big Science)視野下社會科學(xué)和自然科學(xué)對人類視覺的綜合性研究成果,這里的毗鄰軸主要是指與視覺相關(guān)聯(lián)的觸覺毗鄰軸(Sense Syntagm)、嗅覺毗鄰軸(Olfaction Syntagm)、味覺毗鄰軸(Gustation Syntagm)、聽覺毗鄰軸(Auditory Syntagm)、幻覺毗鄰軸(Hallucination Syntagm)和精神毗鄰軸(Spirit Syntagm)。毗鄰軸的量化包括以下幾點:
1)研究生物視覺識別所需要的除視覺信息之外的輔助特征,根據(jù)視覺信息處理要求選擇相應(yīng)的單元,同時毗鄰軸用法必須符合單元中用以組合的規(guī)則慣例;
2)研究擬運用的輔助特征相互之間的關(guān)系,對每個特征抽象出其本質(zhì)的物理因子,減少冗余(redundancy)的信息,降低噪音(noise);
3)研究毗鄰軸各軸線的刻度標(biāo)準(zhǔn),如同系譜軸,這是為了使得識別對象在毗鄰軸建立的空間有其唯一的位置,從而輔助視覺目標(biāo)識別。
(5)數(shù)據(jù)庫視覺信息的研究。從圖10的視覺系譜軸和毗鄰軸的基本模型可以看到,對各軸線精確量化建立的數(shù)學(xué)問題模型,其維數(shù)必然是高維,處理的數(shù)據(jù)量巨大,視像空間中的每個對象屬于空間中的某一點,搜索其位置(即對其進行識別)非常困難。我們擬采用的研究方法是通過演化計算(Evolutionary Computation)理論的遺傳程序設(shè)計(Genetic Programming)的編碼方法對潛在解進行編碼,通過協(xié)作演化對識別對象在基因型水平上進行分解,逐次求精完成目標(biāo)識別。
(6)多目標(biāo)問題的優(yōu)化方法。視覺識別具有廣泛的用途,在求解具體問題時會受到多方面的約束,如何根據(jù)問題特征和建立的識別模型完成目標(biāo)識別也是研究內(nèi)容的一方面,主要就是多目標(biāo)優(yōu)化問題的求解。
2.建設(shè)目標(biāo)
通過對生物視覺信息共軛關(guān)系的研究,提取基于生物視覺物理和生理機制的系譜軸和毗鄰軸特征,用數(shù)學(xué)語言描述各特征的主要參數(shù),運用遺傳程序設(shè)計的編碼方法和多目標(biāo)優(yōu)化算法計算優(yōu)化這些參數(shù),構(gòu)建相應(yīng)的生物視覺信息處理機制模型,并運用到實際的中華藝術(shù)視覺信息數(shù)據(jù)庫的建設(shè)中。
3.擬解決的關(guān)鍵問題
基于本構(gòu)想的研究內(nèi)容和基本思路,擬解決的關(guān)鍵問題如下:
(1)研究解決共扼關(guān)系的數(shù)學(xué)描述問題。我們討論的共扼關(guān)系很多時候是概念性的,而要對生物視覺信息處理機制建模必須要有定量的分析,這是建模的關(guān)鍵。
(2)研究解決視覺系譜軸和毗鄰軸各屬性的量化問題。顏色系譜軸、運動系譜軸、形狀系譜軸和場深系譜軸,以及觸覺、嗅覺、味覺、聽覺、幻覺和精神毗鄰軸,都是我們用來建模的主要屬性,其量化的精度直接影響了模型的精確性,但是過于精細又會導(dǎo)致求解的困難,如何在精確度和復(fù)雜度之間求得平衡是另一關(guān)鍵。
(3)研究解決優(yōu)化算法的設(shè)計問題。如前所述,最后的建模必然是個復(fù)雜的優(yōu)化問題,合理的優(yōu)化算法是建模能否具有實用價值的關(guān)鍵。
三、本項構(gòu)想的建設(shè)方案及可行性分析
本構(gòu)想擬根據(jù)研究內(nèi)容中考慮的幾個方面,通過對研究內(nèi)容中相關(guān)問題的理論分析,結(jié)合計算機仿真的數(shù)值結(jié)果來開展研究。
(1)針對視覺界面的主要屬性,分析發(fā)掘物理與生理的雙重表征特性,確立可分類的視覺系譜族。
(2)依據(jù)擬研究的視覺界面系譜軸和毗鄰軸的各個項目,分析其特征,包括尋找其共同之處和各單元之間的間隔。
(3)量化視覺界面系譜軸和毗鄰軸的各屬性,將其綜合為視覺處理機制模型的各項參數(shù),進而將建模轉(zhuǎn)化為相應(yīng)的數(shù)學(xué)模型。
(4)分析數(shù)學(xué)模型的各項參數(shù)的特點,將模型的求解轉(zhuǎn)化為一個優(yōu)化問題,同時確定約束條件,為實用化奠定基礎(chǔ)。
(5)開展對現(xiàn)代優(yōu)化方法和計算智能等理論及其算法實現(xiàn)方面的研究,尋求將確定性算法和隨機搜索算法結(jié)合的途徑,在保證模型精度的同時,計算復(fù)雜度可以接受。
(6)開展對演化計算理論的遺傳程序設(shè)計的研究,對潛在解進行線性編碼,研究協(xié)作演化對識別對象在基因型水平上進行分解的方法,以便逐次求精完成目標(biāo)識別。
(7)運用小型計算機模擬實際的視覺識別系統(tǒng),檢驗算法對實際系統(tǒng)的有效性,根據(jù)分析結(jié)論實現(xiàn)自適應(yīng)地調(diào)整模型的某些關(guān)鍵參數(shù)。
四、本項構(gòu)想研究的特色與創(chuàng)新之處
(1)本研究擬建立的視覺界面系譜軸以及輔以毗鄰軸的形式是其他方法所沒有的,這樣的研究方法是認識生物視覺信息處理機制的全新視角。
(2)本研究對生物視覺信息處理機制的建模沒有局限于某一具體的識別算法,也沒有局限于某一具體的應(yīng)用,而是通過發(fā)掘視覺系統(tǒng)的物理和生理特征,以建立普適的高維視覺識別系統(tǒng)為目標(biāo),拓寬模型的應(yīng)用范圍,避免研究結(jié)論側(cè)重于問題的某一方面所造成的理論性強而工程價值不足的缺陷。
(3)本研究對生物視覺信息處理機制建模問題的研究,融合了自然科學(xué)和社會科學(xué)對生物視覺的理解。自Marr視覺計算理論提出以來,絕大多數(shù)學(xué)者均注意到了其人工智能符號論,即理論計算機科學(xué)方面的性質(zhì),但極少學(xué)者考慮到Marr作為心理學(xué)家對計算機視覺的多視角理解,本項目研究充分考慮到了這一點,為生物視覺信息處理機制的研究提供了新思路。
(4)使用自然科學(xué)最新的研究成果量化藝術(shù)科學(xué)的研究數(shù)據(jù),從而完成中華藝術(shù)視覺信息的譜系建構(gòu),部分繪出中華的“文化DNA”。
五、結(jié)束語
世界上每一種樣式藝術(shù),都有其固定不變的物理成分,都有其凸顯本質(zhì)特征的文化因子。如果將研究的視點錨固在中華藝術(shù)視覺信息的元素上,通過對視覺界面的深入研究,就可以約簡出構(gòu)成視覺元素的最小公分母。因為任何視覺信息都有其共軛的物象,而共軛關(guān)系是可以建模討論的。最嚴(yán)密的科學(xué)研究應(yīng)是任何人都無法對其自身的特征提出異議,而只能考慮其可能性。該項構(gòu)想的攻關(guān)研究就是確定可能性和不可能性之極限!人文科學(xué)和自然科學(xué)的基礎(chǔ)都在于感官的認知,通過建立其表述藝術(shù)特征的視、聽、觸、味、嗅、心理等軸向數(shù)值,可以將其轉(zhuǎn)換成數(shù)字式的分析量值,在定性的前提下取得定量的表征數(shù)據(jù)。
該項構(gòu)想的最終目標(biāo)是,建設(shè)具有“中華藝術(shù)元素”的視覺信息數(shù)據(jù)庫,建構(gòu)具有“中華藝術(shù)風(fēng)格”的視覺表現(xiàn)形態(tài),創(chuàng)建具有“中華藝術(shù)氣派”的文化藝術(shù)精神。
參考文獻:
[1]沃爾夫林.潘耀昌(譯).藝術(shù)風(fēng)格學(xué)[M].沈陽:遼寧人民出版社,1989.
[2]W.J.T.米歇爾.陳永國,胡文征(譯).圖像理論[M].北京:北京大學(xué)出版社,2006.
[3]潘諾夫斯基.傅志強(譯).視覺藝術(shù)的含義[M].沈陽:遼寧人民出版社,1987.
[4]Collier,John,Jr.& Collier,Malcom:Visual Anthropology?:Photography as a Research Method[M].Albuquerque:University of New Mexico Press,1986.
[5]Jacques Aumont: L′image [M].Paris: Nathan, 2001.
[6]Martine Joly:L′imageetlessinges?:Approchesémiologiquedel′image fixe[M].Paris: Nathan, 2002.
[7]Robert Layton: The Anthropology of Art [M], London: Cambridge University Press, 1991.
[8]韓叢耀.圖像:一種后符號學(xué)的再發(fā)現(xiàn)[M].南京:南京大學(xué)出版社,2008.
[9]韓叢耀.圖像傳播學(xué)[M].臺北:威士曼文化出版公司,2005.
[10]韓叢耀.新聞攝影學(xué)[M].南寧:廣西美術(shù)出版社,1998.
[11]韓叢耀.攝影論[M].北京:解放軍出版社,1997.
[12]韓叢耀.視覺界面初探[M].視覺新理念,北京:中國攝影出版,2001.
[13]韓叢耀.計算機與攝影[M].升華與超越,北京:高等教育出版社,1998.
[14]韓叢耀.計算機與暗房[M].升華與超越,北京:高等教育出版社,1998.
[15]韓叢耀.瞬間論——HCB的話里話外[M].新聞傳播論壇(第8輯),2003.
[16]韓叢耀.失憶與重構(gòu)[J].臺灣臺南藝術(shù)大學(xué)學(xué)報—藝術(shù)觀點,2001年夏季號.
[17]John Fiske.張錦華,劉容玫,孫嘉蕊,黎雅麗(譯).傳播符號學(xué)理論[M].臺北遠流出版事業(yè)股份有限公司,1997.
[18]魯?shù)婪颉ぐ⒍骱D?滕守堯(譯).視覺思維[M].北京:光明日報社,1987.
[19]A·J·格雷馬斯.吳泓緲(譯).結(jié)構(gòu)語義學(xué):方法研究[M].北京:生活·讀書·新知三聯(lián)書店,1999.
[20]楊治良.實驗心理學(xué)[M].杭州:浙江教育出版社,1998.
[21]魯?shù)婪颉ぐ⒍骱D?滕守堯,朱疆源(譯).藝術(shù)與視知覺[M].北京:中國社會科學(xué)出版社,1987.
[22]H·G·布洛克.滕守堯(譯).現(xiàn)代藝術(shù)哲學(xué)[M].成都:四川人民出版社,1998.
[23]馬克·第亞尼.滕守堯(譯).非物質(zhì)社會[M].成都:四川人民出版社,1998.
[24]Gillan Rose.王國強(譯).視覺研究導(dǎo)論—影像的思考[M].臺北:群學(xué)出版有限公司,2006.
(本文系蘇州科技項目《基于智能識別的媒體內(nèi)容管理平臺的研發(fā)》研究成果,項目號:SYJG0933。)
(編輯:金冉)