(張弛,副教授,碩士生導(dǎo)師,中國(guó)傳媒大學(xué)計(jì)算機(jī)學(xué)院計(jì)算機(jī)系副主任,主要研究方向?yàn)槊襟w信息數(shù)據(jù)化技術(shù),從事自然語(yǔ)言處理、數(shù)據(jù)挖掘、知識(shí)庫(kù)等方面的研究)
所謂“一圖勝千言”,視覺信息在人類社會(huì)信息生產(chǎn)和消費(fèi)中始終扮演著重要角色。在融合媒體不斷發(fā)展的背景下,圖片憑借其信息量大、視覺吸引力強(qiáng)、數(shù)據(jù)量小等優(yōu)勢(shì),在兩微一端應(yīng)用、精品內(nèi)容生產(chǎn)等方面不可或缺。資源價(jià)值的發(fā)揮有賴于資源的有效流通,而流通的前提是資源發(fā)現(xiàn)。圖片元數(shù)據(jù)是圖片特征描述的核心,也是圖片發(fā)現(xiàn)、流通的基礎(chǔ)。
國(guó)家標(biāo)準(zhǔn)——《中文新聞圖片內(nèi)容描述元數(shù)據(jù)規(guī)范》(GB/T 35311-2017)于2017年12月底正式發(fā)布,填補(bǔ)了我國(guó)新聞圖片應(yīng)用標(biāo)準(zhǔn)的一項(xiàng)空白,也是世界范圍內(nèi)第一個(gè)以圖片視覺內(nèi)容和語(yǔ)義特征描述為主的圖片元數(shù)據(jù)規(guī)范,專業(yè)性強(qiáng),結(jié)構(gòu)簡(jiǎn)明,有較好的可擴(kuò)展性和兼容性,具有較高的應(yīng)用價(jià)值。
視覺內(nèi)容已經(jīng)成為連接媒體、品牌以及消費(fèi)者的最高效的傳播媒介[1]。圖片是視覺內(nèi)容存儲(chǔ)和傳播的重要載體。隨著互聯(lián)網(wǎng)技術(shù)和數(shù)碼設(shè)備的不斷發(fā)展和普及,圖片數(shù)量劇增、質(zhì)量不斷提升、需求也日益擴(kuò)大。多家國(guó)內(nèi)外大型商業(yè)圖片公司、媒體機(jī)構(gòu)等擁有千萬級(jí)甚至億級(jí)規(guī)模的高質(zhì)量圖庫(kù),為新聞、出版、印刷、廣告、營(yíng)銷、素材制作等提供圖片素材。各類特色圖片庫(kù)以及自用為主的圖片系統(tǒng)更是不勝枚舉。
圖片特征描述在圖片存儲(chǔ)、管理、檢索、交易交換、智能推薦等生命周期各個(gè)階段都具有重要作用。沒有規(guī)矩不成方圓,我們需要圖片元數(shù)據(jù)標(biāo)準(zhǔn)來規(guī)范圖片生產(chǎn)的各個(gè)環(huán)節(jié)。原有圖片元數(shù)據(jù)相關(guān)標(biāo)準(zhǔn)各有側(cè)重,且大都缺乏對(duì)圖片視覺內(nèi)容和語(yǔ)義特征的系統(tǒng)化規(guī)約,未能很好地滿足日益增長(zhǎng)和不斷變化的圖片標(biāo)注需求。目前大部分圖片應(yīng)用系統(tǒng)從自身業(yè)務(wù)需求出發(fā),自定義了若干圖片元數(shù)據(jù)元素來描述圖片內(nèi)容特征,這些私有化的元數(shù)據(jù)元素難以在不同業(yè)務(wù)間流轉(zhuǎn)交換,制約了圖片價(jià)值的發(fā)揮。
在此背景下,新華通訊社提出了《中文新聞圖片內(nèi)容描述元數(shù)據(jù)規(guī)范》國(guó)家標(biāo)準(zhǔn)編制申請(qǐng),經(jīng)全國(guó)中文新聞信息標(biāo)準(zhǔn)化技術(shù)委員會(huì)(以下簡(jiǎn)稱新標(biāo)委)上報(bào)國(guó)家標(biāo)準(zhǔn)委,被國(guó)家標(biāo)準(zhǔn)委批準(zhǔn)列入“2014年第一批國(guó)家標(biāo)準(zhǔn)計(jì)劃項(xiàng)目”。該標(biāo)準(zhǔn)重點(diǎn)關(guān)注圖片視覺內(nèi)容和語(yǔ)義特征描述,可用于圖片數(shù)據(jù)的采集、編輯、存儲(chǔ)、發(fā)布、檢索、交換等處理環(huán)節(jié)。
2015年5月新標(biāo)委秘書處牽頭組建標(biāo)準(zhǔn)編制組,確定了以媒體機(jī)構(gòu)及大型商業(yè)圖片庫(kù)為主要調(diào)研對(duì)象、參考國(guó)外相關(guān)機(jī)構(gòu)案例和國(guó)內(nèi)外相關(guān)標(biāo)準(zhǔn)規(guī)范的工作路線。編制組歷時(shí)一年,先后對(duì)多家報(bào)社、商業(yè)圖片公司等單位進(jìn)行實(shí)地調(diào)研,并充分借鑒了國(guó)內(nèi)外圖片描述相關(guān)標(biāo)準(zhǔn),形成了標(biāo)準(zhǔn)的征求意見稿。在經(jīng)過多次的意見反饋和修改后,于2016年底提交送審稿到新標(biāo)委秘書處。經(jīng)新標(biāo)委委員函審?fù)镀焙?,?017年4月召開送審稿審查會(huì)。再次修改后形成報(bào)批稿,上報(bào)國(guó)家標(biāo)準(zhǔn)委批準(zhǔn)發(fā)布。國(guó)家標(biāo)準(zhǔn)《中文新聞圖片內(nèi)容描述元數(shù)據(jù)規(guī)范》于2017年12月底由國(guó)家標(biāo)準(zhǔn)委正式對(duì)外公布,可在國(guó)家標(biāo)準(zhǔn)全文公開系統(tǒng)[2]中查詢。
該標(biāo)準(zhǔn)的核心目標(biāo)是更好地服務(wù)于圖片生產(chǎn)和消費(fèi)的各個(gè)環(huán)節(jié),突出標(biāo)準(zhǔn)的實(shí)用性,因此,編制組在標(biāo)準(zhǔn)研制初期作了大量的調(diào)研工作。
調(diào)研對(duì)象包括兩類,一是現(xiàn)有相關(guān)國(guó)內(nèi)外標(biāo)準(zhǔn),二是標(biāo)準(zhǔn)主要應(yīng)用對(duì)象。標(biāo)準(zhǔn)編制組首先對(duì)國(guó)內(nèi)外標(biāo)準(zhǔn),包括IPTC圖片元數(shù)據(jù)規(guī)范[3]、EXIF規(guī)范[4]、CNML標(biāo)準(zhǔn)[5]等進(jìn)行研究。研究結(jié)果發(fā)現(xiàn),每個(gè)標(biāo)準(zhǔn)側(cè)重點(diǎn)不同。IPTC圖片元數(shù)據(jù)規(guī)范主要定義圖片描述型元數(shù)據(jù)項(xiàng),幾經(jīng)改版后,補(bǔ)充了若干圖片內(nèi)容描述的元數(shù)據(jù)項(xiàng),但較為零散,在圖片內(nèi)容語(yǔ)義特征描述方面不夠全面。EXIF規(guī)范主要涉及圖片技術(shù)型元數(shù)據(jù)。CNML標(biāo)準(zhǔn)主要對(duì)象是新聞稿件,圖片內(nèi)容相關(guān)元數(shù)據(jù)定義相對(duì)較少。圖片元數(shù)據(jù)主要應(yīng)用對(duì)象是圖片庫(kù)系統(tǒng)。在對(duì)圖片庫(kù)網(wǎng)站、媒體機(jī)構(gòu)圖片庫(kù)系統(tǒng)的調(diào)研中發(fā)現(xiàn),個(gè)性化、私有化圖片元數(shù)據(jù)應(yīng)用現(xiàn)象普遍存在,這其中部分元數(shù)據(jù)僅僅名稱不同,含義卻相近,部分元數(shù)據(jù)具有普遍應(yīng)用價(jià)值。此外,舊的圖片庫(kù)系統(tǒng)越來越難以滿足應(yīng)用需求,新的圖片庫(kù)系統(tǒng)設(shè)計(jì)時(shí)在圖片編目方面也存在較多困惑。標(biāo)準(zhǔn)調(diào)研過程及意見征集過程中得到了圖片各領(lǐng)域?qū)<业姆e極配合和大力支持,使標(biāo)準(zhǔn)內(nèi)容不斷得到豐富和完善。
本標(biāo)準(zhǔn)的主要內(nèi)容是對(duì)圖片元數(shù)據(jù)元素做出準(zhǔn)確定義,尤其突出對(duì)圖片視覺內(nèi)容特征和語(yǔ)義信息的描述。標(biāo)準(zhǔn)以編輯類圖片和創(chuàng)意類圖片為主要對(duì)象,定義了40個(gè)元數(shù)據(jù)元素,分別歸屬到公共元數(shù)據(jù)、編輯類圖片元數(shù)據(jù)和創(chuàng)意類圖片元數(shù)據(jù)三個(gè)部分。
本標(biāo)準(zhǔn)主要從四個(gè)角度進(jìn)行元數(shù)據(jù)元素的篩選和梳理。一是“形”,即視覺表現(xiàn),主要指畫面中的主要事物及環(huán)境信息等;二是 “意”,即圖片主題,主要指概念、專題、分類等;三是“技”,即創(chuàng)作手法,主要指畫面構(gòu)圖、攝影技術(shù)信息。四是圖片基本邏輯屬性,主要指圖片標(biāo)識(shí)、新聞圖片標(biāo)題和圖說等信息。標(biāo)準(zhǔn)具體內(nèi)容詳見國(guó)家標(biāo)準(zhǔn)全文公開系統(tǒng)[2]。
1.從應(yīng)用中來
實(shí)際應(yīng)用中,圖片發(fā)現(xiàn)可分為檢索和推薦兩類。圖片檢索主要包括關(guān)鍵詞檢索、類別檢索、專題檢索和屬性過濾篩選等。關(guān)鍵詞檢索對(duì)于創(chuàng)意類圖片側(cè)重主題和畫面內(nèi)容,對(duì)于編輯類圖片側(cè)重新聞人物、地點(diǎn)和事件信息。用于檢索結(jié)果集合篩選過濾的屬性主要集中在圖片色彩、片幅、尺寸、人物特征等。圖片推薦包括熱門、相似、個(gè)性化以及編輯推薦等,其中相似推薦大多以圖片色彩和主題相似分析為基礎(chǔ)。標(biāo)準(zhǔn)中定義的圖片內(nèi)容元數(shù)據(jù)元素大部分來源于此。
2.有詳有略
標(biāo)準(zhǔn)中對(duì)人物特征描述和攝影技術(shù)進(jìn)行了較為詳細(xì)的定義。人數(shù)、性別、年齡、民族、行為、表情、服飾、人物關(guān)系等人物信息,圖片色彩、畫幅方向、景別、色調(diào)、構(gòu)圖方式、攝影技巧等攝影技術(shù)信息,對(duì)搜索結(jié)果過濾精化、圖片自動(dòng)分析與推薦都具有重要作用。
標(biāo)準(zhǔn)中對(duì)圖片專題、自定義分類、畫面內(nèi)容等未做細(xì)化規(guī)定,以適應(yīng)多種不同業(yè)務(wù)場(chǎng)景的需要,可由用戶自定義擴(kuò)展,提高標(biāo)準(zhǔn)的適用性。
3.強(qiáng)調(diào)規(guī)范化標(biāo)注
標(biāo)準(zhǔn)中定義了22個(gè)可擴(kuò)展的受控詞表,用于規(guī)范20個(gè)元數(shù)據(jù)元素的標(biāo)注,減少主觀標(biāo)注的不一致性,也便于支持圖片檢索時(shí)的結(jié)果集過濾。
4.層次化、體系化
標(biāo)準(zhǔn)編制組首先建立了一套圖片元數(shù)據(jù)體系架構(gòu),根據(jù)語(yǔ)義抽象程度不同,依次分為物理層、邏輯層、內(nèi)容層和主題層。原有圖片元數(shù)據(jù)描述規(guī)范定義的元數(shù)據(jù)項(xiàng)集中在物理層和邏輯層。本標(biāo)準(zhǔn)主要定義了內(nèi)容層和主題層元數(shù)據(jù),這相比傳統(tǒng)圖片基本屬性編目具有更高的辨識(shí)度和利用價(jià)值。
標(biāo)準(zhǔn)編制過程中,得到多位圖片領(lǐng)域?qū)<业闹笇?dǎo)與支持,編制組從圖片特性、新聞圖片編輯、圖片應(yīng)用現(xiàn)狀和發(fā)展等多個(gè)角度,不斷修正完善,形成了層次簡(jiǎn)明清晰、專業(yè)性較強(qiáng)、體系較為完整的圖片內(nèi)容描述元數(shù)據(jù)規(guī)范。
標(biāo)準(zhǔn)來自于應(yīng)用,服務(wù)于應(yīng)用,更需要在應(yīng)用中不斷完善。標(biāo)準(zhǔn)應(yīng)用中有兩個(gè)方面的問題需要認(rèn)真思考和應(yīng)對(duì)。
第一是存量圖片標(biāo)注和已有圖片庫(kù)系統(tǒng)改造問題。隨著圖片業(yè)務(wù)的不斷變化和升級(jí),目前很大一部分圖片庫(kù)系統(tǒng)面臨升級(jí)改造問題。同時(shí),存量圖片數(shù)量巨大,且已經(jīng)基于原有標(biāo)準(zhǔn)和自定義元數(shù)據(jù)進(jìn)行了標(biāo)注。升級(jí)圖片庫(kù)系統(tǒng)的同時(shí),如何花費(fèi)盡可能少的工作量完成存量圖片元數(shù)據(jù)信息向新的圖片元數(shù)據(jù)規(guī)范的轉(zhuǎn)換,是該標(biāo)準(zhǔn)推廣應(yīng)用中的重要問題。圖片庫(kù)升級(jí)以及存量圖片元數(shù)據(jù)遷移是必要的,符合軟件生命周期規(guī)律,也是技術(shù)和業(yè)務(wù)發(fā)展的要求。較可行的方案是圖片系統(tǒng)設(shè)計(jì)人員整理出存量圖片已標(biāo)注的元數(shù)據(jù)與新標(biāo)準(zhǔn)中元數(shù)據(jù)的對(duì)應(yīng)關(guān)系,區(qū)分出直接對(duì)應(yīng)、間接對(duì)應(yīng)、無法對(duì)應(yīng)等不同情況,最大程度的采用自動(dòng)化方式實(shí)現(xiàn)部分元數(shù)據(jù)的遷移轉(zhuǎn)換,保留已標(biāo)注元數(shù)據(jù)內(nèi)容,再逐步完成新的元數(shù)據(jù)的標(biāo)注工作。
第二是圖像智能處理技術(shù)與基于文本的圖片元數(shù)據(jù)規(guī)范在應(yīng)用中的關(guān)系問題。隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的快速發(fā)展,計(jì)算機(jī)在圖像處理、圖像識(shí)別、圖像理解等方面的智能化程度和水平不斷提高,已由特定領(lǐng)域應(yīng)用邁入通用領(lǐng)域應(yīng)用,但同時(shí)我們不難發(fā)現(xiàn),基于文本的圖片特征描述仍然在圖片存儲(chǔ)、編輯、管理、檢索和交換中扮演主要角色。二者之間不是對(duì)立關(guān)系,而是相輔相成、互為補(bǔ)充的關(guān)系。圖片元數(shù)據(jù)標(biāo)準(zhǔn)在應(yīng)用中可充分利用計(jì)算機(jī)自動(dòng)處理技術(shù),提高標(biāo)注效率和質(zhì)量;基于文本的圖片元數(shù)據(jù)標(biāo)注結(jié)果具有豐富的圖片規(guī)格、內(nèi)容、主題等特征,可在圖片自動(dòng)處理與智能推薦等環(huán)節(jié)發(fā)揮重要作用。雙管齊下、各盡其能,使圖片更好地為社會(huì)生產(chǎn)生活服務(wù)。
國(guó)家標(biāo)準(zhǔn)《中文新聞圖片內(nèi)容描述元數(shù)據(jù)規(guī)范》從新聞編輯用圖和創(chuàng)意用圖兩個(gè)應(yīng)用角度,規(guī)定了中文新聞圖片視覺內(nèi)容和語(yǔ)義信息的元數(shù)據(jù)元素集合,有利于跨領(lǐng)域、跨應(yīng)用的圖片交換,更好地服務(wù)于圖片采編發(fā)和分析推薦等業(yè)務(wù)環(huán)節(jié)。標(biāo)準(zhǔn)中未涉及圖片版權(quán)元數(shù)據(jù)規(guī)約,應(yīng)用中可遵循其他版權(quán)元數(shù)據(jù)標(biāo)準(zhǔn)。剛剛發(fā)布的這一版標(biāo)準(zhǔn)中尚未對(duì)數(shù)字圖表、漫畫、動(dòng)圖等其他類型圖片的個(gè)性化元數(shù)據(jù)做出規(guī)定,但標(biāo)準(zhǔn)中已定義的元數(shù)據(jù)元素可適用于這些類圖片的標(biāo)注。
該標(biāo)準(zhǔn)研制過程中得到了很多學(xué)者、領(lǐng)域?qū)<业膸椭椭С?,編制組力求在完整性、專業(yè)性、實(shí)用性等方面達(dá)到相對(duì)平衡,但不斷完善才能保持其生命力。希望標(biāo)準(zhǔn)能夠得到越來越多的應(yīng)用,并在應(yīng)用中發(fā)現(xiàn)不足,促進(jìn)標(biāo)準(zhǔn)的升級(jí)改版,從而更好地為應(yīng)用服務(wù)。
[1]任悅,曾璜編著.《圖片編輯手冊(cè)》第四版.中國(guó)攝影出版社.2015年9月
[2]國(guó)家標(biāo)準(zhǔn)全文公開系統(tǒng) .http://www.gb688.cn/bzgk/gb/index
[3]IPTC Photo Metadata Standard.http://www.iptc.org/std/photometadata/specification/IPTC-PhotoMetadata
[4]EXIF Image Metadata.https://www.exif.org/imagemetadata.html
[5]全國(guó)中文新聞信息標(biāo)準(zhǔn)化技術(shù)委員會(huì).國(guó)家標(biāo)準(zhǔn)GB/T 20092-2013《中文新聞信息置標(biāo)語(yǔ)言》