顧偉
摘? 要:數(shù)碼照片成像設(shè)備和拍攝成本的快速降低,使得數(shù)碼照片數(shù)量迅速增多,由此造成歸檔階段照片選擇工作量的急劇加大,占用了大量的檔案人力資源。為切實(shí)降低人工工作量,本文在分析歸檔照片選擇要求和提出選擇標(biāo)準(zhǔn)的基礎(chǔ)上,引入計(jì)算機(jī)研究領(lǐng)域的圖像質(zhì)量評(píng)價(jià)技術(shù)以輔助檔案工作者快速、準(zhǔn)確的完成照片選擇工作。為確保該技術(shù)的有效性和實(shí)用性,本文設(shè)計(jì)了基于圖像質(zhì)量評(píng)價(jià)技術(shù)的數(shù)碼照片選擇方法,并從該方法的可行性和預(yù)期效果兩方面進(jìn)行分析,以期推動(dòng)歸檔數(shù)碼照片的選擇工作向自動(dòng)化、智能化方向的發(fā)展。
關(guān)鍵詞:數(shù)碼照片? 圖像質(zhì)量評(píng)價(jià)? 照片選擇
Abstract: With the rapid reduction of digital photo imaging equipment and shooting cost, the number of digital photos has increased rapidly, resulting in a sharp increase in the workload of photo selection in the archiving stage, occupying a large number of archives human resources. In order to reduce the manual workload, this paper introduces the image quality evaluation technology in the field of computer research based on the analysis of the selection requirements and the selection standards of archive photos, so as to assist archivists to complete the photo selection work quickly and accurately. In order to ensure the effectiveness and practicability of the technology, this paper designs a digital photo selection method based on image quality evaluation technology, and analyzes the feasibility and expected effect of the method, so as to promote the development of the selection of digital photos to the direction of automation and intelligence.
Keywords:Digital photo;Image quality assessment; Photo selection
1 引言
照片檔案作為一種重要的檔案門類,具有重要的保存意義和憑證價(jià)值。數(shù)碼照片的鑒別和選擇是照片檔案歸檔工作的第一步。近十年來,數(shù)碼照片以其成像便捷、傳輸方便、存儲(chǔ)量大、成本低廉的優(yōu)勢逐漸代替了傳統(tǒng)感光照片,成為照片檔案的主要載體,這種改變既符合原生電子檔案單套制的歸檔要求,也方便了照片檔案的利用,易于發(fā)揮照片檔案在檔案展覽、文化建設(shè)等方面的作用。但另一方面,也正是因?yàn)閿?shù)碼照片成像器材、存儲(chǔ)設(shè)備價(jià)格的低廉,使數(shù)碼照片的拍攝成本幾乎可以忽略。在拍攝時(shí),拍攝者為確保能完整記錄所有場景,做到照片的好中選優(yōu),經(jīng)常會(huì)拍攝大量內(nèi)容重復(fù)和與主題關(guān)聯(lián)度不強(qiáng)的數(shù)碼照片,這就使得檔案工作者需要在照片收集、整理階段花費(fèi)大量的時(shí)間從這些海量照片中鑒別、挑選出小部分有價(jià)值的照片進(jìn)行歸檔。以我校為例,我校每年拍攝產(chǎn)生的數(shù)碼照片大約僅有15-20%進(jìn)行了歸檔,剩余的照片大多都是因?yàn)榕臄z內(nèi)容和場景相似而被舍棄。同時(shí),有學(xué)者研究指出:人眼在長時(shí)間的照片挑選過程中,會(huì)形成視覺疲勞,產(chǎn)生“遮蔽效應(yīng)”,難以始終挑選出符合要求的高質(zhì)量照片。因此,在照片檔案的歸檔階段,數(shù)碼照片選擇問題既是檔案工作者在實(shí)踐工作中存在的實(shí)際難題,也是對檔案部門人力、財(cái)力的巨大耗費(fèi)。
故此,本文首先從分析數(shù)碼照片選擇要求入手,以業(yè)務(wù)和技術(shù)兩個(gè)維度為切入點(diǎn)提出數(shù)碼照片的選擇標(biāo)準(zhǔn),同時(shí),引入計(jì)算機(jī)研究領(lǐng)域的圖像質(zhì)量評(píng)價(jià)技術(shù),將標(biāo)準(zhǔn)與技術(shù)相結(jié)合,提出基于圖像質(zhì)量評(píng)價(jià)技術(shù)的數(shù)碼照片智能化選擇方法,并從可行性、預(yù)期效果兩方面進(jìn)行論證該方法的有效性和實(shí)用性。
2 數(shù)碼照片的選擇要求和選擇標(biāo)準(zhǔn)
數(shù)碼照片選擇質(zhì)量的高低直接影響著照片檔案整理質(zhì)量的好壞,也決定著照片檔案實(shí)際利用效果。在歸檔整理階段,數(shù)碼照片選擇的實(shí)質(zhì)就是根據(jù)照片篩選的原則和方法從大量待選照片中找出有價(jià)值、高質(zhì)量的照片進(jìn)行歸檔,既要做到齊全、完整、精煉、優(yōu)化,又要避免張張歸檔。簡言之,數(shù)碼照片歸檔選擇的核心就是對待選照片進(jìn)行質(zhì)量評(píng)價(jià)。這里的質(zhì)量評(píng)價(jià)包括兩方面的要求:一是價(jià)值角度的評(píng)價(jià)。價(jià)值是照片這一客體對從事歸檔活動(dòng)的人這一主體的作用,這是人作為價(jià)值主體綜合多種選擇因素對每張照片做出的選還是不選的主觀評(píng)價(jià)。二是對照片本身客觀質(zhì)量的評(píng)價(jià),這是從描述照片質(zhì)量量化指標(biāo)的角度所進(jìn)行的客觀定量分析,以照片質(zhì)量量化指標(biāo)值是否達(dá)到歸檔要求為標(biāo)準(zhǔn)進(jìn)行的評(píng)價(jià)。
故此,為滿足上述要求,我們從業(yè)務(wù)和技術(shù)兩個(gè)方面提出數(shù)碼照片的選擇標(biāo)準(zhǔn):
從業(yè)務(wù)的角度來說,照片的選擇應(yīng)符合真實(shí)性原則、價(jià)值性原則和完整性原則[1]。真實(shí)性原則保證照片是原始拍攝的照片,具有可靠性和有效性;價(jià)值性原則是確保被選的照片具有保存意義,做到不重復(fù)、不多選;完整性原則是指被選照片能夠全面的反映事件的全貌,做到不少選、不漏選。
從技術(shù)的角度來說,衡量一幅照片質(zhì)量高低的指標(biāo)可以分為兩類,一類是以讀取圖像像素、分辨率、位深等圖像屬性為代表的衡量指標(biāo),另一類是通過對圖像特征進(jìn)行分析,獲得圖像視覺失真程度的評(píng)價(jià)方法,它是以計(jì)算圖像模糊程度、噪聲大小、壓縮比率為代表的衡量指標(biāo)。第一類指標(biāo)衡量起來簡單、易行,可以實(shí)現(xiàn)圖像質(zhì)量的初步估計(jì),但與照片選擇的實(shí)用需要還有差距;第二類指標(biāo)衡量起來較為復(fù)雜,專業(yè)性較強(qiáng),但能有效區(qū)分照片質(zhì)量的高低,實(shí)用性較高。
業(yè)務(wù)角度的衡量指標(biāo)偏向于主觀方面的評(píng)價(jià),技術(shù)角度的衡量指標(biāo)較為客觀,它們都是從不同角度對數(shù)碼照片進(jìn)行篩選而提出的標(biāo)準(zhǔn)。換句話說,要想較好地解決數(shù)碼照片的選擇問題,就必須盡可能地同時(shí)滿足業(yè)務(wù)和技術(shù)兩方面的選擇標(biāo)準(zhǔn)。
3 數(shù)碼照片圖像質(zhì)量評(píng)價(jià)技術(shù)
數(shù)碼照片的選擇是一個(gè)對數(shù)碼照片圖像質(zhì)量進(jìn)行評(píng)價(jià)的過程。符合評(píng)價(jià)要求的就保留,不符合要求的就舍棄。在計(jì)算機(jī)研究領(lǐng)域,數(shù)碼照片圖像質(zhì)量的評(píng)價(jià)方法主要分為兩類:主觀評(píng)價(jià)方法和客觀評(píng)價(jià)方法。
主觀評(píng)價(jià)方法一般是依據(jù)人對圖像整體視覺內(nèi)容的主觀印象進(jìn)行判斷的方法。這種方法能夠較好地解決數(shù)碼照片選擇要求中完整性原則和價(jià)值性原則主觀部分的選擇需求,因?yàn)檎掌墙o人觀看的,所保留的照片是否完整、是否有保存意義、能否能反映出該事件的主要內(nèi)容和信息由人的主觀印象進(jìn)行評(píng)判是最為準(zhǔn)確的評(píng)價(jià)方法。在實(shí)際過程中,這種評(píng)價(jià)方法會(huì)因人審美的不同、專業(yè)水平的高低以及環(huán)境因素的影響產(chǎn)生不同的評(píng)價(jià)結(jié)果。因此,為減少這種差異性,國際電信聯(lián)盟提出了雙刺激損傷測量法、雙刺激連續(xù)質(zhì)量測量法和單刺激連續(xù)質(zhì)量評(píng)價(jià)法等方法[2]。
客觀評(píng)價(jià)方法通常是利用計(jì)算機(jī)領(lǐng)域的相關(guān)研究方法,對圖像分辨率、模糊程度、噪聲大小、壓縮率、塊效應(yīng)等各項(xiàng)具體衡量指標(biāo)進(jìn)行定量分析和比較的評(píng)價(jià)方法??陀^評(píng)價(jià)方法能夠較好地滿足照片真實(shí)性原則和價(jià)值原則中相似照片擇優(yōu)選擇的要求。照片真實(shí)性檢測方法研究由來已久,在檔案學(xué)研究領(lǐng)域和計(jì)算機(jī)學(xué)科研究領(lǐng)域都有較豐碩的研究成果[3][4][5][6],在文獻(xiàn)質(zhì)量評(píng)估[7]、司法鑒定等應(yīng)用領(lǐng)域也有不少實(shí)際案例。在中國知網(wǎng)、IEEE Electronic Library等數(shù)據(jù)庫中分別以“照片檔案+真實(shí)性/真?zhèn)巍焙汀癐mage Passive Forensics”為關(guān)鍵詞進(jìn)行檢索,能檢索出數(shù)百篇與之相關(guān)的研究論文發(fā)表在檔案學(xué)核心期刊和計(jì)算機(jī)頂級(jí)期刊上。在文獻(xiàn)[3]中詳細(xì)論述了如何將圖像被動(dòng)認(rèn)證技術(shù)應(yīng)用于數(shù)碼照片真?zhèn)舞b定中,并結(jié)合檔案業(yè)務(wù)需要提出了具體的鑒定流程。文獻(xiàn)[4][5][6]分別針對圖像區(qū)域復(fù)制、模糊操作、雙重JPEG壓縮的改動(dòng)進(jìn)行分析,提出了各自的檢測與定位方法。
根據(jù)評(píng)價(jià)照片視覺質(zhì)量時(shí)是否需要參考圖像的信息,可以將相似場景照片優(yōu)選問題分為全參考圖像質(zhì)量評(píng)價(jià)方法、半?yún)⒖紙D像質(zhì)量評(píng)價(jià)方法和無參考圖像質(zhì)量評(píng)價(jià)方法三種[8]。全參考圖像質(zhì)量評(píng)價(jià)方法是假設(shè)參考圖像是完全已知的無失真圖像,通過計(jì)算待評(píng)價(jià)圖像與參考圖像之間的差異得到評(píng)價(jià)值,并按照評(píng)價(jià)值的高低對圖像視覺質(zhì)量進(jìn)行綜合評(píng)價(jià)的方法。半?yún)⒖紙D像質(zhì)量評(píng)價(jià)方法是在只能獲取參考圖像部分關(guān)鍵信息的情況下,利用這些部分信息對待評(píng)價(jià)圖像質(zhì)量進(jìn)行評(píng)價(jià)的一種方法。無參考圖像質(zhì)量評(píng)價(jià)方法不需要任何參考圖像信息,可以直接計(jì)算待評(píng)價(jià)圖像的視覺質(zhì)量。因此,在實(shí)際應(yīng)用中,無參考圖像質(zhì)量評(píng)價(jià)方法受到更廣泛的青睞,并已廣泛應(yīng)用在醫(yī)學(xué)CT圖像、眼底圖像以及航拍圖像、衛(wèi)星圖像等需要進(jìn)行圖像質(zhì)量自動(dòng)檢測的領(lǐng)域。具體的方法主要有基于機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的有監(jiān)督和無監(jiān)督算法等。
主觀評(píng)價(jià)方法雖然是最直接、最能準(zhǔn)確獲得選擇結(jié)果的方法,但是它無法在實(shí)際應(yīng)用系統(tǒng)中直接使用,客觀評(píng)價(jià)方法受到現(xiàn)有計(jì)算機(jī)學(xué)科研究成果的限制,在實(shí)際應(yīng)用中存在一定的局限性,但它擁有較好的發(fā)展?jié)摿Σ⒛芸焖?、方便、自?dòng)化地投入到實(shí)際使用中。兩種方法各有優(yōu)點(diǎn),可以相互結(jié)合,發(fā)揮各自優(yōu)勢,以一種簡單、快速、易行的方式做好數(shù)碼照片的選擇工作。
4 基于圖像質(zhì)量評(píng)價(jià)技術(shù)的數(shù)碼照片選擇方法
4.1 選擇過程和方法
數(shù)碼照片的選擇過程是在滿足真實(shí)性的前提下,按照照片形成的時(shí)間順序,將相似場景的照片劃為一組,然后,對每組照片的價(jià)值進(jìn)行鑒定,確保有價(jià)值的照片能完整的收集,最后,在需要?dú)w檔每組照片中擇優(yōu)選擇一張質(zhì)量最好的照片進(jìn)行歸檔。因此,本文結(jié)合上述選擇過程和圖像質(zhì)量評(píng)價(jià)技術(shù),提出如下照片選擇方法:首先,利用圖像真實(shí)性檢測技術(shù),對每張照片的真實(shí)性進(jìn)行鑒定,去除非自然形成的圖像(如人工合成圖像)和經(jīng)過修改的非原始圖像;然后,分別讀取每張照片的像素大小、分辨率、位深等屬性值,并利用無參考圖像質(zhì)量評(píng)價(jià)方法計(jì)算每幅照片的視覺失真程度以及模糊程度、噪聲大小等數(shù)值,以此作為照片選擇的客觀依據(jù);接著,對相似場景的照片進(jìn)行人工分類和價(jià)值鑒定,如該場景中僅有一張照片,則直接選擇歸檔,如該場景中有多張相似照片,則根據(jù)照片質(zhì)量客觀指標(biāo)值的排序結(jié)果和主觀評(píng)價(jià)選擇最好的一張照片歸檔。
4.2 可行性分析
基于圖像質(zhì)量評(píng)價(jià)方法的數(shù)碼照片選擇過程的主要步驟有:照片真實(shí)性檢測、照片客觀質(zhì)量評(píng)價(jià)值的讀取和計(jì)算、照片分類和價(jià)值鑒定以及相似場景照片優(yōu)選四步。
照片真實(shí)性檢測包括很多方面的檢測內(nèi)容,任何一種檢測方法都無法對照片真實(shí)性的各個(gè)方面做到全面檢測。在照片檔案歸檔階段,照片真實(shí)性檢測不可能也不需要對所有涉及照片真實(shí)性的方面都做檢測,只需重點(diǎn)關(guān)注照片內(nèi)容的真實(shí)性即可,即照片本身是計(jì)算機(jī)合成圖像還是真實(shí)拍攝照片、照片內(nèi)容是否有實(shí)質(zhì)性的改動(dòng)(如照片是否存在復(fù)制-粘貼操作、照片內(nèi)容是否有替換等情況)。至于有些通過圖像處理軟件對照片亮度、對比度等數(shù)值進(jìn)行調(diào)整而不存在內(nèi)容改動(dòng)的檢測,可以根據(jù)各自實(shí)際情況自行把握。不管是合成圖像和真實(shí)照片的區(qū)分,還是復(fù)制-粘貼、替換操作的檢測,通過計(jì)算圖像統(tǒng)計(jì)特性和提取圖像特征均能發(fā)現(xiàn)明顯的變化,這在計(jì)算機(jī)信息安全領(lǐng)域已經(jīng)取得了相對深入完善的研究成果,檢測方法的選擇和具體實(shí)現(xiàn)過程可交由計(jì)算機(jī)科學(xué)領(lǐng)域的人員去完成。
在照片客觀質(zhì)量評(píng)價(jià)值讀取和計(jì)算環(huán)節(jié),像素大小、分辨率、位深等照片評(píng)價(jià)值既可以通過照片屬性自行查找,也可以在照片檔案管理系統(tǒng)元數(shù)據(jù)管理部分中查看;而每幅照片視覺失真程度、模糊程度和噪聲大小等數(shù)值的計(jì)算已有很多方法可以實(shí)現(xiàn),檔案領(lǐng)域工作者只需提出明確的要求和需要計(jì)算的指標(biāo)值即可,具體過程可直接交給計(jì)算機(jī)領(lǐng)域人員實(shí)現(xiàn)。但不同類型的照片,圖像特點(diǎn)不一樣,利用不同方法計(jì)算得到的評(píng)價(jià)結(jié)果會(huì)有差異,因此,在具體實(shí)施中需要檔案領(lǐng)域人員和計(jì)算機(jī)領(lǐng)域人員相互配合,在分類分析照片特點(diǎn)的基礎(chǔ)上選擇合適的計(jì)算方法。
照片分類和價(jià)值鑒定是一個(gè)主觀判斷為主的過程,交由檔案工作者處理即可。相似場景照片的優(yōu)選一般是根據(jù)前期照片客觀質(zhì)量評(píng)價(jià)排序結(jié)果進(jìn)行選擇的,但同時(shí)也需要檔案工作者做最后確認(rèn),這主要是為了去除一些照片質(zhì)量雖然較好,但細(xì)節(jié)上有瑕疵的照片,如拍照時(shí)人物只有一半在鏡頭中、拍攝背景不符合要求等情況。
基于圖像質(zhì)量評(píng)價(jià)方法的數(shù)碼照片選擇方法是一個(gè)主觀評(píng)價(jià)和客觀評(píng)價(jià)相結(jié)合的方法,是將計(jì)算機(jī)學(xué)科研究成果實(shí)際應(yīng)用于檔案業(yè)務(wù)工作環(huán)節(jié)的過程,在這一過程中,只要能因地制宜地認(rèn)真分析檔案領(lǐng)域的業(yè)務(wù)需求,將計(jì)算機(jī)領(lǐng)域的研究成果與其準(zhǔn)確結(jié)合,就能完成預(yù)期的目標(biāo)。
4.3 預(yù)期效果評(píng)價(jià)
本文提出的基于圖像質(zhì)量評(píng)價(jià)方法的數(shù)碼照片選擇方法能夠取得較好的預(yù)期應(yīng)用效果,主要體現(xiàn)在以下兩個(gè)方面:
第一,該方法是針對數(shù)碼照片歸檔過程中照片選擇存在耗時(shí)耗力的問題,精準(zhǔn)地將計(jì)算機(jī)學(xué)科的相關(guān)研究成果直接應(yīng)用于檔案整理業(yè)務(wù)流程中,將許多原先由人工完成的工作轉(zhuǎn)化為計(jì)算機(jī)自動(dòng)執(zhí)行,因此,該方法可以節(jié)省大量人工時(shí)間,切實(shí)解決實(shí)際工作中的痛點(diǎn)和難點(diǎn)。
第二,該方法的實(shí)現(xiàn)是由計(jì)算機(jī)系統(tǒng)去完成的,計(jì)算機(jī)系統(tǒng)的設(shè)計(jì)一般是根據(jù)功能需求使用模塊化的設(shè)計(jì)方法,即某個(gè)功能模塊的更新升級(jí)不會(huì)影響其他功能模塊的使用。目前,雖然可能存在計(jì)算機(jī)技術(shù)智能化程度不高、算法選擇不合適、實(shí)際應(yīng)用效果不佳的情況,但從長遠(yuǎn)看,隨著AI技術(shù)的發(fā)展和研究的深入,該方法會(huì)更加智能化的滿足實(shí)際需要,取得更好地應(yīng)用效果。
5 結(jié)語
長期以來,歸檔照片的選擇工作一直是采用人工方式完成的。在人工智能技術(shù)迅速發(fā)展的今天,結(jié)合計(jì)算機(jī)技術(shù),將圖像質(zhì)量評(píng)價(jià)技術(shù)應(yīng)用于歸檔照片的智能化選擇中,不僅是極具挑戰(zhàn)而且也是極具研究價(jià)值的一項(xiàng)課題。我們只有更加精細(xì)化地分析照片選擇過程中每項(xiàng)業(yè)務(wù)環(huán)節(jié)的具體需求和不同類別照片的特點(diǎn),才能在準(zhǔn)確把握各種圖像質(zhì)量評(píng)價(jià)技術(shù)優(yōu)缺點(diǎn)的基礎(chǔ)上,進(jìn)一步推進(jìn)照片選擇的智能化水平。
基金項(xiàng)目:安徽省高校檔案工作協(xié)會(huì)重點(diǎn)研究項(xiàng)目(2021zd002)的階段性研究成果。
參考文獻(xiàn):
[1]王媛,周璐. 數(shù)碼照片歸檔篩選原則及方法[J].城建檔案,2019(12):94-96.
[2]Huang P, Qin S,Lu D. A Novel Approach to Image Assessment by Seeking Unification of Subjective and Objective Criteria Based on Supervised Learning[M]. Computer Vision/ Computer Graphics Collaboration Techniques. Springer Berlin Heidelberg,2011:274-285.
[3]徐彤陽,尹凱. 基于計(jì)算機(jī)技術(shù)鑒定數(shù)碼照片檔案真?zhèn)蔚难芯縖J].檔案學(xué)研究,2018(5):107-111.
[4]王俊文,劉光杰,張湛,戴躍偉,王執(zhí)銓. 圖像區(qū)域復(fù)制篡改快速魯棒取證[J].自動(dòng)化學(xué)報(bào),2009(12):1488-1495.
[5]王雪瑋,梁曉,鄭津津,周洪軍. 自然圖像的無參考模糊檢測與局部模糊區(qū)域分割[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2017(11):1980-1988.
[6]羅瑚. 基于卷積神經(jīng)網(wǎng)絡(luò)的雙重JPEG壓縮取證研究[D].深圳:深圳大學(xué),2018.
[7] 張海燕. IQA在數(shù)字化文獻(xiàn)質(zhì)量評(píng)估中的應(yīng)用研究[J].大學(xué)圖書情報(bào)學(xué)刊,2016(6):46-50.
[8]孫翠霞,劉有耀. 客觀圖像質(zhì)量評(píng)價(jià)[J]. 計(jì)算機(jī)與數(shù)字工程,2019(9):2290-2294.
(作者單位:安徽大學(xué),安徽大學(xué)管理學(xué)院 來稿日期:2020-05-14)