徐雅琴
(中國(guó)人民大學(xué) 新聞學(xué)院,北京 100872)
?
淺談新聞資料庫(kù)的數(shù)字化建設(shè)與管理
徐雅琴
(中國(guó)人民大學(xué)新聞學(xué)院,北京100872)
隨著媒體的信息化和數(shù)字化日益發(fā)展,新聞院系的新聞資料庫(kù)的建設(shè)日漸引起重視。該文探討了新聞資料庫(kù)的數(shù)字化建設(shè)流程,以及如何進(jìn)行數(shù)字化的加工和信息化的開(kāi)發(fā),最終促進(jìn)資料庫(kù)的開(kāi)發(fā)和網(wǎng)絡(luò)共享,使資料庫(kù)在教學(xué)和培訓(xùn)中發(fā)揮作用,并能與同行進(jìn)行交流,有利于新聞資料的傳播和研究。同時(shí),還探討了在新聞資料庫(kù)的管理中,需要加強(qiáng)管理意識(shí),進(jìn)行相關(guān)的技術(shù)培訓(xùn),培養(yǎng)復(fù)合型的管理和技術(shù)人才,以迎接未來(lái)新聞資料庫(kù)建設(shè)的各種挑戰(zhàn)。
新聞資料庫(kù);數(shù)字化建設(shè);資料庫(kù)共享;資料庫(kù)管理
和專業(yè)媒體集團(tuán)的資料庫(kù)相較,新聞院系的各類圖文、影像等數(shù)據(jù)資料規(guī)模不算大,但豐富的課程案例資料對(duì)今后的教學(xué)研究能起到參考和借鑒作用,一些有特色的珍貴的影像資料、文物資料在未來(lái)也會(huì)具有歷史價(jià)值、社會(huì)價(jià)值甚至經(jīng)濟(jì)價(jià)值。鑒于此,新聞院系的資料庫(kù)建設(shè)是很有必要的。截至2015年,大多數(shù)高校的新聞院系還沒(méi)有成立專門(mén)的新聞資料庫(kù),發(fā)展也較為緩慢。
隨著媒體的信息化和數(shù)字化日益發(fā)展,人們接觸的媒體世界不再只是紙質(zhì)的和平面的,而是數(shù)字化的和多媒體的。“大數(shù)據(jù)”和“云數(shù)據(jù)”也被廣泛提及,各行各業(yè)的信息化數(shù)據(jù)從以前的毫不起眼到現(xiàn)在逐漸被發(fā)掘出了社會(huì)的、經(jīng)濟(jì)的價(jià)值。受到“大數(shù)據(jù)”革命[1]和數(shù)字媒體興起的雙重啟發(fā),新聞院系的各類圖文、影像等數(shù)據(jù)資料的數(shù)字化加工和信息化開(kāi)發(fā)應(yīng)得到更多的重視。
新聞資料庫(kù)需要收集的資料內(nèi)容較為分散,形式也較為多樣,因此需要建立較為規(guī)范的系統(tǒng)流程。需要整理的主要材料有:大量的數(shù)字化圖文及影像資料、各種紙質(zhì)的新聞案例資料以及一些珍貴的歷史檔案。媒介形式上主要是以紙質(zhì)媒介或數(shù)字媒介為主。表現(xiàn)手段上主要有文字、圖片、聲音、影像或其他多媒體手段。
新聞資料庫(kù)的數(shù)字化建設(shè)是一個(gè)比較繁復(fù)的過(guò)程,不僅需要對(duì)紙質(zhì)的資料進(jìn)行前期的數(shù)字化掃描,還涉及大量的數(shù)字資料進(jìn)行后期的壓縮整理、存儲(chǔ)和檢索的問(wèn)題。因此,進(jìn)行資料庫(kù)的建設(shè),首先,需要準(zhǔn)備海量的數(shù)據(jù)存儲(chǔ)空間;其次,要進(jìn)行在線數(shù)據(jù)庫(kù)的建設(shè)。這樣才便于新聞資料的檢索以及共享,最理想的解決辦法就是建設(shè)媒體資產(chǎn)管理系統(tǒng)[2-3]。但由于建設(shè)費(fèi)用較高,只有少數(shù)專業(yè)媒體單位會(huì)采用。
除了對(duì)新聞資料庫(kù)進(jìn)行建設(shè)以外,還要充分開(kāi)發(fā)利用和共享它,使資料庫(kù)在教學(xué)和培訓(xùn)中發(fā)揮作用,也能與同行進(jìn)行交流,有利于新聞資料的傳播和研究。
1.1資料庫(kù)建設(shè)的流程
新聞院系的資料根據(jù)內(nèi)容一般分為以下3類:院系活動(dòng)影像資料和歷史檔案、學(xué)生作品資料、案例教材資料。根據(jù)資料存在的形式不同,需要?dú)w檔的流程也不同。在紙質(zhì)文檔時(shí)代,直接進(jìn)行紙質(zhì)文檔的檔案保存即可,但現(xiàn)在還需要進(jìn)行資料庫(kù)數(shù)字化的建設(shè)。
根據(jù)檔案管理的專業(yè)流程,資料的歸檔一般分為以下5個(gè)流程:收集、整理、鑒定、保管和統(tǒng)計(jì)。收集指將分散的文件經(jīng)過(guò)挑選,按照一定的制度集中保存;整理指將文件進(jìn)一步分門(mén)別類;鑒定指對(duì)文件進(jìn)行審查和鑒別,去粗取精,將確實(shí)已經(jīng)失去保存價(jià)值的檔案剔除;保管是需要對(duì)檔案進(jìn)行合適的保存,以防文件出現(xiàn)損壞或丟失;統(tǒng)計(jì)是要求對(duì)文件的狀況進(jìn)行數(shù)量的觀察和分析研究,形成科學(xué)的管理辦法[4]。以下是新聞院系的各種資料進(jìn)行收集和整理分類的情況。
1)院系活動(dòng)影像資料和歷史檔案。
主要是日常會(huì)議活動(dòng)、學(xué)院重大活動(dòng)以及珍貴的歷史檔案。該部分歸檔的類型主要是圖片、影像、音頻文件和大量紙質(zhì)的文字資料等。根據(jù)活動(dòng)時(shí)間、活動(dòng)類型、文件類型等依次進(jìn)行收集、整理、鑒別和保管。此外,紙質(zhì)資料都需要進(jìn)行數(shù)字化流程再存檔。
2)學(xué)生作品資料。
主要是歷年來(lái)的學(xué)生作品資料。由于新聞院系的學(xué)生作品主要是媒體作品,故以各種媒介的方式進(jìn)行分類。該部分主要有平面報(bào)紙、圖片、音頻、視頻、網(wǎng)站、電子雜志等。根據(jù)學(xué)生作品的年代、課程、作品類型的不同,依次進(jìn)行收集、整理、鑒別和保管。此外,部分紙質(zhì)作品資料需要進(jìn)行數(shù)字化流程再存檔。
3)案例教材資料。
主要是課程案例資料。形式主要有文字資料、圖片和視頻。特別是有特色的影像案例資料,應(yīng)該根據(jù)案例資料的年代、課程、材料類型的不同,依次進(jìn)行收集、整理、鑒別和保管。這些資料中的大部分都需要進(jìn)行數(shù)字化流程再存檔。
紙質(zhì)資料數(shù)字化的流程分為檔案預(yù)整理、數(shù)字化加工、信息處理、信息組織和信息存儲(chǔ)等步驟[4],如圖1所示。其中有兩個(gè)最關(guān)鍵的技術(shù):①進(jìn)行紙質(zhì)圖文資料掃描。根據(jù)檔案幅面的大小選擇相應(yīng)規(guī)格的掃描儀或?qū)I(yè)掃描儀。紙張狀況較差,以及過(guò)薄、過(guò)軟或超厚的檔案,應(yīng)采用平板掃描方式。紙張狀況好的檔案可采用高速掃描方式以提高工作效率。掃描過(guò)程中,確保不對(duì)檔案原件造成破壞,保證檔案掃描圖像與原件一致、整潔、清晰。②進(jìn)行深加工,針對(duì)每份影像頁(yè)面進(jìn)行深處理,以獲得最好的圖像質(zhì)量,保證圖像完整、端正、版面無(wú)暗影、無(wú)干擾信息。影像深處理包括:去黑邊、去污點(diǎn)、糾偏等。處理完的圖像并保存,保存格式為PDF[5-6]。容易忽略的是,對(duì)于圖片和影像等原始數(shù)字資料,也需要進(jìn)行相關(guān)的格式轉(zhuǎn)換和壓縮之后再存檔,沒(méi)有進(jìn)行壓縮的圖文資料的數(shù)字化產(chǎn)物是存儲(chǔ)在電子媒介上的龐大繁復(fù)的數(shù)據(jù)[7],難以管理、共享和使用。如影像資料往往占用空間較大,則在保證清晰度的情況下,可以進(jìn)行高效的無(wú)損壓縮之后再保存,這樣就能大大節(jié)省存儲(chǔ)空間和共享帶寬。
圖1 紙質(zhì)文檔數(shù)字化加工流程
紙質(zhì)文檔數(shù)字化流程中也需要注意以下兩方面的問(wèn)題。首先,對(duì)紙質(zhì)存檔的文件進(jìn)行編號(hào)。每一份文件都有一個(gè)唯一的檔號(hào),以該檔號(hào)作為這份文件掃描后的圖像文件或圖像文件夾的名字,這樣有利于文檔的一一對(duì)應(yīng)和目錄檢索。其次,要建立規(guī)范合理的目錄數(shù)據(jù)庫(kù),并進(jìn)行校對(duì)以免出現(xiàn)不合格的目錄數(shù)據(jù)。
存檔方式主要以硬盤(pán)存儲(chǔ)為主,光盤(pán)備份為輔。硬盤(pán)保存是為了讀取方便、共享自由、便于開(kāi)發(fā)使用、但安全性方面稍差;光盤(pán)備份不僅受到存儲(chǔ)空間限制,且不能自由共享,但優(yōu)點(diǎn)是安全可靠、免受病毒攻擊。兩種存檔方式應(yīng)互補(bǔ)。
1.2資料庫(kù)的開(kāi)發(fā)和共享
在建設(shè)新聞資料庫(kù)的同時(shí),還應(yīng)對(duì)這些資料進(jìn)行開(kāi)發(fā)利用,實(shí)現(xiàn)網(wǎng)絡(luò)共享,不只在學(xué)院的教學(xué)科研中發(fā)揮實(shí)際作用,也應(yīng)盡可能給同行中有需求的人士共享使用。
以中國(guó)人民大學(xué)傳媒實(shí)驗(yàn)教學(xué)示范中心為例,該實(shí)驗(yàn)中心在學(xué)院的支持下建設(shè)了新聞傳播學(xué)案例庫(kù)。該案例庫(kù)是我國(guó)新聞傳播學(xué)界第一個(gè)全面覆蓋本學(xué)科各專業(yè)方向、全方位服務(wù)于新聞傳播各門(mén)業(yè)務(wù)課程的標(biāo)準(zhǔn)案例庫(kù)。該案例庫(kù)根據(jù)新聞傳播學(xué)課程方向設(shè)置了13個(gè)欄目及145個(gè)子欄目。目前案例庫(kù)中已經(jīng)上傳了700余份新聞傳播學(xué)一線教師在實(shí)際授課中歸納總結(jié)出來(lái)的寶貴的案例資料,發(fā)揮了良好的交流和示范作用。
同時(shí),該實(shí)驗(yàn)中心還建設(shè)了數(shù)字化的新聞博物館。該博物館已經(jīng)收集整理了300余份國(guó)內(nèi)外的新聞傳播史和傳播技術(shù)史的資料,最有特色的是一些珍貴的原創(chuàng)新聞史料,有口述新聞史和邵飄萍紀(jì)念館。該數(shù)字博物館的建立既保存了珍貴的影像資料,也為后來(lái)的新聞史料研究提供了充分的素材。
通過(guò)新聞傳播學(xué)案例庫(kù)的搭建和數(shù)字新聞博物館的建設(shè),充分挖掘了新聞資料的學(xué)術(shù)價(jià)值。案例庫(kù)既能指導(dǎo)和幫助學(xué)生進(jìn)行新聞相關(guān)課程的學(xué)習(xí),同時(shí)對(duì)課程實(shí)踐中的收獲進(jìn)行了共享,留存了寶貴的實(shí)踐資料,也為后來(lái)者的學(xué)習(xí)和研究提供了極大的幫助和參考。新聞博物館既成功地將新聞資料進(jìn)行了歸檔和整理,又能共享給網(wǎng)絡(luò)上的新聞史學(xué)愛(ài)好者進(jìn)行學(xué)習(xí)和查閱,讓新聞資料發(fā)揮了最大的作用。這兩個(gè)例子是進(jìn)行新聞資料庫(kù)建設(shè)很好的參考。
對(duì)于影像資料收集較豐富的學(xué)校還可建立影像資料庫(kù)和在線點(diǎn)播系統(tǒng)。復(fù)旦大學(xué)傳媒實(shí)驗(yàn)教學(xué)示范中心開(kāi)發(fā)了自己的在線點(diǎn)播系統(tǒng),為學(xué)生網(wǎng)絡(luò)視頻點(diǎn)播提供了充足的影像資源。其中有近300部學(xué)生視頻作業(yè)、600余部紀(jì)錄片等影像資料,可以實(shí)現(xiàn)校園網(wǎng)內(nèi)在線點(diǎn)播,既方便了教學(xué)科研,也方便了學(xué)生間的交流。這也是進(jìn)行新聞?dòng)跋褓Y料庫(kù)建設(shè)和共享的極好例子。
這些建設(shè)較早的資料庫(kù)經(jīng)過(guò)長(zhǎng)期的積累和良好的管理,一定會(huì)發(fā)揮越來(lái)越大的學(xué)術(shù)價(jià)值和社會(huì)價(jià)值。
1.3資料庫(kù)的傳播與發(fā)展
通過(guò)對(duì)新聞資料的收集,還可進(jìn)行新聞的傳播研究。充分發(fā)揮有特色的資料庫(kù)的優(yōu)勢(shì),以此為橋梁,搭建和業(yè)界、學(xué)界進(jìn)行交流和探討的傳播平臺(tái)。
以安徽大學(xué)影像傳播與研究中心為例,該中心側(cè)重于紀(jì)實(shí)影像的生產(chǎn)、傳播與研究。中心下轄“安影映像”和“安影論壇”兩個(gè)平臺(tái)。前者致力于各類影像的展映,為影像生產(chǎn)提供一個(gè)傳播和交流的平臺(tái),將影像傳播研究中心打造成具有鮮明特色的展映平臺(tái);后者致力于邀請(qǐng)業(yè)界和學(xué)界精英來(lái)中心舉辦各類交流活動(dòng),分享業(yè)界經(jīng)驗(yàn)與學(xué)界思考,以期進(jìn)一步提升學(xué)生的視覺(jué)素養(yǎng)、藝術(shù)想象力、鑒賞力和創(chuàng)造力。
同時(shí),還可以尋求與企業(yè)和媒體單位合作,共同開(kāi)發(fā)一些有市場(chǎng)需求的資料庫(kù)項(xiàng)目,既發(fā)揮了資料庫(kù)的價(jià)值,也能實(shí)現(xiàn)一定的經(jīng)濟(jì)效益,這樣也利于繼續(xù)促進(jìn)資料庫(kù)的發(fā)展。
集中優(yōu)勢(shì)資源和力量,對(duì)學(xué)院中的特色新聞資料庫(kù)進(jìn)行建設(shè),挖掘數(shù)據(jù)的潛在價(jià)值,實(shí)現(xiàn)數(shù)據(jù)共享,提高競(jìng)爭(zhēng)力[8]。
2.1加強(qiáng)管理意識(shí)
進(jìn)行新聞資料庫(kù)管理的關(guān)鍵是加強(qiáng)管理意識(shí)。在紙質(zhì)材料還比較盛行的年代,實(shí)驗(yàn)室建設(shè)中,可能不包含資料室建設(shè)部分,或者不太重視資料庫(kù)的建設(shè)。在數(shù)字化的今天,各種材料的數(shù)字化越來(lái)越普及,各種圖文、音視頻等數(shù)字化文件越來(lái)越多,必須重視新聞資料庫(kù)的建設(shè),否則,就會(huì)跟不上數(shù)字化時(shí)代的腳步。
一旦投入進(jìn)行資料庫(kù)的建設(shè),如何管理資料庫(kù)也需要進(jìn)行一番組織和安排。資料庫(kù)的管理工作較寬泛繁復(fù),類似于檔案管理但也不盡相同。新聞資料庫(kù)工作涉及資料的收集整理、數(shù)字化掃描、存儲(chǔ)、光盤(pán)刻錄等,任何細(xì)節(jié)都不能馬虎。首先,需要建立完善的管理制度及專人負(fù)責(zé)制度。只有在嚴(yán)格的管理制度下運(yùn)行,才能保障資料庫(kù)有條不紊的建設(shè)。其次,要發(fā)動(dòng)師生的積極性, 提高服務(wù)意識(shí)[9]。為了提高教師參與資料庫(kù)建設(shè)的積極性,可以根據(jù)項(xiàng)目進(jìn)度和工作量進(jìn)行補(bǔ)助或?qū)⒔處焻⑴c的工作折算入教學(xué)工作量。另外,為了提高質(zhì)量,也鼓勵(lì)學(xué)生助教參與資料庫(kù)的整理和校對(duì)等工作。再次,運(yùn)行經(jīng)費(fèi)要充分保障。資料庫(kù)的運(yùn)行經(jīng)費(fèi)主要由學(xué)院提供。在某些情況下,如果學(xué)院經(jīng)費(fèi)不足,可以向?qū)W校申請(qǐng)?zhí)峁┫鄳?yīng)的經(jīng)費(fèi)支持。此外,對(duì)外合作也能為資料庫(kù)的建設(shè)提供經(jīng)費(fèi)支持。最后,新聞資料庫(kù)的數(shù)字化建設(shè)涉及技術(shù)類工作較多,除了數(shù)字化的工程比較重要以外,網(wǎng)絡(luò)安全方面也不能放松警惕,否則被病毒攻擊之后很容易造成數(shù)據(jù)丟失和系統(tǒng)癱瘓。另外,光盤(pán)的儲(chǔ)存也需要注意儲(chǔ)存環(huán)境,以免光盤(pán)被污染,應(yīng)備份以防丟失。
2.2進(jìn)行相關(guān)技術(shù)培訓(xùn)
要建立高質(zhì)量的數(shù)字化資料庫(kù),人才是關(guān)鍵[10]。作為新興的實(shí)驗(yàn)室建設(shè),除了需要加強(qiáng)管理以外,還需要進(jìn)行相關(guān)技術(shù)的培訓(xùn)。
1)進(jìn)行檔案管理工作的培訓(xùn)。資料庫(kù)的管理主要是進(jìn)行檔案管理相關(guān)的工作,因此需要進(jìn)行檔案管理的培訓(xùn)。需要培訓(xùn)的內(nèi)容有:檔案的實(shí)體管理、檔案的信息資源開(kāi)發(fā)利用等。
2)進(jìn)行資料數(shù)字化的培訓(xùn)。主要是進(jìn)行紙質(zhì)資料的掃描或數(shù)字資料的高效無(wú)損壓縮,以節(jié)省存儲(chǔ)空間和共享帶寬??梢钥紤]和一些公司合作,先讓公司提供相應(yīng)的數(shù)字化的技術(shù)支持,再開(kāi)展技術(shù)培訓(xùn)。
3)進(jìn)行網(wǎng)絡(luò)知識(shí)和網(wǎng)絡(luò)安全的培訓(xùn)。在發(fā)揮數(shù)字化資料作用的同時(shí),也應(yīng)該將這些資料進(jìn)行開(kāi)發(fā)利用。在開(kāi)發(fā)利用時(shí),難免要和服務(wù)器、網(wǎng)站等能提供共享服務(wù)的網(wǎng)絡(luò)設(shè)備和網(wǎng)絡(luò)服務(wù)打交道,這就需要掌握一定的網(wǎng)站制作和網(wǎng)站編輯技能。同時(shí),比較重要的是,必須掌握網(wǎng)絡(luò)安全的技能,才能避免被病毒攻擊。主要需要的工作就是在硬盤(pán)上安裝殺毒軟件,定期進(jìn)行查毒殺毒,否則病毒攻擊之后容易造成數(shù)據(jù)丟失和系統(tǒng)癱瘓。
數(shù)字化新聞資料庫(kù)的建設(shè)日漸引起重視,但傳統(tǒng)的新聞資料工作也不可忽視。早就有學(xué)者提出新聞資料工作的復(fù)合化發(fā)展[11],即傳統(tǒng)資料管理工作和數(shù)字化新聞資料工作的長(zhǎng)期并存。未來(lái)新聞資料庫(kù)的建設(shè)和管理需要復(fù)合型人才,也將會(huì)面臨越來(lái)越多的技術(shù)上和管理上的挑戰(zhàn)。
[1]維克托·邁爾-舍恩伯格,肯尼思· 庫(kù)克耶.大數(shù)據(jù)時(shí)代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社, 2013:41.
[2]趙保穎, 琚存華.淺談媒體資產(chǎn)管理系統(tǒng)的應(yīng)用[J].現(xiàn)代圖書(shū)情報(bào)技術(shù), 2008(2):19-23.
[3]張順良.建立現(xiàn)代服務(wù)型媒資管理系統(tǒng)[J].視聽(tīng)縱橫,2014(5):110.
[4]陳智為,鄧紹興,劉越男.檔案管理學(xué)[M].3版.北京:中國(guó)人民出版社,2008.
[5] 國(guó)家檔案局.紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范(DA/T31-2005).北京:國(guó)家檔案局,2005.
[6]豆丁網(wǎng).紙質(zhì)檔案數(shù)字化的基本流程及技術(shù)要求[EB/OL].[2014-12-16].http://www.docin.com/p-684462697.html.
[7]龍波,楊麗芳,肖健,等.大規(guī)模圖文資料數(shù)字化的實(shí)現(xiàn)方法[J].廣西科學(xué)院學(xué)報(bào),2008,23(4):275-276.
[8]昂貞.新形勢(shì)下新聞資料管理的創(chuàng)新[J].中國(guó)報(bào)業(yè), 2004(11):76-77.
[9]吳彥平.網(wǎng)絡(luò)環(huán)境下新聞資料服務(wù)工作淺析[J].中國(guó)廣播,2006(5):51-53.
[10]曾晶.網(wǎng)絡(luò)環(huán)境下的新聞資料工作[J].記者搖籃,2005(2):21-22.
[11]周海旭.新聞資料工作的復(fù)合化發(fā)展[J].記者搖籃,2005(12):59-60.
Discussion about Digitization Construction and Management of the News Database
XU Yaqin
(SchoolofJournalismandCommunication,RenminUniversityofChina,Beijing100872,China)
Withthegrowingdevelopmentofmediainformationanddigitizationtechnology,thenewsdatabaseconstructioninschoolsofjournalismhasarousedmoreandmoreattention.Thispaperexploredthedigitizationconstructionprocessofnewsdatabase,andhowtocarryoutthedigitizationandinformationtechnologydevelopment,andultimatelypromotedthedevelopmentofdatabaseandnetworksharing.Itwouldnotonlymakethedatabasetobeusedinteachingandtrainingandhelpnewsinformationtospread,butalsoresearcherscouldcommunicatewithpeers.Atthesametime,thenewsdatabasemanagementneededtostrengthenconsciousness,andcarriedouttherelevanttechnicaltrainingfordevelopingcompoundtalents,inthefuturecouldmeetchallengesinthenewsdatabaseconstruction.
newsdatabase;digitizationconstruction;databasesharing;databasemanagement
2015-05-11;修改日期: 2016-06-28
北京市實(shí)驗(yàn)教學(xué)示范中心教育教學(xué)基金資助項(xiàng)目(1171413205)。
徐雅琴(1984-),女,碩士,工程師,主要從事實(shí)驗(yàn)室管理和網(wǎng)絡(luò)多媒體教學(xué)方面的工作。
G21
Adoi:10.3969/j.issn.1672-4550.2016.04.064