張佳倩 北京印刷學(xué)院
近年來,我國信息化發(fā)展水平日漸提高,對(duì)數(shù)據(jù)資源的開發(fā)和利用也不斷深化,社會(huì)各領(lǐng)域的數(shù)據(jù)量呈現(xiàn)出前所未有的爆炸式增長。自“大數(shù)據(jù)”概念出現(xiàn)以來,大數(shù)據(jù)行業(yè)得到的國家政策的大力支持?!笆濉逼陂g新聞出版廣電總局將深入貫徹落實(shí)《十三五規(guī)劃綱要》,逐步建立起新聞出版大數(shù)據(jù)體系,以支撐國家數(shù)據(jù)強(qiáng)國的建設(shè)和發(fā)展[1]。
在大數(shù)據(jù)蓬勃發(fā)展的時(shí)代,我國傳統(tǒng)出版業(yè)正在經(jīng)歷前所未有的挑戰(zhàn)與變革。大數(shù)據(jù)技術(shù)正滲透出版業(yè)中的各個(gè)環(huán)節(jié),改變了人們傳統(tǒng)的思維習(xí)慣和行為模式,
大數(shù)據(jù)技術(shù)為內(nèi)容生產(chǎn),數(shù)字出版,知識(shí)服務(wù)、行為營銷等方面提供了轉(zhuǎn)型思路,助力傳統(tǒng)出版業(yè)向智能化的方向轉(zhuǎn)型[2]。我國出版行業(yè)處于重要的數(shù)字化轉(zhuǎn)型階段,應(yīng)積極響應(yīng)國家政策,加強(qiáng)出版行業(yè)大數(shù)據(jù)的體系建設(shè)。
就新聞出版行業(yè)而言,大數(shù)據(jù)體系的建構(gòu)是一個(gè)集數(shù)據(jù)采集、標(biāo)引、計(jì)算統(tǒng)計(jì)、建模、服務(wù)于一體的數(shù)據(jù)體系。新聞出版大數(shù)據(jù)體系的構(gòu)建應(yīng)整合各方數(shù)據(jù)資源,通過數(shù)據(jù)計(jì)算統(tǒng)計(jì)將處理后的二次數(shù)據(jù)應(yīng)用于新聞出版業(yè)的個(gè)性化、智能化、數(shù)據(jù)化服務(wù),助力傳統(tǒng)出版業(yè)的轉(zhuǎn)型升級(jí)。
新聞出版業(yè)生產(chǎn)和使用的數(shù)據(jù)類型包括內(nèi)容數(shù)據(jù)、用戶數(shù)據(jù)、市場數(shù)據(jù)和交互數(shù)據(jù)等多種形態(tài)。出版業(yè)的核心業(yè)務(wù)是為社會(huì)提供有價(jià)值的內(nèi)容供給,出版機(jī)構(gòu)則是內(nèi)容的創(chuàng)造者與生產(chǎn)者。我國出版機(jī)構(gòu)在長期經(jīng)營發(fā)展的過程中積累了體量龐大、權(quán)威專業(yè)的內(nèi)容資源,在出版業(yè)轉(zhuǎn)型升級(jí)的過程中,部分內(nèi)容資源經(jīng)過數(shù)字化和碎片化的生產(chǎn)轉(zhuǎn)化為內(nèi)容數(shù)據(jù),為大數(shù)據(jù)應(yīng)用提供了豐富的內(nèi)容資源。在互聯(lián)網(wǎng)背景下,傳統(tǒng)內(nèi)容消費(fèi)者同時(shí)也轉(zhuǎn)變?yōu)閮?nèi)容的生產(chǎn)者,用戶在消費(fèi)內(nèi)容的同時(shí)也會(huì)產(chǎn)生海量的“用戶生產(chǎn)內(nèi)容”,這些用戶數(shù)據(jù)內(nèi)容豐富、形式多樣、時(shí)效性強(qiáng),明確精準(zhǔn)地體現(xiàn)了用戶特征與需求,是內(nèi)容創(chuàng)作的源泉[3]。出版業(yè)在日常運(yùn)營的過程中所產(chǎn)生的市場數(shù)據(jù)和交互數(shù)據(jù)經(jīng)過數(shù)據(jù)匯聚與分析可以支撐和指導(dǎo)在生產(chǎn)與運(yùn)營,協(xié)助出版機(jī)構(gòu)做出科學(xué)決策。
但是,我國出版業(yè)數(shù)據(jù)體系不健全,行業(yè)內(nèi)數(shù)據(jù)缺乏銜接,數(shù)據(jù)孤島現(xiàn)象嚴(yán)重,上下游企業(yè)缺乏數(shù)據(jù)共享機(jī)制以及數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一從而造成數(shù)據(jù)流通不暢。行業(yè)內(nèi)數(shù)據(jù)資產(chǎn)管理意識(shí)不高,不能充分認(rèn)識(shí)和利用數(shù)據(jù)價(jià)值。另外,出版行業(yè)內(nèi)與行業(yè)外的數(shù)據(jù)未能實(shí)現(xiàn)交換,大量的用戶數(shù)據(jù)被掌握在移動(dòng)閱讀與知識(shí)服務(wù)等網(wǎng)絡(luò)運(yùn)營服務(wù)平臺(tái)或者圖書銷售網(wǎng)絡(luò)平臺(tái)手中,出版機(jī)構(gòu)與終端用戶的聯(lián)系被屏蔽,難以衡量其出版服務(wù)的效果與質(zhì)量,使其無法做出真正基于用戶需求的科學(xué)決策。因此,針對(duì)于出版業(yè)存在的數(shù)據(jù)資源問題,出版業(yè)應(yīng)建立統(tǒng)一規(guī)范化的數(shù)據(jù)采集標(biāo)準(zhǔn),建立大數(shù)據(jù)采集平臺(tái),納入行業(yè)數(shù)據(jù)強(qiáng)化規(guī)范自身數(shù)據(jù)管理,納入相關(guān)簽約作者數(shù)據(jù)和出版機(jī)構(gòu)日常運(yùn)營中的市場與交互數(shù)據(jù)實(shí)現(xiàn)行業(yè)上下游之間的數(shù)據(jù)共享,并與移動(dòng)閱讀與知識(shí)服務(wù)網(wǎng)絡(luò)運(yùn)營服務(wù)平臺(tái)和圖書銷售網(wǎng)絡(luò)平臺(tái)協(xié)調(diào)合理化的數(shù)據(jù)交換模式獲取用戶數(shù)據(jù),為大數(shù)據(jù)分析與應(yīng)用提供豐富全面的數(shù)據(jù)資源,提高大數(shù)據(jù)應(yīng)用的準(zhǔn)確性與時(shí)效性。
在進(jìn)行海量數(shù)據(jù)的采集之后,出版機(jī)構(gòu)要對(duì)所獲數(shù)據(jù)進(jìn)行加工標(biāo)引工作。數(shù)據(jù)標(biāo)引是實(shí)現(xiàn)大數(shù)據(jù)應(yīng)用的基礎(chǔ),同時(shí)對(duì)大數(shù)據(jù)在自然科學(xué)領(lǐng)域和社會(huì)科學(xué)領(lǐng)域發(fā)揮預(yù)測、預(yù)警作用,實(shí)現(xiàn)數(shù)據(jù)創(chuàng)新具有關(guān)鍵作用[4]。對(duì)出版行業(yè)而言,數(shù)據(jù)標(biāo)引主要側(cè)重于知識(shí)標(biāo)引和行業(yè)應(yīng)用標(biāo)引,知識(shí)標(biāo)引適用于學(xué)科研究,行業(yè)應(yīng)用標(biāo)引適用于國民經(jīng)濟(jì)各行業(yè)的應(yīng)用,為開展知識(shí)服務(wù)奠定基礎(chǔ)。
1.云計(jì)算
在對(duì)海量數(shù)據(jù)進(jìn)行采集和標(biāo)引之后,便需要對(duì)數(shù)據(jù)進(jìn)行云計(jì)算處理,處理的結(jié)果就是產(chǎn)生了可用于參考及應(yīng)用的二次數(shù)據(jù)。利用云計(jì)算技術(shù)通過互聯(lián)網(wǎng)來提供動(dòng)態(tài)、易擴(kuò)展、虛擬化的信息資源,并將海量用網(wǎng)絡(luò)連接的資源統(tǒng)一管理和調(diào)度,構(gòu)成一個(gè)數(shù)據(jù)資源池向不同需求的用戶提供不同的服務(wù)[5]。
2.統(tǒng)計(jì)學(xué)分析
雖然計(jì)算機(jī)技術(shù)不斷發(fā)展使得統(tǒng)計(jì)數(shù)據(jù)的搜集、處理、分析、存貯、傳遞、印制等過程日益現(xiàn)代化,提高了統(tǒng)計(jì)工作的效能,但是計(jì)算統(tǒng)計(jì)無法厘清數(shù)據(jù)所反映復(fù)雜的規(guī)律、判斷未來發(fā)展趨勢以提出決策方案。標(biāo)引和計(jì)算后的數(shù)據(jù)需要進(jìn)行統(tǒng)計(jì)學(xué)分析,把數(shù)據(jù)中的不確定性進(jìn)行量化,從數(shù)據(jù)中把信息和規(guī)律提取出來,找出最優(yōu)化的方案。
數(shù)據(jù)建模根據(jù)不同的應(yīng)用范圍可分為學(xué)科體系建模和行業(yè)應(yīng)用建模。其中,學(xué)科體系建模依賴于現(xiàn)有的學(xué)科體系,有著相對(duì)成熟的理論知識(shí)體系,可以根據(jù)數(shù)據(jù)的相關(guān)關(guān)系和內(nèi)在模型,選擇合理的方案進(jìn)行大數(shù)據(jù)模型構(gòu)建;行業(yè)應(yīng)用建模,應(yīng)用的范圍涉及到社會(huì)的方方面面,需明晰社會(huì)各行各業(yè)的基礎(chǔ)現(xiàn)狀,深入把握各個(gè)行業(yè)和職業(yè)的工作流程、業(yè)務(wù)范圍的特點(diǎn)和規(guī)律,并針對(duì)用戶特定的需求構(gòu)建相應(yīng)的大數(shù)據(jù)模型[6]。
在經(jīng)歷了數(shù)據(jù)的采集、標(biāo)引、統(tǒng)計(jì)、建模等環(huán)節(jié)后,便可為目標(biāo)用戶提供豐富多彩的大數(shù)據(jù)服務(wù)。在新聞出版業(yè)轉(zhuǎn)型升級(jí)的過程中,大數(shù)據(jù)技應(yīng)用可以推動(dòng)出版機(jī)構(gòu)從內(nèi)容出版到知識(shí)服務(wù)的轉(zhuǎn)型,出版流程由人工到智能化的轉(zhuǎn)型,業(yè)務(wù)驅(qū)動(dòng)到數(shù)據(jù)驅(qū)動(dòng)的轉(zhuǎn)型,提高新聞出版機(jī)構(gòu)的管理效率,同時(shí)為社會(huì)提供豐富的內(nèi)容資源和優(yōu)質(zhì)的知識(shí)信息服務(wù),加快國家的文化建設(shè)[5]。
1.個(gè)性化知識(shí)服務(wù)
新聞出版機(jī)構(gòu)運(yùn)用大數(shù)據(jù)技術(shù),整合從不同渠道獲得的數(shù)據(jù)資源,進(jìn)行數(shù)字化整理之后在知識(shí)服務(wù)平臺(tái)中為用戶提供檢索和閱讀、熱點(diǎn)分析、知識(shí)關(guān)聯(lián)分析、數(shù)據(jù)挖掘分析等服務(wù),構(gòu)建知識(shí)圖譜,為用戶提供知識(shí)化、數(shù)字化、智能化服務(wù)。同時(shí)大數(shù)據(jù)也使得數(shù)字出版知識(shí)服務(wù)更加個(gè)性化。新聞出版機(jī)構(gòu)可以利用大數(shù)據(jù)掌握用戶的搜索、瀏覽等所有終端行為,精準(zhǔn)的掌握用戶需求規(guī)律,分析用戶的知識(shí)需求以提供個(gè)性化的定制方案[6]。
2.智能化出版流程
在新聞出版業(yè)轉(zhuǎn)型的過程中,大數(shù)據(jù)技術(shù)可推動(dòng)出版流程的智能化改造。在選題策劃方面,出版機(jī)構(gòu)基于海量的數(shù)據(jù)資源,通過數(shù)據(jù)挖掘可以根據(jù)網(wǎng)絡(luò)熱點(diǎn)詞匯傳播圖譜,結(jié)合情感分析,用戶偏好分析等數(shù)據(jù)分析結(jié)果,預(yù)測出受讀者歡迎的選題方案[7]。出版業(yè)利用大數(shù)據(jù)平臺(tái)中的豐富數(shù)據(jù)資源進(jìn)行營銷分析,分析挖掘行為數(shù)據(jù),深刻了解讀者的閱讀需求,然后針對(duì)目標(biāo)市場進(jìn)行精準(zhǔn)定位,對(duì)不同性別、年齡、收入和不同受教育程度的讀者制定不同的營銷方案,進(jìn)行精準(zhǔn)化營銷。
3.數(shù)據(jù)化專業(yè)決策
就新聞出版業(yè)而言,傳統(tǒng)的選題策劃依賴于編輯人員的經(jīng)驗(yàn),難免在信息的篩選上受主觀色彩的影響,做出非完全理性的判斷,顧此失彼。在大數(shù)據(jù)的協(xié)同幫助下,編輯只需要設(shè)定自己的偏好和想法,通過海量數(shù)據(jù)的運(yùn)算、篩選與匹配,與作者的資源相匹配,迅速定位目標(biāo)讀者人群,幫助編輯制定更加科學(xué)的策劃方案。在圖書營銷決策方面,出版機(jī)構(gòu)可以根據(jù)用戶自身的數(shù)據(jù)與行為數(shù)據(jù)進(jìn)行影響力分析,直接對(duì)接目標(biāo)讀者進(jìn)行可視化的呈現(xiàn)與推薦,從而實(shí)現(xiàn)產(chǎn)品與服務(wù)的全面數(shù)據(jù)化,利用數(shù)據(jù)化決策提升運(yùn)營效率[8],減少環(huán)境帶來的不確定性,推動(dòng)出版行業(yè)轉(zhuǎn)型升級(jí)。
隨著大數(shù)據(jù)技術(shù)的迅速發(fā)展,數(shù)據(jù)體量規(guī)模呈爆炸式的增長趨勢,信息開放程度進(jìn)一步擴(kuò)大,數(shù)據(jù)的安全性逐漸受到了人們的重視,出版機(jī)構(gòu)在加快自身大數(shù)據(jù)應(yīng)用建設(shè)的同時(shí)也要重視用戶隱私數(shù)據(jù)和自身數(shù)據(jù)的安全。出版機(jī)構(gòu)可以從技術(shù)和管理方面采取措施提高數(shù)據(jù)的安全防護(hù)。在技術(shù)層面,根據(jù)數(shù)據(jù)的保密等級(jí)和使用需求,對(duì)不同的用戶設(shè)置不同的訪問權(quán)限。不斷提高大數(shù)據(jù)的安全防護(hù)技術(shù),及時(shí)發(fā)現(xiàn)安全隱患,有效遏制數(shù)據(jù)泄露。在管理層面,出版行業(yè)應(yīng)建立規(guī)范健全的數(shù)據(jù)安全保護(hù)機(jī)制,對(duì)大數(shù)據(jù)的使用過程進(jìn)行規(guī)范和監(jiān)督[9]。
在轉(zhuǎn)型升級(jí)的過程中,出版業(yè)面臨著巨大的經(jīng)營壓力與業(yè)務(wù)挑戰(zhàn),各出版機(jī)構(gòu)應(yīng)該改變?cè)械娜瞬沤Y(jié)構(gòu),加快數(shù)據(jù)開發(fā)型人才隊(duì)伍建設(shè),實(shí)現(xiàn)從傳統(tǒng)編輯人才到數(shù)據(jù)開發(fā)型人才儲(chǔ)備的轉(zhuǎn)型。在出版業(yè)中,利用大數(shù)據(jù)技術(shù)和人工智能就可以實(shí)現(xiàn)準(zhǔn)確高效的校對(duì)、排版、銷售等工作,因此對(duì)傳統(tǒng)編輯人員的需求減少,對(duì)從事數(shù)據(jù)管理、數(shù)據(jù)開發(fā)和數(shù)據(jù)分析的人才需求迅速增加[10]。著力加快出版業(yè)數(shù)據(jù)型人才隊(duì)伍建設(shè),有利于促進(jìn)出版企業(yè)的數(shù)字化建設(shè),推動(dòng)出版業(yè)向數(shù)字化、智能化發(fā)展,提高出版業(yè)的總體效能。
我國傳統(tǒng)出版業(yè)處在數(shù)字化轉(zhuǎn)型的進(jìn)程中,新聞出版機(jī)構(gòu)應(yīng)在內(nèi)容、閱讀、營銷、管理等方面逐步實(shí)現(xiàn)“數(shù)據(jù)化”運(yùn)作,加快建立出版業(yè)大數(shù)據(jù)體系。在新聞出版機(jī)構(gòu)中建立起統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn)、構(gòu)建統(tǒng)一的數(shù)據(jù)共享平臺(tái),經(jīng)過數(shù)據(jù)采集、數(shù)據(jù)標(biāo)引、數(shù)據(jù)計(jì)算統(tǒng)計(jì)、數(shù)據(jù)建模等處理后提供數(shù)據(jù)服務(wù),提高新聞出版機(jī)構(gòu)的生產(chǎn)效率、優(yōu)化營銷決策、提升內(nèi)容價(jià)值。