文/ 鄧佳佳
在互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算等一系列新技術(shù)背景下,全球數(shù)據(jù)信息呈現(xiàn)出前所未有的爆炸式增長,大數(shù)據(jù)的概念應(yīng)運而生,大數(shù)據(jù)蘊含的價值日益顯現(xiàn),《大數(shù)據(jù)時代》一書的作者、牛津大學教授維克托·邁爾-舍恩伯格開篇直陳:大數(shù)據(jù)開啟了一次重大的時代轉(zhuǎn)型,大數(shù)據(jù)正帶來一場生活、工作和思維的大變革。全球著名咨詢公司麥肯錫發(fā)布報告指出:數(shù)據(jù)已經(jīng)滲透到當今每一行業(yè)和業(yè)務(wù)領(lǐng)域,逐漸成為重要的生產(chǎn)要素。人們對于海量數(shù)據(jù)的運用,預(yù)示著新一波生產(chǎn)率增長和消費者盈余浪潮的到來。[1]大數(shù)據(jù)與以知識和信息為核心的出版業(yè)有著天然的聯(lián)系,將重塑出版業(yè)的生產(chǎn)模式、商業(yè)模式,無疑會對整個出版業(yè)的變革產(chǎn)生深刻影響。大數(shù)據(jù)究竟會給出版業(yè)帶來什么?出版業(yè)如何迎接大數(shù)據(jù)時代的機遇和挑戰(zhàn),實現(xiàn)轉(zhuǎn)型創(chuàng)新和跨越發(fā)展?這是出版業(yè)和這個時代值得思考的問題。
從起源來看,大數(shù)據(jù)是指需要處理的信息量過大,已經(jīng)超出一般電腦在處理數(shù)據(jù)時所能使用的內(nèi)存量。海量數(shù)據(jù)信息的極速擴張催生了人類思維的革命,大數(shù)據(jù)時代信息分析和思維方式的三個重要轉(zhuǎn)變也必將深刻影響出版業(yè)。
第一個轉(zhuǎn)變是,在大數(shù)據(jù)時代,我們可以分析更多的數(shù)據(jù)乃至所有的數(shù)據(jù),而不再依賴隨機采樣分析。與局限在小數(shù)據(jù)范圍相比,使用一切數(shù)據(jù)讓我們更清楚地看到了樣本無法揭示的細節(jié)信息。[2]在傳統(tǒng)出版時代,圖書出版的前期調(diào)研往往采用隨機抽樣問卷調(diào)查、座談會等小數(shù)據(jù)分析方式,成本高、效率低,容易造成決策和判斷上的偏差。而大數(shù)據(jù)時代,出版社可以更實時、準確地分析行業(yè)整體情況、市場供求等信息,從而更好地獲知潛在需求,贏得發(fā)展機會。
第二個轉(zhuǎn)變是,在大數(shù)據(jù)時代,我們要接受混亂和不確定性,而不再熱衷于追求精確性。執(zhí)迷于精確性是信息缺乏時代的產(chǎn)物,擁有了大數(shù)據(jù),不再需要對一個現(xiàn)象刨根究底,只要掌握大體的發(fā)展方向即可。相比依賴于小數(shù)據(jù)和精確性的時代,大數(shù)據(jù)因為更強調(diào)數(shù)據(jù)的完整性和混雜性,所以更進一步接近事實的真相。[3]這樣的思維方式對于今天激烈競爭的出版業(yè)是一個重要啟示。傳統(tǒng)出版業(yè)迫切需要改變“精耕細作”的傳統(tǒng)方式,但如果不能退一步看清整個出版業(yè)發(fā)展的大方向,如果不能利用大數(shù)據(jù)快速作出整體決策判斷、把握機會,就可能面臨被淘汰的命運。
第三個轉(zhuǎn)變是,在大數(shù)據(jù)時代,我們無須再緊盯事物之間的因果關(guān)系,而應(yīng)該尋找事物之間的相關(guān)關(guān)系。[4]在海量信息中尋求因果聯(lián)系,無疑是大海撈針,只要尋找出相關(guān)性即可。相關(guān)關(guān)系的探索在圖書出版銷售領(lǐng)域已經(jīng)得到應(yīng)用。亞馬遜基于數(shù)據(jù)的圖書推薦系統(tǒng)大幅提高了圖書銷售量,該推薦系統(tǒng)梳理出了有趣的相關(guān)關(guān)系,但不知道也無須知道其背后的因果關(guān)系。
美國學樂(Scholastic)出版社通過在線游戲追蹤最吸引人的線索和角色,以此為基礎(chǔ)創(chuàng)作了全球暢銷書《39條線索》(The 39 Clues)系列小說;美國克雷克(Coliloquy)出版公司的電子書允許讀者參與設(shè)計人物角色和情節(jié)線索,通過數(shù)據(jù)分析調(diào)整內(nèi)容,迎合大眾口味。[5]大數(shù)據(jù)無疑已經(jīng)帶來了出版業(yè)的發(fā)展和變革,而且這場變革影響必然是深遠的,涉及需求調(diào)查、出版生產(chǎn)服務(wù)、出版銷售等方方面面。
大數(shù)據(jù)的核心是預(yù)測,大數(shù)據(jù)在許多行業(yè)中的一個主要訴求就是洞悉、預(yù)測消費者需求。一直以來,傳統(tǒng)出版業(yè)被認為是一個專業(yè)性和感性的行業(yè),很多時候依靠經(jīng)驗甚至直覺對圖書出版作出判斷和決策。從實際來看,在洞悉消費者需求方面表現(xiàn)欠佳。2013年,我國圖書出版品種達到44.4萬種,而我國18~70周歲國民圖書閱讀率卻僅有57.8%,人均紙質(zhì)圖書閱讀量也僅為4.77本,比2012年下降了0.02本,52.8%的國民都認為自己的閱讀數(shù)量很少或比較少。人均紙質(zhì)圖書閱讀量的下降一方面是受數(shù)字化閱讀方式日益流行的影響,另一方面,也有很多讀者表示盡管市場上銷售的圖書品種很多,但是能夠引起閱讀興趣的書卻非常少。產(chǎn)生圖書供給與需求結(jié)構(gòu)性矛盾的最直接原因是讀者需求預(yù)測失效。[6]
在大數(shù)據(jù)環(huán)境下,這一狀況將得到根本改變,大數(shù)據(jù)技術(shù)通過數(shù)據(jù)搜集、分析,出版業(yè)對于市場需求、消費者偏好將有更為精準的把握和科學的預(yù)測。2012年,美國一家視頻網(wǎng)站奈飛(Netflix)基于大量北美用戶觀看視頻時留下的行為數(shù)據(jù),分析發(fā)現(xiàn)一部影片如果同時滿足英國廣播公司(BBC)出品、導(dǎo)演是大衛(wèi)·芬奇、演員為凱文·史派西等組合元素就可能成功,于是推出自制劇《紙牌屋》,果然大受歡迎,在第65屆艾美獎評選中獲得了9項提名。這一成功是大數(shù)據(jù)時代海量用戶數(shù)據(jù)積累和分析的結(jié)果,依靠大數(shù)據(jù)精準預(yù)測市場需求。2014年3月,電商京東基于對1700萬用戶的銷售數(shù)據(jù)分析,發(fā)布其新品牌“京東出版”的首部圖書《大衛(wèi)·貝克漢姆》,引起廣泛關(guān)注,這是國內(nèi)運用大數(shù)據(jù)科學分析預(yù)測圖書市場需求的一次重要嘗試。
在科學預(yù)判消費者需求的基礎(chǔ)上,大數(shù)據(jù)支持出版企業(yè)以理性工具和方法確定出版選題和策劃方案,以數(shù)據(jù)整合分析指導(dǎo)圖書出版生產(chǎn),提高圖書出版的質(zhì)量、效率和智能化程度。大數(shù)據(jù)時代,圖書內(nèi)容生產(chǎn)的主體將拓展和延伸,圖書出版更多地以讀者為中心,編輯可以以讀者評論數(shù)據(jù)、讀者對類似書籍和作者的評價等為基礎(chǔ)向作者提出修改建議,讀者對作品篇幅、文字風格、情節(jié)發(fā)展等方面作出的評價可以形成內(nèi)容生產(chǎn)的儲備資源。在編排制作方面,可以通過編纂交互平臺中留下的修改記錄、交流記錄、時間記錄等數(shù)據(jù),發(fā)掘編纂過程中的關(guān)鍵環(huán)節(jié)、效率控制、專業(yè)經(jīng)驗和技巧等,從而進一步優(yōu)化編排制作過程。在確定圖書印數(shù)方面,可以通過收集、分析相關(guān)內(nèi)容圖書的銷量、庫存、讀者分布、讀者評論等數(shù)據(jù),判斷市場需求的基本規(guī)模,從而更準確地確定圖書印數(shù),避免圖書庫存和資源浪費。
隨著現(xiàn)代生活節(jié)奏的加快、移動互聯(lián)網(wǎng)以及各種移動終端的興起,閱讀內(nèi)容和時間的“碎片化”成為一種社會發(fā)展趨勢。順應(yīng)這一趨勢,出版企業(yè)可以利用大數(shù)據(jù)分析技術(shù),深入挖掘個性化的閱讀需求,為用戶提供個性化的產(chǎn)品、信息定制服務(wù)。個性化定制服務(wù)尤其適用于現(xiàn)代數(shù)字出版和數(shù)字閱讀,數(shù)字內(nèi)容個性化定制平臺可實現(xiàn)與手機、平板電腦、智能電視等各種終端和微博、微信、騰訊通信(QQ)等社交媒體的無障礙連接,提升閱讀體驗和方便分享消費體驗。同時,隨著出版大數(shù)據(jù)的深度開發(fā)和利用,出版企業(yè)的服務(wù)不再局限于提供圖書內(nèi)容,還為用戶提供所需要的關(guān)聯(lián)數(shù)據(jù)、交互信息等服務(wù)。例如,谷歌(Google)推出的圖書數(shù)據(jù)庫包括從1500年到2008年間出版的各類圖書的5000億個單詞,用戶可通過輸入特定單詞查看這些單詞歷年來的使用頻率,滿足用戶對相關(guān)數(shù)據(jù)的個性化需求和交互式服務(wù)。
“在大眾銷售的歷史中,我們第一次可以看到每個消費者的頭腦的內(nèi)部。得到關(guān)于消費者的全景視圖一直是銷售和營銷團隊長久以來的愿望,但是今天,如果我們智能地連接數(shù)據(jù),深刻理解個體消費者就能變成現(xiàn)實”。[7]出版營銷的核心同樣是掌握、激發(fā)并滿足消費者深層次需求。長期以來,出版企業(yè)通過經(jīng)驗、直覺或抽樣數(shù)據(jù)來預(yù)判圖書消費需求和偏好,很容易出現(xiàn)偏差。今天,大數(shù)據(jù)技術(shù)可以使我們更清楚地了解用戶特征、用戶行為、閱讀偏好、生活范圍乃至情緒好惡等,我們可以通過系統(tǒng)的數(shù)據(jù)挖掘和分析,洞悉目標用戶的閱讀喜好和習慣,讓產(chǎn)品和服務(wù)真正做到“投讀者所好”,極大地提升出版營銷的精準性。出版企業(yè)可以根據(jù)用戶消費水平、選擇偏好、常用支付方式等數(shù)據(jù)選擇合適價位和類型的圖書以合適的渠道進行推送;根據(jù)用戶閱讀偏好、職業(yè)信息和專業(yè)領(lǐng)域等數(shù)據(jù)進行圖書的按需推送;根據(jù)用戶閱讀時間、場所、強度、終端等閱讀行為數(shù)據(jù)確定推送圖書的篇幅、類別、載體以及推送時間等。此外,通過對社交網(wǎng)站用戶間關(guān)系進行分析,可以辨別出有著不同興趣愛好和消費能力的“小圈子”,按“小圈子”進行市場細分和精準營銷。借助大數(shù)據(jù)的網(wǎng)絡(luò)銷售精準營銷早已開始,前面談到的美國在線銷售書商亞馬遜公司基于大數(shù)據(jù)分析建立起有效的購書推薦系統(tǒng),實現(xiàn)精準推薦和營銷。該推薦系統(tǒng)的創(chuàng)立者格雷格·林登說,如果系統(tǒng)運作良好,亞馬遜應(yīng)該只推薦你一本書,而這本書就是你將要買的下一本書。[8]受到網(wǎng)絡(luò)圖書銷售的巨大沖擊,實體書店也依托大數(shù)據(jù)進行市場重新細分和精準營銷,分析哪些讀者群到網(wǎng)上去,哪些繼續(xù)留在實體書店??梢哉f,直覺的時代已經(jīng)走到了盡頭,“搗弄數(shù)據(jù)”將成為提升出版營銷精準性最重要的基礎(chǔ)。
2012年,國際商業(yè)機器有限公司(IBM)對64個國家及地區(qū)從事19個行業(yè)的1700名首席營銷官開展的調(diào)查顯示,71%的被調(diào)查者表示,他們的企業(yè)還沒有做好充分準備來應(yīng)對大數(shù)據(jù)的挑戰(zhàn)。[9]對于歷史悠久的出版業(yè)而言,“大數(shù)據(jù)”這一概念還比較新鮮,傳統(tǒng)出版業(yè)正處在向數(shù)字化轉(zhuǎn)型的關(guān)鍵時期,唯有提前布局、主動應(yīng)變、創(chuàng)新突破,才能在新一輪變革中立于不敗之地。
應(yīng)對大數(shù)據(jù)時代的第一步是收集、占有可能的數(shù)據(jù)。對于出版企業(yè)內(nèi)部來說,數(shù)據(jù)資源主要包括經(jīng)營管理數(shù)據(jù)、出版物數(shù)據(jù)、交互數(shù)據(jù)。經(jīng)營管理數(shù)據(jù)可以依托企業(yè)ERP(企業(yè)資源計劃)系統(tǒng)積累和挖掘生產(chǎn)數(shù)據(jù)、財務(wù)數(shù)據(jù)、管理數(shù)據(jù)、資源統(tǒng)計數(shù)據(jù)等,深入把握企業(yè)的內(nèi)部管理和市場表現(xiàn);出版物數(shù)據(jù)可以通過對出版物的數(shù)據(jù)化與數(shù)據(jù)庫建設(shè),形成原數(shù)據(jù),提供數(shù)據(jù)服務(wù);交互數(shù)據(jù)是基于出版企業(yè)互動網(wǎng)絡(luò)平臺獲取的用戶注冊信息、用戶行為記錄、用戶需求信息、用戶交易記錄、用戶評價信息等。對于出版企業(yè)外部來說,還可以與專業(yè)數(shù)據(jù)公司、社交網(wǎng)站、電商等合作,獲取第三方數(shù)據(jù)信息。
但目前大多數(shù)出版企業(yè)的數(shù)據(jù)信息平臺構(gòu)建遠未成熟,不少企業(yè)處于“數(shù)字化”轉(zhuǎn)型探索階段,自身內(nèi)部的數(shù)據(jù)收集、存儲不足,而且利用第三方數(shù)據(jù)面臨高昂的成本問題。因此,出版企業(yè)必須首先完善自身的數(shù)據(jù)資源平臺,收集和整合數(shù)據(jù)資源,打造大數(shù)據(jù)的基礎(chǔ)能力。當然,并非所有的出版企業(yè)都有足夠的資源、能力打造自身的數(shù)據(jù)系統(tǒng)。行業(yè)聯(lián)動進行數(shù)據(jù)資源整合也是一個路徑,2013年6月,《中國出版物在線信息交換》行業(yè)標準(CNONIX標準)正式發(fā)布,以出版系統(tǒng)、發(fā)行系統(tǒng)、網(wǎng)店系統(tǒng)、圖書館系統(tǒng)為基礎(chǔ)搭建數(shù)據(jù)交換平臺,行業(yè)大數(shù)據(jù)信息平臺的建設(shè)可以消減信息孤島現(xiàn)象,實現(xiàn)數(shù)據(jù)資源共享,從而提高協(xié)同效率。
當然,大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于是否掌握龐大的數(shù)據(jù)信息,而在于如何對這些信息進行再利用。收集信息固然至關(guān)重要,但還遠遠不夠,因為大部分數(shù)據(jù)價值在于它的使用,而不是占有本身。[10]大數(shù)據(jù)時代更加注重通過信息數(shù)據(jù)的篩選、過濾、分析、加工實現(xiàn)信息數(shù)據(jù)的增值,這對于當今的出版業(yè)來說尤其重要。
在大數(shù)據(jù)時代,出版企業(yè)必須依靠專業(yè)數(shù)據(jù)人才,在數(shù)據(jù)的紛繁復(fù)雜中發(fā)現(xiàn)本質(zhì)、價值和細微差別,將無價值的信息和真實有用的信息區(qū)分開來、利用起來。專業(yè)數(shù)據(jù)人才既要對運營處理本企業(yè)積累、收集、搭建的數(shù)據(jù)庫,又要實現(xiàn)企業(yè)網(wǎng)絡(luò)運營平臺和社交網(wǎng)站、數(shù)據(jù)公司等方面的合作對接。他們不僅要善于收集、整理、分析數(shù)據(jù),更要能夠結(jié)合本企業(yè)自身的發(fā)展,找出數(shù)據(jù)背后隱藏的挑戰(zhàn)和機遇。這樣的數(shù)據(jù)人才相對匱乏,而數(shù)據(jù)技術(shù)企業(yè)的數(shù)據(jù)人才并不懂出版。因此,發(fā)掘和培養(yǎng)具有較高的數(shù)據(jù)素養(yǎng)、熟悉出版業(yè)務(wù)的專業(yè)數(shù)據(jù)人才成為出版業(yè)應(yīng)對大數(shù)據(jù)時代的一項緊迫任務(wù)。
183****8081:黃昏里,古巷中,老樹下。老人機,發(fā)短信,求上墻。期中考,心好慌,求小意,上個墻。
大數(shù)據(jù)也是一把雙刃劍,在改善我們生活、工作的同時,也極易引發(fā)數(shù)據(jù)濫用、侵犯隱私等違反法律與道德的行為。大數(shù)據(jù)的精細、精準、豐富及其廣泛應(yīng)用極有可能導(dǎo)致個人隱私泄露的風險,甚至危及個人人身財產(chǎn)安全。在法治思想深入人心的今天,我國應(yīng)當借鑒美英等發(fā)達國家經(jīng)驗,制定《隱私保護法》《數(shù)據(jù)保護法》等法律,嚴格約束和懲罰侵犯個人隱私和數(shù)據(jù)安全的行為。大數(shù)據(jù)的倡導(dǎo)者維克托·邁爾-舍恩伯格在《大數(shù)據(jù)時代》一書中提出,在大數(shù)據(jù)時代,我們需要設(shè)立一個不一樣的隱私保護模式,即從個人許可是否允許以及由誰來處理他們的信息到數(shù)據(jù)使用者為其行為承擔責任。在這種模式下,監(jiān)管部門可以決定不同種類的個人數(shù)據(jù)必須刪除的時間,公司可以利用數(shù)據(jù)的時間更長,但數(shù)據(jù)使用者也要為敷衍了事和不達標準的保護措施承擔法律責任。此外,也需要發(fā)明并推行新技術(shù)方式來促進隱私保護,一個創(chuàng)新途徑就是“差別隱私”:故意將數(shù)據(jù)模糊處理,促使對大數(shù)據(jù)庫的查詢不能顯示精確的結(jié)果,而只有相近的結(jié)果。這就使得特定個人與特定數(shù)據(jù)的聯(lián)系難以實現(xiàn)并且耗費巨大。[11]
面對大數(shù)據(jù)的洶涌浪潮,我國的大部分出版企業(yè)在數(shù)據(jù)應(yīng)用方面仍處于起步階段,大數(shù)據(jù)在出版業(yè)還停留在概念層面上,少有出版社對此下大功夫,在決策的思維上仍然是傳統(tǒng)而保守的。大多數(shù)出版企業(yè)的經(jīng)營管理決策建立在經(jīng)驗基礎(chǔ)或傳統(tǒng)粗糙的數(shù)據(jù)統(tǒng)計分析基礎(chǔ)之上。要讓出版業(yè)界適應(yīng)大數(shù)據(jù)時代“樣本=總體”、不固守精確判斷而接受模糊和不確定性、注重相關(guān)關(guān)系而放棄對因果關(guān)系的執(zhí)著探索,摒棄“拍腦袋”的直覺傳統(tǒng),運用大數(shù)據(jù)思維和方法進行決策和管理,這是一個不小的轉(zhuǎn)彎,決策慣性的調(diào)整與變革尚需要很長的時間。
大數(shù)據(jù)給出版業(yè)帶來前所未有的機遇,數(shù)據(jù)的真實價值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,而絕大部分則隱藏在表面之下。但大數(shù)據(jù)是一種資源和工具,它指導(dǎo)人們?nèi)ダ斫?,但有時也會引起誤解,這取決于是否被正確使用。大數(shù)據(jù)的力量是那么耀眼,我們必須避免被它的光芒誘惑,并善于發(fā)現(xiàn)它固有的瑕疵。[12]比如大數(shù)據(jù)不能顛覆出版的知識屬性、文化風格和思想深度,出版業(yè)應(yīng)保持對大數(shù)據(jù)分析可靠性和真實性的審慎懷疑。
注釋:
[1]James Manyika,Michael Chui,Brad Brown,etc.,Big data:The next frontier for innovation,competition,and productivity [R/OL].[2011-05],http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation
[2][英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013 :17
[4][英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013 :18
[5]楊鑫倢.終有一天 大數(shù)據(jù)會“顛覆”出版業(yè)[N].IT時報,2013-08-19
[6]劉銀娣.數(shù)據(jù)驅(qū)動出版:基于大數(shù)據(jù)的傳統(tǒng)出版模式變革研究[J].中國出版,2014(8)
[7][德]比約·布勞卿,拉斯·拉克,托馬斯·拉姆什.大數(shù)據(jù)變革——讓客戶數(shù)據(jù)驅(qū)動利潤奔跑[M].沈浩,譯.北京:機械工業(yè)出版社,2014:XV
[8][英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013 :69
[9]耿秋,孟劍.大數(shù)據(jù)時代 機遇?挑戰(zhàn)?[J].中國新時代,2012(6)
[10][英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013 :156
[11][英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013 :220-222
[12][英]維克托·邁爾-舍恩伯格,肯尼思·庫克耶.大數(shù)據(jù)時代[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013 :247