摘要:大數(shù)據(jù)時(shí)代的到來(lái),給傳統(tǒng)行業(yè)帶來(lái)了巨大的沖擊和影響。以出版業(yè)為例,為了更好的滿足讀者的需求,必須與時(shí)俱進(jìn)的引進(jìn)大數(shù)據(jù)技術(shù),從而為編輯流程中信息采集工作的優(yōu)化提供必要的技術(shù)支持,提高出版單位的市場(chǎng)競(jìng)爭(zhēng)力。文章首先對(duì)信息采集的現(xiàn)狀進(jìn)行了分析,隨后在概述大數(shù)據(jù)對(duì)信息采集帶來(lái)影響的基礎(chǔ)上,就如何利用大數(shù)據(jù)技術(shù)實(shí)現(xiàn)編輯流程中信息采集工作的優(yōu)化提出了幾點(diǎn)建議。
關(guān)鍵詞:大數(shù)據(jù);編輯流程;信息采集;策略分析
引言:信息采集作為編輯流程中的第一個(gè)環(huán)節(jié),在很大程度上決定了出版物的質(zhì)量。以往出版單位的信息采集渠道以參加圖書展、調(diào)研圖書銷售機(jī)構(gòu)為主,獲取的圖書信息十分有限。隨著大數(shù)據(jù)時(shí)代的到來(lái),一方面是人們的閱讀習(xí)慣發(fā)生了改變,電子圖書逐漸取代傳統(tǒng)紙質(zhì)圖書;另一方面則是信息技術(shù)得到廣泛應(yīng)用,信息采集工作方式亟待進(jìn)行改革。因此,探究大數(shù)據(jù)背景下信息采集工作的新方式,成為出版單位當(dāng)前工作的重要內(nèi)容。
一、信息采集發(fā)展現(xiàn)狀分析
1.專業(yè)人才數(shù)量不足。
通過(guò)對(duì)現(xiàn)階段出版行業(yè)編輯人員的年齡結(jié)構(gòu)調(diào)查發(fā)現(xiàn),其中30-45歲間的中青年編輯人員占到了60%的比例。這些編輯人員雖然具備較為豐富的信息采集經(jīng)驗(yàn),但是受以往傳統(tǒng)出版工作模式的影響,形成了相對(duì)固化的工作習(xí)慣。即便是在大數(shù)據(jù)背景下,也不能與時(shí)俱進(jìn)的掌握信息化技術(shù),甚至對(duì)專業(yè)的計(jì)算機(jī)編輯軟件不能做到熟練運(yùn)用。除此之外,大數(shù)據(jù)背景下讀者的閱讀需求、閱讀興趣也發(fā)生了較大的改變,而缺乏“互聯(lián)網(wǎng)思維”的編輯人員,由于無(wú)法及時(shí)、準(zhǔn)確的捕捉讀者的閱讀訴求,出版物也就難以受到讀者的青睞和市場(chǎng)的需求,最終也會(huì)造成經(jīng)濟(jì)上的損失。
2.軟件支持體系有待完善。
信息設(shè)備和軟件系統(tǒng)的廣泛應(yīng)用,是推動(dòng)信息采集工作實(shí)現(xiàn)數(shù)字化發(fā)展的必要支持。近年來(lái),隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,市場(chǎng)上也出現(xiàn)了一些實(shí)用性較強(qiáng)的信息采集軟件,對(duì)輔助編輯人員工作起到了一定作用。但是我們也應(yīng)當(dāng)看到,科技的發(fā)展日新月異,尤其是依托于信息技術(shù)的編輯軟件,更新?lián)Q代速度極快。部分出版社所用的編輯軟件雖然能夠滿足信息采集的基本需求,但是無(wú)論是從工作效率上還是信息采集質(zhì)量上,都并不具備競(jìng)爭(zhēng)力。因此,建立完善的軟件支持體系,緊跟市場(chǎng)前沿發(fā)展動(dòng)向,成為大數(shù)據(jù)背景下不斷提高信息采集工作質(zhì)量的一種可行性措施。
二、大數(shù)據(jù)對(duì)信息采集工作帶來(lái)的影響
在大數(shù)據(jù)技術(shù)的支持下,形成采集工作逐漸呈現(xiàn)出智能化和自動(dòng)化發(fā)展趨勢(shì),無(wú)論是在采集效率還是信息質(zhì)量上,都有了較大程度的提升。本文根據(jù)采集信息內(nèi)容的不同,就大數(shù)據(jù)帶來(lái)的影響展開了具體分析。
1.對(duì)一般信息的影響。
在以往的工作模式中,一般信息主要來(lái)源于文字材料或編輯人員自身的知識(shí)儲(chǔ)備,因此采集到的信息十分有限。而借助于大數(shù)據(jù)技術(shù),編輯人員信息采集的途徑變得十分廣闊,例如各類網(wǎng)站、微博以及微信公眾號(hào)等,都可以成為信息獲取的場(chǎng)所。以微博為例,用戶可以隨時(shí)隨地的發(fā)送一則簡(jiǎn)短的消息或短視頻。這些微博在引起較大的反響后,還會(huì)被推送至“熱門話題”,以便于更多用戶參與討論。這些熱點(diǎn)話題可以作為編輯人員信息采集的對(duì)象。
2.對(duì)出版業(yè)市場(chǎng)信息的影響。
掌握最新的出版業(yè)市場(chǎng)信息,對(duì)于出版單位及時(shí)調(diào)整經(jīng)營(yíng)管理策略和把握行業(yè)發(fā)展方向起到了積極作用。就編輯人員來(lái)說(shuō),應(yīng)當(dāng)首先分清出版業(yè)市場(chǎng)信息的具體內(nèi)容,諸如出版物的評(píng)論、競(jìng)爭(zhēng)對(duì)手信息等。大數(shù)據(jù)背景下,獲取市場(chǎng)信息的便利性也大大提升。例如,編輯人員可以登錄熱門的電商平臺(tái)(例如當(dāng)當(dāng)、亞馬遜等),這些電商平臺(tái)出售多種類型的圖書,并且圖書商品保留買家評(píng)論,編輯人員可以從買家的評(píng)論內(nèi)容中獲取相關(guān)信息。此外,部分網(wǎng)站或平臺(tái)還專門開通了圖書評(píng)價(jià)渠道(例如豆瓣、網(wǎng)易云讀書等),也可以成為編輯人員了解圖書內(nèi)容、獲取圖書信息的一種途徑。
三、大數(shù)據(jù)背景下優(yōu)化信息采集的具體策略
1.培養(yǎng)符合時(shí)代要求的編輯人才隊(duì)伍。
熟練掌握和應(yīng)用信息技術(shù),具備“互聯(lián)網(wǎng)思維”,是大數(shù)據(jù)背景下對(duì)編輯工作人員提出的新要求。對(duì)于出版單位來(lái)說(shuō),只有與時(shí)俱進(jìn)的培養(yǎng)符合時(shí)代要求的信息技術(shù)人才,才能為信息采集工作的高效率開展提供必要的智力支持。創(chuàng)建編輯人才隊(duì)伍的方式有兩種:其一是針對(duì)在職的編輯人員,根據(jù)他們對(duì)互聯(lián)網(wǎng)以及信息技術(shù)的掌握情況,開展針對(duì)性的培養(yǎng),例如學(xué)會(huì)對(duì)現(xiàn)階段各種新型編輯軟件的操作應(yīng)用,以“網(wǎng)絡(luò)爬蟲”等技術(shù)手段來(lái)搜索和獲取信息等,為進(jìn)一步提升編輯流程中的信息采集效率提供保證。其二是針對(duì)應(yīng)聘人員,要求應(yīng)聘人員必須具備一定的互聯(lián)網(wǎng)常識(shí),且對(duì)信息化編輯有一定的工作經(jīng)驗(yàn),以確保在入職之后可以盡快投入到信息采集工作中。
2.綜合利用多種渠道進(jìn)行信息采集。
編輯人員要想獲取更加豐富的信息,決不能僅僅局限于同一種信息采集渠道,而是應(yīng)當(dāng)以發(fā)散的眼觀和靈活的思路,利用一切可能的手段來(lái)完成信息采集工作。(1)微博信息的采集。微博與一般的新聞及論壇不同,必須通過(guò)某個(gè)身份(即賬號(hào))進(jìn)入微博系統(tǒng),才能夠查看相應(yīng)的內(nèi)容。目前主要采用利用cookie和API的方式來(lái)破解微博安全認(rèn)證中的加密和校驗(yàn)過(guò)程,實(shí)現(xiàn)賬號(hào)的快速驗(yàn)證登錄。由于微博的有效的安全認(rèn)證和反采集策略,采集策略必須模擬正常使用者的使用模式,才能有效的解決微博的安全認(rèn)證和海量采集問(wèn)題。(2)微信公共帳號(hào)信息的采集。對(duì)微信公眾號(hào)信息的采集主要包括兩種方式:一是模擬登錄采集,二是獲得其后臺(tái)權(quán)限,以API接口的方式去采集相關(guān)信息。然后對(duì)獲取公共賬號(hào)的歷史推送信息,解析獲取正文標(biāo)題、正文、時(shí)間、閱讀量信息。通過(guò)協(xié)議或其他方式獲得微信公眾號(hào)的后臺(tái)權(quán)限,讀取關(guān)注此微信公共帳號(hào)的用戶信息,推送的消息,關(guān)注度、閱讀量、點(diǎn)贊情況等。
參考文獻(xiàn):
[1]陳莎.國(guó)內(nèi)網(wǎng)絡(luò)數(shù)據(jù)新聞發(fā)展中存在的不足——以網(wǎng)易、新浪、搜狐數(shù)據(jù)新聞為例[J].聲屏世界,2016(9):164-166.
[2]董文麗.數(shù)據(jù)新聞:大數(shù)據(jù)時(shí)代新聞的變遷——以網(wǎng)易、搜狐、騰訊、新浪的數(shù)據(jù)新聞為例[J].新聞世界,2014(12):85-87.
[3]甘馨月,馬凱,張韻秋.中外數(shù)據(jù)新聞實(shí)踐比較研究——以英國(guó)衛(wèi)報(bào)“數(shù)據(jù)博客”與中國(guó)網(wǎng)易“數(shù)讀”為例[J].新媒體研究,2016,2(24):11-14.
作者簡(jiǎn)介:
張瑞,女(1982—),黑龍江省綏濱縣人,學(xué)士,哈爾濱工業(yè)大學(xué)出版社編輯,主要從事理工科學(xué)術(shù)專著、大學(xué)教材的編輯出版工作。endprint