楊艷妮+袁甜陽子
[摘 要] 在考慮網絡學習社區(qū)出版選題策劃特殊性的基礎上,提出網絡學習社區(qū)的出版主題選擇模型?;趯衢T話題的采集及話題過濾分類等技術建立候選選題庫,并結合人工辨識采集選題信息,從而探索提升網絡學習社區(qū)出版選題組織效率的方式。
[關鍵詞] 網絡學習社區(qū) 網絡出版 選題策劃
[中圖分類號] G232.1 [文獻標識碼] A [文章編號] 1009-5853 (2017) 02-0036-05
Topic Selection Planning of Publication Content in E-learning Community
Yang Yanni Yuantian Yangzi
(College of Art & Communication, China Three Gorges University, Yichang,443002)( Zhizhesihai (Beijing) Technology Co., Ltd,Beijing,100083)
[Abstract] Considering the particularity of the topic planning of E-learning community publishing, this paper puts forward the topic selection model of the E-learning community. Based on the collection of hot topic and topic filtering classification technology, it builds alternative selection database, and combines with artificial perception to collect topic information, so as to explore the ways to enhance the organization efficiency of the topic selection in E-learning community publishing.
[Key words] E-learning community Network publishing Topic planning
1 引 言
Web 2.0 環(huán)境下,網絡學習社區(qū)作為一種新興的網絡信息資源創(chuàng)作與組織模式,用戶擁有參與表達、創(chuàng)造、溝通和分享的能力,用戶在網絡學習社區(qū)中發(fā)布內容,虛擬學習社區(qū)環(huán)境則促進用戶間的互動以及信息共享。網絡學習社區(qū)包括內容資源、用戶和平臺組織,基于網絡學習社區(qū)的電子出版物改變了傳統(tǒng)出版的內容資源和組織方式,降低了出版的成本和門檻,因而成為網絡學習社區(qū)傳播內容的一種方式。自2012年5月豆瓣閱讀上線,除了挖掘其自有內容資源和社區(qū)資源,也開啟了出版代理模式。果殼、知乎、虎嗅和雪球等越來越多的網絡學習社區(qū)開始輸出社區(qū)內容、出版成書,占據圖書排行榜,如《知乎日報》《豆瓣每日精選》等。
網絡學習社區(qū)聚集了大量用戶群體以及他們生產創(chuàng)作的內容資源,按照不同的興趣偏好,用戶群體可以劃分為一個個社區(qū)群組,而主題豐富、數量龐大的信息資源則“散落”于社區(qū)空間中。內容資源是出版產業(yè)賴以生存和發(fā)展的核心要素[1]。好的知識內容吸引新的用戶遷入網絡學習社區(qū),用戶將內容以共享方式進行傳播,在這一良性循環(huán)中,網絡編輯如何有效利用社區(qū)零散的信息資源,將其重新分配、重組、傳播是網絡學習社區(qū)出版考慮的重要問題。海量數據對策劃編輯的選題能力和信息處理能力提出挑戰(zhàn)[2],在進行網絡學習社區(qū)出版內容選題策劃中,既要明確出版選題及選題實現承載著的知識傳播與接受的功能,又要遵循社區(qū)信息資源傳播的規(guī)約。在本研究中,在考慮網絡學習社區(qū)出版選題策劃特殊性的基礎上,提出網絡學習社區(qū)的出版主題選擇模型。
2 網絡學習社區(qū)出版選題策劃的特殊性
我國網絡出版工作和環(huán)境共同決定了選題策劃必須符合政治性原則、創(chuàng)造性原則、價值性原則等基本要求。但對于各個網絡學習社區(qū)而言,除了承擔著用戶信息共享、知識交流、文化傳播等功能,作為盈利性企業(yè)組織,其每一項業(yè)務開發(fā)都應圍繞企業(yè)整體戰(zhàn)略目標運營。相較于傳統(tǒng)出版社的網絡出版工作,網絡學習社區(qū)出版運營一方面隨著網絡出版物的傳播擴散,學習社區(qū)整體的影響力得以擴大,延伸觸達至非本社區(qū)用戶,增加用戶接受網絡學習社區(qū)的幾率;另一方面,基于對學習社區(qū)中優(yōu)質內容的聚合和傳播,激勵學習社區(qū)內優(yōu)質用戶的內容生產行為,增加用戶的社區(qū)黏性,從而形成良性知識交流共享氛圍。此外,培養(yǎng)“大出版策劃”思維,將網絡學習社區(qū)的選題策劃和社區(qū)營銷整合起來,實現網絡學習社區(qū)出版的“雙效”提升[3]。因此,綜合網絡學習社區(qū)其本身特點及學習社區(qū)網絡出版功能來看,網絡學習社區(qū)出版內容在選題策劃上應精心策劃考慮用戶行為偏好和基于用戶興趣的主題內容。
網絡學習社區(qū)品牌能帶給社區(qū)溢價、產生增值,與學習社區(qū)相關的產品也會備受關注,社會化媒體環(huán)境下品牌效應會不斷被放大。學習社區(qū)的知名度、可信度、口碑、定位決定了網站的轉化率。對學習社區(qū)內容的結構化整理和系統(tǒng)性篩選,將高質量的內容以網絡出版物形式呈現給用戶,使用戶獲取知識的花費成本和耗費時間都降低。同時,當網絡出版物通過其他媒介平臺傳播時,內容的質量、社區(qū)的品牌都會影響“社區(qū)外”的信息流轉。
以《知乎周刊》為例,周刊的內頁會有“查看知乎討論”的選項,已經安裝知乎App的設備會自動跳至應用內的相關頁面,未安裝的則會打開網頁版社區(qū)討論,而要進一步實現諸如添加評論、進行回答、關注問題等則需要下載App。然而只有保證推送內容品質,用戶才有進一步使用App的意向。保證內容格調的相符,也才更有可能吸引目標用戶下載。網絡出版物的內容也反映學習社區(qū)的內容競爭優(yōu)勢,不同的社區(qū)在出版物類型上有所區(qū)別,以雪球為例,定位于投資行業(yè)的應用工具,作為投資領域的社交網絡平臺,其在亞馬遜出版的電子書幾乎均是與財經、證券、股票資訊等相關,當該領域讀者閱覽眾多相關書籍均是由雪球出版,就會對雪球社區(qū)產生“專業(yè)”的印象,從而鞏固社區(qū)品牌。
3 網絡學習社區(qū)的出版主題選擇模型
信息采集是編輯工作的起點[4],借助大數據分析處理方法,對出版內容選題進行采集,這有別于傳統(tǒng)的內容選題策劃方式,除了對網絡媒介數據的搜集與整理,同時利用文本語義挖掘和處理手段,多樣化地展示選題內容,將高質量的信息呈現出來。對于出版編輯而言,為了獲取較為全面完整的主題信息,需充分發(fā)揮創(chuàng)新性思維,拓展并延伸網絡媒介數據所反映的價值。因此,如何有效辨識網絡學習社區(qū)中話題內容的來源,再造網絡出版選題內容組織流程,實現計算機輔助的選題信息采集,對網絡學習社區(qū)出版有著重要意義。在本研究中,結合對網絡學習社區(qū)用戶的行為數據挖掘以及各社交媒體、門戶等平臺中話題內容挖掘和再組織,以此實現網絡學習社區(qū)出版選題策劃,建立網絡學習社區(qū)出版主題選擇模型。
3.1 熱門話題(Topic)
網絡熱門話題是網絡社會中引起公眾網民關注或參與討論的各類事件的總括,它源于大眾網民對社會各類現象和事物的看法。網絡熱門話題牽動著用戶的情感波動,話題性強的出版物更能引起大眾的興趣,有助于出版物的銷售和傳播。如新浪微博平臺,其公共傳播屬性明顯,新浪熱門話題常常及時反映社會熱點,并呈現“先情后理”的話題演化趨勢。熱門話題熱度值升降快速,能引起大眾情感共鳴的微話題更容易成為熱門話題,在一定程度上滿足受眾的心理需求。心理需求相似的受眾會逐漸形成一個群體,并實現向群體心理的轉變,形成某一類型的熱門話題。本研究提出獲取具有網絡出版價值的熱門話題的步驟和途徑。
3.1.1 通過微博、門戶了解話題走向
微博和新聞門戶平臺的熱門內容反映了網絡話題的走向,話題在社交平臺的進一步擴散,也促進了話題的熱度上升。社會化媒體環(huán)境下,熱門話題的活躍程度主要表現在話題的傳播深度和廣度兩個方面。基于對主流社交媒體平臺(如微博、微信、短視頻、直播及專業(yè)領域的交流平臺等)的信息內容發(fā)掘及熱點主題詞分析以發(fā)掘新的話題。如2014年的馬航失聯事件在各大社交平臺備受關注,成為最熱門的話題,雖然是負能量事件,但因為關乎社會公共安全且當時沒有及時給出定論,十分吸引用戶關注。在事件發(fā)生后的各個時段,各新聞媒體有了大量關于馬航的專題報道。圖書出版領域也有了相關的書籍,例如中信出版社推出的《馬航MH370失聯十七天》等。
3.1.2 跟蹤熱門檢索詞發(fā)掘用戶關注熱點
檢索是用戶主動發(fā)現內容的重要方式。聚合用戶的熱搜詞語,以及海量用戶的搜索行為數據,以此發(fā)掘某一段時間大眾用戶群體的主要信息需求,如基于標題的熱點挖掘也能夠有效抓住一段時間內網站的話題趨勢[5]。另外百度熱搜和谷歌趨勢均提供熱搜詞語榜單,且支持查看一年甚至多年熱門話題的用戶關注度和媒體關注的具體數值變化表。除此之外,谷歌趨勢對不同城市、國家、語言的熱搜關鍵字的搜索量以及相關主要新聞進行統(tǒng)計。而新浪微博首頁每十分鐘就會刷新微博的熱搜詞和熱門話題。通過對這些熱門檢索詞的抓取,基本上可以做到網絡熱點追蹤的無延遲。
3.1.3 提取熱門內容主題詞
網絡熱點、焦點會對網民的觀點看法產生較大影響并起到導向性作用。對于網絡編輯而言,這都是反映讀者需求的重要信息?;谡齽t表達式、PAT-Tree等網頁文本抽取技術,對用戶的搜索熱點和新聞熱點進行抓取。并結合詞頻統(tǒng)計分析對熱門內容的主題詞進行頻次計數和排序,對頻率較高的詞語進行統(tǒng)計。詞頻統(tǒng)計方法操作簡便易行,成本較低,但也存在一些問題,詞語從熱門文章中提取分離出來,缺乏語境要素,可能導致對主題詞理解偏差,因此也需結合編輯的主觀判斷。
3.2 過濾分類(Classify)
由于熱門話題的采集過程中,文本內容可能包含大量重復信息和廣告信息以及其他無效數據,增加了后期的判斷篩選工作,因而對采集內容進行過濾是非常必要的。以新浪微博為例,其推廣營銷摻雜在訂閱流之中。針對社交媒體平臺或門戶網站的文本信息進行過濾,采用布隆過濾算法和樸素貝葉斯算法對重復無效的數據進行處理[6],過濾清洗熱詞的原始數據,以減少信息噪音。
另外通過對文本信息分類也可進一步篩選熱詞。將相似度高、類別屬性相同的詞語和內容進行聚類,以區(qū)分熱門話題和內容的主題種類?;谠掝}有效性、品牌定位等條件進行分類設置,也能使話題范圍進一步縮小,減少人工方式的信息標注,以有效簡化流程并提高編輯在后期的處理效率。
3.3 備用選題(Aggregation)
經話題分類和篩選階段,將熱門主題詞置于網絡學習社區(qū)的資源庫中進行檢索和配對,對社區(qū)中內容進行評估,以判斷相關選題是否有足夠的內容資源來組稿。網絡學習社區(qū)中用戶和內容是體現價值的兩大部分,因而針對不同選題的資源匹配不僅是內容層面的,而且要依據選題與用戶興趣偏好進行匹配,形成面向用戶的推薦,這樣有利于編輯在內容組織后期鎖定目標作者,節(jié)約組稿時間成本。
在對選題相關信息的采集和處理基礎上,形成系統(tǒng)的、有一定規(guī)格的候選選題庫。這些候選選題來源于用戶的關注焦點,緊跟時代熱點,并且通過聚合社區(qū)內相關信息資源,能夠避免網絡編輯海底撈針式的全網搜索,通過對社區(qū)中結構化數據的處理也可有效降低網絡編輯被其他冗雜信息干擾的程度、縮短有效獲取時間,實現新環(huán)境下的信息辨識工作。
建立網絡學習社區(qū)的出版候選選題庫,一方面是為了通過篩選和加工社區(qū)內的信息資源使之成為企業(yè)數字資產的一部分,也可轉化為編輯人員自身的知識儲備[7];另一方面提高資源二次利用的效率,盤活社區(qū)中隱匿沉積的豐富知識資源。與紙質檔案不同,以數字化信息保存的候選選題庫從不同應用角度出發(fā),對其進行二次深度加工,以新的內容形態(tài)呈現仍具有利用價值。
3.4 人工辨識(Selection)
基于網絡文本挖掘等技術實現建立以熱門主題詞為基礎的候選選題庫,是大數據分析技術在網絡出版選題上的實現。選題作為一種融合網絡編輯創(chuàng)造性思維的活動,人力因素仍不可或缺。因而為實現精準的選題策劃,還需編輯人工在候選選題庫的基礎上進行再次構思與挖掘,形成明確的、具有可操作性的、創(chuàng)新性的選題。
分別以傳播、編輯、出版利潤、讀者等為主導的出版模式,選題策劃必然不同,其選題策劃所依據的評估要素必然呈現差異。網絡學習社區(qū)出版流程中編輯與用戶均是信息節(jié)點,基于以讀者需求為出版中心的認識,編輯置身于讀者閱讀圈子之中,將滿足讀者價值體驗的精神元素融入選題,凸顯網絡出版物的人格化特征[8]。
據以上認識,結合網絡學習社區(qū)網絡出版選題策劃的特殊性,從選題的實際可操性出發(fā),從候選選題到正式選題形成這一過程需從以下幾個方面進行選題評估。
3.4.1 具有匹配的出版資源
出版資源是與網絡出版物直接關聯的各種資源集合,包括編輯人力資源、宣傳推廣資源、渠道資源、網絡學習社區(qū)內部的內容資源、作者資源等。網絡學習社區(qū)的網絡出版最重要的資源評估要素是有沒有相應的內容資源和作者資源。如果組不到稿或很難組到稿,或組到了稿卻很難得到專業(yè)領域人士及讀者的認同,這樣的選題就會有違選題初衷。因而選題對內容和作者資源的評估十分重要,要對資源的可獲得性進行預判,對內容質量、表達質量和效用質量有概略性的預估。網絡學習社區(qū)的出版資源處于動態(tài)變化的過程,其內容資源常常呈迅猛增長的狀態(tài),對于資源的評估一方面取決于經驗豐富的編輯的判斷;另一方面也要求編輯自身實時跟進學習社區(qū)內的信息內容。明確各類話題下,有哪些活躍用戶,其他用戶對他的評價如何;有沒有作者用戶已經出版過圖書,或者出版社已經向用戶約稿;哪些用戶有較多粉絲和人氣,在某領域有較大話語權;站內什么話題的內容最豐富、討論最多,哪些話題下優(yōu)質回答的比例較高等。
3.4.2 推進電子書系列化品牌化
根據電子書品牌和企業(yè)的品牌方向,開展多個選題計劃,從策劃單一型的選題向系列化選題發(fā)展,加強推廣品牌形象,以實現經濟效益的最大化。在傳統(tǒng)圖書出版行業(yè),許多出版社都已意識到全面開花的圖書發(fā)行并不利于企業(yè)優(yōu)勢的形成且易造成內耗。因此垂直型戰(zhàn)略被廣泛采用,利用自身優(yōu)勢力量縱深發(fā)展,著力于某一方向上的系列出版物,有益于形成相對固定的讀者群體并提升品牌影響力。
3.4.3 優(yōu)先開發(fā)空白品類
在各圖書銷售平臺的電子書成千上萬,從中比對尋找圖書市場種類的空白并不容易。將候選選題庫中的選題與圖書銷售平臺數據進行匹配,開發(fā)新的熱點話題下圖書策劃的空間。網絡出版組稿快、環(huán)節(jié)少、出版效率高等,這些優(yōu)勢能夠幫助網絡出版物以更快的速度跟進新的讀者需求點。且網絡出版的成本較低,一些紙質圖書未能涉獵的小眾選題和方向,對于網絡學習社區(qū)在有相應內容資源的情況下,都可以嘗試。借助大數據分析技術,對小眾圖書的用戶畫像分析描寫,結合多渠道營銷,讓小眾圖書的推廣渠道觸達真正需要的讀者面前,小眾市場將不再小眾。
3.4.4 符合市場發(fā)展趨勢
基于對社交媒體、新聞門戶等平臺熱點主題的數據監(jiān)測,結合對網絡學習社區(qū)的網絡出版物在各對外傳播渠道的情況進行剖析,更多了解網絡出版物市場及其他相關因素,對其未來的發(fā)展趨勢予以預測。以亞馬遜中國圖書分類的熱門關鍵詞為例[9],通過對圖書榜單的長期觀測,可以掌握用戶的閱讀需求變化,通過熱門搜索詞,能夠迅速抓住讀者用戶在不同時間段的興趣偏好和需求,以此開發(fā)選題上架新書,可以更容易被讀者發(fā)現,并充分利用長尾效應以積累讀者用戶。如據《冰與火之歌》小說改編的電視劇《權力的游戲》受到全球粉絲的熱烈追捧,若能結合熱門討論主題,推出 “權力的游戲”專題,極有可能獲得不錯的市場反響。
要了解網絡出版市場的發(fā)展趨勢,需對網絡出版物有充分的市場調研。首先應密切關注閱讀類App、社交媒體、其他學習社區(qū)上的最新專業(yè)信息,抓住市場熱點,善于聯想,跟進讀者的潛在需求。其次利用好網絡出版圖書榜單。各大電商憑借獨特優(yōu)勢,推出一系列有影響的排行榜,如亞馬遜中國每年發(fā)布“年度圖書銷售排行榜”“年度暢銷圖書作家榜”等,這些官方平臺提供的閱讀榜單有著可靠的數據支撐,有助于選題策劃者對市場建立起理性把握。
4 結 論
用戶生產內容數量急劇上升,網絡學習社區(qū)的內容出版跨入“大規(guī)模業(yè)余生產”的時代,對于網絡出版行業(yè)和編輯來說,通過對讀者生成內容進行有效數據分析和挖掘,有利于獲取更多可利用的內容資源,也有了更多發(fā)現作者的機會[10]。網絡學習社區(qū)的內容出版與傳統(tǒng)出版和紙質內容的網絡化最明顯的不同在于,面對和處理的信息來源不同,以往過度依賴編輯人工的手動搜索和發(fā)現,極大地拉低了信息處理效率,這種生產方式與網絡信息更迭速率呈現出嚴重不匹配。
本研究提出網絡學習社區(qū)的出版主題選擇模型,通過熱點詞語、話題的語義挖掘和過濾分類技術,結合編輯的深度辨識來實現社區(qū)出版選題策劃。綜合數據分析和主觀經驗判斷,能幫助編輯在內容組織上有系統(tǒng)地指導和依據,節(jié)省內容的檢索時間,并避免對主觀思維的過度依賴,提高網絡出版的開發(fā)效率。在未來網絡學習社區(qū)出版生態(tài)演變背景下,目前由編輯承擔的選題策劃組織工作是否能夠由用戶來完成,形成信息內容來源于用戶,且選題內容策劃組織由用戶完成,使得內容聚合形式、模式和應用得以擴展,這值得我們深入研究。
注 釋
[1]方卿. 資源、技術與共享:數字出版的三種基本模式[J]. 出版科學,2011(1):28-32
[2]周永斌. 淺析大數據時代研究型策劃編輯的六項選題信息能力建設[J].科技與出版,2016(2):46-49
[3]王巧林. 對數字出版選題策劃的哲學思考[J].中國編輯,2014(3):28-29
[4]劉麗平. 選題信息的收集、發(fā)掘與處理[J].科技與出版,2013(1):32-34
[5]劉驊,朱慶華. 基于標題的BBS熱點話題挖掘:以南京大學小百合BBS為例[J]. 現代情報,2013(1):162-165
[6]唐蓉青.基于微博熱詞挖掘的新聞話題提取研究[D].長沙:湖南大學,2014
[7]程建霞,呂雪梅,張大勇,等.論科技期刊選題策劃中的信息整合[J].編輯學報,2011(2):99-100
[8]段維,嚴定友.“互聯網+”時代出版選題策劃新思路[J].中國出版,2016(1):14-17
[9]https://www.amazon.cn/%E5%9B%BE%E4%B9%A6/b/ref=sa_menu_top_books_l1?ie=UTF8&node=658390051
[10]閆偉華.大數據分析與暢銷書選題的精準策劃[J]. 編輯之友,2015(6):5-9