• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      從解構(gòu)到重構(gòu):結(jié)構(gòu)化新聞的概念承遞、價(jià)值與未來(lái)*

      2019-05-24 09:25:40何德俊
      中國(guó)出版 2019年9期
      關(guān)鍵詞:知識(shí)庫(kù)結(jié)構(gòu)化數(shù)據(jù)庫(kù)

      □文│胡 兵 何德俊

      結(jié)構(gòu)化新聞不管作為一種技術(shù)還是一種新聞范式,研究其概念承遞與研究變遷可為當(dāng)下自動(dòng)化新聞的縱深發(fā)展提供新的思路。然而,目前國(guó)內(nèi)外只有少數(shù)學(xué)者在進(jìn)行結(jié)構(gòu)化新聞的研究,且多為新聞數(shù)據(jù)如何結(jié)構(gòu)化的技術(shù)性論文。綜觀這些論文,與本文研究的結(jié)構(gòu)化新聞(新聞的原子化與再利用)在研究對(duì)象上有所不同,在研究視角上也存在差異。國(guó)內(nèi)既缺乏結(jié)構(gòu)化新聞的實(shí)踐,對(duì)結(jié)構(gòu)化新聞的研究也只停留在概念的認(rèn)知層面,缺乏深度和廣度的研究;而本研究采用“微宏互補(bǔ)”的研究視角,注重思辨性和宏觀性。希望當(dāng)下新聞生產(chǎn)者能看到結(jié)構(gòu)化新聞對(duì)新聞業(yè)帶來(lái)的深遠(yuǎn)影響以及發(fā)展機(jī)遇。

      一、結(jié)構(gòu)化新聞的概念承遞與研究變遷

      盡管“structured journalism”在國(guó)外也是近幾年才出現(xiàn)的概念,但與其相關(guān)的研究已存在十幾年。它的前身是數(shù)據(jù)庫(kù)新聞(database journalism),其也屬于近幾年熱門的自動(dòng)化新聞(automated journalism)領(lǐng)域。 “structured journalism”在國(guó)外發(fā)展的脈絡(luò)如何?其與同由數(shù)據(jù)庫(kù)新聞演進(jìn)而來(lái)的數(shù)據(jù)驅(qū)動(dòng)新聞(data-driven journalism)又有何不同?

      1.后“數(shù)據(jù)庫(kù)新聞”階段:解構(gòu)新聞

      數(shù)據(jù)庫(kù)新聞,作為計(jì)算機(jī)輔助報(bào)道的同義詞,可以追溯到20世紀(jì)50年代。到了20世紀(jì)90年代,記者們開(kāi)始嘗試從一些數(shù)據(jù)庫(kù)中找一些數(shù)據(jù)集,挖掘新聞專題,這些數(shù)據(jù)庫(kù)既包括政府公開(kāi)數(shù)據(jù)庫(kù),也包括媒體自己的數(shù)據(jù)庫(kù)。[1]早期的數(shù)據(jù)庫(kù)新聞沒(méi)有以機(jī)器可讀的方式將新聞信息保存起來(lái),這些數(shù)據(jù)的價(jià)值沒(méi)有被挖掘,無(wú)法重新利用或聚合成新的故事。只是在形式上通過(guò)新聞鏈接的方式,利用原有的新聞信息資料對(duì)已有的新聞報(bào)道元素進(jìn)行深度和廣度描述鏈接。[2]

      互聯(lián)網(wǎng)的發(fā)展給數(shù)據(jù)庫(kù)新聞提供了一個(gè)新的定義。傳播學(xué)者維貝克·盧森(Wiebke Loosen)將數(shù)據(jù)庫(kù)新聞定義為“通過(guò)使用與媒體無(wú)關(guān)的發(fā)布系統(tǒng)將原始資料(文章、照片和其他內(nèi)容)充實(shí)數(shù)據(jù)庫(kù),并將其提供給不同的設(shè)備”。[3]傳統(tǒng)新聞將文章作為最終產(chǎn)品,而數(shù)據(jù)庫(kù)新聞生成不斷維護(hù)和改進(jìn)的事實(shí)數(shù)據(jù)庫(kù)。[4]2007年起數(shù)據(jù)庫(kù)新聞迅速發(fā)展,包括英國(guó)廣播公司(BBC)、《衛(wèi)報(bào)》《紐約時(shí)報(bào)》和美國(guó)國(guó)家公共廣播電臺(tái)等多家新聞機(jī)構(gòu)在網(wǎng)站上發(fā)布應(yīng)用程序接口(application programming interface,API),開(kāi)放給用戶提供數(shù)據(jù)。這些新聞機(jī)構(gòu)將新聞內(nèi)容視為數(shù)據(jù),承認(rèn)他們活動(dòng)的核心不是編寫故事,而是數(shù)據(jù)收集和數(shù)據(jù)分發(fā)。到了2011年,一些項(xiàng)目的數(shù)據(jù)庫(kù)本身就可以被視為新聞網(wǎng)站,讀者可以通過(guò)數(shù)據(jù)庫(kù)接口對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索和分析,從而發(fā)現(xiàn)新的“新聞”。至此,數(shù)據(jù)庫(kù)新聞演變成一種由結(jié)構(gòu)化數(shù)據(jù)碎片組成新聞內(nèi)容的信息管理準(zhǔn)則,重在對(duì)新聞故事的解構(gòu),將新聞信息碎片化后存入數(shù)據(jù)庫(kù)以備后用。

      2.結(jié)構(gòu)化新聞階段:原子化新聞

      由于業(yè)界逐漸發(fā)現(xiàn)非結(jié)構(gòu)化數(shù)據(jù)(不可以用行列表格呈現(xiàn)的數(shù)據(jù))在新聞生產(chǎn)過(guò)程中的重要性,希望找到一種自動(dòng)化的方式去“解構(gòu)”這些新聞故事中的元素,并將這些元素保存起來(lái)進(jìn)行再利用,繼而自動(dòng)生成結(jié)構(gòu)化的“新”報(bào)道。結(jié)構(gòu)化新聞的概念亦隨之出現(xiàn)。隨后,“structured journalism”一詞見(jiàn)諸于一些記者的博客中;BBC新聞實(shí)驗(yàn)室、《紐約時(shí)報(bào)》研發(fā)中心、《華盛頓郵報(bào)》、尼曼實(shí)驗(yàn)室、杜克大學(xué)記者實(shí)驗(yàn)室、密蘇里新聞學(xué)院雷諾茲新聞研究所等也相繼開(kāi)展了以“structured journalism”標(biāo)識(shí)的研究項(xiàng)目或?qū)嵺`項(xiàng)目,例如“政治事實(shí)(PolitiFact)”項(xiàng)目對(duì)政府或非政府人員在公開(kāi)場(chǎng)合發(fā)表的政治陳述文本進(jìn)行處理,并將每一個(gè)個(gè)案呈現(xiàn)出來(lái)供用戶查詢。結(jié)構(gòu)化新聞就是將日常的非結(jié)構(gòu)化新聞文本處理成結(jié)構(gòu)化數(shù)據(jù)并再次利用在新的報(bào)道中或者將其可視化。[5]新聞故事拆分得越小,獲得的價(jià)值越大,所有的故事都是在一個(gè)不斷擴(kuò)張的網(wǎng)絡(luò)當(dāng)中相互關(guān)聯(lián)的。[6]因此也有學(xué)者把結(jié)構(gòu)化新聞稱為“原子化新聞”。

      隨著數(shù)據(jù)挖掘技術(shù)的發(fā)展,新聞數(shù)據(jù)庫(kù)中的數(shù)據(jù)價(jià)值被挖掘出來(lái),“數(shù)據(jù)新聞”(data journalism)或稱為“數(shù)據(jù)驅(qū)動(dòng)新聞”(data-driven journalism)是“數(shù)據(jù)庫(kù)新聞”的另一個(gè)演進(jìn)方向。結(jié)構(gòu)化新聞與數(shù)據(jù)驅(qū)動(dòng)新聞都與“數(shù)據(jù)”有著密切的聯(lián)系,但兩者的本質(zhì)卻并不相同。數(shù)據(jù)驅(qū)動(dòng)新聞強(qiáng)調(diào)從數(shù)據(jù)當(dāng)中去挖掘新聞故事,是一個(gè)“數(shù)據(jù)—新聞”的過(guò)程。而結(jié)構(gòu)化新聞則是對(duì)新聞文本及內(nèi)容的解構(gòu)和重構(gòu),強(qiáng)調(diào)構(gòu)造和維護(hù)基于新聞內(nèi)容的知識(shí)庫(kù),并最終生成更多新聞故事,是一個(gè)“新聞—數(shù)據(jù)—新聞+”的循環(huán)增值過(guò)程。

      3.自動(dòng)化新聞2.0:重構(gòu)新聞

      2016年,第三次人工智能浪潮席卷各行業(yè),自動(dòng)化寫作系統(tǒng)的開(kāi)發(fā)與應(yīng)用也風(fēng)生水起,“自動(dòng)化新聞(automated journalism)”一詞逐漸普及。而“structured journalism”一詞卻在國(guó)外媒體和文獻(xiàn)中少有出現(xiàn),僅有一些“結(jié)構(gòu)化故事(structured stories)”“結(jié)構(gòu)化敘事(structured narratives)”表述。媒體和學(xué)術(shù)機(jī)構(gòu)開(kāi)放的以“structured journalism”標(biāo)識(shí)的項(xiàng)目大多都沒(méi)有更新。由此可見(jiàn),從2017年起國(guó)外已逐步用“automated journalism”“算法新聞(algorithmic journalism)”或“機(jī)器人新聞(robot journalism)”等詞代替“structured journalism”。結(jié)構(gòu)化新聞表述的變化也預(yù)示著對(duì)結(jié)構(gòu)化新聞研究重點(diǎn)的變遷:其一,結(jié)構(gòu)化新聞不像數(shù)據(jù)庫(kù)新聞只關(guān)注對(duì)新聞信息解構(gòu)成“原子”存入數(shù)據(jù)庫(kù),同時(shí)也強(qiáng)調(diào)將這些“原子”重構(gòu)成新的更有價(jià)值的新聞報(bào)道,也就是說(shuō)“解構(gòu)”與“重構(gòu)”同樣重要。其二,新聞?dòng)浾咧饾u將注意力集中到蘊(yùn)含價(jià)值更大的非結(jié)構(gòu)化數(shù)據(jù)之上,不僅對(duì)結(jié)構(gòu)化的新聞信息進(jìn)行解構(gòu),更關(guān)注非結(jié)構(gòu)化新聞信息的解構(gòu)。

      二、結(jié)構(gòu)化新聞的技術(shù)框架:I-T-O模式

      結(jié)構(gòu)化新聞主要涉及自然語(yǔ)言處理(natural language processing,NLP)和自然語(yǔ)言生成(natural language generation,NLG)技術(shù),其核心在于知識(shí)庫(kù)的構(gòu)建。賴特(Reiter)等人曾使用“I-T-O模式”去解釋NLG技術(shù)在新聞生產(chǎn)上的應(yīng)用。[7]筆者借用這個(gè)“I-T-O模式”分析結(jié)構(gòu)化新聞的技術(shù)架構(gòu)。“I-T-O模式”分別對(duì)應(yīng)輸入層(Input)、處理層(Throughput)以及輸出層(Output),如圖1所示。

      圖1 “I-T-O模式”下的結(jié)構(gòu)化新聞技術(shù)框架圖

      1.輸入層

      所有自動(dòng)化新聞都需要先讀入大量的數(shù)據(jù)。輸入層主要有數(shù)據(jù)讀入和事實(shí)核查兩個(gè)環(huán)節(jié)。

      數(shù)據(jù)讀入(data ingestion)。與一般的機(jī)器寫作不同,結(jié)構(gòu)化新聞的輸入并不只是諸如體育比賽、金融股市等高度結(jié)構(gòu)化的數(shù)據(jù),傳統(tǒng)的非結(jié)構(gòu)化新聞文本才是結(jié)構(gòu)化新聞的主要輸入源之一。媒體的歷史新聞數(shù)據(jù)庫(kù)以及社交媒體的公開(kāi)API也是結(jié)構(gòu)化新聞數(shù)據(jù)輸入的主要來(lái)源。隨著技術(shù)的成熟,圖像、視頻等也在逐漸成為結(jié)構(gòu)化新聞的輸入數(shù)據(jù)。

      事實(shí)核查。為確保新聞報(bào)道的真實(shí)性,對(duì)于已讀入的文本數(shù)據(jù),必須要進(jìn)行報(bào)道真實(shí)性、發(fā)布媒體權(quán)威性以及數(shù)據(jù)精確性等事實(shí)核查操作。目前,依靠機(jī)器已經(jīng)能實(shí)現(xiàn)大部分的核查操作,但涉及倫理道德等問(wèn)題的審核依舊需要人工干預(yù)。

      2.處理層

      該層主要負(fù)責(zé)新聞文本的“結(jié)構(gòu)化”。

      信息抽?。╥nformation extraction)。采用NLP技術(shù)和文本挖掘方法的信息抽取就是將非結(jié)構(gòu)化數(shù)據(jù)“結(jié)構(gòu)化”,將新聞文本拆分成零散的“信息碎片”,從中發(fā)現(xiàn)新知識(shí)并將其轉(zhuǎn)換為可理解的有用信息,然后對(duì)這些碎片進(jìn)行語(yǔ)義標(biāo)注(tag)并存儲(chǔ)起來(lái)。簡(jiǎn)單說(shuō),NLP的工作就是“讀”新聞,將文本置于上下文中理解。信息抽取具體包括三種關(guān)鍵技術(shù):命名實(shí)體識(shí)別、關(guān)系抽取和事件抽取。

      命名實(shí)體識(shí)別。日常的新聞文本中通常包含著大量的人物、地點(diǎn)、組織等要素。在NLP技術(shù)中,這些要素被稱作命名實(shí)體(name entity)。在對(duì)文本數(shù)據(jù)進(jìn)行預(yù)處理后(包括分詞、詞性標(biāo)注),就要發(fā)現(xiàn)命名實(shí)體并確定其類別。關(guān)系抽取。關(guān)系抽取的作用是獲取文本中實(shí)體之間存在的語(yǔ)法或語(yǔ)義上的聯(lián)系。例如,從“馬云是阿里集團(tuán)的首席執(zhí)行官(CEO)”這個(gè)句子中可以抽取出:“馬云”和“阿里集團(tuán)”的關(guān)系。事件抽取。事件是新聞?wù)Z義特征構(gòu)建的中心。結(jié)構(gòu)化新聞中的事件抽取主要指從大量的新聞文本中抽取出相關(guān)的事件,該過(guò)程一般分成“元事件抽取”和“主題事件抽取”。前者著重對(duì)單一事件的時(shí)間、地點(diǎn)、人物的抽取。而后者主要是抽取某一主題下的系列事件。

      知識(shí)庫(kù)的構(gòu)建與更新。隨著大量的新聞文本等非結(jié)構(gòu)化數(shù)據(jù)不斷輸入,處理層將構(gòu)建一個(gè)龐大的“知識(shí)庫(kù)”(knowledge base)。這是結(jié)構(gòu)化新聞生產(chǎn)過(guò)程的核心步驟。知識(shí)庫(kù)實(shí)際上是對(duì)數(shù)據(jù)庫(kù)的擴(kuò)充與升級(jí)。知識(shí)庫(kù)系統(tǒng)利用知識(shí)庫(kù)對(duì)輸入的數(shù)據(jù)信息進(jìn)行推理之后,提供給系統(tǒng)使用者的是判斷分析后的結(jié)果,而不僅僅是向用戶提供可檢索的信息。在知識(shí)庫(kù)平臺(tái)后面實(shí)則是語(yǔ)義網(wǎng)的建設(shè)。

      3.輸出層

      “數(shù)據(jù)庫(kù)新聞”側(cè)重于強(qiáng)調(diào)將新聞“解構(gòu)”后存入數(shù)據(jù)庫(kù),以備再利用。而隨著NLG技術(shù)的發(fā)展,結(jié)構(gòu)化新聞逐漸強(qiáng)調(diào)“解構(gòu)-重構(gòu)”這一完整過(guò)程,“重構(gòu)”可以是人工完成,也可以是機(jī)器自動(dòng)完成。輸出的文本可以是非結(jié)構(gòu)化的也可以是結(jié)構(gòu)化的。

      人工編輯。從輸入層到處理層,文本數(shù)據(jù)已經(jīng)實(shí)現(xiàn)了“結(jié)構(gòu)化”并構(gòu)成了一個(gè)知識(shí)庫(kù)??梢哉f(shuō),這個(gè)龐大的知識(shí)庫(kù)就是記者大腦的延伸,其中所儲(chǔ)存的數(shù)據(jù)和關(guān)聯(lián)規(guī)則能夠提供大量的人物關(guān)系和背景材料,從而有效地提高記者寫作的效率和質(zhì)量。

      自然語(yǔ)言生成(NLG)。NLG技術(shù)是機(jī)器實(shí)現(xiàn)自動(dòng)化寫作的核心技術(shù)。簡(jiǎn)言之,NLG的工作類似于填字游戲,是“寫”新聞,把結(jié)構(gòu)化、模塊化的數(shù)據(jù)組裝成易理解的書(shū)面敘事。在結(jié)構(gòu)化新聞的輸出層,機(jī)器將自動(dòng)從知識(shí)庫(kù)中讀取相應(yīng)的“原子”,根據(jù)原本的關(guān)聯(lián)規(guī)則和特定的語(yǔ)言模板將這些“新聞原子”取出并重新組合成新的自然語(yǔ)言形式的新聞報(bào)道。

      三、結(jié)構(gòu)化新聞的價(jià)值

      結(jié)構(gòu)化新聞是一種信息表現(xiàn)機(jī)制,為新聞提供了另一種范式。[8]正如電視時(shí)代要求新聞是可視化的,結(jié)構(gòu)化新聞則能更好地適合數(shù)字時(shí)代,更容易被讀者理解。結(jié)構(gòu)化新聞將為新聞消費(fèi)者、新聞生產(chǎn)者、新聞編輯室以及不斷變化的媒體環(huán)境提供一個(gè)可持續(xù)的前進(jìn)方向。

      1.新聞消費(fèi)者:個(gè)性化閱讀和填補(bǔ)“記憶漏洞”

      尼葛洛龐帝曾提到“超媒體(hypermedia)”的概念。他認(rèn)為:數(shù)字世界的信息空間可以通過(guò)一組多維指針來(lái)進(jìn)一步引申或辨明。整個(gè)文檔結(jié)構(gòu)仿佛一個(gè)復(fù)雜的分子模型,大塊信息可以被重新組合,句子可以擴(kuò)張,字詞則可以當(dāng)場(chǎng)定義,這些連接可以由作者或讀者在出版前后自行嵌入。[9]“結(jié)構(gòu)化故事”網(wǎng)站(www.structuredstories.com)是一個(gè)新聞數(shù)據(jù)庫(kù),它不僅允許每個(gè)人對(duì)某個(gè)新聞事件進(jìn)行持續(xù)收集、使用和改進(jìn);而且受眾閱讀新聞時(shí)可以選擇多種新聞呈現(xiàn)形式,包括“要點(diǎn)”“時(shí)間線”“圖片集”“結(jié)構(gòu)化故事”(內(nèi)容中標(biāo)注動(dòng)詞、名詞,并可連接至維基百科)、“新聞5W卡片”等形式,受眾還可根據(jù)對(duì)事件的感興趣程度選擇新聞呈現(xiàn)的詳略,讓消費(fèi)者對(duì)報(bào)道產(chǎn)生“流連忘返”的反復(fù)閱讀的欲望,從而實(shí)現(xiàn)個(gè)性化閱讀。

      為了追求時(shí)效性,網(wǎng)絡(luò)媒體的新聞報(bào)道往往只能“管中窺豹”,無(wú)法對(duì)包括事件背景在內(nèi)的各個(gè)方面進(jìn)行詳細(xì)敘述,受眾難以對(duì)事件進(jìn)行全面了解和把握。類似地,曾經(jīng)關(guān)注過(guò)該事件的讀者也可能因?yàn)闀r(shí)間間隔太長(zhǎng)而忘記事件的前因或背景,這就是讀者的“記憶漏洞”,而且每個(gè)讀者的“記憶漏洞”是不一致的?!度A盛頓郵報(bào)》有一個(gè)實(shí)驗(yàn)項(xiàng)目“知識(shí)地圖”(Knowledge Map),該項(xiàng)目在文章中使用大量的注釋文本(如姓名、主題和事件),當(dāng)讀者點(diǎn)擊摘要、圖片或其他輔助材料時(shí),這些注釋會(huì)出現(xiàn)在側(cè)邊欄中,使讀者的“記憶漏洞”得到填補(bǔ)。

      2.新聞生產(chǎn)者:信息再加工和深加工創(chuàng)造新聞價(jià)值

      美國(guó)文學(xué)教授杰·戴維·波爾特提出了“寫作空間”(writing space)的概念,他問(wèn):是不是可以設(shè)想一種寫作空間的存在,使得作者可以同時(shí)思考和呈現(xiàn)幾條不同的敘述線?[10]結(jié)構(gòu)化新聞背后龐大的知識(shí)庫(kù)提供了一種新型的“寫作空間”。它將散落在互聯(lián)網(wǎng)中的離散的碎片信息重新整合到一張龐大的知識(shí)網(wǎng)絡(luò)當(dāng)中,碎片之間的關(guān)系和邏輯依舊保留下來(lái)。根據(jù)需要,這些碎片將以特定方式混合和重組,從而實(shí)現(xiàn)當(dāng)天新聞與歷史資料的無(wú)縫聚合,發(fā)揮傳播的長(zhǎng)尾效應(yīng)。記者在尋找新的報(bào)道角度、創(chuàng)造新聞價(jià)值的同時(shí),還應(yīng)植入產(chǎn)品邏輯,將自己定位為“做產(chǎn)品”而非“寫文章”,將文本生產(chǎn)從靜態(tài)的、完成式的工作,變成動(dòng)態(tài)的、始終進(jìn)行式的生產(chǎn)過(guò)程。

      3.新聞編輯室:數(shù)據(jù)財(cái)富和分散共治

      知識(shí)庫(kù)是新聞編輯室的“數(shù)據(jù)中心”,也是“信息聯(lián)結(jié)中心”。數(shù)據(jù)的每一次“流動(dòng)”都會(huì)“自我增值”,能夠?yàn)槭褂谜邘?lái)更豐富的內(nèi)容或更多元的角度。套用梅特卡夫法則(Metcalfe's Law),網(wǎng)絡(luò)價(jià)值以用戶數(shù)量的平方速度增長(zhǎng),知識(shí)庫(kù)的價(jià)值則以新聞報(bào)道數(shù)量的平方速度增長(zhǎng)。同時(shí),新聞也有不言而喻的市場(chǎng)價(jià)值,各個(gè)新聞編輯室所擁有的結(jié)構(gòu)化的知識(shí)庫(kù)是不可復(fù)制的,是新聞編輯室的一個(gè)新的經(jīng)濟(jì)基礎(chǔ)。“買新聞”可以發(fā)揮成本效能,新聞素材在媒體內(nèi)部實(shí)現(xiàn)市場(chǎng)化流通,形成媒體融合的觀念和思維。

      戴維·溫伯格提出了“三階秩序”的概念,他認(rèn)為:照片放進(jìn)相冊(cè)是“一階組織”,圖片資料庫(kù)的目錄卡是“二階物件”,它指向的是一階圖片所在的位置。而內(nèi)容被數(shù)字化,該內(nèi)容的相關(guān)信息也由數(shù)位組成——這就是三階秩序。[11]在二階世界中,我們需要專家來(lái)逐個(gè)檢查信息、思想和知識(shí),然后將其整整齊齊放好,過(guò)去我們的報(bào)業(yè)等許多產(chǎn)業(yè)和機(jī)構(gòu)都是基于這一事實(shí)之上。傳統(tǒng)的新聞故事生產(chǎn)方式并不允許人們做過(guò)多的組合和修改,而結(jié)構(gòu)化新聞(三階秩序)則是萬(wàn)物皆可被重構(gòu)。結(jié)構(gòu)化新聞的生產(chǎn)蘊(yùn)含了新聞編輯室文化和思維的轉(zhuǎn)型,“無(wú)序中的有序”一種責(zé)任共擔(dān)的自治管理文化正在新聞編輯室興起,它能讓新聞編輯室內(nèi)的個(gè)人和團(tuán)隊(duì)直接對(duì)內(nèi)容負(fù)責(zé),不僅可以提升內(nèi)容的生產(chǎn)效率,內(nèi)容本身的地位也會(huì)大大提升。

      四、機(jī)遇與挑戰(zhàn)

      雖然結(jié)構(gòu)化新聞蘊(yùn)含著豐富的價(jià)值,但結(jié)構(gòu)化新聞并沒(méi)有像數(shù)據(jù)新聞那樣逐漸成為一種特色鮮明的新聞范式,反而其概念還有弱化的趨勢(shì)?,F(xiàn)階段結(jié)構(gòu)化新聞存在許多挑戰(zhàn),同時(shí)我們也應(yīng)看到人工智能技術(shù)的發(fā)展給其帶來(lái)的發(fā)展機(jī)遇。

      1.機(jī)遇一:“事件驅(qū)動(dòng)”的自動(dòng)化新聞的發(fā)展

      在實(shí)現(xiàn)發(fā)稿快、產(chǎn)量高之后,自動(dòng)化新聞將向深度內(nèi)容、寫作風(fēng)格等縱深領(lǐng)域發(fā)展。美國(guó)“結(jié)構(gòu)化故事(Structured Stories)”項(xiàng)目的目的就是為了讓記者和機(jī)器以結(jié)構(gòu)化的方式解構(gòu)新聞事件而并非輸入傳統(tǒng)的非結(jié)構(gòu)化文本,以便讓機(jī)器找到新聞的中心語(yǔ)義特征——事件,完成復(fù)雜的寫作??ㄋ鬼f爾(Caswell,2017)發(fā)表的論文首次使用了“Automated Journalism 2.0”一詞,[12]強(qiáng)調(diào)以“事件驅(qū)動(dòng)”的敘事報(bào)道不同于目前大多數(shù)機(jī)器生成的簡(jiǎn)單描述性新聞,其能夠解釋、放大和闡述重大事件及其內(nèi)在價(jià)值,幫助受眾更豐富、更微妙地去理解敘事信息,滿足受眾的情感需求。從簡(jiǎn)單故事到復(fù)雜敘事的自動(dòng)化寫作需求,將推動(dòng)結(jié)構(gòu)化新聞的發(fā)展。

      2.機(jī)遇二:媒體“中央廚房”的發(fā)展

      從某種意義上講,結(jié)構(gòu)化新聞的知識(shí)庫(kù)類似于“中央廚房”的新聞稿庫(kù)。雖然“中央廚房”也是以內(nèi)容的生產(chǎn)與傳播為主線的公共平臺(tái),但是,結(jié)構(gòu)化新聞所依托的知識(shí)庫(kù)比目前“中央廚房”的新聞稿庫(kù)更有價(jià)值。其一,建設(shè)“中央廚房”的目的是為了融媒體的發(fā)展,實(shí)現(xiàn)稿件共享。但實(shí)際上,在傳統(tǒng)媒體上發(fā)布的新聞稿件并不適合直接在新媒體平臺(tái)上發(fā)布,在標(biāo)題、報(bào)道風(fēng)格、新聞?dòng)谜Z(yǔ)等方面?zhèn)鹘y(tǒng)媒體和新媒體平臺(tái)有著本質(zhì)不同。而結(jié)構(gòu)化新聞是將新聞故事拆分后使用,拆分得越小獲得的價(jià)值越大,越有利于新媒體平臺(tái)創(chuàng)新組合使用。其二,“中央廚房”的新聞數(shù)據(jù)庫(kù)雖然積累和共享新聞報(bào)道中的事實(shí)、理論和背景材料,但它并不能有效地對(duì)事件間彼此的關(guān)系和邏輯進(jìn)行識(shí)別和保存。結(jié)構(gòu)化新聞的發(fā)展將促進(jìn)媒體的“中央廚房”發(fā)揮更大的作用,兩者相輔相成,共同發(fā)展。

      3.挑戰(zhàn)一:技術(shù)和編輯

      盡管在技術(shù)上捕獲和存儲(chǔ)新聞的結(jié)構(gòu)化事件和故事數(shù)據(jù)的能力在不斷提高,但有些問(wèn)題仍未完全解決。例如目前對(duì)新聞事件的分詞系統(tǒng)切割文本的“碎片”還不夠細(xì);以事件驅(qū)動(dòng)的結(jié)構(gòu)化新聞的文本碎片構(gòu)造和NLG模版邏輯的設(shè)計(jì)比目前流行的機(jī)器人寫作所使用的NLG模版要復(fù)雜得多。[13]來(lái)自編輯層面的挑戰(zhàn)可能更大。結(jié)構(gòu)化新聞在生成過(guò)程中離不開(kāi)人的干預(yù),新聞生產(chǎn)應(yīng)從數(shù)字泰勒主義到人機(jī)共生。[14]一方面,新聞的素材是在網(wǎng)絡(luò)上自動(dòng)抓取的,因此最終生成的新聞在事實(shí)性、合法性上都需要經(jīng)過(guò)編輯的二次核查才能被分解再重新利用。[15]另一方面,目前人工對(duì)新聞的“結(jié)構(gòu)化”,即對(duì)結(jié)構(gòu)化事件和故事數(shù)據(jù)的碎片化,比程序?qū)π侣勛詣?dòng)“結(jié)構(gòu)化”的效果要好,準(zhǔn)確率更高。

      4.挑戰(zhàn)二:人才結(jié)構(gòu)和培養(yǎng)

      結(jié)構(gòu)化新聞的發(fā)展必然要求“媒體+科技”。雖然科技具有無(wú)窮無(wú)盡的迷人力量,但媒體要擁抱科技,借助科技力量探索新的內(nèi)容生產(chǎn)方式,就必須要有技術(shù)人才。然而,媒體不是同時(shí)擁有了記者編輯和技術(shù)人員就算大功告成了。技術(shù)人員不了解新聞生產(chǎn),傳統(tǒng)媒體人不了解如何用技術(shù)呈現(xiàn)內(nèi)容。因此,我們的媒體要擔(dān)負(fù)起復(fù)合型媒體人才培養(yǎng)職責(zé),一方面,對(duì)技術(shù)人員既要培訓(xùn)新聞生產(chǎn)流程,也要培養(yǎng)他們的新聞敏感性;另一方面,要培養(yǎng)記者的計(jì)算性思維,讓記者能以軟件開(kāi)發(fā)者思考代碼那樣的方式思考新聞。

      五、結(jié)語(yǔ)

      不管結(jié)構(gòu)化新聞未來(lái)發(fā)展如何,把非結(jié)構(gòu)化的文本、聲音和圖像等進(jìn)行結(jié)構(gòu)化,形成知識(shí)庫(kù),卻是一件非常有意義的事情。凱文·凱利認(rèn)為,被抓住的每一個(gè)機(jī)遇都會(huì)引發(fā)至少兩個(gè)新的機(jī)遇。[16]自動(dòng)化新聞只是這些結(jié)構(gòu)化數(shù)據(jù)的應(yīng)用之一,其他的應(yīng)用,如智能語(yǔ)音聊天、智能商業(yè)、政府智能應(yīng)用等,都可能驅(qū)動(dòng)這些結(jié)構(gòu)化數(shù)據(jù)平臺(tái)的發(fā)展。例如在智能醫(yī)療中,通過(guò)對(duì)病歷信息結(jié)構(gòu)化后所獲得的數(shù)據(jù)進(jìn)行分析,可以發(fā)現(xiàn)病情與食物之間的相關(guān)性?!爸亟M”(remixing)產(chǎn)生價(jià)值。圣塔菲研究所的經(jīng)濟(jì)學(xué)家布萊恩·亞瑟(Brain Arthur)認(rèn)為“所有的新技術(shù)都源自于已有技術(shù)的組合”。適用于經(jīng)濟(jì)增長(zhǎng)和技術(shù)增長(zhǎng)的事實(shí)同樣也適用于媒介發(fā)展。

      猜你喜歡
      知識(shí)庫(kù)結(jié)構(gòu)化數(shù)據(jù)庫(kù)
      促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
      結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
      基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
      數(shù)據(jù)庫(kù)
      高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      數(shù)據(jù)庫(kù)
      基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
      基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
      隆回县| 天气| 芦溪县| 宜川县| 囊谦县| 社会| 比如县| 轮台县| 东兰县| 五台县| 肃宁县| 蛟河市| 清苑县| 瑞昌市| 沙田区| 余干县| 卢湾区| 平乡县| 景宁| 前郭尔| 延寿县| 定州市| 克东县| 泸溪县| 防城港市| 揭西县| 南开区| 洪洞县| 许昌县| 军事| 汽车| 格尔木市| 凤山市| 通山县| 芮城县| 陆川县| 南川市| 闻喜县| 隆德县| 公主岭市| 榆树市|