• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      從NLG到機(jī)器新聞寫(xiě)作

      2017-11-04 16:23周佳玥
      今傳媒 2017年10期
      關(guān)鍵詞:人工智能

      周佳玥?

      摘 要:隨著人工智能技術(shù)在全行業(yè)的滲透,機(jī)器新聞作為人工智能在傳媒業(yè)的一種應(yīng)用越來(lái)越受到學(xué)界和業(yè)界的關(guān)注。本文梳理了機(jī)器寫(xiě)作的發(fā)展過(guò)程,分析機(jī)器新聞的優(yōu)缺點(diǎn);從機(jī)器新聞發(fā)展的現(xiàn)狀入手,對(duì)機(jī)器新聞的發(fā)展進(jìn)行反思,也對(duì)未來(lái)機(jī)器新聞的發(fā)展提出一些建議。

      關(guān)鍵詞:機(jī)器新聞;人工智能;人機(jī)協(xié)同

      中圖分類(lèi)號(hào):G20 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-8122(2017)10-0018-02

      機(jī)器新聞,被認(rèn)為是人工智能時(shí)代的產(chǎn)物。有研究者將機(jī)器新聞分為廣義和狹義兩個(gè)方面。廣義的機(jī)器新聞是指人工智能技術(shù)在新聞寫(xiě)作、采訪、編輯等新聞活動(dòng)中的具體運(yùn)用;狹義的機(jī)器新聞是指基于數(shù)據(jù)統(tǒng)計(jì)和機(jī)器學(xué)習(xí),運(yùn)用算法,從可識(shí)別的數(shù)據(jù)中提取具有新聞價(jià)值的信息,形成新聞報(bào)道角度,自動(dòng)選擇語(yǔ)詞樣本、新聞報(bào)道模板生成的新聞故事[1]。廣義的機(jī)器新聞運(yùn)用非常廣泛,早期的Google News就是通過(guò)聚合算法進(jìn)行新聞首頁(yè)的自動(dòng)更新和推薦。這種形式可以看作是機(jī)器新聞的雛形。

      狹義的機(jī)器新聞,可以概括為機(jī)器新聞寫(xiě)作。國(guó)外的研究者用一些不同的名稱(chēng)來(lái)表示這種過(guò)程,比如計(jì)算新聞(computational journalism)定義為用來(lái)補(bǔ)充新聞的責(zé)任功能的算法、數(shù)據(jù)和社會(huì)科學(xué)知識(shí)的組合[2]。本文討論的是狹義的機(jī)器新聞,即機(jī)器新聞寫(xiě)作。

      一、從NLG到機(jī)器新聞寫(xiě)作

      (一)機(jī)器新聞寫(xiě)作技術(shù)的發(fā)展

      機(jī)器新聞寫(xiě)作的核心在于自然語(yǔ)言生成(Natural Language Generation)技術(shù)。自然語(yǔ)言生成是指基于非語(yǔ)言輸入自動(dòng)生成自然語(yǔ)言文本的過(guò)程[3],是人工智能和計(jì)算語(yǔ)言學(xué)的分支。

      機(jī)器寫(xiě)作可以追溯到20世紀(jì)五六十年代對(duì)機(jī)器翻譯和生成上下文無(wú)關(guān)文法句子的研究。70年代,在游戲等領(lǐng)域已經(jīng)開(kāi)始應(yīng)用機(jī)器寫(xiě)作,利用該技術(shù)生成游戲文本。80年代,文本規(guī)劃的概念被提出,機(jī)器寫(xiě)作有了更大進(jìn)步,可生成段落甚至篇章。到90年代,基于模板的文本生成算法被提出,文本規(guī)劃器和語(yǔ)言實(shí)現(xiàn)器的出現(xiàn)使得機(jī)器寫(xiě)作在軍事、氣象等更多領(lǐng)域得到了運(yùn)用。

      自然語(yǔ)言生成系統(tǒng)的工作流程與新聞寫(xiě)作的基本模式有許多地方是相符合的[4]。但是直到21世紀(jì)初,機(jī)器寫(xiě)作才進(jìn)入新聞?lì)I(lǐng)域,并且投入市場(chǎng)。2006年,Thomson Reuters集團(tuán)網(wǎng)站宣布使用算法在網(wǎng)站自動(dòng)編寫(xiě)財(cái)政新聞。

      2007年,美國(guó)第一家利用機(jī)器生產(chǎn)新聞的公司——StatSheet誕生。2011年公司改組并改名為Automated Insights。它的主要產(chǎn)品Wordsmith是一個(gè)自然語(yǔ)言生成平臺(tái),使用基于數(shù)據(jù)、定量分析和關(guān)于寫(xiě)作風(fēng)格規(guī)則的人工智能系統(tǒng)來(lái)生產(chǎn)故事。2015年10月,平臺(tái)允許用戶(hù)通過(guò)上傳自己的數(shù)據(jù)和模板來(lái)創(chuàng)作。現(xiàn)在,Automated Insights公司的具體業(yè)務(wù)涉及新聞報(bào)道、數(shù)據(jù)分析、寫(xiě)作程序開(kāi)發(fā)等。用戶(hù)可以直接在電子表格中通過(guò)應(yīng)用程序制作Wordsmith內(nèi)容。根據(jù)Automated Insights官方網(wǎng)站的統(tǒng)計(jì)數(shù)據(jù),2016年該平臺(tái)共生產(chǎn)了超過(guò)15億篇文章,成為世界上最大的內(nèi)容生產(chǎn)商。

      與Wordsmith同年進(jìn)入市場(chǎng)的是Narrative Science公司。它的主要產(chǎn)品為Quill。目前,該公司的重心放在了金融服務(wù)提供商等企業(yè)客戶(hù)上。

      (二)國(guó)內(nèi)機(jī)器新聞寫(xiě)作的應(yīng)用

      國(guó)內(nèi)企業(yè)在機(jī)器新聞寫(xiě)作領(lǐng)域也做出了一系列探索與嘗試。騰訊推出“Dream Writer”,在2015年9月10日發(fā)布了第一篇機(jī)器寫(xiě)作新聞《8月CPI同比上漲2% 創(chuàng)12個(gè)月新高》。這篇稿件從國(guó)家統(tǒng)計(jì)局中獲取數(shù)據(jù),涵蓋高級(jí)統(tǒng)計(jì)師的評(píng)論建議,用時(shí)僅為一分鐘。目前,Dream Writer寫(xiě)作的主要領(lǐng)域是財(cái)經(jīng)和體育。

      同年11月7日,新華社推出“快筆小新”機(jī)器人,為體育部、經(jīng)濟(jì)信息部和中國(guó)證券報(bào)部門(mén)提供新聞稿件。

      2016年,由北京大學(xué)和今日頭條合作研發(fā)的Xiaoming bot在里約奧運(yùn)會(huì)期間發(fā)稿超過(guò)450篇[5]。Xiaoming bot主要應(yīng)用在體育賽事當(dāng)中。技術(shù)上,它是首個(gè)基于文字直播數(shù)據(jù)進(jìn)行新聞生成的系統(tǒng),并在語(yǔ)言情感自適應(yīng)等技術(shù)上實(shí)現(xiàn)了突破。還能夠圖文自動(dòng)關(guān)聯(lián)發(fā)稿,基于大量的圖文數(shù)據(jù)庫(kù),采用機(jī)器學(xué)習(xí)算法,學(xué)習(xí)圖文語(yǔ)義匹配模型,為文本自動(dòng)挑選合適的圖片。

      DT稿王是第一財(cái)經(jīng)媒體實(shí)驗(yàn)室開(kāi)發(fā)的一款自動(dòng)化的新聞寫(xiě)作工具,2015年5月正式推出。它具有信息采集、語(yǔ)義分析、搜索、聯(lián)想等功能,通過(guò)與DT稿王的自動(dòng)寫(xiě)作功能連接,能代替作者完成簡(jiǎn)單而龐大的片段寫(xiě)作。

      南方都市報(bào)社的寫(xiě)稿機(jī)器人“小南”也在2017年1月18日正式上崗,首篇文章為300余字的春運(yùn)報(bào)道。在數(shù)據(jù)自動(dòng)抓取完成之后,這篇報(bào)道的生成只用了不到1秒的時(shí)間。與前面提到的新聞寫(xiě)作機(jī)器人有所不同的是,“小南”并沒(méi)有著力于體育和財(cái)經(jīng)領(lǐng)域,而是聚焦于民生。此外,廣州日?qǐng)?bào)寫(xiě)稿機(jī)器人“阿同”的強(qiáng)項(xiàng)則是分析政府工作報(bào)告。

      二、機(jī)器新聞的優(yōu)勢(shì)與不足

      (一)機(jī)器新聞的優(yōu)勢(shì)

      速度快,準(zhǔn)確性高。機(jī)器新聞自動(dòng)獲取、組織數(shù)據(jù),必然能夠提高新聞報(bào)道的速度和準(zhǔn)確性。在突發(fā)事件中也能一定程度上起到預(yù)警作用。2014年《洛杉磯時(shí)報(bào)》在地震發(fā)生8分鐘后將由地震機(jī)器人自動(dòng)生成的消息發(fā)布在全美媒體上,在一定程度上起到了穩(wěn)定情緒,避免更多人卷入災(zāi)害的作用。

      客觀公正。機(jī)器新聞不帶有人類(lèi)記者的偏見(jiàn)。在沒(méi)有人工干預(yù)的條件下,只是單純地對(duì)數(shù)據(jù)、信息進(jìn)行結(jié)構(gòu)化的輸出。

      個(gè)性化定制。隨著技術(shù)更新,機(jī)器新聞能夠?qū)崿F(xiàn)精準(zhǔn)的個(gè)性化定制,甚至為讀者生成屬于個(gè)人風(fēng)格的報(bào)道。Dream Writer在10月14日發(fā)布的 “常規(guī)版”“研判版”“民生版”3個(gè)不同文風(fēng)版本的稿件說(shuō)明在個(gè)性化定制和推送上是有發(fā)展前景的。endprint

      解放新聞從業(yè)者,擴(kuò)充報(bào)道范圍。機(jī)器新聞寫(xiě)作可以簡(jiǎn)化新聞生產(chǎn)流程,解放新聞從業(yè)者,讓他們一些常規(guī)的報(bào)道中脫離出來(lái)。另一方面,機(jī)器抓取數(shù)據(jù)范圍廣泛,而記者的興趣范圍和精力有限,機(jī)器新聞可以在一定程度上補(bǔ)充記者寫(xiě)稿的局限,擴(kuò)充信息范圍。

      (二)機(jī)器新聞的不足

      模式化、同質(zhì)化傾向明顯。機(jī)器新聞的原理導(dǎo)致了其高度模式化,同質(zhì)化的傾向。Dream Writer的大部分經(jīng)濟(jì)報(bào)道都是統(tǒng)一模式的標(biāo)題,內(nèi)容短小,按照統(tǒng)一模板嵌入不同數(shù)據(jù)。目前機(jī)器新聞寫(xiě)作也主要局限于財(cái)經(jīng)、體育等少數(shù)幾個(gè)領(lǐng)域。

      數(shù)據(jù)的獲取和可信度。數(shù)據(jù)是機(jī)器新聞形成的重要元素,沒(méi)有數(shù)據(jù)就無(wú)法形成報(bào)道。數(shù)據(jù)的價(jià)值和重要性得到重視,對(duì)于數(shù)據(jù)的保護(hù)更多,是否能夠訪問(wèn)到所需要的關(guān)鍵數(shù)據(jù)也是機(jī)器新聞的一個(gè)挑戰(zhàn)。同時(shí),在機(jī)器新聞的報(bào)道中,應(yīng)當(dāng)明確數(shù)據(jù)來(lái)源,讓用戶(hù)有跡可循。由于機(jī)器新聞進(jìn)行數(shù)據(jù)抓取和處理的過(guò)程對(duì)于用戶(hù)來(lái)說(shuō)是一個(gè)“黑箱”,要保證真實(shí)和準(zhǔn)確,應(yīng)該公開(kāi)披露數(shù)據(jù)來(lái)源,使得數(shù)據(jù)和處理結(jié)果更加可信。

      無(wú)法脫離算法和模板的窠臼。機(jī)器新聞現(xiàn)在依然不能脫離算法和模板,無(wú)法進(jìn)行創(chuàng)造。僅僅依賴(lài)于一些定量數(shù)據(jù)進(jìn)行膚淺的展現(xiàn),是遠(yuǎn)遠(yuǎn)不夠的。

      主題單一,缺乏人情味。目前的機(jī)器新聞無(wú)法主動(dòng)發(fā)現(xiàn)新聞,只能通過(guò)已經(jīng)抓取的數(shù)據(jù),通過(guò)算法和模板生成對(duì)某一主題相對(duì)固定的報(bào)道。同時(shí)寫(xiě)作上,機(jī)器新聞故事性不足,缺乏吸引力。

      個(gè)性化的漩渦。個(gè)性化服務(wù)基于用戶(hù)數(shù)據(jù)進(jìn)行分析。但大量相似的內(nèi)容無(wú)法真正滿(mǎn)足用戶(hù)的需求,應(yīng)有的價(jià)值取向不應(yīng)該被算法蒙蔽。一味地追求個(gè)性化而失去態(tài)度和價(jià)值,不是媒體人應(yīng)該提供的服務(wù)。

      三、人機(jī)協(xié)同,彰顯人的價(jià)值

      機(jī)器新聞是新聞生產(chǎn)自動(dòng)化的一個(gè)新階段。無(wú)論是代替記者完成機(jī)械重復(fù)的特定稿件的生產(chǎn),還是和記者協(xié)同合作,互相補(bǔ)充,新聞生產(chǎn)的智能化已經(jīng)是不可避免的趨勢(shì),新聞專(zhuān)業(yè)主義和人的價(jià)值也顯得格外重要。

      機(jī)器新聞的應(yīng)用受到自然語(yǔ)言生成、大數(shù)據(jù)等技術(shù)的限制。盡管近年來(lái),人工智能技術(shù)應(yīng)用的成果在各個(gè)領(lǐng)域迅速滲透,深度學(xué)習(xí)等算法、運(yùn)算能力等技術(shù)有了很大的進(jìn)步,但是自然語(yǔ)言處理的整體水平還不算高,自然語(yǔ)言生成的水平依然有限,現(xiàn)在的機(jī)器寫(xiě)作基本還是“模板+自動(dòng)數(shù)據(jù)填充”的模式。但是未來(lái),機(jī)器在規(guī)律的挖掘、情感的分析和表達(dá)、對(duì)原因的分析方面都有可能得到巨大的提高,機(jī)器新聞很可能會(huì)脫離模板的桎梏,學(xué)習(xí)更多“人性化”的敘事技巧,讓機(jī)器新聞報(bào)道的可讀性更強(qiáng),甚至具有創(chuàng)造力和思考的能力。

      從目前的技術(shù)水平來(lái)看,這還需要一個(gè)過(guò)程。更好地利用機(jī)器新聞,應(yīng)當(dāng)充分利用機(jī)器收集和處理大數(shù)據(jù)的能力,完成基礎(chǔ)性的信息采集和處理工作。在此基礎(chǔ)上,發(fā)揮人本身的價(jià)值,挖掘數(shù)據(jù)背后深層的思想。技術(shù)無(wú)法取代人對(duì)于“新聞價(jià)值”的判斷,缺乏深度思考和人文關(guān)懷的報(bào)道也無(wú)法具備輿論引導(dǎo)的能力。

      當(dāng)前,大部分的機(jī)器新聞在發(fā)布之前,仍然需要經(jīng)過(guò)“人工審核”這一關(guān),機(jī)器無(wú)法完成對(duì)價(jià)值取向的判斷。對(duì)于新聞?dòng)浾邅?lái)說(shuō),機(jī)器新聞的出現(xiàn)未必是對(duì)職業(yè)的沖擊,而是有力的助手。機(jī)器對(duì)數(shù)據(jù)的采集和處理能力可以將記者從繁瑣機(jī)械的信息搜集工作中解放出來(lái),利用機(jī)器處理的結(jié)果進(jìn)行更深層次的思考和挖掘。彭蘭教授指出智媒時(shí)代的三大特征是萬(wàn)物皆媒、人機(jī)共生、自我進(jìn)化[6]。機(jī)器的計(jì)算能力能夠幫助記者尋找選題、搜集信息和數(shù)據(jù),幫助記者完成高水平的報(bào)道。人與機(jī)器當(dāng)相互協(xié)作,形成“人機(jī)協(xié)同”的工作模式,讓技術(shù)更好地為記者和用戶(hù)服務(wù)。

      不論是國(guó)內(nèi)還是國(guó)外,機(jī)器新聞的主要研發(fā)力量還是在掌握技術(shù)的互聯(lián)網(wǎng)科技公司。對(duì)于技術(shù),我們既不應(yīng)盲目追從,也不該躲避抗拒。對(duì)于新技術(shù),傳媒業(yè)應(yīng)該以冷靜的態(tài)度看待,利用技術(shù)帶來(lái)的便利和優(yōu)勢(shì)。機(jī)器新聞從目前的發(fā)展情況來(lái)看,可以用來(lái)替代一些基礎(chǔ)的、繁雜的重復(fù)性工作,但是,離真正的“智能”還有很長(zhǎng)的一段距離。技術(shù)與人,機(jī)器與記者應(yīng)該是互補(bǔ)互存的關(guān)系。正確地利用機(jī)器的能力,發(fā)揮人的所長(zhǎng),是機(jī)器新聞未來(lái)發(fā)展的方向。

      參考文獻(xiàn):

      [1] 李蘇.機(jī)器新聞發(fā)展的市場(chǎng)進(jìn)路及反思——以AutomatedInsights

      公司為例[J].新聞界,2015(18):56-61.

      [2] Hamilton J T, Turner F. Accountability through algorithm: Developing the field of computational journalism[C].Report from the Center for Advanced Study in the Behavioral Sciences, Summer Workshop.2009:27-41.

      [3] Reiter E,Dale R. Building applied natural language generation systems[J]. Natural Language Engineering,1997,3(1):57-87.

      [4] Van D K H A J, Journalist versus news consumer: The perceived credibility of machine written news[C].British Medical Jourrnal,

      2014,2(5147):305.

      [5] 管瓊.“機(jī)器人記者”新聞生產(chǎn)的現(xiàn)狀與趨勢(shì)[J].傳媒,2017(3): 53-55.

      [6] 彭蘭.智媒化:未來(lái)媒體浪潮——新媒體發(fā)展趨勢(shì)報(bào)告(2016)[J].國(guó)際新聞界,2016,38(11):6-24.

      [責(zé)任編輯:思涵]endprint

      猜你喜歡
      人工智能
      人工智能AI
      人工智能
      人工智能之父
      2019:人工智能
      人工智能
      人工智能與就業(yè)
      China’s Artificial Intelligence Revolution
      數(shù)讀人工智能
      人工智能時(shí)代,就業(yè)何去何從
      下一幕,人工智能!
      平舆县| 桂平市| 武陟县| 德惠市| 洛阳市| 广宗县| 绥宁县| 高尔夫| 竹溪县| 临澧县| 吴堡县| 葫芦岛市| 太康县| 巴中市| 南投县| 神木县| 财经| 新民市| 芜湖市| 津市市| 龙川县| 达日县| 青龙| 柳林县| 如东县| 普陀区| 辽源市| 齐齐哈尔市| 利津县| 恩施市| 滨州市| 磐安县| 平定县| 高清| 平昌县| 美姑县| 新津县| 加查县| 辰溪县| 金坛市| 乌鲁木齐县|