凌啟渝+廖勤
“我們的目標不是用機器人取代記者,而是讓機器人解放記者?!?/p>
小明,中國人最普通的名字。從算術(shù)題,到造句講故事,誰都能麻煩到他。不過在里約奧運會上,張小明可真是“高大上”了一回。他的大名變成了《奧運IT小記者張小明》,更有注腳是“基于大數(shù)據(jù)分析、自然語言理解和深度學(xué)習(xí)的人工智能機器人”。
這位機器人記者Xiaomingbot,由今日頭條實驗室與北京大學(xué)計算機所(萬小軍團隊)聯(lián)合開發(fā),結(jié)合了最新的自然語言處理、機器學(xué)習(xí)和視覺圖像處理的技術(shù),通過語法合成與排序?qū)W習(xí),自動生成新聞。
負責(zé)抓取數(shù)據(jù)寫短消息
小明提前一周到奧運“上崗”,任務(wù)是報道乒乓球、網(wǎng)球、羽毛球和女足的賽事。機器人天生勤快,不知勞累,8月14日他一天“寫”了58篇稿件;整個奧運時段發(fā)稿超過450篇。內(nèi)容包括比賽名稱、場地、開賽時間、運動員姓名國籍和年齡、世界排名、比賽持續(xù)時間、大比分、小比分,并能根據(jù)新聞人物添加不同的配圖。除了短訊,小明也能自動撰寫長達千字的賽事報道。
當然,里約奧運會上,小明并不孤單。據(jù)美國財經(jīng)網(wǎng)站《商業(yè)內(nèi)幕》援引科技媒體“數(shù)字趨勢”的報道,《華盛頓郵報》今年打破傳統(tǒng),首次使用“機器人記者”和人類記者一起來報道里約奧運會。
這個機器人名叫“heliograf”,是《華盛頓郵報》自主研發(fā)的一款軟件。其基于一套人工智能算法,先從體育數(shù)據(jù)網(wǎng)站stats.com上抓取需要的數(shù)據(jù),再將其轉(zhuǎn)換成幾個簡短句子的短消息報道,然后把短消息上傳《華盛頓郵報》的直播博客、推特賬戶。此外,郵報還通過facebook messenger的聊天機器人向用戶推送消息,并在亞馬遜的echo上提供音頻版本的消息播送。
在里約奧運會舉行期間,heliograf一般會準備三類消息:每場比賽金、銀、銅三枚獎牌得主、各國獎牌總數(shù)、每日賽事安排。甚至在獎牌產(chǎn)生前的15分鐘,heliograf就能對讀者發(fā)出預(yù)告,提醒讀者關(guān)注比賽結(jié)果。不過,《華盛頓郵報》戰(zhàn)略行動方案總監(jiān)杰里米·吉爾伯特強調(diào),包括記者和heliograf在內(nèi)的所有撰寫的報道都會接受編輯的審核。
講故事寫分析仍需人類
“我們的目標不是用機器人取代記者,而是讓機器人解放記者?!奔獱柌卣f。
吉爾伯特稱,在2012年倫敦奧運會報道中,郵報編輯、記者及相關(guān)內(nèi)容生產(chǎn)者一天12小時緊盯奧運賽事,就為比賽結(jié)果出來后能迅速寫成報道在網(wǎng)上搶發(fā)。整個奧運會大約會產(chǎn)生300多枚金牌,如果沒有數(shù)字化處理工具和人工智能的幫助,那將耗費記者、編輯大量時間,而這些時間完全可以用在其他更有深度、更具洞察力的原創(chuàng)新聞采寫上。
據(jù)悉,在此次里約奧運會報道中,《華盛頓郵報》并非把所有報道任務(wù)都扔給heliograf,郵報的其他記者、編輯同樣會參與報道,只不過各有分工,優(yōu)勢互補。郵報奧運報道團隊大概有20多人,特派里約的記者、編輯約12人,后方留守華盛頓特區(qū)新聞編輯部的超過12人。
“人類記者將負責(zé)故事性報道,發(fā)掘獨家信源、講述有趣故事、分析解讀新聞,這些工作也只有人類可以做到?!奔獱柌卣f。
未來有很多開拓空間
《華盛頓郵報》并非第一個使用機器人記者來生產(chǎn)內(nèi)容的媒體。此前,福布斯網(wǎng)站曾使用自動化寫作服務(wù)公司narrative science的技術(shù)制作財報展望和房地產(chǎn)報告;美聯(lián)社也采用機器寫作軟件automate dinsights寫作大量有關(guān)企業(yè)財務(wù)業(yè)績的新聞和報告。
但是,讓機器人記者采寫奧運新聞,在傳統(tǒng)紙媒中,華郵是第一家。而且,報道奧運只是heliograf“出征”的第一步。吉爾伯特透露,在11月舉行的美國總統(tǒng)大選中,heliograf也將加盟郵報報道組,實時報道大選新聞,比如大選日全國投票站投票率和投票結(jié)果。此前,在大選初選階段,郵報已經(jīng)對heliograf的采集數(shù)據(jù)并采寫消息的“能力”進行了測試。
《華盛頓郵報》報道稱,heliograf還可用來處理整合不同數(shù)據(jù)資源,比如犯罪率和房地產(chǎn)數(shù)據(jù)。對讀者來說,這項技術(shù)還能根據(jù)用戶閱讀習(xí)慣為其定制新聞,使閱讀體驗更具個性化,可基于讀者的地理位置、對主題的熟悉度,甚至年齡和閱讀級別來定制新聞。而對記者而言,heliograf能在記者采寫報道過程中出現(xiàn)異常數(shù)據(jù)時發(fā)出預(yù)警,甚至還能通過數(shù)據(jù)整合能力為記者采寫新聞提供一些新角度。
《華盛頓郵報》數(shù)據(jù)科學(xué)工程總監(jiān)薩姆·漢認為,未來heliograf的功能還有進一步開拓的空間,包括如何拓展報道主題、深化分析性報道采寫、發(fā)現(xiàn)潛在新聞故事等。
看來,機器人寫手不僅是寫個天氣預(yù)報、股市行情那么簡單,在奧運連發(fā)快訊也只是小試身手。百度的度秘就更加專業(yè)化,報道時能與人互動而更顯人性化。它甚至在先前的中美男籃比賽中展示過“資深籃球評論員”的風(fēng)范。而主播風(fēng)格靈活多變的微軟小冰,則依托微軟的人工智能體現(xiàn)了高超的預(yù)測技能。
一個不得不想的問題是,智能機器人逐漸進入尋常百姓家,作者、記者、編者會不會失業(yè)?顯然,雙方都得努力才行。不過,如果法制節(jié)目老有“一個身影進入了刑警的視線”;致富節(jié)目總是“就在她信心滿滿大干一場時,意想不到的厄運降臨”的話,讓機器人學(xué)會這幾句,是“小菜一碟”的。