• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      淺談全媒體內(nèi)容庫的內(nèi)容挖掘與可視化

      2018-08-17 07:27:42郭海程大川
      中國(guó)傳媒科技 2018年7期
      關(guān)鍵詞:提取

      文/郭海 程大川

      1.全媒體內(nèi)容服務(wù)的新需求

      全媒體內(nèi)容庫是融合媒體平臺(tái)的重要組成部分,通過全媒體內(nèi)容庫可實(shí)現(xiàn)跨媒體的內(nèi)容資源管理,整合全臺(tái)在線全媒體內(nèi)容資源。通過構(gòu)建全媒體內(nèi)容庫,還可以實(shí)現(xiàn)全臺(tái)內(nèi)容的統(tǒng)一檢索、統(tǒng)一共享和快速調(diào)用,真正激活臺(tái)內(nèi)現(xiàn)有的媒資及各種業(yè)務(wù)系統(tǒng)內(nèi)的媒體內(nèi)容資源,為全媒體融合生產(chǎn)、全媒體指揮策劃和內(nèi)容運(yùn)營(yíng)提供內(nèi)容支撐。當(dāng)前,廣電融合媒體平臺(tái)建設(shè)如火如荼,在新的技術(shù)平臺(tái)和業(yè)務(wù)架構(gòu)下,媒體內(nèi)容管理的對(duì)象、流程,以及提供內(nèi)容服務(wù)的方式也隨之變化。

      用戶需要提供更加豐富的內(nèi)容發(fā)現(xiàn)手段,不僅僅是分類查找、全文搜索。在用戶有明確目的查找內(nèi)容的時(shí)候,要能使用戶隨時(shí)隨地通過各種搜索手段獲得準(zhǔn)確的內(nèi)容。在用戶沒有明確目標(biāo)的時(shí)候,達(dá)到“想你所想”的內(nèi)容響應(yīng),在服務(wù)形式上化被動(dòng)為主動(dòng),將內(nèi)容與用戶需求相結(jié)合,為用戶提供精準(zhǔn)、貼合的內(nèi)容分析服務(wù)。

      原有內(nèi)容再造,是傳統(tǒng)媒體在內(nèi)容上的核心競(jìng)爭(zhēng)力,[1]全媒體內(nèi)容庫需要為用戶提供更多的內(nèi)容可視化分析工具,讓用戶通過內(nèi)容可視化工具,更多維度的去理解內(nèi)容庫中的內(nèi)容,讓內(nèi)容的分析、內(nèi)容挖掘更加簡(jiǎn)單、易用、直觀,讓用戶進(jìn)行交互式、可視化的內(nèi)容探索。

      2.內(nèi)容可視化技術(shù)研究與應(yīng)用

      全媒體內(nèi)容庫以大數(shù)據(jù)、人工智能等先進(jìn)技術(shù)為支撐,進(jìn)行媒體內(nèi)容服務(wù)的創(chuàng)新,通過對(duì)全媒體內(nèi)容進(jìn)行標(biāo)簽提取,基于內(nèi)容標(biāo)簽進(jìn)行內(nèi)容的深度分析、計(jì)算,實(shí)現(xiàn)對(duì)內(nèi)容庫媒體內(nèi)容的挖掘,包括索引、關(guān)鍵詞提取、自動(dòng)摘要、分類、聚類、情感分析、關(guān)聯(lián)計(jì)算等,對(duì)得到的分析計(jì)算結(jié)果進(jìn)行解釋和表示。最終,通過內(nèi)容可視化的方式為用戶提供更友好、更準(zhǔn)確的內(nèi)容服務(wù)。

      2.1 全媒體內(nèi)容的特征提取及計(jì)算

      全媒體內(nèi)容庫中的內(nèi)容種類包括文本、圖片、音頻、視音頻等,全媒體內(nèi)容包含多種維度的描述內(nèi)容的特征,對(duì)于這些特征的提取,是分析、挖掘全媒體內(nèi)容的基礎(chǔ)。

      2.1.1 文本特征提取

      全媒體內(nèi)容庫通過自然語言處理技術(shù),實(shí)現(xiàn)對(duì)文本內(nèi)容的分析,包括詞性分析、關(guān)鍵詞提取、自動(dòng)摘要、情感分析等,從而提取文本的相關(guān)特征。

      2.1.2 圖像特征提取

      通過人工智能圖像技術(shù),將內(nèi)容庫中的圖像內(nèi)容自動(dòng)生成相應(yīng)的文字描述,描述的特征范圍涵蓋場(chǎng)景描述、物體分類、人物、地標(biāo)、熱詞等,可以提取對(duì)不同維度、不同層次的圖片內(nèi)的語義特征信息。[2]抽取相關(guān)的特征向量后,形成代表該圖像的多維特征向量,通過向量計(jì)算,在特征向量空間中比較、分析各圖像特征向量之間的距離或相似關(guān)系,完成對(duì)圖像內(nèi)容相關(guān)分析計(jì)算,從而讓系統(tǒng)獲得高層次的對(duì)圖像的理解。

      2.1.3 視頻特征提取

      通過人工智能的視頻處理技術(shù),對(duì)內(nèi)容庫中的視頻進(jìn)行智能分析,分析的視頻內(nèi)容包括視頻內(nèi)的語音、文字、人臉、物體、場(chǎng)景等多種維度內(nèi)容,提取描述視頻內(nèi)容的特征信息。特征內(nèi)容包括視頻的分類、人物、語音識(shí)別文字、物體、字幕、標(biāo)題、彈幕文字內(nèi)容等。

      2.1.4 音頻特征提取

      通過人工智能技術(shù),對(duì)內(nèi)容庫中的音頻進(jìn)行智能分析。音頻挖掘通常有兩種方式:將音頻中的語音識(shí)別成文字,再對(duì)文字信息進(jìn)行特征提?。粡囊纛l中提取音樂特征,例如音調(diào)、旋律,以及說話人的聲紋特征,提取人物等。通過分析獲得的音頻特征,進(jìn)行音頻內(nèi)容的相關(guān)內(nèi)容分析計(jì)算。

      2.2 基于標(biāo)簽的內(nèi)容分析

      所謂標(biāo)簽,既上述媒體內(nèi)容的特征,通過一些標(biāo)簽描述、代表某一內(nèi)容,這個(gè)內(nèi)容可以是全媒體內(nèi)容庫中的任何內(nèi)容,包括互聯(lián)網(wǎng)匯聚、通聯(lián)稿件、報(bào)題、選題、報(bào)道等。對(duì)比傳統(tǒng)“分類”的概念,一個(gè)內(nèi)容往往只屬于幾個(gè)固定的分類,但可以擁有許多個(gè)不同維度的內(nèi)容描述標(biāo)簽。同時(shí),“分類”的定義相對(duì)固定,數(shù)量有限,而標(biāo)簽則是數(shù)量無上限擴(kuò)展,自由添加,并且標(biāo)簽具有時(shí)效性。全媒體內(nèi)容庫中的內(nèi)容大爆炸給標(biāo)簽帶來了用武之地,通過內(nèi)容標(biāo)簽可以對(duì)全媒體內(nèi)容庫中的海量?jī)?nèi)容進(jìn)行多維度的管理。

      通過標(biāo)簽進(jìn)行內(nèi)容分析,讓系統(tǒng)、用戶可以更多維度、更深地理解內(nèi)容,抽取全媒體內(nèi)容的具有表意性、顯著性的特征、特點(diǎn),形成描述該全媒體內(nèi)容的標(biāo)簽。

      可以解決使用者對(duì)海量全媒體內(nèi)容的“發(fā)現(xiàn)”的需求。內(nèi)容庫中,海量的全媒體內(nèi)容,使用者要想快速、方便的找到自己需要的內(nèi)容,通過內(nèi)容標(biāo)簽是最方便、可靠地方式。對(duì)于全媒體內(nèi)容庫的使用者,標(biāo)簽?zāi)軌蛴行У剡M(jìn)行內(nèi)容整理、組織和管理。

      標(biāo)簽有助于用戶挖掘全媒體內(nèi)容庫中的內(nèi)容價(jià)值,通過人工智能技術(shù)挖掘得到不同維度的內(nèi)容標(biāo)簽,使用戶進(jìn)行探索式內(nèi)容挖掘成為可能,用戶可以從不同角度通過可視化的方式,觀察內(nèi)容庫中的內(nèi)容,發(fā)掘更深度的內(nèi)容價(jià)值。

      2.3 多種媒體內(nèi)容的可視化應(yīng)用

      對(duì)于全媒體內(nèi)容庫中的內(nèi)容可視化,處理的數(shù)據(jù)類型涵蓋文本、多維、視音頻、時(shí)空數(shù)據(jù)等,采用的顯示方法包括標(biāo)準(zhǔn)的2D/3D圖表顯示、圖像化顯示、列表顯示、地圖顯示等。

      多維數(shù)據(jù)可視化分析的目標(biāo)是發(fā)現(xiàn)多維數(shù)據(jù)分布規(guī)律,尋求不同維度之間的邏輯關(guān)系,通常采用的顯示方法包括曲線圖、折線圖、散點(diǎn)圖、餅圖、柱狀圖、雷達(dá)圖、熱力圖等圖表顯示方法。

      文本內(nèi)容的可視化,常用的可視化技術(shù)是標(biāo)簽云,[3]它直接抽取文本中的關(guān)鍵詞并將其按照一定的順序和規(guī)律整齊美觀地呈現(xiàn)在屏幕上。關(guān)鍵詞在文本中有分布的差異,有的出現(xiàn)的頻率高,有的出現(xiàn)的頻率低,有的重要性高,有的重要性低,可以利用字體的大小和顏色的醒目度反映文本中各個(gè)關(guān)鍵字的差異,越是重要、出現(xiàn)頻率高的關(guān)鍵詞可以采用較大、顏色較醒目的字體。

      2.4 探索式可視化的內(nèi)容分析

      可視化的自助式內(nèi)容探索工具,輔助用戶通過可視化的方式分析、挖掘內(nèi)容,產(chǎn)出對(duì)內(nèi)容生產(chǎn)有價(jià)值的洞察。整個(gè)內(nèi)容挖掘“可視化”的過程,用戶根據(jù)需求簡(jiǎn)單進(jìn)行拖拽式、交互式操作即可完成,多種展示形式,秒級(jí)響應(yīng)。讓用戶能夠以最直觀的方式發(fā)現(xiàn)一些內(nèi)容背后潛在的相關(guān)性。

      (1)內(nèi)容分布分析工具,通過內(nèi)容的屬性、標(biāo)簽等,用戶可以通過工具自助地進(jìn)行內(nèi)容分析、統(tǒng)計(jì),提供多種可視化組件,使用戶以最直觀的方式了解內(nèi)容庫中的內(nèi)容。

      (2)熱點(diǎn)內(nèi)容挖掘工具,通過可視化工具可以直觀地發(fā)現(xiàn)當(dāng)前熱點(diǎn),再通過熱點(diǎn)進(jìn)行下鉆,分析、挖掘與熱點(diǎn)相關(guān)的內(nèi)容??梢酝ㄟ^選擇不同領(lǐng)域,包括時(shí)政、經(jīng)濟(jì)、體育、民生、影視等,更加專注地挖掘熱點(diǎn)內(nèi)容。

      (3)主通過對(duì)海量?jī)?nèi)容的智能挖掘關(guān)聯(lián),自動(dòng)聚合生成事件專題、人物專題、自定義專題等。通過可視化的對(duì)內(nèi)容聚類分析結(jié)果的呈現(xiàn),幫助用戶挖掘潛在的內(nèi)容,為選題決策、內(nèi)容生產(chǎn)提供智能支持。

      (4)詞云分析工具,以所選范圍內(nèi)的內(nèi)容相關(guān)的標(biāo)簽數(shù)據(jù)為分析基礎(chǔ),以詞云的方式對(duì)標(biāo)簽數(shù)據(jù)進(jìn)行展示,用最直觀的方式為業(yè)務(wù)人員展示輿情關(guān)鍵詞、新聞關(guān)鍵詞、評(píng)論關(guān)鍵詞等。

      (5)情感分析工具,通過對(duì)評(píng)論、輿情內(nèi)容的智能分析,利用先進(jìn)的深度學(xué)習(xí)技術(shù),實(shí)現(xiàn)內(nèi)容的精準(zhǔn)挖掘,針對(duì)媒體領(lǐng)域特點(diǎn)進(jìn)行情感正負(fù)面判斷,提取與用戶相關(guān)的高價(jià)值信息。[4]

      3.全媒體內(nèi)容庫構(gòu)建的核心模塊

      全媒體內(nèi)容庫致力于打造出大容量、多種類、可學(xué)習(xí)、可交互的智能化內(nèi)容管理引擎,通過全媒體內(nèi)容服務(wù)平臺(tái),可以充分吸收多種渠道海量匯聚的內(nèi)容,經(jīng)過內(nèi)容整理后,實(shí)現(xiàn)內(nèi)容的精準(zhǔn)查詢、關(guān)聯(lián)檢索、可視化分析等。同時(shí),還可以根據(jù)對(duì)自有內(nèi)容的數(shù)據(jù)挖掘,通過建模,自動(dòng)形成主題事件庫、知識(shí)庫等面向業(yè)務(wù)的輔助決策、輔助生產(chǎn)、輔助發(fā)布的內(nèi)容池。核心模塊包括以下幾方面。

      3.1 內(nèi)容處理引擎

      針對(duì)不同類型、不同來源的內(nèi)容,處理引擎對(duì)內(nèi)容進(jìn)行自動(dòng)化處理,進(jìn)行結(jié)構(gòu)化,內(nèi)容處理引擎能力包括:

      內(nèi)容篩選:通過分析內(nèi)容元數(shù)據(jù)、文本信息,以及系統(tǒng)配置信息,設(shè)置內(nèi)容的重要級(jí)別、保密級(jí)別。

      內(nèi)容過濾:內(nèi)容的重復(fù)過濾、垃圾信息過濾、廣告過濾,同時(shí)對(duì)視音頻素材也需要具有過濾功能,對(duì)重復(fù)上傳的視音頻避免重復(fù)入庫。

      內(nèi)容審核:基于敏感詞及特征庫,過濾檢測(cè)內(nèi)容的文本、圖片及視頻。自動(dòng)過濾匯聚素材中的敏感內(nèi)容,并將包含敏感詞的素材放入待發(fā)布區(qū),由人工二次處理。

      字幕檢測(cè)與識(shí)別:從視頻中檢測(cè)到是否有字幕。字幕識(shí)別,對(duì)有字幕的視頻把字幕轉(zhuǎn)換成文字。

      人臉檢測(cè):檢測(cè)是否是某個(gè)特定人的臉,檢測(cè)是否含有人臉。

      視頻標(biāo)簽提?。鹤R(shí)別視頻中的場(chǎng)景、人物、風(fēng)景、建筑、生活物品等,支持不同維度層次的圖像語義信息提取,豐富內(nèi)容標(biāo)簽。

      多格式轉(zhuǎn)換:可將多種音視圖文素材轉(zhuǎn)換為標(biāo)準(zhǔn)的制作格式、碼率,供電視新聞生產(chǎn)網(wǎng)或新媒體調(diào)用。

      3.2 內(nèi)容挖掘引擎

      通過人工智能技術(shù)對(duì)入庫的海量?jī)?nèi)容的屬性、文本、標(biāo)簽等進(jìn)行內(nèi)容挖掘,包括分類、聚類、自動(dòng)關(guān)聯(lián)、實(shí)體名提取、情感分析、標(biāo)簽提取等。

      分類:通過分析內(nèi)容元數(shù)據(jù)、文本信息、內(nèi)容標(biāo)簽,以及分類配置信息,自動(dòng)將入庫內(nèi)容進(jìn)行分類。

      聚類:根據(jù)編目信息、自動(dòng)提取的標(biāo)簽信息,支持文件屬性自動(dòng)辨別分類,元數(shù)據(jù)分析分類,元數(shù)據(jù)自動(dòng)關(guān)聯(lián),話題內(nèi)容相似性聚類,可通過自動(dòng)聚類技術(shù)自動(dòng)聚焦一段時(shí)間內(nèi)網(wǎng)上熱點(diǎn)信息,可自定義需進(jìn)行自動(dòng)聚類運(yùn)算的素材來源和類別。

      自動(dòng)關(guān)聯(lián):新聞稿件相關(guān)內(nèi)容自動(dòng)關(guān)聯(lián),自動(dòng)關(guān)聯(lián)相關(guān)、相似的多媒體素材,形成新聞素材集合,便于編輯制作人員有針對(duì)性地挑選采用,可自定義需進(jìn)行自動(dòng)關(guān)聯(lián)的來源,可靈活配置自動(dòng)關(guān)聯(lián)分析靈敏度。

      實(shí)體名提取,對(duì)內(nèi)容進(jìn)行領(lǐng)域內(nèi)的實(shí)體名提取,包括欄目名、節(jié)目名、主演、主持、導(dǎo)演等領(lǐng)域內(nèi)實(shí)體名;

      情感分析,針對(duì)輿情、評(píng)論,進(jìn)行情感分析。

      標(biāo)簽提?。和ㄟ^分析內(nèi)容的元數(shù)據(jù)及文本信息,自動(dòng)提取內(nèi)容的關(guān)鍵詞,形成內(nèi)容的標(biāo)簽。

      3.3 可視化渲染引擎

      通過靈活使用HTML5技術(shù),適配不同的展現(xiàn)模式,同時(shí)運(yùn)用CSS3的動(dòng)畫特性,結(jié)合媒體內(nèi)容的自身特點(diǎn),以更生動(dòng)、更友好的形式,實(shí)時(shí)呈現(xiàn)隱藏在龐雜媒體內(nèi)容背后的規(guī)律、聯(lián)系。

      總結(jié)

      以全媒體內(nèi)容為基礎(chǔ)的媒體融合業(yè)務(wù),對(duì)內(nèi)容保存和使用需求不再只是以素材和節(jié)目為核心,也不再以人工編目和結(jié)構(gòu)化的數(shù)據(jù)保存為主要手段,而是擴(kuò)展到面向全媒體業(yè)務(wù),涵蓋素材、節(jié)目、電視稿件、兩微內(nèi)容、H5頁面等多種內(nèi)容形態(tài),同時(shí),對(duì)內(nèi)容的編目也以自動(dòng)化的數(shù)據(jù)提取、智能編目、非結(jié)構(gòu)化的原始數(shù)據(jù)保存為主要手段,重視對(duì)原始內(nèi)容數(shù)據(jù)的持續(xù)挖掘。[5]

      以大數(shù)據(jù)、人工智能技術(shù)為基礎(chǔ),重新梳理媒體內(nèi)容服務(wù)的各個(gè)環(huán)節(jié)?;跇?biāo)簽的內(nèi)容分析挖掘,充分發(fā)揮內(nèi)容的最大價(jià)值,最終實(shí)現(xiàn)全臺(tái)內(nèi)容包括媒資、制作,以及電視媒體、廣播媒體、新媒體等多種業(yè)務(wù)體系內(nèi)容的統(tǒng)一檢索和使用,實(shí)現(xiàn)為融合媒體各種業(yè)務(wù)的內(nèi)容支撐。

      猜你喜歡
      提取
      射擊痕跡的尋找和提取
      法制博覽(2016年12期)2016-12-28 18:50:33
      植物基因組DNA提取
      濱州市沾化冬棗核中活性多糖的提取
      綠色科技(2016年20期)2016-12-27 18:10:47
      茶色素生物活性及制備技術(shù)研究進(jìn)展
      木犀草素提取工藝的研究概況
      現(xiàn)場(chǎng)勘查中物證的提取及應(yīng)用
      淺談涂料墻面上汗液手印的顯現(xiàn)和提取
      土壤樣品中農(nóng)藥殘留前處理方法的研究進(jìn)展
      中學(xué)生開展DNA“細(xì)”提取的實(shí)踐初探
      淺析城市老街巷景觀本土設(shè)計(jì)元素的提取與置換
      左贡县| 岢岚县| 托克逊县| 武鸣县| 长治县| 琼海市| 大关县| 镇雄县| 衡山县| 固阳县| 武鸣县| 文山县| 白玉县| 双辽市| 罗田县| 嵊州市| 邵武市| 和顺县| 四会市| 邯郸市| 青冈县| 丽水市| 卫辉市| 紫阳县| 澳门| 依兰县| 凯里市| 眉山市| 江陵县| 巴林左旗| 鄂尔多斯市| 太谷县| 宁阳县| 山西省| 祁连县| 内江市| 和林格尔县| 曲松县| 高陵县| 游戏| 鹰潭市|