• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      多媒體網(wǎng)絡(luò)輿情語義識(shí)別的關(guān)鍵技術(shù)分析

      2019-12-04 14:34:41許林全民互聯(lián)科技天津有限公司
      數(shù)碼世界 2019年11期
      關(guān)鍵詞:輿情語義特征

      許林 全民互聯(lián)科技(天津)有限公司

      在互聯(lián)網(wǎng)高度發(fā)達(dá)的今天,網(wǎng)絡(luò)環(huán)境比較復(fù)雜,管理難度大,需要借助語義識(shí)別技術(shù)對(duì)網(wǎng)絡(luò)上輿情進(jìn)行有效的監(jiān)督,對(duì)凈化網(wǎng)絡(luò)環(huán)境,維護(hù)網(wǎng)絡(luò)秩序有很大幫助。下面將針對(duì)多媒體網(wǎng)絡(luò)信息特征、識(shí)別技術(shù)及流程展開分析。

      一、語義識(shí)別特征及相應(yīng)流程

      (一)網(wǎng)絡(luò)輿情語義識(shí)別特征

      1.文本信息語義識(shí)別特征

      在多媒體網(wǎng)絡(luò)中,文本信息語義識(shí)別相對(duì)簡(jiǎn)單,主要針對(duì)新聞、推文、評(píng)論等文本形式對(duì)其所要表達(dá)的情感、態(tài)度進(jìn)行識(shí)別。文本信息語義識(shí)別主要有兩種方式:一是檢索、識(shí)別關(guān)鍵詞,在對(duì)文本信息分類上有效率優(yōu)勢(shì);二是通過分析詞句間的聯(lián)系識(shí)別文本語義,主要用于分析文本信息所包含的情感、態(tài)度等特征。文本信息識(shí)別發(fā)展較為成熟,識(shí)別率相較后三者有顯著優(yōu)勢(shì)。

      2.聲音信息語義識(shí)別特征

      通常情況下,聲音信息不單獨(dú)存在,多作為視頻信息的附屬如新聞采訪、自媒體視頻等,由于視頻錄制環(huán)境的復(fù)雜性,聲音信息多存在噪聲,包含更多的情感因素,所以聲音信息識(shí)別要通過優(yōu)化識(shí)別算法實(shí)現(xiàn)環(huán)境噪音的濾除和情感信息識(shí)別。

      3.圖像信息語義識(shí)別特征

      互聯(lián)網(wǎng)中圖像信息多見于文章插圖、新聞配圖、視頻所截取的分幀圖等,所包含的內(nèi)容有人物、文字、背景等。為完整識(shí)別圖像信息,首先要采用人臉識(shí)別技術(shù),對(duì)圖像中人臉進(jìn)行定位并分析其表情,還可以深入發(fā)掘其身份信息;其次要以文字信息識(shí)別技術(shù)為基礎(chǔ)對(duì)對(duì)圖像中文字進(jìn)行識(shí)別;最后還要分析圖像背景信息,重點(diǎn)識(shí)別敏感元素和關(guān)鍵物件。

      4.視頻信息語義識(shí)別特征

      由于視頻既包含分幀圖像還包括字幕、聲音等,在進(jìn)行識(shí)別時(shí)應(yīng)采取降維處理的方法進(jìn)行處理。首先要進(jìn)行鏡頭分割和分幀處理,以圖像信息識(shí)別方式進(jìn)行分析;其次要截取適當(dāng)?shù)溺R頭,使字幕信息能完整顯示。除視頻內(nèi)容識(shí)別外,視頻的分類、檢索也很關(guān)鍵,而視頻指紋概念的提出,有效提高了視頻檢索效率。

      (二)網(wǎng)絡(luò)輿情語義識(shí)別流程

      為了更好識(shí)別視頻、圖像、聲音以及文本的語義,從而實(shí)現(xiàn)網(wǎng)絡(luò)輿情的有效分析和深化應(yīng)用,在掌握識(shí)別技術(shù)的同時(shí)還應(yīng)符合語義識(shí)別的流程。首先進(jìn)行特征識(shí)別,當(dāng)獲取多媒體信息后應(yīng)對(duì)分析其載體形式,并采取不同的識(shí)別方法;其次要對(duì)多媒體信息的語義進(jìn)行識(shí)別,多采用先進(jìn)算法實(shí)現(xiàn)各類信息的深度分析,對(duì)信息的真實(shí)性、所表現(xiàn)的態(tài)度、情感、內(nèi)容以及敏感內(nèi)容進(jìn)行識(shí)別,從而獲取網(wǎng)絡(luò)輿情的真實(shí)語義。

      二、網(wǎng)絡(luò)輿情語義識(shí)別技術(shù)

      (一)文本信息語義識(shí)別技術(shù)

      多媒體網(wǎng)絡(luò)文本信息的語義識(shí)別主要針對(duì)新聞、評(píng)論、網(wǎng)絡(luò)文章等,所采用的的識(shí)別技術(shù)有兩類:一是分詞技術(shù),該技術(shù)通過將文本信息同所具備的中文詞表進(jìn)行比對(duì),從而獲取詞句語義。但由于詞語排序不同語義會(huì)發(fā)生較大變化,這就需要在分詞時(shí)對(duì)語義分歧進(jìn)行處理,要先確定歧義存在的位置,再利用T檢驗(yàn)和雙字耦合度的方法予以消除;二是詞向量模型,主要是對(duì)文本信息進(jìn)行轉(zhuǎn)換,使之能夠被計(jì)算機(jī)所理解,目前多采用基于神經(jīng)網(wǎng)絡(luò)的Word2vec 模型,可實(shí)現(xiàn)詞向量的有效訓(xùn)練,又可分為CBOW和Skip-gram 模型,前者利用上下文對(duì)當(dāng)前詞進(jìn)行預(yù)測(cè),主要用于小型語料庫;后者利用當(dāng)前詞對(duì)上下文進(jìn)行預(yù)測(cè),主要用于大型語料庫。

      (二)圖像信息語義識(shí)別技術(shù)

      由于圖像信息中包含人物、背景、色彩、文字等多種特征信息,而圖像特征的提取是語義識(shí)別的關(guān)鍵,通常采用圖像分割技術(shù)來獲取圖像特征信息,常用方法有:閾值法、區(qū)域分割法、邊緣檢測(cè)法、小波法分析法、神經(jīng)網(wǎng)絡(luò)法等,各有不同的應(yīng)用優(yōu)勢(shì)和不足,其中,神經(jīng)網(wǎng)絡(luò)法在獲取圖像復(fù)雜特征信息上有較高精度,但是算法較為復(fù)雜,對(duì)數(shù)據(jù)依賴性大,識(shí)別效率較低。邊緣檢測(cè)法主要用于具有鮮明特點(diǎn)、特征易分離的圖像識(shí)別,雖然識(shí)別速率快,但精確度較低。

      (三)聲音信息語義識(shí)別技術(shù)

      主要包含兩類:一是聲音預(yù)處理技術(shù),這對(duì)于提高聲音信息識(shí)別精度尤為關(guān)鍵,具體分為三步:①帶通濾波,可將目標(biāo)音頻外的頻段聲音進(jìn)行過濾,使信噪比提高;②預(yù)加重處理,在數(shù)字濾波器的基礎(chǔ)上予以加重處理,使聲音信號(hào)更加平緩;③分段處理,先對(duì)聲音信號(hào)進(jìn)行分幀處理,由于分幀后可能會(huì)造成不連貫,還要對(duì)分幀的信號(hào)進(jìn)行加窗,常采用漢明窗。二是聲音特征提取技術(shù),對(duì)于聲音特征的提取方法有:基于語音信號(hào)和基于非平穩(wěn)信號(hào)兩種。

      (四)視頻信息語義識(shí)別技術(shù)

      由于視頻中大多為漸變鏡頭,偶爾出現(xiàn)突變鏡頭,在視頻信息處理時(shí),像素點(diǎn)檢測(cè)法可用于漸變和突變鏡頭的區(qū)分,能夠?qū)⑼蛔冪R頭提取出來。漸變鏡頭也要進(jìn)行分幀處理,常用雙閾值檢測(cè)的方法,還要注意確保字幕的完整性,方便語義識(shí)別。此外,關(guān)鍵幀提取對(duì)于減少視頻信息分析工作量有很大幫助。

      三、結(jié)束語

      綜上所述,語義識(shí)別技術(shù)是實(shí)現(xiàn)多媒體網(wǎng)絡(luò)輿情監(jiān)控及預(yù)警的有效手段,面對(duì)復(fù)雜的網(wǎng)絡(luò)環(huán)境,政府應(yīng)加大網(wǎng)絡(luò)監(jiān)管,為人們提供安全、干凈的網(wǎng)絡(luò)環(huán)境。

      猜你喜歡
      輿情語義特征
      語言與語義
      如何表達(dá)“特征”
      不忠誠的四個(gè)特征
      抓住特征巧觀察
      輿情
      中國民政(2016年16期)2016-09-19 02:16:48
      輿情
      中國民政(2016年10期)2016-06-05 09:04:16
      “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
      輿情
      中國民政(2016年24期)2016-02-11 03:34:38
      認(rèn)知范疇模糊與語義模糊
      線性代數(shù)的應(yīng)用特征
      河南科技(2014年23期)2014-02-27 14:19:15
      长岭县| 奉化市| 嘉禾县| 台北县| 景宁| 浠水县| 瑞金市| 怀柔区| 常山县| 信阳市| 体育| 和静县| 公主岭市| 封开县| 临泽县| 宜昌市| 疏勒县| 太仆寺旗| 黔江区| 洞口县| 安徽省| 马尔康县| 华容县| 海口市| 修文县| 敦化市| 台东市| 顺昌县| 滁州市| 蛟河市| 普安县| 十堰市| 阳新县| 宣汉县| 威海市| 贡山| 肇庆市| 兴和县| 招远市| 乌拉特后旗| 杨浦区|