• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      面向社會媒體的消費意圖識別:任務(wù)、挑戰(zhàn)與機遇

      2015-05-30 10:48:04付博劉挺
      智能計算機與應(yīng)用 2015年4期

      付博 劉挺

      摘 要:社會媒體是一個基于用戶關(guān)系的信息分享、、傳播以及獲取平臺,并實現(xiàn)即時分享。在社會媒體上產(chǎn)生了大量的用戶發(fā)布的,對于諸如產(chǎn)品購買、喜好等有價值的消費需求信息。這些關(guān)于產(chǎn)品需求的信息表達了人們的各種消費意愿和消費需求。例如,“請推薦一款2,000塊錢左右的諾基亞手機”即為用戶的一種消費需求。類似這樣的信息為公司或企業(yè)提供了有價值的信息。本文以此介紹了面向社會媒體的消費意圖識別這一任務(wù)的誕生背景、要解決的主要問題、面臨的主要挑戰(zhàn)、相關(guān)工作以及未來的研究方向。

      關(guān)鍵詞:消費意圖識別;查詢商業(yè)意圖識別;消費意圖模板;社會媒體

      中圖分類號:TP391.41 文獻標(biāo)識號:A 文章編號:2095-2163(2015)04-

      Consumption Intent Recognition for Social Media: Task, Challenge and Opportunity

      FU Bo, LIU Ting

      (Research Center for Social Computing and Information Retrieval, Harbin Institute of Technology, Harbin 150001,China)

      Abstract: Social media is the platform where people freely share with each other information such as comments, experiences, and an opinion. Among the large amount of posts, some may reveal the users' underlying commercial intention (CI). The consumption intent is a desire or hope for something to purchase. For instance, a post like “Please recommend for me a Nokia mobile phone about 2,000 RMB” may indicate an immediate or future purchase. Such information is valuable for better advertisement services. The paper introduces the problems this task try to resolve, the main challenges of this task, representative emerging work related to this task. After that, the paper proposes several directions that are worth exploring in future.

      Keywords: Consumption Intent; Query Commercial Intent; Consumption Intent Pattern; Social Media

      0 研究背景

      近年來,網(wǎng)絡(luò)數(shù)據(jù)資源呈現(xiàn)幾何式、爆炸式增長,巨量的網(wǎng)絡(luò)數(shù)據(jù)中蘊含著大量的用戶發(fā)布的,對諸如產(chǎn)品購買等有價值的行為信息及個性化需求信息,這些關(guān)于產(chǎn)品類的信息需求表達了人們的各種消費意愿和消費需求。例如,Google、Baidu等搜索引擎查詢?nèi)罩居涗浟巳藗儚幕ヂ?lián)網(wǎng)搜索所需產(chǎn)品的信息;Twitter、新浪微博等社會化媒體平臺的時尚性、廣泛性和互動性能幫助人們即時發(fā)布所需產(chǎn)品的信息;京東商城、淘寶網(wǎng)等電商網(wǎng)站記錄了用戶瀏覽和購買行為。只有充分了解利用用戶的信息和需求,才能做到有的放矢。互聯(lián)網(wǎng)各種不同的媒體上存儲了大量用戶資料、用戶之間的社交關(guān)系以及用戶的行為數(shù)據(jù),如表1所示。

      可以看出,各種不同媒體中所積累的海量用戶信息為構(gòu)建新的社會化應(yīng)用,以及理解人們當(dāng)前和潛在的消費需求帶來了前所未有的新機遇。在如此龐大用戶基數(shù)的支撐下,互聯(lián)網(wǎng)的巨大潛力正日益體現(xiàn),與現(xiàn)實社會的互動滲透更加緊密深入。互聯(lián)網(wǎng)上出現(xiàn)的不同媒體在商業(yè)、生活、政治等各方面,也正發(fā)揮著源自其強大信息傳播的重要作用。截至2014年12月底,我國網(wǎng)絡(luò)購物用戶規(guī)模達到3.61億,較2013年底增加5 953萬人,增長率為19.7%;我國網(wǎng)民使用網(wǎng)絡(luò)購物的比例從48.9%提升至55.7%。根據(jù)艾瑞咨詢預(yù)測,2017年的網(wǎng)絡(luò)購物交易規(guī)模將達到56 340億元,占社會消費品零售總額的比例為15.7%,較2010年提升12.8個百分點。特別是在商業(yè)營銷上,約有51%的消費者在成為企業(yè)品牌的粉絲后,購買該品牌商品的意愿也會相應(yīng)提高5個百分點。可以說,互聯(lián)網(wǎng)上用戶對產(chǎn)品的需求與日俱增,并且形式多種多樣。在經(jīng)濟全球化和信息網(wǎng)絡(luò)化的今天,主動掌握個體興趣偏好和群體消費趨勢等用戶消費需求信息,就可以在市場營銷、產(chǎn)品計劃等實現(xiàn)智能精準(zhǔn)決策,在此背景下,消費意圖(Consumption Intent)識別的相關(guān)技術(shù)應(yīng)運而生。

      表1 互聯(lián)網(wǎng)不同媒體數(shù)據(jù)和對應(yīng)的國內(nèi)外流行站點

      Tab.1 Examples of different media and the corresponding domestic and foreign websites

      1 任務(wù)

      消費意圖,是指用戶表達出的對購買產(chǎn)品服務(wù)等一些商業(yè)消費需求的意愿[1]。消費意圖識別技術(shù)是對帶有消費需求色彩的互聯(lián)網(wǎng)用戶生成的文本或用戶本身行為數(shù)據(jù)進行的分析和整理,通過網(wǎng)絡(luò)的方式挖掘出用戶當(dāng)前或潛在的消費需求。

      面向社會媒體的消費意圖識別的任務(wù)可以分為基于內(nèi)容的消費意圖識別和基于用戶的消費意圖識別。其中,基于內(nèi)容的消費意圖研究包括消費模板的抽取、消費意圖識別以及消費意圖中的消費對象抽取等。具體地,基于內(nèi)容的消費意圖是指導(dǎo)用戶通過互聯(lián)網(wǎng)發(fā)布與購買需求相關(guān)的信息,如:“我想買一部手機,誰能給推薦一下嗎”,即是一個顯式消費意圖內(nèi)容,這里的“手機”即為消費對象;而基于用戶的消費意圖則是指一條信息沒有明確的表達購買產(chǎn)品或服務(wù)的意圖,但通過推理可發(fā)現(xiàn)用戶潛在的商業(yè)需求,間接地表明用戶將來會購買與母嬰用品相關(guān)的產(chǎn)品或服務(wù)。然而到目前為止,關(guān)于消費意圖并沒一個標(biāo)準(zhǔn)的定義及分類體系。通過大量的調(diào)研,即可發(fā)現(xiàn)基于內(nèi)容的消費意圖文本中有意義的信息主要有觸發(fā)詞語(如“想買”)、消費對象等,而基于用戶的消費意圖也會包含有一些用戶歷史行為。下面本文將逐一介紹目前顯式消費意圖識別研究中的主要任務(wù)和主要實現(xiàn)技術(shù)。

      最初的消費意圖識別任務(wù)源自前人對帶有消費意圖的詞語或模板的分析,如“想買”即是帶有消費意圖的模板。隨著互聯(lián)網(wǎng)上大量的帶有消費意圖的文本出現(xiàn),研究者們逐漸從簡單的消費意愿的模板的分析研究過渡到更為復(fù)雜的用戶當(dāng)前需求以及潛在需求的研究。基于此,按照處理角度的不同,可分為基于文本內(nèi)容的消費意圖識別和基于用戶的消費意圖識別。其中,前者處理的文本內(nèi)容包括互聯(lián)網(wǎng)上用戶在搜索引擎輸入的單個查詢、單條微博文本等用戶發(fā)布的內(nèi)容,如微博消費意圖文本“想給兒子買個電動挖掘機”,表明了用戶的消費意愿是想為受眾目標(biāo)“兒子”購買一臺“電動挖掘機”的消費對象;后者處理的對象主要是以用戶為中心,如一個用戶一直對母嬰用品有消費意圖。按時消費意圖的時效不同,可分為現(xiàn)實需求和潛在需求?,F(xiàn)實需求是指已經(jīng)存在用戶當(dāng)前的需求。潛在需求是指消費者雖然有明確意識的欲望,但由于種種原因還沒有明確的顯示出來的需求。

      2 挑戰(zhàn)

      互聯(lián)網(wǎng)用戶的消費意圖識別存在著各種各樣的挑戰(zhàn)。具體地,可將其劃分為三種?,F(xiàn)給出如下論述:

      2.1 網(wǎng)絡(luò)數(shù)據(jù)采集的挑戰(zhàn)

      互聯(lián)網(wǎng)數(shù)據(jù)形式多樣化,不同媒體平臺的用戶和內(nèi)容具有異構(gòu)性,因而針對網(wǎng)絡(luò)數(shù)據(jù)的采集需要就不同類型的內(nèi)容分別進行處理,提取有價值的內(nèi)容信息和用戶行為信息。例如,在線社區(qū)中的用戶信息大部分以超文本標(biāo)記語言(HTML)的網(wǎng)頁方式展現(xiàn),挖掘基于社區(qū)中的用戶消費意圖文本,需要針對HTML這種非結(jié)構(gòu)化的數(shù)據(jù)精準(zhǔn)地抽取出用戶名、用戶發(fā)貼內(nèi)容等元數(shù)據(jù)信息。而社交媒體網(wǎng)站的數(shù)據(jù)挖掘則需要通過采集記錄內(nèi)部系統(tǒng)日志來實現(xiàn),如Facebook的Scribe。因而,在進行消費意圖研究的相關(guān)工作中,都首先需要挖掘出不同媒體中的含有消費意圖的內(nèi)容或具體行為。

      2.2 數(shù)據(jù)稀疏的挑戰(zhàn)

      互聯(lián)網(wǎng)上存在著大量的垃圾信息。例如社會媒體用戶中有33%左右的用戶微博發(fā)布的是自己的狀態(tài)信息,諸如“好無聊怎么辦”,而僅有8.7%的微博內(nèi)容傳達了有價值的信息。由于微博上用戶可以借助個人習(xí)慣的方式表達自己的感受,因而在這些有價值的信息中,微博內(nèi)容信息通常是隨意、零散和有噪聲的。

      2.3 跨社區(qū)的挑戰(zhàn)

      互聯(lián)網(wǎng)上社會媒體、論壇、電商網(wǎng)站等迅速發(fā)展,積累了大量的用戶信息,為社會計算的相關(guān)研究提供了前所未有的海量數(shù)據(jù)。例如,Ding等人[2]基于微博用戶的消費意圖研究電影票房預(yù)測問題。也有學(xué)者分別研究了用戶評價[3]和在線論壇中的用戶[4]消費意圖識別問題。但是這些相關(guān)工作都只關(guān)注面向單個社區(qū)或社交媒體的消費意圖識別問題,這是因為不同媒體的用戶之間往往沒有顯式的鏈接,就使得一個媒體中的用戶與其他媒體的用戶之間是無法進行關(guān)聯(lián)的。此外,雖然每個用戶在不同媒體平臺上擁有不同的用戶信息,但是這些用戶信息在不同的平臺之間是非共享的??梢杂^察到,由于不同媒體平臺在主題以及功能上的不同,用戶的信息碎片化地分布在不同類型的媒體平臺中。

      3 相關(guān)工作

      3.1 消費意圖模板的抽取

      模板(pattern)是自然語言領(lǐng)域中的常見概念,是指從自然語言實例(如短語、句子等)中泛化而來的抽象表達。正因為模板較之實例有著更好的概括和泛化能力,因此被廣泛使用于信息抽取、機器翻譯、自然語言生成等研究中。一個模板通常包含兩部分,即模板詞(patternwords)和模板槽(pattern slots),其中前者可看作模板的常量部分,后者則是模板的變量部分。例如,對于模板“想給[x]買個[y]”,“想給”和“買個”是模板詞,而“[x]”是模板槽。在模板匹配過程中,模板詞必須嚴(yán)格匹配,而模板槽可匹配任意內(nèi)容。這里,通過在模板槽中填充具體內(nèi)容從而生成模板實例的過程稱作模板的實例化(instantiation)。例如,在模板“想買[x]買個[y]”的前后兩個槽中分別填充“兒子”和“iPhone6”,便將上述模板實例化為“想給兒子買個iPhone6”。顯然,一個模板可以實例化為多種不同的實例。

      模板在信息抽取以及自動問答中已然獲得十分廣泛的應(yīng)用,因此這兩個研究方向的許多學(xué)者都曾提出過模板的抽取方法。與這些方向的研究類似,在消費意圖類模板抽取的研究中,一部分學(xué)者使用基于規(guī)則的方法抽取模板。規(guī)則的制定通常要基于一系列的語言分析與預(yù)處理,如詞性標(biāo)注、命名實體識別和句法分析等。相應(yīng)地,制定的復(fù)述規(guī)則也包括詞序列規(guī)則、詞性規(guī)則以及句法規(guī)則等形式。有學(xué)者[3,5]基于規(guī)則和基于圖的方法分別獲取意圖模板。在基于圖的方法中,通過將意圖模板抽取看作為圖上隨機游走過程,而且定義的圖節(jié)點將分別為模板節(jié)點和原始內(nèi)容節(jié)點,其基本想法是,若模板節(jié)點+原始內(nèi)容節(jié)點仍能出現(xiàn)在原始語料中,則該模板為候選模板,進而通過圖迭代的方法獲取最終模板。依據(jù)這一方法抽取得到的愿望模板可如下所示:

      可以看到,基于規(guī)則的方法其缺點在于規(guī)則的可擴展性差,人工編寫規(guī)則的工作量大,成本較高。具體來講,由于人們在語言表述上具有復(fù)雜性和靈活性,規(guī)則的制定過程費時費力且難以覆蓋所有的語言現(xiàn)象。規(guī)則往往依賴于具體語言、領(lǐng)域和文本風(fēng)格,可移植性不好。同時基于規(guī)則的方法代價昂貴,且遷移性差,因此越來越多的研究者開始利用基于統(tǒng)計的方法來識別消費意圖。

      有研究者基于種子實例從產(chǎn)品評價中抽取產(chǎn)品受眾者,即上述模板中的“[x]”。例如,Wang等人[6]將抽取產(chǎn)品受眾者的模板用于產(chǎn)品推薦系統(tǒng)的目標(biāo)人物抽取環(huán)節(jié)。研究中首先為其產(chǎn)品推薦系統(tǒng)設(shè)計了一個受眾人分類體系,然后針對該體系人工編寫少量“種子”實例。比如,對于“I bought my son this phone.”類型的產(chǎn)品評論,其編寫的種子實例為“buy somebody something”。該方法利用種子實例作為輸入,并使用基于boostrapping的方法從產(chǎn)品評論中匹配該種子實例的字符串,進而生成模板。依據(jù)此方法抽取得到的受眾者模板如下所示:

      3.2基于內(nèi)容的消費意圖識別

      Goldberg等[3]首次提出了“buy wish”的概念(即本文定義的顯式消費意圖,如:想買一部手機)。研究是從用戶在互聯(lián)網(wǎng)上發(fā)布的愿望清單和產(chǎn)品評論中的內(nèi)容來識別其中的消費意圖。過程中,即事先人工給定了一些通用的消費意圖規(guī)則模板,比如“I wish for”,而后再利用規(guī)則模板去匹配具有消費意圖的句子。這種方法較為簡單,但基于人工制定模板的匹配方法效果不甚理想,特別是系統(tǒng)的召回率很低。進而,作者提出了基于二元圖方法自動抽取消費意圖模板,如此生成的消費意圖模板表達能力更強,使得系統(tǒng)識別的效果的性能也相對提高,特別是召回率有了顯著的提升。在此基礎(chǔ)上,作者加入了文本中詞匯作為消費意圖識別的特征。盡管采用詞特征比較簡單,但是通過實驗結(jié)果發(fā)現(xiàn)文本中的詞特征對于消費意圖識別是非常有效的。

      Chen和Hsu[4]也提出過相似的概念“Intention Posts”。研究者基于不同領(lǐng)域間消費意圖表達方式相近的假設(shè),即用于學(xué)習(xí)的訓(xùn)練樣本與新的測試樣本近似地滿足獨立同分布的條件。利用這種遷移學(xué)習(xí)(Transfer learning)的思想只需要在一個領(lǐng)域標(biāo)注數(shù)據(jù),并將其應(yīng)用于一個新的沒有任何標(biāo)注的目標(biāo)域數(shù)據(jù)。面對著消費意圖文本中表達意圖的內(nèi)容通常只有一個或幾個關(guān)鍵字,同時數(shù)據(jù)不平衡的問題,作者提出了Co-Class算法 。 首先,利用已有領(lǐng)域的標(biāo)注數(shù)據(jù)構(gòu)建一個分類器,然后將分類器應(yīng)用到目標(biāo)域的無標(biāo)注數(shù)據(jù)中。這樣,在目標(biāo)數(shù)據(jù)中便可以重新形成特征選擇,進而構(gòu)建新的分類器。這兩個分類器將共同對目標(biāo)實施數(shù)據(jù)分類。這一迭代過程運行即直至類別標(biāo)簽對目標(biāo)數(shù)據(jù)標(biāo)注不再改變?yōu)橹?。作者分別在四個領(lǐng)域的語料上進行了遷移學(xué)習(xí)的實驗,而通過實驗則證明了提出的Co-class算法對跨領(lǐng)域遷移學(xué)習(xí)的消費意圖識別任務(wù)是有效的。

      Wang等[7]在不同領(lǐng)域的消費意圖識別任務(wù)上展開了相關(guān)研究。研究提出了基于圖的方法來識別Twitter中表達用戶意圖的內(nèi)容。具體來說,該方法將要分類的Twitter內(nèi)容和意圖關(guān)鍵詞(如:對句子“I want to buy an xbox”中“buy an xbox”即為文中定義的意圖關(guān)鍵詞)作為圖上的節(jié)點,利用意圖關(guān)鍵詞和Twitter句子之間的關(guān)系形成邊和邊權(quán)重來構(gòu)建圖,繼而使用圖傳播算法來完成在不同領(lǐng)域類別上的消費意圖分類。此外,Ding等人[2]提出了基于領(lǐng)域自適應(yīng)卷積神經(jīng)網(wǎng)絡(luò)的微博文本消費意圖識別方法,并將此方法應(yīng)用到了電影票房預(yù)測的任務(wù)上,研究證明,消費意圖特征有助于預(yù)測電影票房,其原因在于用戶對電影的消費意愿能直接反映出用戶購票的活躍度。

      3.3基于內(nèi)容的消費對象識別

      相比而言,已有研究主要針對基于內(nèi)容的消費意圖進行識別,很少研究消費意圖句中的消費對象識別。本文定義消費對象是指消費者提出所需要購買的對象,即某段文本內(nèi)容中所論述的對象。由于廣告商所關(guān)注的正是用戶針對某一消費對象的消費意圖,而也就是這一存在使得消費意圖研究更加突顯其現(xiàn)實重要意義。但目前針對消費意圖對象的相關(guān)研究較少。Wang等人[6]提出了從微博中挖掘趨勢相關(guān)產(chǎn)品的問題。相應(yīng)地即將“趨勢”定義為在微博上被用戶熱烈討論的話題。例如,如果有人在微博上說“最近北京空氣很差”,那么就希望從空氣很差這一趨勢中,挖掘出空氣凈化器,口罩等與之相關(guān)的產(chǎn)品。

      一般而言,現(xiàn)有的研究是從文本內(nèi)容中挖掘產(chǎn)品命名實體[8-10]或是評價對象[11-14]。這里期望能從產(chǎn)品命名實體和評價對象抽取的研究中借鑒一些有價值的和方法,從而對消費對象抽取研究有所啟發(fā)和促進。一方面,事實上產(chǎn)品命名實體抽取的研究屬于命名實體識別的研究范疇。命名實體(Named Entity:NE)挖掘,主要是指從文本中挖掘出人名、地名、機構(gòu)名等。早期命名實體的研究方法是基于人工規(guī)則的算法。近年來,一些機器學(xué)習(xí)的方法被應(yīng)用到命名實體的研究之中。一部分學(xué)者采用基于分布假設(shè)計算詞義相似度,其基本思想是那些傾向于出現(xiàn)在相似的上下文中的詞意思相近,通過人工給定一組實體作為種子,其上下文作為模板并使用迭代的方法獲取了給定目標(biāo)類別下的新實體。以往的產(chǎn)品命名實體識別的研究主要是基于有指導(dǎo)的方法,然而這類方法需要標(biāo)注大規(guī)模的訓(xùn)練語料,由于產(chǎn)品命名實體中詞匯量比較大,新詞頻繁出現(xiàn),經(jīng)常出現(xiàn)縮略語,構(gòu)建足夠訓(xùn)練規(guī)模的產(chǎn)品命名實體訓(xùn)練集是比較困難的。這個問題對于消費對象識別來說同樣存在,由于社會媒體中用戶發(fā)布的內(nèi)容隨意,導(dǎo)致消費對象的成分多不完整,通常由縮略語等代替,故而諸如產(chǎn)品型號類:5s(指iPhone手機的型號5s)這種產(chǎn)品型號邊界未必能夠被識別出來。

      在情感分析中有研究從評論中挖掘用戶的評價對象。一般而言,現(xiàn)有的方法將評價對象的范圍限定在名詞或名詞短語的范疇內(nèi),當(dāng)然并非所有的名詞或名詞短語都是評價對象,因而需要對其進行識別。有研究者基于經(jīng)驗性的規(guī)則[12]或關(guān)聯(lián)規(guī)則的方法找出頻繁出現(xiàn)的評價對象[13-14],然后基于經(jīng)驗性的剪枝方法從中過濾錯誤的評價對象實例。還有學(xué)者將評價對象與產(chǎn)品屬性之間關(guān)聯(lián)起來,即認(rèn)為產(chǎn)品屬性可以作為評價對象的一種表達方式,如對一個手機來講,“手機的像素”是手機的一個屬性,而“觸屏手機”是手機的部件之一。首先,該方法獲取大量的名詞短語作為候選評價對象;繼而采用了某些關(guān)系指示短語(比如“屬性-從性”關(guān)系指示詞:attribute-of)來獲取評價對象,最后利用候選評價對象和關(guān)系指示短語之間的共現(xiàn)關(guān)系,得出該候選評價對象是否是真正的評價對象。

      4 未來的研究方向

      消費意圖識別作為產(chǎn)品推薦和自然語言處理領(lǐng)域的一個重要方向,還有許多有意義的問題值得研究,其中熱點的研究方向和問題主要包括:

      (1)雖然研究者們已經(jīng)提出了多種方法用于消費意圖句的識別、消費意圖模板和消費對象識別等方法。然而總的來看識別出的準(zhǔn)確率較低,仍有許多噪聲數(shù)據(jù)無法過濾,特別是隱性消費意圖識別鮮有研究。因此接下來的一個主要目標(biāo)就是如何找到一種有效的方法對不同平臺中的消費意圖句進行準(zhǔn)確識別。同時,迫切需要其后的研究者把消費意圖識別的各項任務(wù)做細(xì)、做深。尤其是希望能找到一種對于各個平臺或各個不同領(lǐng)域都適用的識別方法。

      (2)目前來看,消費意圖識別的大部分工作都集中在顯式消費意圖識別的研究任務(wù)中。然而與顯式消費意圖識別任務(wù)不同,隱式消費意圖識別的研究任務(wù)也是比較有意義的問題。即在一個用戶表達的文本中,挖掘出潛在的購買目標(biāo)。這方面的研究工作還比較少且仍未臻深入。此外,相對于消費意圖句的識別而言,基于用戶消費意圖的研究也還未展開,尤其是在跨平臺上的研究遠(yuǎn)達到充分和全面。然而總的看來,基于隱式消費意圖的研究和基于用戶的消費意圖研究方面還有許多的問題有待解決。

      (3)消費意圖研究中的評測問題一直是困擾研究者的一個主要問題。因此希望廣大研究者們能夠共同努力,推出一套大家都能認(rèn)可和接受的評測體系和數(shù)據(jù),這樣定會極大的促進本研究的發(fā)展。本文基于內(nèi)容的消費意圖識別中各類實驗大都采用人工評測的方法,基于用戶的消費意圖識別評價中采用了自動評價的方法。由于人工評測主觀性強且費時費力,因此找到一種消費意圖研究的自動評測方法還是非常有必要的。

      (4)消費意圖識別研究在眾多相關(guān)研究中都有很大的應(yīng)用潛力,如有研究是基于消費意圖的電影票房預(yù)測取得了不錯的性能。但這方面具體應(yīng)用的例子仍不多。所以在今后的研究中,應(yīng)該積極探索消費意圖識別在各種實際任務(wù)中的作用,這樣才能更好地推動此項研究深入開展。

      6 結(jié)束語

      社會媒體是一個基于用戶關(guān)系的信息分享、傳播以及獲取平臺,并實現(xiàn)即時分享。這即使得微博成為一個嶄新的信息傳播和用戶交互的方式:一方面,人們通過微博發(fā)布各種消費需求信息,向家人、朋友、同事等尋求幫助,期望從朋友中獲得產(chǎn)品的信息;另一方面,越來越多的用戶也樂于在微博上發(fā)布分享各種感興趣的話題和愛好進行即時分享。因而,迫切需要了解用戶的消費意圖或興趣。消費意圖識別作為產(chǎn)品推薦和自然語言處理領(lǐng)域的一個重要方向,目前的研究還遠(yuǎn)未足夠。因此就需要在已有工作的基礎(chǔ)上進一步鉆研,針對尚且存在的問題展開攻關(guān)。另外,隨著消費意圖識別方法和技術(shù)的逐漸成熟,相應(yīng)研究成果也將更為廣泛地投入到實際應(yīng)用中去,以促進諸如產(chǎn)品推薦、信息抽取、在線廣告以及市場營銷等相關(guān)研究的發(fā)展。

      參考文獻:

      [1] B. Fu, T. LIU. Weakly-supervised Consumption Intent Detection in Microblogs [J]. Journal of Computational Information Systems, 2013, 6(9):2423–2431.

      [2] X. Ding, T. Liu, J. Duan, et al. Mining User Consumption Intention from Social Media Using Domain Adaptive Convolutional Neural Network [C]// Proceedings of AAAI 2015, Austin, Texas,USA:AAAI,2015: 2389-2395.

      [3] J. Ramanand, K. Bhavsar, N. Pedanekar. Wishful Thinking: Finding Suggestions and ‘buy Wishes from Product Reviews. [C]// Proceedings of NAACL HLT 2010 Workshop on Computational Approaches to Analysis and Generation of Emotion in Text, Los Angeles, California:ACL, 2010:54–61.

      [4] A. Goldberg, N. Fillmore, D. Andrzejewski, et al. May all Your Wishes Come True: A Study of Wishes and How to Recognize Them. [C]// Proceedings of NAACL HLT 2009, Boulder, Colorado:ACL, 2009:263–271.

      [5] J. Wang, W. X. Zhao, H. Wei, et al. Mining New Business Opportunities: Identifying Trend Related Products by Leveraging Commercial Intents from Microblogs [C]// Proceedings of EMNLP 2013, Seattle, USA:ACL, 2013:1337–1347.

      [6] Z. Chen, B. Liu, M. Hsu, et al. Identifying Intention Posts in Discussion Forums [C]// Proceedings of HLT- NAACL2013, Atlanda, GA, USA:ACL, 2013:1041–1050.

      [7] J. Wang, G. Cong, X. W. Zhao, et al. Mining User Intents in Twitter: A Semi-supervised Approach to Inferring Intent Categories for Tweets [C]// Proceedings of AAAI 2015, Austin, Texas, USA:AAAI, 2015: 318-324.

      [8] 劉非凡, 趙軍, 呂碧波等. 面向商務(wù)信息抽取的產(chǎn)品命名實體識別研究[J].中文信息學(xué)報, 2006, 20(1):7–13.

      [9] F. Luo, Q. Qiu, Q. Xiong. Introduction to the Product-entity Recognition Task [C]// Proceedings of Web Society (SWS), 2011 3rd Symposium on, Port Elizabeth, South Africa: Web Society,2011:122–126.

      [10] F. Luo, H. Xiao, W. Chang. Product Named Entity Recognition Using Conditional Random Fields [C]// Proceedings of Business Intelligence and Financial Engineering (BIFE) 2011, Wuhan,China:[s.n.],2011:86–89.

      [11] Y. Zhao, B. Qin, S. Hu, et al. Generalizing Syntactic Structures for Product Attribute Candidate Extraction [C]// Proceedings of NAACL 2010, Los Angeles, CA:ACL, 2010:377–380.

      [12] J. Yi, T. Nasukawa, R. Bunescu, et al. Sentiment Analyzer: Extracting Sentiments about a Given Topic Using Natural Language Processing Techniques [C]// Proceedings of ICDM 2003, Melbourne, Florida, USA:ICDM, 2003:427–434.

      [13] Hu M, Liu B. Mining opinion features in customer reviews. [C]// Proceedings of the AAAI 2004. Menlo Park: AAAI Press,2004. 755?760.

      [14] 劉鴻宇,趙妍妍,秦兵,劉挺.評價對象抽取及其傾向性分析.中文信息學(xué)報,2010,24(1):84?88.

      普兰店市| 瑞金市| 德安县| 六盘水市| 北辰区| 高邮市| 全州县| 牡丹江市| 师宗县| 饶河县| 苍梧县| 冕宁县| 大城县| 德保县| 白河县| 监利县| 昌宁县| 上林县| 闻喜县| 东阳市| 新兴县| 湖北省| 大姚县| 海阳市| 建平县| 广河县| 辽源市| 隆林| 庆云县| 寻乌县| 镇安县| 彩票| 云梦县| 扎鲁特旗| 白水县| 潮州市| 阿巴嘎旗| 乾安县| 锦屏县| 兴城市| 陇西县|