• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      大數(shù)據(jù)環(huán)境下微信公眾平臺(tái)非結(jié)構(gòu)化數(shù)據(jù)融合研究

      2015-07-20 09:41:38郭春霞
      現(xiàn)代情報(bào) 2015年8期
      關(guān)鍵詞:結(jié)構(gòu)化公眾微信

      郭春霞

      (濱州學(xué)院圖書館,山東濱州256600)

      大數(shù)據(jù)環(huán)境下微信公眾平臺(tái)非結(jié)構(gòu)化數(shù)據(jù)融合研究

      郭春霞

      (濱州學(xué)院圖書館,山東濱州256600)

      〔摘 要〕微信公眾平臺(tái)具有開(kāi)源、發(fā)布及時(shí)的特點(diǎn),目前它已經(jīng)成為各機(jī)構(gòu)發(fā)布信息的重要渠道。但這類數(shù)據(jù)又具有非結(jié)構(gòu)化、無(wú)語(yǔ)義描述的特點(diǎn),如何將微信公眾平臺(tái)從非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為可分析、判斷的結(jié)構(gòu)化數(shù)據(jù),成為一個(gè)亟須解決的問(wèn)題。針對(duì)該問(wèn)題,本文提出一個(gè)對(duì)微信公眾平臺(tái)結(jié)構(gòu)化數(shù)據(jù)監(jiān)測(cè)的層次體系。這一方法將通過(guò)數(shù)據(jù)融合方式,從平臺(tái)資源中抽取數(shù)據(jù),構(gòu)建結(jié)構(gòu)化數(shù)據(jù)庫(kù),進(jìn)行權(quán)重比較,判斷情報(bào)價(jià)值,進(jìn)而實(shí)現(xiàn)對(duì)研究領(lǐng)域的態(tài)勢(shì)監(jiān)測(cè)。

      〔關(guān)鍵詞〕微信公眾平臺(tái);非結(jié)構(gòu)化數(shù)據(jù);同型異源數(shù)據(jù);異型異源數(shù)據(jù);同型同源數(shù)據(jù);數(shù)據(jù)融合;態(tài)勢(shì)監(jiān)測(cè)

      由于手機(jī)終端設(shè)備越來(lái)越智能化,3G手機(jī)、4G手機(jī)以及WiFi的普及為網(wǎng)民提供了更為優(yōu)質(zhì)的上網(wǎng)環(huán)境,微信成為人們交流和傳播信息最廣泛的平臺(tái)。2015年2月3日CNNIC(中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心)發(fā)布的第35次《中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2014年12月,我國(guó)手機(jī)網(wǎng)民規(guī)模達(dá)6.49億人,手機(jī)網(wǎng)民為5.57億人,手機(jī)即時(shí)通信使用率為91.2%[1]。2011年1月21日,騰訊公司推出微信,支持發(fā)送語(yǔ)音輸入、小視頻、實(shí)時(shí)對(duì)講機(jī)、圖片和文字等功能,適合大部分智能手機(jī),截至2014年7月,已有超過(guò)3億人使用。手機(jī)微信成為一個(gè)生活方式[2]。

      2012年8月,騰訊公司推出致力于為機(jī)構(gòu)或個(gè)人提供服務(wù)拓展、品牌推廣渠道的微信公眾平臺(tái),其核心理念為“再小的個(gè)體,也有自己的品牌”[3]。公眾平臺(tái)從推出至今,通過(guò)不斷豐富、完善自身的功能,用戶遍布社會(huì)知名人士、商業(yè)團(tuán)體、企事業(yè)單位、政府機(jī)構(gòu)等眾多領(lǐng)域。每個(gè)公眾平臺(tái)都有所屬組織機(jī)構(gòu)發(fā)布的重要信息,在這里人們可以更快、更便捷地了解相關(guān)機(jī)構(gòu)的動(dòng)態(tài)和活動(dòng)。如《圖書情報(bào)工作》期刊截至2015年3月23日,在CNKI中僅列出2015年第3期的全文,沒(méi)有第4期的任何信息,但卻能從其微信公眾平臺(tái)上看到2015年第4期的期刊目錄。

      微信公眾平臺(tái)已經(jīng)成為移動(dòng)設(shè)備中開(kāi)源情報(bào)重要的獲取源之一。這些信息大部分是一種非結(jié)構(gòu)化、無(wú)語(yǔ)義描述的信息。他們的結(jié)構(gòu)不同、內(nèi)容不同、布局不同,這使得從微信公眾平臺(tái)獲取數(shù)據(jù)帶來(lái)難度。如何實(shí)現(xiàn)將微信公眾平臺(tái)非結(jié)構(gòu)化的、自由的信息轉(zhuǎn)化為可計(jì)算的、結(jié)構(gòu)化的數(shù)據(jù),成為開(kāi)源情報(bào)獲取的一個(gè)重要問(wèn)題。

      針對(duì)上述問(wèn)題,筆者提出了一個(gè)針對(duì)微信公眾平臺(tái)結(jié)構(gòu)化監(jiān)測(cè)的層次體系,并基于這一思路設(shè)計(jì)了一個(gè)技術(shù)框架。

      1 微信公眾平臺(tái)的非結(jié)構(gòu)化數(shù)據(jù)類型分析

      隨著移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計(jì)算技術(shù)的迅速發(fā)展,大數(shù)據(jù)時(shí)代已經(jīng)來(lái)臨[4]。非結(jié)構(gòu)化數(shù)據(jù)成為科研的重點(diǎn)對(duì)象。微信公眾平臺(tái)是一個(gè)多種信息資源交互的平臺(tái),數(shù)據(jù)呈現(xiàn)多重格式,如視頻、音頻、圖像、文檔等,這些數(shù)據(jù)格式呈現(xiàn)明顯的異構(gòu)性,有結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù),還有非結(jié)構(gòu)化的數(shù)據(jù)[5]。筆者將微信公眾平臺(tái)的非結(jié)構(gòu)化數(shù)據(jù)源劃分為3種類型,即同型異源數(shù)據(jù)、異型異源數(shù)據(jù)、同型同源數(shù)據(jù)(見(jiàn)圖1)。

      圖1 微信公眾平臺(tái)非結(jié)構(gòu)化數(shù)據(jù)數(shù)據(jù)源類型劃分

      1.1同型異源數(shù)據(jù)

      不同微信公眾平臺(tái)相同類型的數(shù)據(jù),為同型異源數(shù)據(jù)。不同的站點(diǎn)有著不同的信息收集渠道、加工體系和標(biāo)準(zhǔn),不同站點(diǎn)的信息發(fā)布模式均不相同。不同的微信平臺(tái),發(fā)布同一條信息,即使發(fā)布數(shù)據(jù)類型相同,其發(fā)布的具體內(nèi)容、闡述重點(diǎn)也不盡相同,如果利用惟一數(shù)據(jù)源進(jìn)行信息分析,獲得結(jié)論可能會(huì)缺乏全面性,故應(yīng)將多種數(shù)據(jù)整合在一起,進(jìn)行融合分析。

      1.2異型異源數(shù)據(jù)

      在不同的微信公眾平臺(tái)上,由于數(shù)據(jù)不同,就會(huì)導(dǎo)致不同的數(shù)據(jù)呈現(xiàn)形式。同一信息,可以以視頻、HTML頁(yè)面、PDF、Word等形式呈現(xiàn),但表達(dá)的內(nèi)容大致相同,如果對(duì)數(shù)據(jù)進(jìn)行監(jiān)測(cè)研究,僅對(duì)其單一類型進(jìn)行分析,顯然會(huì)導(dǎo)致數(shù)據(jù)分析結(jié)果不全面。我們將這些呈現(xiàn)同一信息的數(shù)據(jù)源進(jìn)行采集,對(duì)其進(jìn)行各種分析、融合,這樣更能得出某信息研究的整體情況。

      1.3同型同源數(shù)據(jù)

      同一微信公眾平臺(tái),數(shù)據(jù)類型雖然有不同的呈現(xiàn)形式,但總有些內(nèi)容不同、文獻(xiàn)類型相同的信息資源,這些信息資源構(gòu)成了每個(gè)公眾平臺(tái)的主體,是整個(gè)信息平臺(tái)存在的基礎(chǔ)。信息源發(fā)布方,可根據(jù)訪問(wèn)者的檢索歷史、瀏覽歷史、近期關(guān)注的各種數(shù)據(jù)進(jìn)行統(tǒng)計(jì)整合,判斷用戶的需求和興趣點(diǎn),從而為機(jī)構(gòu)的項(xiàng)目發(fā)展或者戰(zhàn)略計(jì)劃的調(diào)整提供參考依據(jù)。

      2 微信公眾平臺(tái)非結(jié)構(gòu)化數(shù)據(jù)監(jiān)測(cè)

      通過(guò)對(duì)微信公眾平臺(tái)的非結(jié)構(gòu)化數(shù)據(jù)源數(shù)據(jù)類型劃分可以看出,如果想將這些不同類型、不同內(nèi)容的數(shù)據(jù)進(jìn)行整合、判斷、研究,需要對(duì)這些數(shù)據(jù)進(jìn)行監(jiān)測(cè)。

      2.1微信公眾平臺(tái)數(shù)據(jù)監(jiān)測(cè)思路

      機(jī)構(gòu)在微信公眾平臺(tái)發(fā)布同類信息時(shí),經(jīng)常會(huì)體現(xiàn)出不同的側(cè)重點(diǎn)。這些側(cè)重點(diǎn)便是公眾平臺(tái)所闡述的主體內(nèi)容,而側(cè)重點(diǎn)之間的關(guān)聯(lián)揭示出這一平臺(tái)中其他要點(diǎn)的骨干結(jié)構(gòu),從而體現(xiàn)出這個(gè)平臺(tái)對(duì)于該領(lǐng)域研究人員的意義所在。本文將這些反應(yīng)平臺(tái)信息的側(cè)重點(diǎn)稱為內(nèi)容監(jiān)測(cè)對(duì)象,將側(cè)重點(diǎn)之間的各種關(guān)系稱為對(duì)象關(guān)系。

      將非結(jié)構(gòu)化的數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化的監(jiān)測(cè)數(shù)據(jù),主要思路就是資源的整合和共享。具體操作起來(lái)就是從特定平臺(tái)采集到的信息資源中,提取對(duì)該平臺(tái)有價(jià)值的內(nèi)容作為監(jiān)測(cè)對(duì)象:如調(diào)研數(shù)據(jù)、企業(yè)規(guī)劃、項(xiàng)目成果、科研指標(biāo)等,并通過(guò)語(yǔ)法分析、共現(xiàn)分析、語(yǔ)義計(jì)算等方法,構(gòu)建監(jiān)測(cè)層次體系,實(shí)現(xiàn)對(duì)某研究領(lǐng)域熱點(diǎn)的監(jiān)測(cè)與分析。

      簡(jiǎn)而言之,對(duì)于每一條從微信公眾平臺(tái)上采集到的數(shù)據(jù),利用監(jiān)測(cè)系統(tǒng),通過(guò)關(guān)鍵詞抓取技術(shù),從中抓取嵌在其中的數(shù)據(jù)對(duì)象以及數(shù)據(jù)對(duì)象之間的相互關(guān)系。如“2014年度‘復(fù)印報(bào)刊資料’轉(zhuǎn)載學(xué)術(shù)論文指數(shù)排行榜及重要轉(zhuǎn)載來(lái)源期刊發(fā)布”這一題名,通過(guò)內(nèi)容監(jiān)測(cè)對(duì)象抽取,系統(tǒng)將識(shí)別出“2014年”“復(fù)印報(bào)刊資料”“學(xué)術(shù)論文指數(shù)”,形成了“時(shí)間——對(duì)象——對(duì)象”的結(jié)構(gòu)。通過(guò)對(duì)數(shù)據(jù)監(jiān)測(cè)對(duì)象關(guān)鍵詞的抓取,可以實(shí)現(xiàn)數(shù)據(jù)從非結(jié)構(gòu)化向可計(jì)算的結(jié)構(gòu)化轉(zhuǎn)換。結(jié)合實(shí)際需要,研究人員可以利用轉(zhuǎn)換后的結(jié)構(gòu)化數(shù)據(jù),實(shí)現(xiàn)對(duì)監(jiān)測(cè)目標(biāo)對(duì)象進(jìn)行跟蹤和識(shí)別、熱點(diǎn)內(nèi)容關(guān)注、特定情報(bào)價(jià)值的判斷和提取等功能,從而幫助圖書情報(bào)人員實(shí)現(xiàn)相關(guān)領(lǐng)域的態(tài)勢(shì)捕捉、跟蹤、分析和可視化表述。

      2.2微信平臺(tái)結(jié)構(gòu)化監(jiān)測(cè)層次體系

      通過(guò)上述分析,可細(xì)化為一個(gè)結(jié)構(gòu)化監(jiān)測(cè)的層次體系(如圖2所示)。這一平臺(tái)重點(diǎn)完成結(jié)構(gòu)化監(jiān)測(cè)的4項(xiàng)任務(wù),即確定監(jiān)測(cè)源、多源信息采集、多源數(shù)據(jù)融合以及價(jià)值體現(xiàn)。

      2.2.1確定監(jiān)測(cè)源

      確定監(jiān)測(cè)源是指確定需要監(jiān)測(cè)的領(lǐng)域、站點(diǎn)以及站點(diǎn)之下的目錄。對(duì)于微信公眾平臺(tái)來(lái)講,把需監(jiān)測(cè)相關(guān)機(jī)構(gòu)的數(shù)據(jù)納入目標(biāo)監(jiān)測(cè)范圍,對(duì)其進(jìn)行監(jiān)測(cè)跟蹤。

      2.2.2多源數(shù)據(jù)采集

      多源數(shù)據(jù)采集是指利用多種分布式網(wǎng)絡(luò)定向采集器定期向目標(biāo)站點(diǎn)進(jìn)行采集和收割。將不同呈現(xiàn)形式的數(shù)據(jù)(如視頻、音頻、圖片、文檔等)采集到語(yǔ)義庫(kù)。

      2.2.3多源數(shù)據(jù)融合

      多源數(shù)據(jù)融合是指把通過(guò)不同收集渠道、加工體系和采集模式獲取的具有不同數(shù)據(jù)結(jié)構(gòu)的信息進(jìn)行整合,形成格式統(tǒng)一、應(yīng)用廣泛的數(shù)據(jù)集合。這一過(guò)程稱為多源數(shù)據(jù)融合[6]。把這些數(shù)據(jù)融合匯聚在一起進(jìn)行相關(guān)性分析,可以更全面、更透徹地揭示事物聯(lián)系,尋找新的模式和關(guān)系,從而為市場(chǎng)研發(fā)、商業(yè)模式創(chuàng)新、競(jìng)爭(zhēng)機(jī)會(huì)選擇提供有力的數(shù)據(jù)支撐與決策參考。

      2.2.4價(jià)值體現(xiàn)

      經(jīng)過(guò)對(duì)數(shù)據(jù)進(jìn)行整合分析,可提供熱點(diǎn)跟蹤、態(tài)勢(shì)分析、重要情報(bào)揭示等服務(wù)。

      圖2 微信公眾平臺(tái)結(jié)構(gòu)化監(jiān)測(cè)層次體系

      3 微信平臺(tái)結(jié)構(gòu)監(jiān)測(cè)技術(shù)

      微信公眾平臺(tái)的監(jiān)測(cè),一般需要回答3個(gè)方面的問(wèn)題:確定開(kāi)源情報(bào)需關(guān)注的領(lǐng)域(包括這一領(lǐng)域的重要機(jī)構(gòu)、人物、項(xiàng)目、計(jì)劃、戰(zhàn)略等),通過(guò)監(jiān)測(cè),所獲取的信息資源中是否有需關(guān)注內(nèi)容?如何從眾多信息資源中整合出重點(diǎn)情報(bào),進(jìn)行結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換?對(duì)獲得的情報(bào)內(nèi)容如何梳理,判斷是否有今后的關(guān)注點(diǎn)。

      圍繞這3個(gè)問(wèn)題,筆者基于將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)的融合思路,按照字段映射、字段拆分、數(shù)據(jù)記錄慮重、異構(gòu)數(shù)據(jù)加權(quán)的要求[7],設(shè)計(jì)出上述3個(gè)問(wèn)題的解決方案。構(gòu)建監(jiān)測(cè)本體指導(dǎo)目標(biāo)內(nèi)容監(jiān)測(cè);基于內(nèi)容之間的相互關(guān)系,利用字段拆分、映射、慮重,實(shí)現(xiàn)數(shù)據(jù)從非結(jié)構(gòu)化到結(jié)構(gòu)化的轉(zhuǎn)化;對(duì)整合之后的結(jié)構(gòu)化數(shù)據(jù)進(jìn)行加權(quán)分析、價(jià)值判斷,對(duì)于有價(jià)值的數(shù)據(jù)進(jìn)行分析。

      3.1構(gòu)建監(jiān)測(cè)本體,指導(dǎo)目標(biāo)源監(jiān)測(cè)

      監(jiān)測(cè)目標(biāo)是監(jiān)測(cè)研究團(tuán)隊(duì)希望通過(guò)對(duì)目標(biāo)的監(jiān)測(cè),獲得與本領(lǐng)域重大活動(dòng)相關(guān)的內(nèi)容。由于研究領(lǐng)域各不相同,每個(gè)領(lǐng)域可根據(jù)自己領(lǐng)域的重要機(jī)構(gòu)來(lái)確定自己的監(jiān)測(cè)目標(biāo),構(gòu)建一個(gè)自建數(shù)據(jù)庫(kù),將重要的監(jiān)測(cè)平臺(tái)鏈接切換到數(shù)據(jù)庫(kù)中。利用編程程序,在一定的時(shí)間內(nèi),自動(dòng)提醒監(jiān)測(cè)團(tuán)隊(duì)對(duì)目標(biāo)內(nèi)容的跟蹤,使監(jiān)測(cè)目標(biāo)能夠以結(jié)構(gòu)化表達(dá)。

      3.2針對(duì)個(gè)體微信公眾平臺(tái),實(shí)現(xiàn)網(wǎng)頁(yè)內(nèi)容結(jié)構(gòu)化表示

      確定監(jiān)測(cè)目標(biāo)之后,明確了監(jiān)測(cè)團(tuán)隊(duì)的監(jiān)測(cè)內(nèi)容,抽取嵌入其中的監(jiān)測(cè)對(duì)象,通過(guò)字段映射、拆分、數(shù)據(jù)慮重的方式,對(duì)監(jiān)測(cè)對(duì)象進(jìn)行標(biāo)注、規(guī)范,將自由文本轉(zhuǎn)換為結(jié)構(gòu)化的、可以計(jì)算的數(shù)據(jù),實(shí)現(xiàn)對(duì)微信公眾平臺(tái)研究領(lǐng)域的監(jiān)測(cè)。

      對(duì)于每一條從微信平臺(tái)上采集到的數(shù)據(jù)源(如HTML頁(yè)面、聲像文件等),微信公眾監(jiān)測(cè)平臺(tái)首先通過(guò)信息資源抽取技術(shù),抽取嵌入監(jiān)測(cè)對(duì)象中的目標(biāo)數(shù)據(jù),然后將知識(shí)對(duì)象進(jìn)行字段映射、拆分。將拆分之后的字段,利用數(shù)據(jù)慮重功能,將重復(fù)數(shù)據(jù)進(jìn)行清洗,清洗之后,將最終監(jiān)測(cè)的內(nèi)容進(jìn)行標(biāo)注、規(guī)范,形成一個(gè)結(jié)構(gòu)化化數(shù)據(jù)庫(kù)。基于這些結(jié)構(gòu)化數(shù)據(jù),分析數(shù)據(jù)對(duì)象之間的相互關(guān)系,利用可視化分析軟件,實(shí)現(xiàn)對(duì)目標(biāo)的對(duì)象的識(shí)別、跟蹤、熱點(diǎn)監(jiān)測(cè)、價(jià)值判斷等功能。微信平臺(tái)網(wǎng)頁(yè)內(nèi)容結(jié)構(gòu)化轉(zhuǎn)化流程,見(jiàn)圖3。

      圖3 微信平臺(tái)網(wǎng)頁(yè)內(nèi)容結(jié)構(gòu)化轉(zhuǎn)化流程

      3.3結(jié)構(gòu)化數(shù)據(jù)進(jìn)行加權(quán)分析、價(jià)值判斷

      不同的數(shù)據(jù)類型、不同來(lái)源的數(shù)據(jù),其權(quán)重不同,如科研發(fā)布的視頻與對(duì)該視頻的評(píng)價(jià)的文檔權(quán)重不同,中國(guó)科技部發(fā)布的數(shù)據(jù)與地方情報(bào)所發(fā)布的數(shù)據(jù)。權(quán)重的測(cè)算可以通過(guò)2種方法。一種是專家法,請(qǐng)幾位該領(lǐng)域的專家,憑借其知識(shí)結(jié)構(gòu)與經(jīng)驗(yàn)進(jìn)行判斷,對(duì)數(shù)據(jù)進(jìn)行打分。不同的專家有不同的認(rèn)知,致分值不同,故采用平均值,進(jìn)行排比。另一種我們可以采用實(shí)證統(tǒng)計(jì)的方法,微信公眾平臺(tái)不同于網(wǎng)頁(yè),每條數(shù)據(jù)都可以統(tǒng)計(jì)關(guān)注量,可以分享到其他朋友圈,研究人員可根據(jù)關(guān)注量與分享量進(jìn)行實(shí)證統(tǒng)計(jì)排名。通過(guò)權(quán)重分析,判斷數(shù)據(jù)的價(jià)值,提供態(tài)勢(shì)分析、重要情報(bào)揭示、熱點(diǎn)跟蹤的服務(wù)。

      4 結(jié) 語(yǔ)

      微信公眾平臺(tái)已經(jīng)成為戰(zhàn)略情報(bào)監(jiān)測(cè)的重要資源之一。筆者提出的微信公眾平臺(tái)開(kāi)源情報(bào)的結(jié)構(gòu)化監(jiān)測(cè)的層次體系和簡(jiǎn)單的融合方法,將這些非結(jié)構(gòu)化的數(shù)據(jù)從自由文本轉(zhuǎn)為結(jié)構(gòu)化、語(yǔ)義化的情報(bào)資源,并且利用這些資源實(shí)現(xiàn)科技戰(zhàn)略情報(bào)的監(jiān)測(cè)和跟蹤。在文中,筆者重點(diǎn)對(duì)結(jié)構(gòu)化監(jiān)測(cè)的層次體系、方法技術(shù)框架進(jìn)行了闡述?;谶@一思路,相關(guān)計(jì)算機(jī)技術(shù)人員,可以開(kāi)發(fā)適用于這一領(lǐng)域的“微信公眾平臺(tái)開(kāi)源情報(bào)自動(dòng)監(jiān)測(cè)系統(tǒng)”,根據(jù)監(jiān)測(cè)所得數(shù)據(jù),進(jìn)行從非結(jié)構(gòu)化數(shù)據(jù)到結(jié)構(gòu)化數(shù)據(jù)的轉(zhuǎn)換,實(shí)現(xiàn)對(duì)監(jiān)測(cè)目標(biāo)的態(tài)勢(shì)分析、熱點(diǎn)跟蹤,體現(xiàn)其價(jià)值。

      參考文獻(xiàn)

      [1]中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC).第35次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告[EB/OL].http:∥www.cnnic.net.cn/gywm/xwzx/rdxw/2015/201502/t20150203-51631.htm,2015-03-16.

      [2]微信是一個(gè)生活方式[EB/OL].http:∥weixin.qq.com/,2015-03-07.

      [3]再小的個(gè)體,也有自己的品牌[EB/OL].http:∥www.siteinseo.com/www/mp.weixin.qq.com/,2015-03-09.

      [4]劉智慧,張泉靈.大數(shù)據(jù)技術(shù)研究綜述[J].浙江大學(xué)學(xué)報(bào):工學(xué)版,2014,48(6):957-952.

      [5]李廣建,化柏林.大數(shù)據(jù)分析與情報(bào)分析關(guān)系辨析[J].中國(guó)圖書館學(xué)報(bào),2014,(5):14-22.

      [6]張智雄,張曉林,劉建華,等.網(wǎng)絡(luò)科技信息結(jié)構(gòu)化監(jiān)測(cè)思路和技術(shù)方法實(shí)現(xiàn)[J].中國(guó)圖書館學(xué)報(bào),2014,40(212):4-15.

      [7]化柏林.多源信息融合方法研究[J].情報(bào)理論與實(shí)踐,2013,36,(11):16-19.

      (本文責(zé)任編輯:郭沫含)

      ·研究生園地·

      ·業(yè)務(wù)研究·

      Research on Unstructured Data of WeChat Public Platform on Large Data Environment

      Guo Chunxia
      (Library,Binzhou University,Binzhou 256600,China)

      〔Abstract〕Micro letter public platform has the characteristics of open source and timely release,which has become a important information channel of different institutions.But this kind of data is unstructured and without semantic description.How to change the data from unstructured to analyzed and judged has become an urgent problem.To soleve this problem,the paper proposed a hierarchical reflects of the micro-channel public platform data monitoring.This approach would use data fusion methods,extract data from the platform resources,build a structured database,compare them,judge the value of the information and realize the situation monitoring of research field.

      〔Key words〕WeChat public platform;unstructured data;data fusion;situation monitoring

      作者簡(jiǎn)介:郭春霞(1978-),女,館員,碩士,研究方向:信息分析、文獻(xiàn)計(jì)量,發(fā)表論文8篇。

      收稿日期:2015-04-22

      〔中圖分類號(hào)〕G250.73

      〔文獻(xiàn)標(biāo)識(shí)碼〕A

      〔文章編號(hào)〕1008-0821(2015)08-0141-03

      DOI:10.3969/j.issn.1008-0821.2015.08.027

      猜你喜歡
      結(jié)構(gòu)化公眾微信
      公眾號(hào)3月熱榜
      促進(jìn)知識(shí)結(jié)構(gòu)化的主題式復(fù)習(xí)初探
      公眾號(hào)9月熱榜
      公眾號(hào)8月熱榜
      公眾號(hào)5月熱榜
      結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
      微信
      微信
      微信
      基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
      同江市| 和龙市| 青海省| 安庆市| 漾濞| 陆良县| 彩票| 海安县| 昭平县| 云安县| 清水河县| 普陀区| 华容县| 华蓥市| 天水市| 无为县| 莆田市| 上虞市| 庆元县| 明光市| 崇仁县| 江陵县| 黄梅县| 濮阳市| 孝昌县| 驻马店市| 南召县| 凌海市| 锡林浩特市| 洮南市| 财经| 阜宁县| 新竹市| 马尔康县| 云浮市| 哈密市| 宜城市| 北京市| 望谟县| 南城县| 达日县|