• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      互聯(lián)網(wǎng)大數(shù)據(jù)的多維度特征數(shù)據(jù)的應用

      2013-09-03 06:32:24吳俊爽韓琴琴劉誠偉
      中國信息化·學術版 2013年7期
      關鍵詞:多維度建模用戶

      吳俊爽 韓琴琴 劉誠偉

      【摘 要】隨著計算機技術和應用飛速發(fā)展,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,網(wǎng)民數(shù)量也成倍的增加,再加之全世界其他各行各業(yè)每分每秒都在制造著大量數(shù)據(jù)。“大數(shù)據(jù)”的概念逐步被人們所重視,本文提出了一種大數(shù)據(jù)的多維度特征表示方法(BDDP),并且積極探討了這種表示方法在互聯(lián)網(wǎng)中的應用,比如:招聘信息挖掘、移動APP的廣泛利用。

      【中圖分類號】TP393.4【文獻標識碼】A【文章編號】1672-5158(2013)07-0117-02

      1、研究背景介紹

      大數(shù)據(jù)具有信息體量巨大、數(shù)據(jù)類型繁多、價值密度低,商業(yè)價值高、處理速度快的4個“V”特點。[1]大數(shù)據(jù)的概念一經提出,科學研究者就發(fā)現(xiàn)大數(shù)據(jù)技術的戰(zhàn)略意義并不在于對掌握龐大的數(shù)據(jù)信息而歡欣鼓舞,而在于對這些含有意義的數(shù)據(jù)進行專業(yè)化處理,即提高對數(shù)據(jù)的“加工處理能力”體現(xiàn)數(shù)據(jù)的“價值”。本文認同,在大數(shù)據(jù)時代下,仍將是以數(shù)據(jù)為中心的SOA模型占領主導地位。故本論文側重對大數(shù)據(jù)本身的處理,而并非對其存儲等架構技術[2]做過多的探討。本論文提出了大數(shù)據(jù)的多維度處理方法,將互聯(lián)網(wǎng)上的大數(shù)據(jù)進行整合處理,并對其應用到互聯(lián)網(wǎng)應用中提出了憧憬和建議。

      2、 大數(shù)據(jù)的多維表示方法(BDDP)

      2.1 互聯(lián)網(wǎng)應用中的大數(shù)據(jù)

      2.1.1 互聯(lián)網(wǎng)中的大數(shù)據(jù)定義

      互聯(lián)網(wǎng)中的大數(shù)據(jù)目前還沒有很明確的定義,本論文特指其是:由互聯(lián)網(wǎng)產品或者網(wǎng)民產生的大量數(shù)據(jù)。如:商品信息、商品價格、用戶信息(位置、好友信息、生活信息)、 音頻、視頻、圖片、網(wǎng)站管理日志、用戶登錄日志 、社交網(wǎng)站中的聊天記錄、博文等等。[3]

      2.1.2 互聯(lián)網(wǎng)用戶產生大數(shù)據(jù)的方式

      目前,互聯(lián)網(wǎng)用戶的主要接入媒介分為:PC和手機、智能平板等移動和不可移動終端。[4]加之互聯(lián)網(wǎng)應用包括:企事業(yè)信息門戶網(wǎng)站、百度等搜索引擎、新浪等新聞網(wǎng)站、APP應用商城、阿里巴巴等電子商務網(wǎng)站、社交網(wǎng)站、騰訊微博、騰訊微信、移動互聯(lián)網(wǎng)應用等。因此本論文認為,大數(shù)據(jù)產生方式有以下:

      1) 新聞、企事業(yè)單位網(wǎng)站的每日新聞、政策公布

      2) 博客用戶針對新聞事件的討論、引用

      3) 移動APP用戶信息匯總(移動終端觸摸行為)

      4) 電子商城用戶行為(鼠標點擊行為)

      5) 社交網(wǎng)站用戶的交流與社交關系

      2.2 BDDP數(shù)據(jù)建模

      2.2.1 BDDP建模的依據(jù)

      互聯(lián)網(wǎng)大數(shù)據(jù)的產生方式是可以根據(jù)2.1.2中進行劃分的,因此能夠準確的了解并掌握不同數(shù)據(jù)的特征與特性。這些數(shù)據(jù)可以是結構化的、半結構化的、非結構化的。

      但是這些數(shù)據(jù)的產生都是基于為用戶服務產生,并且由于用戶不同的參與行為導致數(shù)據(jù)急劇增加,因此用戶行為分析,[5]可以幫助我們進行BDDP數(shù)據(jù)建模。另一方面,互聯(lián)網(wǎng)應用供應商性質,也是決定數(shù)據(jù)性質的一個關鍵因素。

      2.2.2 BDDP建模算法

      1)以新聞事件為中心的大數(shù)據(jù)產生模型

      對某一新聞頭條為中心的大數(shù)據(jù)產生進行建模

      第二層微博、微信、QQ推送記錄為第二層數(shù)據(jù)

      第三層各種互聯(lián)網(wǎng)用戶產生的行為記錄為

      我們還可以在每一層數(shù)據(jù)上加入時間維和地點維,這樣我們不僅可以檢測到該條新聞的傳播影響力,而且可以很清晰的查看到該頭條新聞在某一時所產生的影響,便于新聞歸檔,方便以后查閱。

      2)移動互聯(lián)網(wǎng)APP為中心的大數(shù)據(jù)產生模型

      對某款新的手機APP為中心的大數(shù)據(jù)進行建模圖2 典型的APP事件流動模式

      根據(jù)上圖,本論文將APP產品數(shù)據(jù)記錄建立大數(shù)據(jù)多維特征數(shù)據(jù)

      第一層數(shù)據(jù)

      第二層數(shù)據(jù)

      第三層數(shù)據(jù)

      同理我們可以在每一層數(shù)據(jù)上加上時間維和地點維,便可得到特定時刻某個APP產品的用戶數(shù)量。

      綜上所述,以上僅是兩種典型的模型,不足以代表所有互聯(lián)網(wǎng)大數(shù)據(jù)的產生模式。但是整體看:移動互聯(lián)網(wǎng)大數(shù)據(jù)一致可以分為三層、最多四維的特征數(shù)據(jù),而最后一層數(shù)據(jù)通常又是以一個中心向外輻射的特征數(shù)據(jù)集,由于輻射數(shù)據(jù)集的復雜性才使得互聯(lián)網(wǎng)大數(shù)據(jù)的處理和挖掘變得異常困難。但是上述的大數(shù)據(jù)的多維度特征數(shù)據(jù)維度較少,定義精確,可以那個多層次關聯(lián)規(guī)則數(shù)據(jù)挖掘算法,[6]以較高的效率實現(xiàn)。

      3、 BDDP在互聯(lián)網(wǎng)中的應用

      移動互聯(lián)網(wǎng)的發(fā)展,離不開用戶的支持?,F(xiàn)在很多互聯(lián)網(wǎng)企業(yè)都是利用高瀏覽量來賺取廣告費用。掌握大量數(shù)據(jù)、分析用戶消費行為、引導用戶消費已然成為目前各大互聯(lián)網(wǎng)企業(yè)的重點研究領域。

      前程無憂,應屆生求職網(wǎng)等以發(fā)布招聘信息為主的招聘網(wǎng)站,它并不為用戶提供任何職位,而是求職者和招聘單位的一個溝通橋梁。通過點擊率賺取利潤,這是一種典型的以新聞事件為中心的大數(shù)據(jù)產生模式。

      近期,百度發(fā)布了“明星臉”,是一款手機終端的APP[7],目前該APP功能較單一,就是支持用戶上傳照片,然后識別與用戶相似的明星臉。其實這就是第二種大數(shù)據(jù)產生模式的一個應用。其發(fā)布時間是2013年愚人節(jié)那天,經過APP為中心的數(shù)據(jù)產生模式,很快就有了大量用戶關注。

      從上述的分析可以知道,很多互聯(lián)網(wǎng)公司是憑借大量用戶、擁有大量數(shù)據(jù),靠著模式創(chuàng)新而不是提供產品來獲得利潤。因此掌握互聯(lián)網(wǎng)大數(shù)據(jù)多維特征數(shù)據(jù),有利于互聯(lián)網(wǎng)企業(yè)準確定位,建立正確的盈利模式。

      4、 結束語

      參考文獻

      [1] 百度百科 大數(shù)據(jù)詞條 http://baike.baidu.com/view/6954399. htm 2013-4-5

      [2] 王珊,王會舉,覃雄派,烜周.《架構大數(shù)據(jù):挑戰(zhàn)、現(xiàn)狀與展望》 計算機學報Vol.34 No.10 Oct.2011

      [3] 199IT推薦文章,2012年中國移動互聯(lián)網(wǎng)發(fā)展歷程回顧,2013-4- 3

      [4] 劉三德.互聯(lián)網(wǎng)大數(shù)據(jù)應用之二:用戶行為分析 速途專欄,2012-6-10

      [5] 王璐,唐紅.移動互聯(lián)網(wǎng)用戶行為分析,中國知網(wǎng)Vol.11 2012

      [6] 程繼華,施鵬飛.多層次關聯(lián)規(guī)則的有效數(shù)據(jù)挖掘算法 軟件學報Vol.9,No.12,Dec.1998

      [7] 百度百科,明星臉詞條,http://baike.baidu.com/view/10370916. htm 2013-4-5

      猜你喜歡
      多維度建模用戶
      聯(lián)想等效,拓展建?!浴皫щ娦∏蛟诘刃鲋凶鰣A周運動”為例
      “多維度評改”方法初探
      基于PSS/E的風電場建模與動態(tài)分析
      電子制作(2018年17期)2018-09-28 01:56:44
      不對稱半橋變換器的建模與仿真
      多維度市南
      商周刊(2017年7期)2017-08-22 03:36:22
      關注用戶
      商用汽車(2016年11期)2016-12-19 01:20:16
      關注用戶
      商用汽車(2016年6期)2016-06-29 09:18:54
      關注用戶
      商用汽車(2016年4期)2016-05-09 01:23:12
      如何獲取一億海外用戶
      三元組輻射場的建模與仿真
      武宁县| 隆尧县| 淮南市| 美姑县| 林芝县| 武陟县| 富源县| 长乐市| 盘锦市| 湾仔区| 额济纳旗| 大兴区| 阳东县| 静安区| 山阳县| 平原县| 博客| 赣州市| 龙口市| 澄城县| 遵化市| 丰城市| 镇巴县| 西和县| 石家庄市| 成都市| 拉萨市| 深水埗区| 琼中| 台中县| 宜川县| 冕宁县| 永靖县| 竹溪县| 淮北市| 崇礼县| 湛江市| 宜春市| 五寨县| 旬阳县| 公安县|