• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      基于云計(jì)算的在線4G用戶(hù)行為研究分析

      2015-02-04 09:26馮俊翔等
      電子技術(shù)與軟件工程 2014年22期
      關(guān)鍵詞:means算法引擎云計(jì)算

      馮俊翔等

      伴隨著近幾年“產(chǎn)品經(jīng)理”的火熱起來(lái),“用戶(hù)體驗(yàn)”的設(shè)計(jì)概念被絕大多數(shù)公司企業(yè)所接受。為更好的研究與分析4G時(shí)代下移動(dòng)網(wǎng)絡(luò)用戶(hù)的行為,本文提出了一套新的用戶(hù)行為研究與分析方案。

      【關(guān)鍵詞】云計(jì)算 大數(shù)據(jù) 引擎 K-means算法

      1 引言

      伴隨著當(dāng)今中國(guó)社會(huì)移動(dòng)數(shù)字通信與多媒體需求的發(fā)展,適應(yīng)移動(dòng)數(shù)據(jù)、移動(dòng)計(jì)算及移動(dòng)多媒體運(yùn)作需要的第四代移動(dòng)通信開(kāi)始興起,基于傳統(tǒng)3G時(shí)代下對(duì)用戶(hù)行為的研究與分析已經(jīng)無(wú)法滿足現(xiàn)在運(yùn)營(yíng)商與公司企業(yè)的業(yè)務(wù)需求。因此,為了應(yīng)對(duì)新型移動(dòng)網(wǎng)絡(luò)中用戶(hù)行為的轉(zhuǎn)變和傳輸數(shù)據(jù)量的規(guī)模由TB向PB的轉(zhuǎn)變。在此,提出一種4G用戶(hù)行為研究分析方法。

      2 總體設(shè)計(jì)介紹

      2.1 引擎詳細(xì)介紹

      在本文描述內(nèi)容中,所進(jìn)行的研究和分析都是基于一種傳統(tǒng)云計(jì)算設(shè)計(jì)的用戶(hù)行為分析引擎實(shí)現(xiàn)的,該引擎的優(yōu)點(diǎn)主要有以下幾點(diǎn):

      (1)能夠通過(guò)云計(jì)算完成分布式并發(fā)的大規(guī)模計(jì)算能力。

      (2)能夠構(gòu)建網(wǎng)絡(luò)用戶(hù)端到端的大數(shù)據(jù)挖掘分析系統(tǒng)。以此完成對(duì)DPI 和目標(biāo)用戶(hù)上網(wǎng)行為的深度心理行為分析。滿足國(guó)內(nèi)運(yùn)營(yíng)商和公司企業(yè)對(duì)收集海量網(wǎng)絡(luò)數(shù)據(jù)、研究與分析用戶(hù)行為、確立與執(zhí)行營(yíng)銷(xiāo)策略的三大環(huán)節(jié)的連鎖需求。

      如圖1所示,系統(tǒng)通過(guò)DPI和Web服務(wù)器獲取數(shù)據(jù),在接口層處利用分布式計(jì)算與批量處理模式,將海量數(shù)據(jù)存入Hbase數(shù)據(jù)庫(kù),滿足海量數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)功能。將進(jìn)入數(shù)據(jù)庫(kù)的數(shù)據(jù)用Hive 進(jìn)行整合層和匯總層的ETL 處理,再使用大數(shù)據(jù)中的MapReduce計(jì)算框架設(shè)計(jì)分析模型,最后把經(jīng)過(guò)Hive映射后形成的數(shù)據(jù)庫(kù)表導(dǎo)入前端展現(xiàn)數(shù)據(jù)庫(kù)MySQL。

      2.2 用戶(hù)行為模型

      利用上述模型,我們可以在Hadoop平臺(tái)下為用戶(hù)行為研究分析分布式分析模型。在此將詳細(xì)闡述評(píng)估、用戶(hù)偏好、關(guān)系挖掘三大模型。

      2.2.1 評(píng)估模型

      該模型主要利用了參數(shù)調(diào)整,是對(duì)模型中所采用算法不同變量和參數(shù)和模型設(shè)計(jì)空間規(guī)模的調(diào)整與設(shè)置;除此之外,不僅有對(duì)該模型進(jìn)行校驗(yàn),還將針對(duì)計(jì)算結(jié)果與實(shí)際數(shù)據(jù)進(jìn)行比較。以此實(shí)現(xiàn)模型的精確校驗(yàn)指入和對(duì)跟模型有效性的評(píng)價(jià)與校驗(yàn)。

      在考慮到移動(dòng)網(wǎng)絡(luò)用戶(hù)會(huì)在不同的平臺(tái)上有相關(guān)的訪問(wèn)數(shù)據(jù),評(píng)估模型還將采取針對(duì)性的關(guān)聯(lián)分析,基于用戶(hù)的日常操作日志,系統(tǒng)可以進(jìn)行用戶(hù)與網(wǎng)絡(luò)多個(gè)平臺(tái)的關(guān)聯(lián)關(guān)系確認(rèn),依據(jù)K-means關(guān)聯(lián)算法,在找出平方誤差最小的k個(gè)函數(shù)值,就可以實(shí)現(xiàn)對(duì)用戶(hù)簇的緊湊劃分,將這些用戶(hù)簇固化,就是運(yùn)營(yíng)商、公司企業(yè)所需要的數(shù)據(jù)支持。

      2.2.2 用戶(hù)偏好模型

      該模型利用了文本挖掘,其主要作用是消除收集數(shù)據(jù)中的文本內(nèi)容,通過(guò)多種基于用戶(hù)需求的預(yù)處理技術(shù)獲取文本里面的重要內(nèi)容,依據(jù)K-means算法進(jìn)行文本內(nèi)容的精細(xì)劃分,實(shí)現(xiàn)對(duì)高可靠性標(biāo)準(zhǔn)文本庫(kù)的構(gòu)造。

      用戶(hù)偏好模型將分為三大類(lèi):用戶(hù)訪問(wèn)、用戶(hù)應(yīng)用、用戶(hù)推薦。

      用戶(hù)訪問(wèn)依據(jù)網(wǎng)頁(yè)訪問(wèn)日志,通過(guò)分類(lèi)后,完成對(duì)用戶(hù)訪問(wèn)網(wǎng)頁(yè)行為的跟蹤與分析,它將計(jì)算和生成用戶(hù)的偏好。

      用戶(hù)應(yīng)用將深度分析用戶(hù)下載APP應(yīng)用的詳細(xì)情況。從類(lèi)別,使用時(shí)長(zhǎng),APP相關(guān)性等方面著手,最終完成對(duì)用戶(hù)興趣和愛(ài)好的準(zhǔn)確計(jì)算。

      用戶(hù)推薦以現(xiàn)有內(nèi)容推薦技術(shù)為依托,結(jié)合其他推薦技術(shù),綜合考慮網(wǎng)頁(yè)、APP應(yīng)用的內(nèi)容與用戶(hù)關(guān)聯(lián)性,定義出綜合相似度參數(shù),對(duì)它進(jìn)行多維度計(jì)算,為用戶(hù)提供推薦信息。

      2.2.3 關(guān)系挖掘模型

      依據(jù)評(píng)估模型和用戶(hù)偏好模型構(gòu)建出關(guān)系挖掘模型,該模型主要是對(duì)用戶(hù)的社會(huì)交往關(guān)系和興趣關(guān)系進(jìn)行圖譜構(gòu)建,再結(jié)合用戶(hù)的網(wǎng)絡(luò)訪問(wèn)日志對(duì)用戶(hù)潛藏信息進(jìn)行挖掘,來(lái)構(gòu)建用戶(hù)的“多維關(guān)系”。

      3 系統(tǒng)測(cè)試與結(jié)果分析

      為了驗(yàn)證對(duì)文中所采用的基于云計(jì)算的在線4G用戶(hù)行為研究與分析,我們從網(wǎng)上隨機(jī)抓取了10000個(gè)人在網(wǎng)上訂購(gòu)快餐的消費(fèi)頻率和其他上網(wǎng)記錄,在此,本文提取以下兩條數(shù)據(jù)進(jìn)行分析:

      (1)10000人中有8032人在線搜索過(guò)“減肥、長(zhǎng)胖、瘦肚子”等關(guān)鍵字,5793人購(gòu)買(mǎi)過(guò)與治療高血壓、減肥相關(guān)藥品。

      (2)高頻率消費(fèi)快餐(一周超過(guò)3次)共有3034人,其中有2874人日常平均上網(wǎng)時(shí)間超過(guò)9個(gè)小時(shí)。在他們的一周整個(gè)上網(wǎng)時(shí)間(超過(guò)26210個(gè)小時(shí))內(nèi),分配為網(wǎng)游42.75%,電視劇、電影、綜藝節(jié)目16.26%,淘寶等電子商務(wù)平臺(tái)14.25%,聊天、微博8.34%,其他1.84%。

      依據(jù)上面統(tǒng)計(jì)結(jié)果,我們可以明確分析出:消費(fèi)快餐,會(huì)存在長(zhǎng)胖、高血壓的風(fēng)險(xiǎn),對(duì)于“健康飲食”,“方便”、“健康”字樣信息會(huì)格外關(guān)注;對(duì)于高頻率食用快餐的人群,還是以喜歡宅在家里的人居多,他們更喜歡瀏覽“送貨上門(mén)”,“包郵”字樣的商品。以上兩點(diǎn)內(nèi)容通過(guò)實(shí)驗(yàn)人群的上網(wǎng)瀏覽記錄也得以證實(shí)。如圖2所示。

      在另一方面,本文中所使用的引擎與傳統(tǒng)的單機(jī)批量入庫(kù)方式,更具有實(shí)時(shí)化和壓縮時(shí)間縮短的優(yōu)勢(shì),對(duì)于4G時(shí)代井噴式的用戶(hù)數(shù)據(jù),將更加適用運(yùn)營(yíng)商和公司、企業(yè)的需求。

      4 結(jié)束語(yǔ)

      本文對(duì)4G時(shí)代下的用戶(hù)行為提出了一種新的研究與分析方案,能夠有效的滿足現(xiàn)在運(yùn)營(yíng)商、公司企業(yè)的需求。如果在數(shù)據(jù)處理方面,仍覺(jué)得本方案的引擎不夠快,可以嘗試數(shù)據(jù)挖掘、數(shù)據(jù)倉(cāng)庫(kù)的方法去處理。

      參考文獻(xiàn)

      [1]喬志偉.基于用戶(hù)行為的3G業(yè)務(wù)分析與探討[J].移動(dòng)通信, 2010(12): 52- 55.

      [2]馮銘,王保進(jìn).蔡建宇.基于云計(jì)算的可重構(gòu)移動(dòng)互聯(lián)網(wǎng)用戶(hù)行為分析系統(tǒng)的設(shè)計(jì)[J]. 計(jì)算機(jī)科學(xué), 2011(08).

      [3]王明會(huì).移動(dòng)互聯(lián)網(wǎng)技術(shù)及應(yīng)用熱點(diǎn)淺析[J].信息通信技術(shù),2010(04).

      [4]皇甫大鵬,陳平,王興建.基于一種改進(jìn)的K- means 算法的校園網(wǎng)用戶(hù)行為分析研究[J].廣西大學(xué)學(xué)報(bào),2011(11).

      作者單位

      重慶郵電大學(xué) 重慶市 400065endprint

      猜你喜歡
      means算法引擎云計(jì)算
      實(shí)驗(yàn)云:理論教學(xué)與實(shí)驗(yàn)教學(xué)深度融合的助推器
      無(wú)形的引擎
      基于Cocos2d引擎的PuzzleGame開(kāi)發(fā)
      One?。牛睿纾椋睿濉。蹋澹妫糁皇O乱粋€(gè)引擎
      禹城市| 桃江县| 呼和浩特市| 三江| 锡林郭勒盟| 铜山县| 鸡东县| 北川| 松江区| 达尔| 南华县| 河南省| 历史| 宝山区| 鄂尔多斯市| 江安县| 文登市| 和龙市| 清原| 杭锦后旗| 庆安县| 林芝县| 伊吾县| 铜梁县| 乌鲁木齐县| 武胜县| 灯塔市| 乌什县| 金堂县| 丹凤县| 环江| 新源县| 紫云| 绍兴县| 怀集县| 革吉县| 新宾| 茶陵县| 毕节市| 同心县| 额尔古纳市|