梅振宇
【摘 要】隨著計(jì)算機(jī)信息技術(shù)的不斷發(fā)展,在其中衍生出來多個(gè)方面的應(yīng)用,其中大數(shù)據(jù)分析以及構(gòu)建大數(shù)據(jù)服務(wù)模型已然成為當(dāng)前企業(yè)發(fā)展最熱門的話題之一,而數(shù)據(jù)融合問題對(duì)于企業(yè)未來的發(fā)展有著較為嚴(yán)重的影響。在這個(gè)信息量巨大的社會(huì)中,電信領(lǐng)域有著巨大的挑戰(zhàn)。本文旨在借助分析目前電信領(lǐng)域用戶消費(fèi)習(xí)慣,結(jié)合大數(shù)據(jù)現(xiàn)階段的大環(huán)境構(gòu)建一個(gè)全新的用戶服務(wù)模型,在Hadoop模型的幫助下完成大數(shù)據(jù)處理框架,最后實(shí)現(xiàn)電信領(lǐng)域數(shù)據(jù)融合。
【關(guān)鍵詞】大數(shù)據(jù);數(shù)據(jù)融合;服務(wù)模型;Hadoop模型
在互聯(lián)網(wǎng)技術(shù)火熱發(fā)展的今天,大數(shù)據(jù)呈爆發(fā)式的增長,數(shù)據(jù)已經(jīng)成為一種新的資源,為這個(gè)快速發(fā)展的社會(huì)提供著巨大的價(jià)值,也為創(chuàng)新驅(qū)動(dòng),萬眾創(chuàng)新的時(shí)代主題提供推動(dòng)力。尤其在電信領(lǐng)域大數(shù)據(jù)有著巨大的潛在價(jià)值,但其面對(duì)的挑戰(zhàn)也非常大且問題類型很多,如在該領(lǐng)域下怎樣完成用戶服務(wù)模型的搭建,如何實(shí)現(xiàn)所有數(shù)據(jù)的有效融合等。
一、電信領(lǐng)域用戶消費(fèi)特征與用戶服務(wù)模型構(gòu)建
眾所周知,企業(yè)想要設(shè)計(jì)一款符合大眾消費(fèi)者的產(chǎn)品,必須要抓住消費(fèi)者普遍的消費(fèi)心理以及消費(fèi)特征。同樣的電信企業(yè)也應(yīng)該牢記,新信息時(shí)代下消費(fèi)群眾常有的習(xí)慣,而后可以結(jié)合大數(shù)據(jù)完成全新的用戶服務(wù)模型的構(gòu)建。所以整個(gè)電信服務(wù)系統(tǒng)中應(yīng)該具備了消費(fèi)群眾的個(gè)人基本信息,可以根據(jù)不同的消費(fèi)用戶制定出符合他們特色的消費(fèi)產(chǎn)品。同時(shí)記錄的數(shù)據(jù)中還應(yīng)該包括了用戶每日流量使用情況、通話時(shí)長以及短信和通話的比例關(guān)系,種種數(shù)據(jù)也能大體的了解電信用戶的消費(fèi)習(xí)慣。
在所有的電信領(lǐng)域消費(fèi)群眾中,可以根據(jù)消費(fèi)群眾個(gè)人消費(fèi)特征的不同構(gòu)建出特有的服務(wù)模型,本系統(tǒng)對(duì)于用戶的特征數(shù)據(jù)進(jìn)行數(shù)據(jù)集的處理。比如數(shù)據(jù)集的總和是所有注冊過的電信用戶,可以用U={u1,u2,…,uN}來表示;同樣電信用戶的自然特征數(shù)據(jù)應(yīng)該包括了消費(fèi)群眾的基本的個(gè)人信息(性別、年齡、收入水平以及日常生活地區(qū)等),同樣也可以用數(shù)據(jù)集A={a1,a2,…,an}來代替,圖中的其他特征數(shù)據(jù)信息同樣可以構(gòu)建數(shù)據(jù)集的形式,影響力特征對(duì)應(yīng)的數(shù)據(jù)集為B={b1,b2,…,bn};生活軌跡、電信特征、品牌特征、文化特征對(duì)應(yīng)的數(shù)據(jù)集依次為C、D、E、F。但是在構(gòu)建這些特征數(shù)據(jù)集之間又存在交叉重合的子集,根據(jù)不同用戶交叉子集的比例權(quán)重就可以看出兩個(gè)消費(fèi)用戶具有的情景相似情況,就能做出針對(duì)性的消費(fèi)產(chǎn)品。
二、Hdoop模型的大數(shù)據(jù)處理框架及數(shù)據(jù)融合策略
電信企業(yè)需要使用的數(shù)據(jù)主要包括了企業(yè)內(nèi)部數(shù)據(jù)以及用戶的外部數(shù)據(jù)。內(nèi)部數(shù)據(jù)又可以分為系統(tǒng)下電信用戶個(gè)人信息數(shù)據(jù)、消費(fèi)特征以及消費(fèi)習(xí)慣以及電信企業(yè)具有的業(yè)務(wù)信息數(shù)據(jù)等;外部數(shù)據(jù)主要包括了用戶在使用電信產(chǎn)品時(shí)利用到的電子產(chǎn)品(手機(jī)、電腦以及平板電腦等)以及各種各樣的網(wǎng)絡(luò)社交平臺(tái)。所以整個(gè)數(shù)據(jù)量非常龐大,如果采用以前的數(shù)據(jù)采樣形式,需要進(jìn)行許多不必要的工作,導(dǎo)致數(shù)據(jù)的精準(zhǔn)度有待商榷,電信服務(wù)模型在性能上也無法滿足目前消費(fèi)用戶的要求。為了改善這方面的不足,使用的數(shù)據(jù)存取為層次分布的方法。在Hadoop模型的幫助下,搭建出一個(gè)更有效、可完成層次計(jì)算的系統(tǒng)基礎(chǔ)架構(gòu),最后還可以兼顧電信領(lǐng)域數(shù)據(jù)特點(diǎn),完成了Hadoop模型的大數(shù)據(jù)處理框架。
1.數(shù)據(jù)采集層
數(shù)據(jù)采集層主要完成的任務(wù)是實(shí)現(xiàn)各個(gè)不同系統(tǒng)實(shí)現(xiàn)傳輸協(xié)議,并在此基礎(chǔ)下記錄電信用戶在不同數(shù)據(jù)源中獲得API的數(shù)據(jù)信息。上圖可以看出電信用戶主要在網(wǎng)上營業(yè)廳以及掌上營業(yè)廳完成電信產(chǎn)品的消費(fèi),電信企業(yè)可以借助HTTP記錄下用戶使用的IP地址以及訪問記錄;其他的內(nèi)部系統(tǒng)一般需要向外來用戶提供專門的API,系統(tǒng)就可以借助這些專門的API獲得用戶使用電信產(chǎn)品的數(shù)據(jù)信息;現(xiàn)代化常用的社交平臺(tái)同樣也添加了開放性的API從而可以有效的獲得電信用戶數(shù)據(jù)情況;互聯(lián)網(wǎng)則有自身特有的網(wǎng)關(guān)采集能夠及時(shí)的記錄電信用戶的數(shù)據(jù)。
2.數(shù)據(jù)存儲(chǔ)層
數(shù)據(jù)存儲(chǔ)層主要將采集層收集到的數(shù)據(jù)信息進(jìn)行專門的歸類,最后整理有序?qū)⑵浯娴秸麄€(gè)模型的層次性數(shù)據(jù)庫中。數(shù)據(jù)庫主要包括了牽引庫以及特征庫;兩者分工明確,根據(jù)收集數(shù)據(jù)的信息不同,將內(nèi)部系統(tǒng)采集到用戶數(shù)據(jù)集中分布在特征庫中,最后可以將收集數(shù)據(jù)進(jìn)行專門的數(shù)據(jù)分析以及整合工作,形成有效的特征庫以及牽引庫,有利于電信企業(yè)制定針對(duì)性的消費(fèi)產(chǎn)品,實(shí)現(xiàn)更便利的業(yè)務(wù)服務(wù)模型的構(gòu)建,該層還附帶者將系統(tǒng)收集到的數(shù)據(jù)存儲(chǔ)到其他文件系統(tǒng)中。
3.文件存儲(chǔ)層
文件存儲(chǔ)層相比于數(shù)據(jù)存儲(chǔ)層,最主要的區(qū)別是文件存儲(chǔ)層是在HDFS的基礎(chǔ)下,并且該層下面有三個(gè)不同的節(jié)點(diǎn)協(xié)同工作完成文件存儲(chǔ)的工作,即存儲(chǔ)控制(namenode)、數(shù)據(jù)存儲(chǔ)(datanode)以及集群監(jiān)控節(jié)點(diǎn)。namenode作為HDFS的管理者,負(fù)責(zé)完成不同系統(tǒng)的文件的命名工作,是三個(gè)節(jié)點(diǎn)中最為重要的,還需要在它的幫助下完成文件系統(tǒng)的維護(hù)工作。
三、結(jié)語
大數(shù)據(jù)時(shí)代下,數(shù)據(jù)帶來了價(jià)值的同時(shí),也給電信企業(yè)帶來無限的商機(jī)。所以怎樣利用好大數(shù)據(jù)這個(gè)平臺(tái),成為電信企業(yè)發(fā)展的關(guān)鍵所在。掌握好電信用戶的消費(fèi)習(xí)慣以及消費(fèi)特征,有針對(duì)性的設(shè)計(jì)出符合大眾用戶的產(chǎn)品。必須用戶內(nèi)部環(huán)境以及網(wǎng)絡(luò)平臺(tái)外部環(huán)境兩方面進(jìn)行,完成電信領(lǐng)域數(shù)據(jù)融合。
【參考文獻(xiàn)】
[1]王笑宇,程良倫. 云計(jì)算下的多源信息資源云體系及云服務(wù)模型研究[J]. 計(jì)算機(jī)應(yīng)用研究,2014,31(03):784-788.
[2]高永梅,琚春華,鮑福光. 基于大數(shù)據(jù)的電信領(lǐng)域用戶服務(wù)模型與數(shù)據(jù)融合策略研究[J]. 電信科學(xué),2014,30(07):62-69.
[3]張春麗. 基于數(shù)字圖書館關(guān)聯(lián)數(shù)據(jù)的用戶服務(wù)模型與協(xié)同信息推薦模型研究[J]. 圖書館理論與實(shí)踐,2017(07):89-92.
[4]姜強(qiáng),趙蔚,王朋嬌,王麗萍. 基于大數(shù)據(jù)的個(gè)性化自適應(yīng)在線學(xué)習(xí)分析模型及實(shí)現(xiàn)[J]. 中國電化教育,2015(01):85-92.
[5]鄧仲華,劉偉偉,陸穎雋. 基于云計(jì)算的大數(shù)據(jù)挖掘內(nèi)涵及解決方案研究[J]. 情報(bào)理論與實(shí)踐,2015,38(07):103-108.