宋茜
盡管大數(shù)據(jù)分析聽起來很有希望,但公司對其數(shù)據(jù)的期望與現(xiàn)實之間仍然存在巨大差距。現(xiàn)在的公司喜歡大數(shù)據(jù)但缺乏有效使用大數(shù)據(jù)的策略,哈佛商學(xué)院分享了他們的一些見解:“問題是在很多情況下,大數(shù)據(jù)沒有得到很好的利用,公司更擅長收集關(guān)于他們的客戶、他們的產(chǎn)品以及競爭對手的數(shù)據(jù),而不是分析這些數(shù)據(jù)并圍繞它設(shè)計戰(zhàn)略?!?/p>
這不僅突出了對大數(shù)據(jù)的需求,而且強調(diào)了學(xué)習(xí)如何設(shè)計包含大數(shù)據(jù)的業(yè)務(wù)戰(zhàn)略。
大數(shù)據(jù):利用高級分析
大數(shù)據(jù)是一種消耗大量空間(體積)、以前所未有的速度(速度)并以不同格式(種類)存在的東西。大數(shù)據(jù)本身并不能為業(yè)務(wù)流程或戰(zhàn)略增加價值,必須用好它才能從中提取所有見解和好處。
如果大數(shù)據(jù)使用得當(dāng),那么它可以通過利用收集到的有關(guān)產(chǎn)品、客戶和市場的洞察來幫助優(yōu)化運營和業(yè)務(wù)流程。
制定結(jié)合大數(shù)據(jù)的有效商業(yè)戰(zhàn)略
BillSchmarzo被稱為大數(shù)據(jù)院長,他對使用大數(shù)據(jù)來實現(xiàn)業(yè)務(wù)目標(biāo)過程進行逆向工程的操作,做出了最好的解釋。
確定預(yù)期的業(yè)務(wù)成果
首先,必須確定業(yè)務(wù)需要的成果,嘗試考慮能夠改變業(yè)務(wù)的舉措,或使其離成功更近一步。例如,在未來12個月內(nèi)將在線商店銷售額增加10 %。
確定支持用例
此步驟是關(guān)于了解哪些用例將幫助實現(xiàn)第一步中的成果。例如,如果在線銷售額增加10 %是期望的業(yè)務(wù)成果,那么其支持用例將是:在高流量網(wǎng)站上做廣告促銷、開展電子郵件營銷活動以及增加在線潛在客戶生成等。
一旦實現(xiàn)了每個業(yè)務(wù)成果的支持用例,需要評估每個用例的財務(wù)影響、潛在價值和實施風(fēng)險。
優(yōu)先考慮用例
在此步驟中組織需要對所有用例進行優(yōu)先級排序,以便可以一次專注于一個用例,這可以通過對比業(yè)務(wù)價值、用例的實施可行性來完成。
確定每個用例的數(shù)據(jù)源
每個用例的實現(xiàn)都需要使用數(shù)據(jù)來完成。例如,為了提高客戶交叉銷售,需要來自社交媒體、購物籃、站點流量信息等數(shù)據(jù)。在這一步中,每個用例都與一個或多個數(shù)據(jù)源相關(guān)聯(lián)。
計算每個用例的經(jīng)濟價值
一旦了解了成功執(zhí)行每個用例所需的數(shù)據(jù)源,就可以計算數(shù)據(jù)源所擁有的財務(wù)價值。
剛剛看到了每個數(shù)據(jù)源如何擁有經(jīng)濟、財務(wù)價值,以及如何使用它來成功執(zhí)行任何有助于實現(xiàn)預(yù)期業(yè)務(wù)成果的用例。每個組織都可以訪問其數(shù)據(jù),它一定很簡單,每個人都應(yīng)該這樣做,對吧?
數(shù)據(jù)源具有這種經(jīng)濟價值,因為它們要具有衡量數(shù)據(jù)質(zhì)量的6個關(guān)鍵維度:數(shù)據(jù)準(zhǔn)確性、有效性、一致性、唯一性、完整性和及時性。
有一個挑戰(zhàn)比其他挑戰(zhàn)更復(fù)雜,就是在所有數(shù)據(jù)源中擁有獨特的數(shù)據(jù)記錄。
很多時候,需要來自多個來源的數(shù)據(jù)才能完全執(zhí)行單一用例,為此,數(shù)據(jù)首先被合并和整合,以便可以存儲在一個地方,并且可以用于分析。
公司通常在數(shù)據(jù)庫中有許多關(guān)于同一個人/實體的數(shù)據(jù)記錄。這是因為很多完整的信息會導(dǎo)致創(chuàng)建新聯(lián)系人而不是更新現(xiàn)有聯(lián)系人,或者信息存儲在不同的系統(tǒng)中,例如網(wǎng)站跟蹤應(yīng)用程序、電子郵件活動工具等。
不管是什么原因,這是降低大數(shù)據(jù)分析結(jié)果準(zhǔn)確性的最常見障礙。例如,如果數(shù)據(jù)包含與同一個人相關(guān)的重復(fù)記錄,最終可能會向這個人發(fā)送2次電子郵件。這不僅會損害客戶體驗,還會使用例結(jié)果不準(zhǔn)確,可能會多次計算來自同一個人的點擊率,并高估了電子郵件活動的有效性。
介紹數(shù)據(jù)匹配
當(dāng)不同的數(shù)據(jù)集被合并和清除在一起時,數(shù)據(jù)值會變得重復(fù)和不一致。如果將大數(shù)據(jù)業(yè)務(wù)戰(zhàn)略建立在不準(zhǔn)確的數(shù)據(jù)記錄上,則會產(chǎn)生有偏見的結(jié)果。另一方面,如果執(zhí)行數(shù)據(jù)匹配技術(shù),就可以輕松地利用這些數(shù)據(jù)來執(zhí)行任何用例或業(yè)務(wù)流程。
數(shù)據(jù)匹配如何工作
當(dāng)數(shù)據(jù)集包含唯一標(biāo)識符(例如社會保險號、身份證號)時,數(shù)據(jù)匹配非常簡單。在這種情況下,可以簡單地比較2個記錄的標(biāo)識符并將它們分類為匹配或不匹配。
當(dāng)數(shù)據(jù)集中沒有唯一標(biāo)識符或由于保密目的而無法使用時,事情就會變得復(fù)雜。在這種情況下,多個變量被分配權(quán)重,然后一起評估并配進行分類。
組織采用各種數(shù)據(jù)匹配技術(shù),例如語音、數(shù)字、模糊匹配或其他專有算法。匹配后,可以決定合并記錄或清除它們,以便大數(shù)據(jù)中的每條記錄僅與單個實體相關(guān),此過程也稱為實體解析。在整合大數(shù)據(jù)設(shè)計業(yè)務(wù)戰(zhàn)略時,數(shù)據(jù)匹配和數(shù)據(jù)質(zhì)量的作用非常重要,會對業(yè)務(wù)成果產(chǎn)生重大影響。