Kevin Case
大數(shù)據(jù)技術(shù)并不像幾年前那樣廣受關(guān)注,但這并不意味著大數(shù)據(jù)技術(shù)沒有得到發(fā)展。如果說有什么不同的話,那就是大數(shù)據(jù)的規(guī)模正在變得越來越大。
大數(shù)據(jù)曾經(jīng)被認為是一項重大挑戰(zhàn)。但是現(xiàn)在,它越來越被視為一種理想狀態(tài),尤其是在那些正嘗試并實施機器學習和其他人工智能學科的組織中。
Anexinet公司高級數(shù)字策略師Glenn Gruber說:“人工智能和機器學習現(xiàn)在為我們提供了使用現(xiàn)有大數(shù)據(jù)的新機會,并利用新數(shù)據(jù)類型開發(fā)了很多新用例。我們現(xiàn)在擁有更多可用的數(shù)據(jù),例如圖片、視頻和語音。過去,我們可能試圖盡量減少捕獲此類數(shù)據(jù)的數(shù)量,因為我們無法對其做太多的處理,但是存儲此類數(shù)據(jù)會產(chǎn)生巨大的成本?!?/p>
AI正創(chuàng)造新數(shù)據(jù)分析方法
大數(shù)據(jù)的基本業(yè)務問題之一有時可以用一個簡單的問題來概括:現(xiàn)在是什么?人們已經(jīng)擁有了所有這些東西,并且還會有更多的東西出現(xiàn),那么如何處理呢?在大數(shù)據(jù)的大肆宣傳和炒作中,聽到這個問題的答案并不總是那么容易。
此外,回答這個問題(或從數(shù)據(jù)中獲取見解)通常需要大量的人工工作。人工智能正在創(chuàng)造新的方法。從廣義上講,人工智能和機器學習是新方法。
從歷史上看,在分析數(shù)據(jù)時,工程師不得不使用查詢或SQL(查詢列表)。但是,隨著數(shù)據(jù)重要性的不斷增長,獲得洞察力的多種方法也應運而生。人工智能是查詢/SQL的下一步。Alluxio公司首席執(zhí)行官Steven Mih說:“過去的統(tǒng)計模型現(xiàn)在已經(jīng)與計算機科學融合,并已成為人工智能和機器學習的一部分?!?/p>
數(shù)據(jù)分析勞動強度正降低
與過去相比,管理和分析數(shù)據(jù)所需的人工時間更少了。人們?nèi)匀辉跀?shù)據(jù)管理和分析中扮演著至關(guān)重要的角色,但由于人工智能,原來可能需要幾天或幾周(或更長)的過程正在顯著縮短。
Sungard AS公司的高級架構(gòu)師Sue Clark說:“人工智能和機器學習是幫助企業(yè)分析數(shù)據(jù)的工具,比員工單獨完成的工作更快、更有效?!?/p>
Exasol公司首席技術(shù)官Mathias Golombek在大數(shù)據(jù)方面已觀察到一種采用兩層策略的趨勢,因為組織爭辯要從中獲得任何價值所必須管理的海量信息——存儲層和位于其之上的運營分析層。
Golombek說:“這是從數(shù)據(jù)中提取見解并進行數(shù)據(jù)驅(qū)動決策的地方。人工智能通過全新的功能培訓數(shù)據(jù)做出半自動決策來增強分析。它不適用于企業(yè)對數(shù)據(jù)存在的所有問題,但是對于特定的用例,它徹底改變了無需復雜的人類知識就能完成規(guī)則、決策和預測的方式?!?/p>
換句話說,洞察力和決策可以更快地發(fā)生。此外,IT可以將類似的原理(使用人工智能技術(shù)來減少人工、勞動密集型負擔并提高速度)應用于后端事物,讓人們面對現(xiàn)實,IT之外很少有人想知道。
Alluxio公司Mih說:“數(shù)據(jù)洞察力的實時性質(zhì),加上現(xiàn)在無處不在的事實,將跨越不同的機架、區(qū)域和云計算。
這意味著企業(yè)必須從傳統(tǒng)的管理和分析數(shù)據(jù)方法中發(fā)展而來,這就是人工智能的用武之地。數(shù)據(jù)工程師一次又一次地人工復制數(shù)據(jù)的日子已經(jīng)一去不復返了,今后,在數(shù)據(jù)科學家提出要求數(shù)周之內(nèi)數(shù)據(jù)集就將交付?!?/p>
人類仍然重要
與其他人一樣,Qlik Research公司副總裁Elif Tutuk將人工智能和機器學習視為處理大數(shù)據(jù)的強大杠桿。
Tutuk說:“人工智能和機器學習以及其他新興技術(shù),對于幫助企業(yè)更全面地了解所有數(shù)據(jù),為他們提供一種在關(guān)鍵數(shù)據(jù)集之間建立聯(lián)系的方式至關(guān)重要?!钡撬a充說,這并不是削弱人類智慧和洞察力的問題,“企業(yè)需要將人類直覺的力量與機器智能相結(jié)合,以增強這些技術(shù)或增強智能。更具體地說,人工智能系統(tǒng)需要從數(shù)據(jù)和人類身上學習,才能實現(xiàn)其功能。成功地將人力和技術(shù)力量結(jié)合起來的企業(yè),可以擴大從數(shù)據(jù)科學家和業(yè)務分析師那里獲得分析關(guān)鍵見解的人員,同時節(jié)省時間,并減少由于業(yè)務用戶解釋數(shù)據(jù)而導致的潛在偏見。這樣可以提高業(yè)務運營效率,從數(shù)據(jù)中收集更快的見解,并最終提高企業(yè)生產(chǎn)率?!?/p>
AI可緩解常見數(shù)據(jù)問題
有一些沒有改變的東西:數(shù)據(jù)的價值與其質(zhì)量密不可分。低質(zhì)量意味著低價值或無價值。這就是大數(shù)據(jù)與人工智能的共同點。
Ness Digital工程公司首席技術(shù)官Moshe Kranc說:“關(guān)于機器學習的對話總是回到企業(yè)數(shù)據(jù)的質(zhì)量上。如果數(shù)據(jù)質(zhì)量差,那么從中獲得的任何見解都將無法得到信任。機器學習項目80%的時間都花在了清理和準備數(shù)據(jù)上。”
一切舊的東西似乎又是新的。但這個問題的解決方案(可能還有其他類似的解決方案)可能已經(jīng)出現(xiàn)。
Kranc說:“幸運的是,可以使用機器學習來清理和準備數(shù)據(jù)。機器學習算法可以檢測異常值和缺失值,找到用稍微不同的術(shù)語描述同一實體的重復記錄,準確將數(shù)據(jù)規(guī)范化為通用術(shù)語?!?/p>
分析更具預測性和規(guī)范性
在過去,數(shù)據(jù)分析比事后分析更為重要,事后分析就是“分析已經(jīng)發(fā)生的事情。”未來的預測本質(zhì)上仍是歷史分析。人工智能和機器學習正在幫助開拓一個新領(lǐng)域——“將要發(fā)生的事情”,或者至少是“可能發(fā)生的事情”。此外,還可以教會機器學習算法基于前瞻性的見解做出決策或采取行動。
Sparkhound公司分析部門總經(jīng)理Sean Werick說:“如今,人工智能正在通過使用預測分析,以更準確的方式將大數(shù)據(jù)決策進一步推進。傳統(tǒng)上,大數(shù)據(jù)決策是基于過去和現(xiàn)在的數(shù)據(jù)點,通常會導致線性的投資回報率。借助人工智能,這一比例已達到史詩級和指數(shù)級。利用人工智能的規(guī)范性分析有可能提供全公司的前瞻性戰(zhàn)略見解,有助于推動業(yè)務發(fā)展?!?/p>
Werick指出,這是一個“在走路之前需要學會爬行”的過程。根據(jù)Werick的說法,使用人工智能根據(jù)不準確或不充分的數(shù)據(jù)做出預測性或規(guī)定性的商業(yè)決策,可能會產(chǎn)生“災難性”的后果。
Werick說:“隨著分析成熟度模型的每一個進展,對業(yè)務的價值都會增加。從流程和數(shù)據(jù)映射開始,到描述性分析,到預測性分析,最后,到規(guī)定性分析?!?/p>
人工智能和大數(shù)據(jù)的下一步
如果大多數(shù)團隊仍在學習爬行(或行走),那可能沒問題,因為人工智能和大數(shù)據(jù)的結(jié)合才剛剛開始揭示其可能性。
Scale Venture Partners公司合伙人Andy Vitus看到了更智能的企業(yè)軟件的巨大前景。他認為,許多商業(yè)應用程序仍顯示其模擬DNA。
Vitus說:“大多數(shù)商業(yè)應用程序仍然使用紙質(zhì)表單和分類賬的設(shè)計語言構(gòu)建。這意味著,對于企業(yè)捕獲和存儲的所有數(shù)據(jù),用戶仍在花費大量的時間費力地通過無休止的報告來尋找有用的信息?!?/p>
智能軟件將利用所有這些數(shù)據(jù)來解決問題并提供場景和答案,而不僅僅是美觀的報告。從工程的角度來看,智能企業(yè)應用程序?qū)⒁髮蝹€人工智能/機器學習系統(tǒng)連接到其他系統(tǒng),以便它們可以相互通信并相互學習。企業(yè)最終將從存儲的所有數(shù)據(jù)中獲得可觀的投資回報。
人工智能是一種不斷發(fā)展的手段,可以回答有關(guān)大數(shù)據(jù)的基本問題。Alluxio公司的Mih說:“這只是一個開始,未來將有新的技術(shù)來分析數(shù)據(jù)以獲得實時洞察力,但獲得見解的方式將有所改進?!?/p>