格倫·厄本 阿爾喬姆·季莫申科 帕拉姆維爾·迪隆 約翰·豪澤
深度學習在大數據庫分析方面的優(yōu)勢越來越明顯,它可以從中摸索出規(guī)律并得出洞見。不難想象有一天,企業(yè)能夠廣泛整合各種數據庫,以更高的水準和更強的分析能力來識別消費者需求,并利用所得信息進行精準的市場營銷。
深度學習和普通數據分析究竟有何不同?它是實現了質的飛躍,還只是稍有改進?為了比較兩者的作用,作者研究了一個與信用卡市場相關的大型數據庫,探尋多層次深度學習模型是否可以比傳統(tǒng)模型更準確地預測人們對信用卡的選擇。
該數據庫源自大型信用卡網絡供應商NerdWallet,其中包括點擊流、人口統(tǒng)計和廣告曝光等相關信息。作者利用這個數據庫比較了三種顧客選擇信用卡的模型。第一種是簡單線性回歸模型,第二種是簡單的深度學習模型,第三種是簡單深度學習模型的加強版。
根據分析,兩種基于深度學習的模型都能夠比傳統(tǒng)方法更準確地預測用戶對于信用卡的選擇。然而,改進并沒有預期的那么大:簡單線性回歸模型的準確率為70.5%,簡單深度學習模型的預測準確率稍高一些,為71.7%,復雜深度學習模型的預測準確率為73%。
既然深度學習對選擇預測的改進有限,市場營銷部門是否還有必要投資該技術并開發(fā)其關鍵能力?作者認為,和傳統(tǒng)的數據分析相比,深度學習帶來的預測準確率的小幅提升,在多數情況下不大可能產生足夠豐厚的回報,因此不值得大舉投資。在試水之前,企業(yè)不但要考慮可能的收益,還要考慮執(zhí)行的風險和成本。
深度學習的主要缺點在于很難確定哪些變量能對消費者的選擇產生更大的影響。是信用卡旅行獎勵還是低利率?由于變量是通過眾多影響選擇的潛在層進行處理的,因此很難衡量其中某一個變量的影響。營銷經理的直覺判斷很難與模型結果相關聯(lián),這將使深度學習的實施變得困難。
當然,還有其他因素需要考慮。獲取深度學習技術需要成本,實施該技術也需要相關人員,同時還可能導致額外數據成本。除此之外,即使使用當今的快速計算機,深度學習模型也需要大量的計算資源,并且可能需要較長的運行時間。大多數情況下,除非預測準確性的小幅提升能夠大大降低成本或增加收益,否則用深度學習取代傳統(tǒng)數據分析缺乏充足的理由。
盡管如此,作者仍然認為,某些情況下深度學習前景光明。與傳統(tǒng)的線性回歸模型相比,深度學習在分析包括圖像和非數值數據在內的“豐富”數據庫方面具有顯著優(yōu)勢。這些豐富數據涵蓋了用戶生成的所有信息(例如亞馬遜評論、Instagram帖子、臉書帖子以及公司網站上的評論),其潛在價值是巨大的。
深度學習特別適合識別異質和非結構化數據中的模式。例如,有一種基于深度學習的模型可以幫助汽車設計師預測消費者對繪圖板上的汽車原型有何反應,同時也可產生新產品創(chuàng)意。另一個案例中,研究人員根據客戶的新聞消費行為創(chuàng)建了一個模型,以預測他們將來閱讀新聞的習慣。最近,企業(yè)已經開始使用深度學習來分析消費者在社交媒體上發(fā)布的品牌服裝圖片,同時預測哪些商品的客戶退貨率最高,哪些優(yōu)惠券產生的利潤最大。
隨著基于深度學習的新算法和更豐富的數據庫的出現,深度學習有望提供更好的結果。