王海明
基于大數(shù)據(jù)下電子商務(wù)商品推薦系統(tǒng)的分析
王海明
隨著電子商務(wù)的不斷發(fā)展,電子商品的種類逐漸增多,如何推薦給適合顧客的商品來(lái)提高交易量成為電商首要考慮的問(wèn)題。本文對(duì)如何完善電子商務(wù)商品推薦系統(tǒng)進(jìn)行分析,圍繞設(shè)計(jì)搜索的整體性、相似商品的推薦和對(duì)顧客進(jìn)行分類三個(gè)方面展開(kāi)討論,從而實(shí)現(xiàn)提高電子商務(wù)商品成交額的目標(biāo)。
電子商務(wù)目前已經(jīng)十分普遍,網(wǎng)上商品交易數(shù)量也隨之增多,網(wǎng)上商品種類繁多,商品消費(fèi)者的選擇性增加。因此,電子商務(wù)商品推薦系統(tǒng)的完善成為提高交易量的重要手段。通過(guò)挖掘大數(shù)據(jù)下消費(fèi)者的消費(fèi)特點(diǎn),進(jìn)行相應(yīng)的商品推薦,對(duì)實(shí)現(xiàn)電子商務(wù)商品發(fā)展有著重要的作用。
從消費(fèi)者的角度出發(fā),將電子商務(wù)商品推薦系統(tǒng)按使用技術(shù)分為兩類,一種是自動(dòng)化程度,一種是持久性程度。自動(dòng)化程度是指消費(fèi)者在進(jìn)行商品選擇時(shí),通過(guò)輸入相關(guān)信息,便會(huì)出現(xiàn)一系列有關(guān)商品,其中可能出現(xiàn)消費(fèi)者恰好感興趣的商品,以此縮短消費(fèi)者查找商品時(shí)間,盡可能提供給消費(fèi)者便利。手工方式是指消費(fèi)者需要進(jìn)行對(duì)所需商品的具體要求,網(wǎng)上會(huì)根據(jù)消費(fèi)者需求顯示出具體的商品,這類推薦方法存在限制消費(fèi)者接觸更多商品類型的弊端;所謂持久性程度,是指根據(jù)用戶的不同需求,綜合推薦消費(fèi)者感興趣的商品,不局限與消費(fèi)者某階段的單獨(dú)需求,而是對(duì)用戶多種需求進(jìn)行整合分析,再推薦給用戶相關(guān)的商品。
以上兩個(gè)推薦系統(tǒng)從用戶的角度出發(fā)進(jìn)行分類,體現(xiàn)了電子商務(wù)網(wǎng)站以用戶為核心的標(biāo)準(zhǔn),通過(guò)進(jìn)行不同類型推薦系統(tǒng)的探索,盡可能使推薦系統(tǒng)滿足用戶的需求。以上兩類推薦系統(tǒng)可以實(shí)現(xiàn)自主的、持久的對(duì)用戶進(jìn)行推薦?;谝陨蟽蓚€(gè)推薦標(biāo)準(zhǔn)可以將電子商務(wù)推薦系統(tǒng)分為四類,包括非個(gè)性電子商務(wù)推薦系統(tǒng)、根據(jù)產(chǎn)品屬性的電子商務(wù)推薦系統(tǒng)、相關(guān)性商品推薦系統(tǒng)、相關(guān)性用戶推薦系統(tǒng)。其中,非個(gè)性電子商務(wù)推薦系統(tǒng)指的是推薦標(biāo)準(zhǔn)主要源于各個(gè)用戶的評(píng)價(jià),對(duì)全部用戶評(píng)價(jià)作出綜合判斷,這種推薦系統(tǒng)對(duì)全部用戶的推薦標(biāo)準(zhǔn)相同,并且是系統(tǒng)自動(dòng)產(chǎn)生的,不需要對(duì)用戶需求進(jìn)行復(fù)雜的分析;基于產(chǎn)品屬性的推薦系統(tǒng),主要核心是商品,通過(guò)接收用戶輸入的相關(guān)產(chǎn)品屬性,推薦給用戶具有對(duì)應(yīng)屬性的商品。這種推薦系統(tǒng)注重用戶的個(gè)性化需求,可以使根據(jù)用戶的瞬時(shí)需求進(jìn)行推薦,也可以根據(jù)用戶的多種需求來(lái)推薦;相關(guān)性產(chǎn)品和相關(guān)性客戶推薦分別是根據(jù)商品的相似性和用戶之間的相似性進(jìn)行推薦,個(gè)性化程度較高。
基于大數(shù)據(jù)的電子商務(wù)個(gè)性化推薦
大數(shù)據(jù)的挖掘是根據(jù)用戶需求進(jìn)行相應(yīng)商品推薦的前提。目前,主要推薦算法包括內(nèi)容過(guò)濾算法和協(xié)同過(guò)濾算法兩類,其中過(guò)濾算法是在內(nèi)容的基礎(chǔ)上進(jìn)行信息檢索,協(xié)同過(guò)濾算法更多的是根據(jù)用戶的具體需求,以客戶的興趣為主要推薦標(biāo)準(zhǔn)。當(dāng)前最為流行的挖掘算法是基于Web的挖掘,因此將Web挖掘的電子商務(wù)推薦與用戶需求進(jìn)行有效結(jié)合是實(shí)現(xiàn)電子商務(wù)發(fā)展的關(guān)鍵。
研究表明,目前存在的推薦算法準(zhǔn)確性不夠,通常是根據(jù)用戶以往的瀏覽內(nèi)容進(jìn)行推薦。而用戶的需求處于不斷變化中,若只根據(jù)消費(fèi)者以往需求進(jìn)行推薦,往往有別與消費(fèi)者的目前需求,并且這種方式也不被消費(fèi)者接受,在進(jìn)行商品選擇時(shí),常出現(xiàn)用戶不感興趣的商品推薦,會(huì)影響用戶的消費(fèi)情緒。因此,創(chuàng)新出能滿足用戶當(dāng)前商品需求的推薦算法,是完善電子商務(wù)商品推薦系統(tǒng)的重點(diǎn)。
基于關(guān)聯(lián)規(guī)則的推薦算法
基于關(guān)聯(lián)規(guī)則的推薦算法。關(guān)聯(lián)規(guī)則屬于數(shù)據(jù)挖掘技術(shù),該技術(shù)能發(fā)現(xiàn)數(shù)據(jù)之間的某些關(guān)聯(lián)。關(guān)聯(lián)規(guī)則挖掘出的數(shù)據(jù)能有效將用戶消費(fèi)特點(diǎn)顯示出來(lái),根據(jù)用戶的購(gòu)買(mǎi)習(xí)慣,可通過(guò)關(guān)聯(lián)規(guī)則進(jìn)行與用戶需求有關(guān)的商品匹配,對(duì)用戶的需求有一定的掌握。這種方法對(duì)商家進(jìn)行商品促銷(xiāo)有很大的幫助,舉例說(shuō)明,當(dāng)用戶產(chǎn)生購(gòu)買(mǎi)記錄后,關(guān)聯(lián)規(guī)則便會(huì)挖掘出相關(guān)數(shù)據(jù),商家通過(guò)對(duì)數(shù)據(jù)的分析,能直觀的發(fā)現(xiàn)消費(fèi)者的購(gòu)買(mǎi)習(xí)慣,在進(jìn)行商品促銷(xiāo)時(shí),商家便會(huì)根據(jù)分析出的數(shù)據(jù)結(jié)果,進(jìn)行符合群眾需求的商品促銷(xiāo),能為商家?guī)?lái)很大的效益。
Apriori算法及改進(jìn)算法。Apriori算法是基于關(guān)聯(lián)規(guī)則的一種推薦算法,它的基本思想是,首先通過(guò)挖掘數(shù)據(jù)中大范圍的數(shù)據(jù)項(xiàng)集作為候選,并記錄候選項(xiàng)集中每個(gè)數(shù)據(jù)發(fā)生的次數(shù),將大于最小支持率的數(shù)據(jù)作為一個(gè)集合,將該集合記作L1,再基于L1中數(shù)據(jù),進(jìn)一步生成集合L2,以此類推,直至生成集合Ln,標(biāo)志著集合已經(jīng)不能更加細(xì)分。最后,再根據(jù)相應(yīng)算法導(dǎo)出規(guī)律。Apriori算法在用戶相似商品需求的判斷中起到重要的作用,但是仍然存在一些不足,包括由于數(shù)據(jù)庫(kù)太大,導(dǎo)致算法存在一些不必要的規(guī)則,加大了數(shù)據(jù)分析難度;Apriori算法的運(yùn)算步驟,要求在運(yùn)算時(shí),要對(duì)數(shù)據(jù)庫(kù)進(jìn)行多次掃描,降低了算法的效率;由于一些客觀因素的存在,也會(huì)影響算法的準(zhǔn)確性,導(dǎo)致最后的結(jié)果與實(shí)際存在差異。算法的改進(jìn)是實(shí)現(xiàn)結(jié)果準(zhǔn)確的重點(diǎn),它的改進(jìn)可以從算法的效率和產(chǎn)生集合的準(zhǔn)確性入手,例如數(shù)據(jù)庫(kù)中包括多種商品的信息,由于某些商品之間的聯(lián)系較大,可能導(dǎo)致它與其他商品之間關(guān)聯(lián)性被忽視,那么產(chǎn)生的集合就是不準(zhǔn)確的,為了改善這種情況,可以將與眾多商品具有關(guān)聯(lián)性的商品做出標(biāo)志,避免此類商品數(shù)據(jù)的頻繁掃面,造成算法的不準(zhǔn)確。
分段Apriori算法及其應(yīng)用。分段Apriori算法就是將大數(shù)據(jù)庫(kù)中的項(xiàng)分成小部分,再對(duì)各部分進(jìn)行Apriori算法。這種算法可能會(huì)丟掉數(shù)據(jù)庫(kù)中的一些信息,是分段算法存在的缺陷,但是由于數(shù)據(jù)庫(kù)太大,其中的數(shù)據(jù)不完全有效,分段算法通過(guò)丟掉多余的數(shù)據(jù),不僅可以提高算法效率,還能提高算法的準(zhǔn)確性。舉例說(shuō)明,當(dāng)我們針對(duì)某些屬性進(jìn)行推薦算法時(shí),可以通過(guò)添加一些限制條件,頻繁集合必須滿足前提條件才能進(jìn)行運(yùn)算,這樣就可以在進(jìn)行算法前將不必要的數(shù)據(jù)進(jìn)行排除,減少運(yùn)算量,提高算法的效率。
隨著科技的發(fā)展,電子商務(wù)越來(lái)越普遍化,網(wǎng)上消費(fèi)者的數(shù)量明顯增加,同時(shí)由于電子商務(wù)商品數(shù)量和種類的增加,電子商務(wù)的競(jìng)爭(zhēng)力增大。如何提高對(duì)消費(fèi)者的了解程度,提供相應(yīng)的產(chǎn)品推薦成為重點(diǎn)問(wèn)題??梢酝ㄟ^(guò)完善電子商務(wù)商品推薦系統(tǒng),實(shí)現(xiàn)提高網(wǎng)上交易量的目標(biāo)。
(作者單位:蘇州大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院)