趙園丁
摘要:對于電子商務(wù)網(wǎng)站,站內(nèi)搜索結(jié)果的好壞直接決定著網(wǎng)站商品的銷量。擁有高質(zhì)量的站內(nèi)搜索引擎對于在線銷售收入是至關(guān)重要的。用戶對站內(nèi)搜索的要求越來越高,好的站內(nèi)搜索引擎應(yīng)該盡量滿足準(zhǔn)確、高速、方便和搜索智能化這些方面的要求。
關(guān)鍵詞:電子商務(wù);站內(nèi)搜索;用戶需求
1什么是站內(nèi)搜索引擎
站內(nèi)搜索是指對網(wǎng)站內(nèi)部信息的精確檢索和資源挖掘,它為用戶提供全面、準(zhǔn)確、快速的站內(nèi)信息檢索服務(wù),是網(wǎng)站的核心競爭力之一。通俗地說,站內(nèi)搜索引擎就是一個(gè)提供給網(wǎng)站用戶的軟件,方便他們搜索網(wǎng)站中的信息從而得到想要的內(nèi)容。
2站內(nèi)搜索引擎在電子商務(wù)網(wǎng)站中的重要地位
2.1站內(nèi)搜索效果的好壞直接決定著網(wǎng)站商品的銷量
對于電子商務(wù)網(wǎng)站,網(wǎng)站的每一條信息都具有商業(yè)價(jià)值,而有限的頁面是不可能反映所有信息的價(jià)值的。站內(nèi)搜索因此而成為電子商務(wù)網(wǎng)站發(fā)展的關(guān)鍵,是網(wǎng)站的核心服務(wù)之一。站內(nèi)搜索效果的好壞可以直接決定網(wǎng)站商品的銷量。2008年6月24日,中國互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布了《2008年中國網(wǎng)絡(luò)購物調(diào)查研究報(bào)告》。報(bào)告中的調(diào)查數(shù)據(jù)顯示(如圖1),站內(nèi)搜索對用戶最重要,影響也最大,有43.8%的用戶習(xí)慣通過站內(nèi)搜索瀏覽商品。
如果消費(fèi)者無法搜索到他們想要的商品,那么他們就會(huì)轉(zhuǎn)移到其他網(wǎng)站。因此,擁有高質(zhì)量的站內(nèi)搜索引擎對于在線銷售收入是至關(guān)重要的。
2.2站內(nèi)搜索引擎是研究網(wǎng)站用戶行為的一個(gè)有效工具
站內(nèi)搜索引擎同時(shí)也是研究網(wǎng)站用戶行為的一個(gè)有效工具。通過對網(wǎng)站用戶搜索行為的分析,了解他們?yōu)g覽商品的習(xí)慣對于網(wǎng)站有針對性地改進(jìn)網(wǎng)頁布局,進(jìn)一步制定更為有效的網(wǎng)絡(luò)營銷策略以及改善網(wǎng)站服務(wù)質(zhì)量都具有重要價(jià)值。
3站內(nèi)搜索發(fā)展過程中存在的問題
隨著使用互聯(lián)網(wǎng)進(jìn)行電子商務(wù)的普及程度的不斷提高,搜索引擎已成為人們上網(wǎng)購買商品不可缺少的工具。用戶對站內(nèi)搜索引擎的精確度、速度和便利友好程度等的要求也越來越高。一個(gè)好的站內(nèi)搜索應(yīng)該盡量滿足準(zhǔn)確、高速、方便和搜索智能化這些方面的要求。而目前大部分站內(nèi)搜索引擎,還存在種種的問題缺憾,需要進(jìn)一步結(jié)合相關(guān)先進(jìn)技術(shù)發(fā)展完善。
3.1用戶輸入與結(jié)果不相符
很多網(wǎng)站通過關(guān)鍵字匹配查詢數(shù)據(jù)庫來實(shí)現(xiàn)搜索,關(guān)鍵字所對應(yīng)的數(shù)據(jù)庫字段非常有限。但由于文化水平的差異,并不是所有的用戶都能輸入合適的關(guān)鍵詞來進(jìn)行搜索。他們往往輸入的是一些簡單的短語,甚至是一句話。關(guān)鍵詞錯(cuò)誤匹配的情況很多,用戶看到的常常是“沒有您所需要的搜索結(jié)果”或者很多無關(guān)結(jié)果。例如:輸入“禮品行”進(jìn)行搜索,可能會(huì)出現(xiàn)“禮品行業(yè)”、“禮品行李”、“禮品行云流水”等大量無關(guān)結(jié)果。不理想的原因之一是分詞不準(zhǔn)確。要提高站內(nèi)搜索的水平,就得對用戶的輸入進(jìn)行進(jìn)一步處理,加入分詞技術(shù)和智能搜索技術(shù),才能使用戶隨心所欲地輸入,從而提供網(wǎng)站的友好程度。
3.2搜索速度緩慢
很多網(wǎng)站讓用戶的搜索操作直接與數(shù)據(jù)庫查詢掛鉤,這樣使網(wǎng)站數(shù)據(jù)庫的負(fù)荷很大。當(dāng)數(shù)據(jù)庫記錄量比較大的時(shí)候,頻繁地查詢數(shù)據(jù)庫,查詢速度會(huì)很慢,進(jìn)而影響網(wǎng)站的正常運(yùn)轉(zhuǎn)。尤其是同時(shí)有很多用戶進(jìn)行操作的時(shí)候,會(huì)導(dǎo)致信息塞車,這樣用戶經(jīng)過一段時(shí)間等待仍然看不到結(jié)果,很快就會(huì)轉(zhuǎn)移到其他網(wǎng)站選購商品。如何不讓用戶不耐煩是一個(gè)至關(guān)重要的問題,加入索引技術(shù)是解決這一問題的很重要的手段。
3.3關(guān)鍵詞中的同音字和錯(cuò)別字得不到自動(dòng)更正
在網(wǎng)站的站內(nèi)搜索中輸入“挪積壓”進(jìn)行搜索,如果得到的是與“諾基亞”相關(guān)的結(jié)果,并且提示你是不是要找“諾基亞”。這說明網(wǎng)站提供了搜索關(guān)鍵詞的相關(guān)詞的自動(dòng)匹配,幫助用戶在搜索的時(shí)候進(jìn)行參考。因?yàn)橐呀?jīng)預(yù)先估計(jì)到用戶可能誤拼這個(gè)詞,因而避免了搜索不到任何結(jié)果的糟糕結(jié)局。但目前只有極少數(shù)的電子商務(wù)網(wǎng)站實(shí)現(xiàn)了這一智能化檢索功能,大部分網(wǎng)站上輸入這樣的關(guān)鍵詞,會(huì)返回“0”個(gè)結(jié)果,除非更正拼寫,才會(huì)有所收獲。這也是決定網(wǎng)站用戶多少的一個(gè)因素。
3.4無法提供主題搜索和熱門統(tǒng)計(jì)功能
如果搜索引擎根據(jù)用戶的搜索要求,按照一個(gè)主題把與之相關(guān)的信息提供給用戶,就可以讓用戶更加全面地了解他所想要的商品。這就需要優(yōu)化電子商務(wù)網(wǎng)站信息之間的內(nèi)部組織結(jié)構(gòu),從而方便用戶的使用。另外,如果搜索引擎具備統(tǒng)計(jì)功能,可以統(tǒng)計(jì)一段時(shí)間內(nèi)關(guān)鍵字的訪問頻度,列出熱門關(guān)鍵字。就可以讓用戶知道熱門商品,網(wǎng)站也能更好地把握其用戶的需求,抓住市場動(dòng)向,創(chuàng)造更多的財(cái)富。但是當(dāng)前這些智能檢索功能在大部分電子商務(wù)網(wǎng)站中都沒有得以實(shí)現(xiàn)。
4站內(nèi)搜索引擎發(fā)展所需的計(jì)算機(jī)技術(shù)
4.1中文分詞技術(shù)
中文分詞技術(shù)屬于自然語言處理技術(shù)的范疇。從語言哲學(xué)的高度講,“詞”是從無意義的聲音到有意義的“語音”的關(guān)鍵過度。計(jì)算機(jī)理解和處理自然語言,也得從這一步開始。眾所周知,英文詞與詞之間是靠空格分隔開來,而中文詞與詞之間沒有顯性的分隔標(biāo)記。例如對于英文句子I need a cup和與之相應(yīng)的中文句子“我需要一個(gè)杯子”。計(jì)算機(jī)可以通過空格知道need是一個(gè)詞,但是沒有顯性標(biāo)志使它知道“需”和“要”兩個(gè)字合起來才表示一個(gè)詞。把中文的漢字序列切分成有意義的詞,就是中文分詞,也稱為切詞?!拔倚枰粋€(gè)杯子”這個(gè)句子經(jīng)過分詞后的結(jié)果是:我/需要/一個(gè)/杯子。
4.2索引技術(shù)
索引是數(shù)據(jù)庫隨機(jī)檢索的常用手段,它實(shí)際上就是記錄的關(guān)鍵字與其對應(yīng)地址的對應(yīng)表。建立索引的目的就是為了檢索數(shù)據(jù)。如同書籍目錄,其中指明了章節(jié)內(nèi)容在正文中的頁碼,方便讀者很快查找到內(nèi)容。使用索引技術(shù)提高查詢的速度原理也是一樣,當(dāng)數(shù)據(jù)庫的容量很大時(shí),如果要快速有效地獲取信息,那么就需要使用特定的索引技術(shù),避免信息塞車。
“倒排索引”是支持提高搜索引擎速度的核心技術(shù)之一。一個(gè)網(wǎng)頁文件要建立倒排索引,需要先抽取它的純文本內(nèi)容,然后把文本中的一個(gè)個(gè)詞切分開來,每個(gè)詞在數(shù)據(jù)庫里對應(yīng)一條記錄。在索引中詞作為關(guān)鍵字,后面跟著文件的標(biāo)識(shí)及其位置。例如有3個(gè)文件:文件1、文件2、文件3。它們的內(nèi)容如下:文件1(詞1,詞2,詞3)、文件2(詞a,詞b。詞c)、文件3(詞1,詞a,詞3)。建立的倒排索引就是:詞1(文件1,文件3)、詞2(文件1)、詞3(文件1,文件3),詞a(文件2,文件3)、詞b(文件2)、詞c(文件2)。
4.3智能檢索技術(shù)
傳統(tǒng)的檢索由于存在查不全、查不準(zhǔn)、檢索質(zhì)量不高的現(xiàn)象,早已不能滿足用戶的需求。智能檢索技術(shù)利用了同音詞典、同義詞典來改善檢索效果,比如用戶查詢“計(jì)算機(jī)”類商品,那么與“電腦”、“微機(jī)”相關(guān)的信息也能檢索出來。進(jìn)一步通過主題詞典、上下位詞典等還可以形成一個(gè)概念網(wǎng)絡(luò),在概念層面上輔助檢索,對用戶的檢索進(jìn)行相關(guān)性聯(lián)想,給予用戶智能知識(shí)提示線索,在交互過程中誘導(dǎo)用戶表達(dá)出真正想要的東西。比如用戶查詢“膠片”,提示出與之相關(guān)的“相機(jī)”、“知名膠片品牌”、“膠片銷售店鋪”等。