柏 楠, 山 娜
(1.安徽國際商務(wù)職業(yè)學(xué)院,安徽 合肥 231131;2.北京服裝學(xué)院,北京 100029 )
隨著現(xiàn)代科技的快速發(fā)展,數(shù)字化場景逐漸成為人們?nèi)粘I畹闹匾M成部分。數(shù)字化場景下的互動設(shè)計,既包含了智能手機、智能手表、智能家居等設(shè)備的交互,也包括人與人之間的交互和社交。數(shù)字化場景下的互動影響設(shè)計,不僅僅涉及技術(shù),也融合了心理學(xué)、社會學(xué)、設(shè)計和用戶體驗等多個方面的知識。數(shù)字化技術(shù)的快速發(fā)展帶來了前所未有的機遇和挑戰(zhàn),設(shè)計師們不僅需要考慮用戶的需求和體驗,還要充分利用數(shù)字化場景下的工具和資源,為用戶提供創(chuàng)新的設(shè)計方案。而在設(shè)計數(shù)字產(chǎn)品和服務(wù)時,設(shè)計師需要了解行為學(xué)派的有關(guān)心理學(xué)框架,在用戶的認知、決策與行為間探索反饋關(guān)系,以此優(yōu)化產(chǎn)品與用戶之間的交互體驗,提升用戶的參與度和改進用戶的滿意度。
從認知行為理論的角度出發(fā),探討了數(shù)字化場景下互動影響設(shè)計的問題,分析了認知行為理論對用戶體驗和設(shè)計的影響,并提出了基于用戶行為預(yù)測的設(shè)計模型和方法。通過本文的研究和探討,希望能夠為數(shù)字化場景下的設(shè)計者們提供思路和方向,更好地應(yīng)對設(shè)計挑戰(zhàn),提升用戶體驗。
使用三模型進行對比分析,分別為AdaBoost,ExtraTrees與GBDT,均為集成學(xué)習(xí)中的基于決策樹的算法.
AdaBoost(Adaptive Boosting)通過對弱分類器進行加權(quán)組合,得到一個性能更優(yōu)的分類器。AdaBoost的核心思想是迭代訓(xùn)練模型,每一輪根據(jù)前一輪模型的表現(xiàn)對樣本進行加權(quán),使得錯誤分類的樣本得到更高的權(quán)重,正確分類的樣本得到更低的權(quán)重,從而使得弱分類器逐步聚焦于難以分類的樣本,最終得到較好的分類效果。
假設(shè)對于初始化訓(xùn)練樣本集,其權(quán)重為:
對其中t=1,2,…,T,訓(xùn)練基分類器Gi(x),計算其分類誤差率ct,由此有權(quán)重系數(shù):
更新樣本權(quán)重有:
wt+1(i)=wt(i)exp(-αiyiGt(xi)),i=1,2,…,m
則有強分類器:
ExtraTrees(Extremely Randomized Trees)和Random Forest算法非常類似。ExtraTrees的特點是,在構(gòu)建決策樹時,對每個節(jié)點的特征進行隨機抽樣,而不是從全部特征中選取最優(yōu)切分點。這樣可以使得ExtraTrees的決策樹更加多樣化,減少了決策樹之間的相關(guān)性,從而提高了模型的泛化能力。
GBDT(Gradient Boosting Decision Tree)同樣采用Boosting的思想,通過迭代訓(xùn)練決策樹模型來不斷優(yōu)化模型的分類性能。GBDT的訓(xùn)練過程中,每個新的模型都會在之前模型的殘差基礎(chǔ)上進行訓(xùn)練,從而不斷提高模型的表現(xiàn)。與AdaBoost不同的是,GBDT并不是每次都對所有樣本進行加權(quán),而是針對每個樣本都設(shè)立一個殘差,從而使得GBDT更加注重錯誤分類的樣本,提高了模型在難以分類的樣本上的表現(xiàn)。
這一殘差設(shè)置有:
ri:ri=yi-fm-1xi,i=1,2,…,n
訓(xùn)練基分類器hm(x),使目標函數(shù)最小化,有:
基于先行搜索獲得合適步長pm,更新模型權(quán)重有:
fm(x)=fn(x)+pmhm(x)
輸出得到強分類器:
面向數(shù)字化互動場景設(shè)計,使用現(xiàn)有互動場景訪問真實數(shù)據(jù)作為樣本庫進行分析,相應(yīng)構(gòu)建九項輸入變量與一項輸出變量。首先,場景瀏覽量可以作為預(yù)測模型中設(shè)計的吸引力參數(shù),幫助更好地評估設(shè)計方案的吸引力和流行度。與之相對的,跳出率可以被視為設(shè)計未能滿足用戶期望的重要指標,幫助設(shè)計師優(yōu)化設(shè)計以提高用戶留存時間。繼而,通過預(yù)測模型中的用戶反應(yīng)時長指標,設(shè)計師可以了解用戶對應(yīng)的操作難度,優(yōu)化設(shè)計以提高用戶的交互體驗。用戶交互頻率是指一個用戶在一定時間內(nèi)與網(wǎng)站或應(yīng)用的互動次數(shù)。在數(shù)字化場景下,用戶交互頻率與網(wǎng)站或應(yīng)用的設(shè)計相關(guān),高度可用性和覆蓋良好的用戶需求通常會導(dǎo)致更高的用戶交互頻率。較高的用戶誤差率可能會導(dǎo)致用戶在網(wǎng)站或應(yīng)用中的停留時間減少,從而影響用戶的滿意度。再次,模型需要考慮轉(zhuǎn)化率、任務(wù)完成時長、用戶留存率等指標。與此同時,消費規(guī)模可以作為一種商業(yè)指標來幫助設(shè)計師衡量網(wǎng)站或應(yīng)用的經(jīng)濟價值。最后,平均用戶滿意度是指用戶對網(wǎng)站或應(yīng)用的滿意度評價的平均分數(shù)??梢宰鳛樵O(shè)計師衡量用戶體驗的關(guān)鍵指標,根據(jù)此指標進行設(shè)計優(yōu)化。
對樣本數(shù)據(jù)進行整理,如表1. 場景瀏覽量標準差為2785.7,說明了不同數(shù)字化場景項目的用戶點擊與瀏覽數(shù)據(jù)的離散程度比較大。用戶平均有61.2%的概率在場景中停留,跳出率的平均數(shù)值比中位數(shù)略低,有可能是由于部分用戶在場景中的停留時間過短,無法統(tǒng)計在跳出率指標中。用戶反應(yīng)時長平均值為0.271,用戶在處理場景交互元素時平均反應(yīng)較快,且大部分用戶反應(yīng)時長分布較為集中。用戶平均每個任務(wù)中的錯誤率為25.4%,部分用戶的錯誤率更高,數(shù)據(jù)的離散程度比較大。用戶在場景中完成一個任務(wù)的平均轉(zhuǎn)化率為38.8%,表明用戶參與交互的效率有改進的空間。其他指標則普遍具有高水平的標準差,表明變量的分布差異顯著,不同用戶習(xí)慣有顯著不同。
表1 描述性統(tǒng)計
基于上述樣本數(shù)據(jù)構(gòu)建模型,訓(xùn)練樣本數(shù)與測試樣本數(shù)分別占比為70%與30%,模型均不進行數(shù)據(jù)洗牌和交叉驗證,進行模型預(yù)測。其結(jié)果如表2:
表2 模型預(yù)測結(jié)果權(quán)重評分
如圖1所示,不同預(yù)測模型對于不同指標的權(quán)重評分,其中跳出率,用戶留存率和轉(zhuǎn)化率這三個指標在所有模型中都獲得了較高的權(quán)重。這告訴我們在數(shù)字化場景中,這三個指標對于互動影響設(shè)計至關(guān)重要,需要在設(shè)計中特別關(guān)注這些因素,以提高用戶體驗和交互效果。同時,消費規(guī)模和場景瀏覽量等指標的權(quán)重較低,說明用戶的瀏覽情況與場景整體吸引力對用戶滿意度的影響較弱,但可能受到用戶滿意度基于瀏覽后評分的影響,需要依據(jù)實際情況靈活應(yīng)用。
整理各模型的預(yù)測結(jié)果有:
圖1 AdaBoost,ExtraTrees,GBDT預(yù)測結(jié)果
如圖1所示,各模型中預(yù)測值與真實值數(shù)據(jù)波動高度吻合,模型的預(yù)測能力顯著較好。
模型性能的檢驗是基于用戶行為預(yù)測的設(shè)計模型和方法的重要環(huán)節(jié)。通過檢驗?zāi)P托阅?可以評估模型的有效性和效果,并為進一步的優(yōu)化和迭代提供指導(dǎo)。
表3 模型預(yù)測誤差性能
如表3所示,模型預(yù)測準確性整體表現(xiàn)良好。其中,adaboost和GBDT的訓(xùn)練集MSE、RMSE和MAE都為0,R2顯著較高說明在訓(xùn)練集上模型的預(yù)測結(jié)果準確度很高。測試集上的MAPE值也比較高,說明在測試集上模型預(yù)測的誤差相對較大,而ExtraTrees的測試集MAPE略高于adaboost和GBDT,但也保持了較高的預(yù)測準確度。
從探討了數(shù)字化場景下互動影響設(shè)計問題,相應(yīng)討論的基于用戶行為預(yù)測的設(shè)計模型和方法表現(xiàn)出良好的預(yù)測準確性,從而為互動設(shè)計提供了更加系統(tǒng)和科學(xué)的設(shè)計方法。