黃國忠,林 琳,高學鴻
(1.北京科技大學 土木與資源工程學院,北京 100083;2.北京科技大學 大安全科學研究院,北京 100083)
隨著市場競爭日趨激烈,產品創(chuàng)新性以及產品投放周期逐漸縮短,“缺陷產品”造成的傷害事故也越來越頻繁[1]。作為產品安全管理的重要手段,缺陷產品召回制度在國外發(fā)展已經較為成熟[2],且召回立法也明確監(jiān)管部門和專家對召回的效果進行評估[3],但缺乏一定依據和理論指導。消費品分類的復雜性決定了其召回率的不穩(wěn)定,后召回管理階段對于召回工作能否有效地降低或消除缺陷消費品的安全風險至關重要。
國內已有學者從不同角度對影響召回效果的原因展開研究,并提出了相應的措施優(yōu)化召回流程。高芳等[4]就生產者召回的內外因素和缺乏召回動力的原因展開分析,并對召回行為對生產者產生的影響進行了研究。楊金晶[5]提出對參與缺陷產品召回的消費者進行補償的想法,并根據召回成本和補償限額等建立優(yōu)化模型,以提升產品召回率,達到企業(yè)利益最優(yōu)化。徐乾程和錢存華等[6-7]從政府監(jiān)管視角運用模糊層次分析法構建評價缺陷消費品召回效果的模型。這些研究多從單一視角對召回效果優(yōu)化進行分析,缺乏對整個召回周期的關鍵節(jié)點上生產者、消費者和監(jiān)管機構的行為和反饋影響的討論,在利用召回率對召回效果進行評定上存在探討空間。
此外,目前效果評估主要運用AHP等依靠專家評分的方法進行重要度分析[8],而將機器學習算法模型應用于召回效果評估,可以減小經驗性帶來的誤差。因此,筆者擬綜合考慮召回流程中影響消費品召回效果的因素,結合改良CIRO層級模型建立召回效果指標體系。運用隨機森林算法構建消費品召回效果評估模型,為消費品的召回效果評估提供理論依據。
消費品召回效果評估指標體系的建立需要考慮流程中涉及的人為因素、產品特性及召回環(huán)境等外在因素。召回活動整個生命周期包括召回計劃、召回發(fā)起、召回處理和召回效果評估4個階段,缺陷產品的召回分為3個主體部分:生產者是主體、消費者是參與者、監(jiān)管機構是召回的監(jiān)管者[9]。召回活動產生的效果包括產品的退回和危險殘留等直接效果以及對召回主體和召回環(huán)境等產生的增益效果。
CIRO評估模型的4項評估活動分別是:背景評估、輸入評估、反應評估、輸出評估。背景評估分析和確定培訓需求;輸入評估收集培訓資源和相關信息;反應評估用于收集和分析培訓對象的反饋信息,并進行分析和評估[10]。邏輯框架矩陣通過投入、產出、目的與目標的4個層次描述,實現各層目標的假設條件,判定項目實施成果的可驗證指標[11]。
CIRO評估模型和邏輯模型與消費品召回整個動作邏輯相吻合,結合消費品召回評估的特點,將CIRO模型與邏輯模型結合得到消費品召回效果評估的層級模型,如表1所示。
表1 消費品召回效果評估的層級模型
篩選召回行為中召回完成度、召回后產品的殘余風險及各方滿意程度等產出層面影響因素,建立消費品召回效果評估指標體系。
1.2.1召回效果評估
召回產品退回情況需要根據背景層面中各方的固有情況進行單獨評估。由于消費品的特性,實際退回率很少超過30%,因此,需通過生產者提供的資料與數據,基于具體產品情況、行業(yè)整體召回水平、常規(guī)召回措施及消費者的基本情況等建立基準退回率指標體系。考慮退回這一行為主要來自購買了缺陷產品的消費者,消費者自身對缺陷的判斷能力、日常環(huán)境對參與召回是否便捷及個人對召回活動本身的認可和積極性都對退回率有影響。因此從消費者退回意愿的角度,結合缺陷產品本身的特性建立判定基準退回率的指標體系,如表2所示。
表2 基準退回率指標體系
“4級評估模型”中產出層面從召回情況、殘余風險和各方評價評估召回效果。結合前2個層面對召回率指標的影響,通過計算實際召回率與理想召回率的比值,綜合判斷一起消費品召回活動的效果。從影響層面來看,消費品的單次召回還會產生增益效果,包括對生產者自身的影響和召回活動的社會性影響。由此,建立由召回效果和增益效果組成的評估指標體系如表3所示。
表3 召回效果和增益效果組成的評估指標體系
隨機森林是一種包含多棵決策樹的機器學習模型,結合了bootstrap采樣和隨機屬性選擇的優(yōu)點[12],通過分析目標值與各個影響因子之間的復雜關系,得出不同影響因子對目標值的重要度,具有調試參數少、不易過度擬合和分類速度快的優(yōu)點,可以通過樣本數據精確擬合各種復雜的非線性關系[13]。
消費品召回效果評估模型是需要利用隨機森林算法將特征值的輸入轉化為召回效果的預測輸出,即需要用隨機森林中的隨機回歸森林。基于隨機森林的消費者召回效果評估模型的建立,首先需要對原始數據作歸一化預處理;其次調取數據,結合交叉驗證方法求取設置不同參數值時的均方誤差(MSE)的變化曲線,以此得出最適合該模型的參數;利用合適的參數計算得出不同特征值的權重,并建立效果評估模型。
生產者與監(jiān)管者負責對消費者采集數據與資料,主要途徑包括公開發(fā)表的開放數據;調查:可采用查閱檔案、電話訪問、在線調查、問卷調查、短信評價、回訪抽查等;現場采集:實時跟蹤召回情況,采集有關數據;生產者通過填寫材料表向監(jiān)管部門提供相關的數據和資料。
不同的特征指標往往具有不同的量綱和單位范圍,所以在進行模型計算前需要對數據進行一定的處理,常用的方法即為數據標準化(歸一化)[14],以此來減輕和消除數據量綱不同對模型的分析和指標重要性分析的影響。根據消費品召回的數據特點選擇線性函數歸一化方法。選取來自國家市場監(jiān)督管理總局缺陷產品管理中心的數據樣本作為隨機森林算法的樣本集和訓練集。
利用Python語言建立隨機森林參數選擇函數,對模型建立過程中的參數進行調試。由于在建立召回效果評估模型時已確定需要考慮的特定指標,因此主要考慮n_estimators和max_depth兩個對模型影響比較顯著的參數,其對模型準確度影響的判斷用MSE數值大小表示。
2.2.1隨機森林的關鍵參數調試
1)確定最優(yōu)n_estimators值
在確定最優(yōu)n_estimators值時,具體步驟如下:① 將樣本數據歸一化。② 初始化訓練集/測試集的MSE。③ 從1~500循環(huán),依次利用交叉驗證和隨機森林訓練該模型。輸出結果如圖1和圖2所示。
圖1 基準退回率模型的最優(yōu)n_estimators值分布圖
根據圖1和圖2可以看出,測試集和訓練集的MSE均方誤差均隨著n_estimastors數值的增大而先呈現下坡式下降,后呈現平穩(wěn)微上升的態(tài)勢。因為MSE數值越小,該測試集與訓練集之間的誤差越小,該測試模型的準確度越高。因此,將測試集和訓練集MSE差值最小點作為最優(yōu)n_estimastors取值點。
圖2 召回效果評估模型的最優(yōu)n_estimators值分布圖
2)確定最優(yōu)max_depth值
參數max_depth決定隨機森林中樹木的最大深度,是影響隨機森林模型在建立每一個決策樹時準確度的重要參數。調試過程參考n_estimators值的確定。輸出結果如圖3和圖4所示。
圖3 基準退回率模型的最優(yōu)max_depth值分布圖
圖4 召回效果評估模型的最優(yōu)max_depth值分布圖
同樣地,將測試集和訓練集MSE差值最小點作為最優(yōu)max_depth取值點。
綜合以上分析,基準退回率模型和召回效果評估模型的參數最優(yōu)值如表4所示。
表4 隨機森林參數值
2.2.2基于隨機森林的指標權重系數確定
隨機森林具有在生成每一棵樹的過程中,其內部節(jié)點在每次分裂時都會從候選的屬性里隨機挑選一定數量的分裂屬性的特點[15],利用這一點,在每次迭代中隨機換掉其中的一個屬性,利用換掉之后模型準確度的變化和變化幅度來預測該屬性對整個模型的預測結果之間的影響程度和重要性,完成對每個特征屬性重要度的判斷。在對數據歸一化處理并求得最優(yōu)參數值后,利用 Python中的importance函數確定指標權重系數,結果如表5和表6所示。
表5 基準退回率指標體系的權重系數
表6 召回效果指標體系的權重系數
指標體系中需要量化的指標包含定量指標、半定量指標及定性指標。定量指標主要利用該指標的隸屬度函數實現量化分級;半定量指標根據指標特點、法規(guī)規(guī)定等因素,利用語義賦值法實現量化分級;定性指標利用專家意見、消費者反饋等形式實現量化分級。
2.3.1指標量化原理
1)定量指標量化原理。定量指標的量化主要根據指標所對應的隸屬度函數,根據召回效果評估結果的分級,分為好、較好、一般、差4個等級,即S(x)={S1,S2,S3,S4}。假設量化指標的指數為x,量化范圍為[minx,maxx],其分布函數為:
(1)
2)半定量指標及定性指標量化原理。對于缺乏數據難以量化的指標,如:召回方式等指標,以及評價性指標,如:消費者滿意度等指標,采用語義賦值和專家及消費者評判相結合的方式完成量化分級。目前已經實施的缺陷汽車產品召回效果評估指南[16]中,指標量化分級為10分制,但由于消費品與汽車產品相比,其大部分追溯系統(tǒng)尚未成熟,某些企業(yè)的召回管理過程中部分指標的數值只能進行模糊統(tǒng)計,因此需要簡化量化分級。根據董紅磊等[17]基于模糊綜合評價法運用于汽車產品召回領域的方法和標準化研究院相關專家的意見,將消費品召回效果評價指標量化的評分等級設置為4級,如表7所示,其中半定量指標還需結合指標特點確定各等級評估說明。
表7 指標量化評分等級
2.3.2定量指標評級與量化情況說明
1)單值。按照消費品被投入市場時的單體價格,即單值劃分?,F設定單值a屬于[0,10 000]的區(qū)間內,其隸屬度函數如下:
(2)
式中:a為目標消費品的單值,元。
2)損耗比。損耗比包括固有價值損耗和壽命損耗?,F定實施召回的時間點TA,被召回批次消費品的生產日期為TB(若存在多時間段生產消費品召回,以最遠生產日期為準),行業(yè)內一般認為該消費品的使用周期為TI。此外,若生產者實施召回的時間點超過消費品使用周期時間段,則其損耗比為1。
a)固有價值損耗比。按照生產者實施召回的時間點處于該消費品使用周期時間段內固有價值損耗比計算,其隸屬度函數如下:
(3)
式中:VI為目標消費品的固有價值,元;VA為目標消費品的實際價值,元。
b)壽命損耗比。按照生產者實施召回的時間點處于該消費品使用周期時間段內使用壽命損耗比計算,其隸屬度函數如下:
(4)
式中:LI為行業(yè)內一般認為該類消費品的使用壽命,天;LA為實施召回時該消費品的使用壽命,天。
3)實際召回退回率/基準召回退回率。根據基準召回退回率的評級和量化結果計算該次召回的基準退回率數值,并將實際召回退回率與其進行比較。該指標數值量化如下:
(5)
4)召回后受傷頻次。召回是消除產品因缺陷造成傷害的行為活動,如果一個產品發(fā)生召回后仍出現受傷投訴,根據召回效果評估最嚴苛原則,可認定其召回效果差,賦值1分,未出現投訴賦值3分。
對某一評價對象Oj,若評價指標集是Ei={E1,E2,…,En},Oj關于Ei的規(guī)范關聯(lián)度是kij,Ei的權重是w(w表示評價指標Ei的相對重要程度),且0≤w≤1。優(yōu)度是評級指標Ei的權重值w與對象Oj的規(guī)范關聯(lián)度kij,即指標賦值的乘積[18],將優(yōu)度定義為:
(6)
確定召回效果評語V={V1,V2,V3},利用等級比重法,根據召回效果優(yōu)度值及殘余風險量級分析,將召回效果分為好、一般和差3級,所對應的殘余風險為低風險、可接受風險和不可接受風險,用數字1~3依次表示,并對等級由1~3進行區(qū)間賦值,以便召回效果量化評判。其賦值情況如表8所示。
表8 效果評估結果的賦值情況
由于增益效果評估指標為輔助性指標,其具體效果評定與直接效果相比,需要一段較長的反饋時間。因此,結合標準化領域相關專家的意見,使用打分法進行計算,不對指標體系進行權重確定,僅當每個指標的重要度相等。具體評分規(guī)則根據召回活動對指標產生的效果分為負面影響、無影響和正面影響,分別賦值-1、0和1分(此處賦值僅表示召回是否對該指標產生影響,不代表影響程度)。當總賦值得分大于0時,表示該召回活動產生了增益效果。
通過以上幾節(jié)的分析,在構建基準退回率的最優(yōu)模型時,選取參數如表4所示。目前,對于消費品召回的預期退回率沒有嚴格的規(guī)定說明其誤差范圍和標準,根據經驗得到一般預測數據與真實數據之間相差±10%均可接受。因此對比分析基于隨機森林的評估模型,選取匹配度和相對誤差2個指標對評估模型的準確性進行判斷。
1)匹配度。該指標反映預測值和實際值之間的匹配情況,匹配度越接近,單個樣本的預測效果越好,公式如下:
(7)
式中:i表示樣本;Xi表示預測值;Yi表示真實值;pi表示樣本i的匹配度。
2)相對誤差。實際相對誤差指測量造成的絕對誤差與被測量真值之比,相對誤差更能反映預測結果與真實值之間的差異,計算公式如下:
(8)
式中:Δ表示絕對誤差,L表示真值。
采用的案例來源于國家市場監(jiān)督管理總局缺陷產品管理中心提供的2010—2018年消費品召回數據,因篇幅原因此處只展示選取15個案例作為預測集數據的基準召回率模型,如表9所示。
通過表9的數據可以看到,在展示的預測集中的15個案例得到的預測值和真實值匹配度基本均接近1,5個樣本數據的相對誤差在±5%以內,14個樣本數據的相對誤差在±10%以內。
表9 基于隨機森林的基準退回率評估預測結果
通過完整數據分析,隨機森林運用在消費品召回效果評估模型時的擬合預測值中,93.33%的樣本在合理的誤差范圍內。由此得出:隨機森林算法運用于該召回效果評估模型的權重系數確定時具有較高的擬合度,可用于召回效果評估領域,解決專家打分主觀性較強的缺點。
某品牌青少年運動夾克在設計過程中未能充分考慮到調節(jié)松緊的繩帶在抽出后可能對兒童存在隱患,且無提醒標志和說明,有造成纏繞的風險,其召回信息如表10所示。
表10 某品牌青少年運動夾克召回信息
將以上案例應用于消費品召回效果評估模型,運用召回效果評估模型進行召回效果優(yōu)度值計算,可得召回效果評估優(yōu)度值為2.063,對應評級為好。
青少年運動夾克在召回后價格大幅下跌,可以看出消費者的未來購買意圖不強,但由于該企業(yè)管理有限公司對本次召回活動的挽救較為及時,品牌影響未發(fā)生大幅度下跌,消費者對該品牌仍有較強的購買意圖,且對該品牌聲譽沒有不良影響。同時,在該品牌召回完成后并未引起行業(yè)標準的更改和同類產品生產者的自查,但該消費品的召回結合監(jiān)管部門對該類產品的消費預警,一定程度上引起消費者的重視和對同類消費品召回的促進,其召回增益效果評估打分如表11所示。
表11 召回增益效果評估打分
增益效果得分為2,結合國家市場監(jiān)督管理總局缺陷產品管理中心提供的缺陷總結報告和召回評價、媒體評價,根據優(yōu)度值和殘余風險量級分析可以得出,當召回效果評估優(yōu)度值為2.063時,其對應召回評估結果為“好”,其殘余風險為低風險,與實際召回效果相符合。因該產品受單值、目標群體對缺陷判斷能力等影響,導致其基準退回率和實際退回率較低,但該品牌及時發(fā)布召回信息、使用方便便捷的召回方式并有效減少甚至消除同一缺陷對消費者帶來的安全隱患和傷害,同時監(jiān)管部門監(jiān)管合理到位,使得其召回效果較好,值得同類召回產品借鑒。
1)結合改良CIRO層級評估建立召回效果評價分析指標體系,運用隨機森林算法在數據案例的基礎上確定指標權重,建立基于隨機森林的消費品召回效果評估總模型。通過使用模型對案例的預測基準退回率進行計算,與實際預測退回率的相對誤差在可接受范圍內,證明該評估模型可以有效、準確地評價消費品召回效果。
2)所構建的評估指標體系考慮到召回活動參與的各個相關方的行為后果和影響,采用實際/基準召回率直觀地評估召回效果,隨機森林算法的運用能較好地彌補目前召回效果評估研究中主觀性較強、指標定量化難等問題。
3)采用傳統(tǒng)的隨機森林算法構建模型,選擇來自國內典型的召回案例,樣本數據較為完整,但實際運用過程中,主觀性指標的數據往往難以收集。因此,該方法對此類非平衡數據的處理仍不夠理想。未來可引入NCL技術、應用代價敏感學習等對隨機森林算法進行優(yōu)化。