郝國(guó)棟 曹瑞華 李高升 李新悅
摘要:步入新時(shí)代以來,國(guó)民的收入水平不斷提升,生活水平及生活質(zhì)量得到極大改善,尤其是臨近2020年我國(guó)即將全面建成小康社會(huì)的目標(biāo)的實(shí)現(xiàn),食品安全日益成為人們關(guān)注熱點(diǎn),市場(chǎng)上存在著各式各樣的飯店,政府無法及時(shí)的將飯店食品安全檢查結(jié)果傳遞給廣大消費(fèi)者,從而出現(xiàn)餐飲行業(yè)衛(wèi)生安全問題層出不窮,使得人們對(duì)餐飲食品安全產(chǎn)生懷疑。食品安全關(guān)系到國(guó)民切身利益,關(guān)系到經(jīng)濟(jì)健康發(fā)展和社會(huì)穩(wěn)定。而食安之健康服務(wù)平臺(tái)的創(chuàng)立旨在銜接廣大消費(fèi)者與地區(qū)相關(guān)政府部門,將商戶衛(wèi)生安全情況及時(shí)反饋消費(fèi)者,為消費(fèi)者提供衛(wèi)生健康優(yōu)質(zhì)的商戶選擇,并監(jiān)督商戶配合管理部門及時(shí)整改,推動(dòng)該地區(qū)整體餐飲行業(yè)環(huán)境向衛(wèi)生安全健康方向發(fā)展。
本文基于該平臺(tái)前端數(shù)據(jù)反饋,采用層次分析法對(duì)主要影響商戶評(píng)判的各個(gè)因素進(jìn)行分析,對(duì)各商戶進(jìn)行綜合評(píng)估打分。并對(duì)商戶所得分值采用快速聚類法進(jìn)行層次等級(jí)劃分,目的為方便客戶對(duì)商戶的判別。
關(guān)鍵詞:AHP;快速聚類;商戶評(píng)判;SPSS
一.問題分析
收集可以反映餐館整體情況的相關(guān)信息,包括營(yíng)業(yè)執(zhí)照、衛(wèi)生許可證、食品從業(yè)人員健康檢查、培訓(xùn)資料證明,和質(zhì)量技術(shù)監(jiān)督部門要求提供的其他資料等各種正規(guī)的證件信息,政府相關(guān)部門對(duì)商戶檢查情況和消費(fèi)者本身對(duì)商家的反映情況數(shù)據(jù)。本文采用層次分析法建立評(píng)價(jià)模型,最大化反映商戶實(shí)際整體情況,基于商家實(shí)際數(shù)據(jù)通過數(shù)學(xué)模型計(jì)算出來的分值,對(duì)計(jì)算出來的分值數(shù)據(jù)進(jìn)行快速聚類分析算法,對(duì)數(shù)據(jù)進(jìn)行劃分等級(jí),從而更清晰的將情況反映給客戶及商家。
二.符號(hào)說明
三.模型的建立與求解
1.步驟一模型的建立與求解
1.1 AHP模型說明
層次分析法(AHP)作為一種綜合評(píng)價(jià)方法,以其所具有的定性和定量相結(jié)合的優(yōu)點(diǎn)在目前的安全領(lǐng)域研究中取得廣泛應(yīng)用。層次分析法的優(yōu)點(diǎn)是能將復(fù)雜的問題進(jìn)行分解,為最佳方案的選擇提供科學(xué)依據(jù),為決策層作出正確的決策提供理論參考。在進(jìn)行社會(huì)的、經(jīng)濟(jì)的以及科學(xué)管理領(lǐng)域問題的系統(tǒng)分析中,面臨的常常是一個(gè)由相互關(guān)聯(lián)、相互制約的眾多因素構(gòu)成的復(fù)雜缺少定量數(shù)據(jù)的系統(tǒng)。層次分析法為這部分問題的決策和排序提供了實(shí)用的建模方法。
1.2 問題分析與求解
通過平臺(tái)收集數(shù)據(jù)及線下調(diào)查獲取商家相關(guān)安全信息和客戶反映信息,包括營(yíng)業(yè)執(zhí)照、衛(wèi)生許可證、食品從業(yè)人員健康檢查和培訓(xùn)資料證明以及質(zhì)量技術(shù)監(jiān)督部門要求提供的其他資料等各種正規(guī)的證件信息。綜合上面考核信息主要分為六大類影響因素,采用層次分析法建立模型,綜合評(píng)價(jià)商家整體情況。
在這個(gè)模型下,將問題分解為多個(gè)元素的組成,這些元素又按其屬性及關(guān)系形成若干層次。上一層次的元素作為準(zhǔn)則對(duì)下一層次有關(guān)元素起支配作用。
(1)最高層:這一層次為目標(biāo)層,反映最終評(píng)價(jià)分值。
(2)中間層:這一層次中為實(shí)現(xiàn)目標(biāo)所涉及的中間環(huán)節(jié),包含所需考慮的準(zhǔn)則:營(yíng)業(yè)證件完善度、從業(yè)人員健康證、食品安全檢查評(píng)審、客戶評(píng)價(jià)、環(huán)境污染相關(guān)證件、消防安全相關(guān)評(píng)審。
(3)最底層:這一層次為可供選擇的各商戶。
采用調(diào)查問卷形式,對(duì)以上五種因素進(jìn)行數(shù)據(jù)統(tǒng)計(jì),對(duì)每一因素打分分值求均值,確定準(zhǔn)則層判斷矩陣B;bij表示的意義為與指標(biāo)j相比,i的重要程度。
中間層判斷矩陣A,通過平臺(tái)反饋數(shù)據(jù)及實(shí)際調(diào)查對(duì)商戶單項(xiàng)因素打分進(jìn)行兩兩比較。
計(jì)算一致性指標(biāo)CI
CI=(λmax-n)/(n-1)
查找相應(yīng)的平均隨機(jī)一致性指標(biāo)RI。
計(jì)算一致性比例CR
CR=CI/RI
當(dāng)CR<0.10 時(shí),認(rèn)為判斷矩陣的一致性可以接受
最終由算術(shù)平均法和特征值法兩組權(quán)重求平均數(shù)得出最后評(píng)分準(zhǔn)則權(quán)重:營(yíng)業(yè)證件完善度:0.2413、從業(yè)人員健康證情況:0.2002、食品安全檢查評(píng)審:0.1442、客戶評(píng)價(jià):0.1123、環(huán)境污染相關(guān)證件:0.0667、消防安全相關(guān)評(píng)審:0.1283
2.步驟二模型的建立與求解
2.1 模型說明
聚類分析方法能夠?qū)Ω鞣N事物的性質(zhì)進(jìn)行直接的比較。在數(shù)據(jù)分析中,這是一種重要的數(shù)據(jù)分析技術(shù),并有著廣泛的應(yīng)用。在大樣本聚類分析中,傳統(tǒng)的聚類分析能夠?qū)崿F(xiàn)對(duì)數(shù)據(jù)進(jìn)行分類的需求。本文應(yīng)用的k-mean聚類方法可以對(duì)測(cè)量數(shù)據(jù)快速分類。這種方法中,數(shù)據(jù)被視為k維空間中的點(diǎn),通過距離實(shí)現(xiàn)對(duì)個(gè)體之間親疏程度的判別。
2.2 問題分析與求解
本文以調(diào)查的廊坊市多家商戶具體情況為例,采用步驟一模型進(jìn)行計(jì)算,計(jì)算后的數(shù)據(jù)采用SPSS軟件進(jìn)行聚類分析求解。指定聚類成3類,SPSS確定3個(gè)類的初始類中心點(diǎn)。SPSS根據(jù)樣本數(shù)據(jù)的實(shí)際情況,選擇3個(gè)由代表性的樣本數(shù)據(jù)作為初始類中心。需要指定3組樣本數(shù)據(jù)作為初始類中心點(diǎn)。計(jì)算所有樣本數(shù)據(jù)點(diǎn)到3個(gè)類中心點(diǎn)的歐氏距離,SPSS按照距3個(gè)類中心點(diǎn)距離最短的原則,把所有樣本分派到各中心點(diǎn)所在的類中,形成一個(gè)新的類,完成一次迭代過程。其中計(jì)算公式為:
式中,k表示每個(gè)樣本中有個(gè)變量:示第一個(gè)樣本在第i個(gè)變量上的取值:yi表示第二個(gè)樣本在第i個(gè)變量上的取值。SPSS重新確定k個(gè)類的中心點(diǎn)。SPSS計(jì)算每個(gè)類中各個(gè)變量的變量值均值,并以均值點(diǎn)作為新的類中心點(diǎn)。重復(fù)以上計(jì)算過程,直到達(dá)到指定的迭代次數(shù)或終止達(dá)代的判斷要求停止。
將數(shù)據(jù)錄入SPSS中,檢查數(shù)據(jù)是否有錄入錯(cuò)誤,是否有不合理的數(shù)據(jù),最后做一個(gè)描述性統(tǒng)計(jì),進(jìn)而查看那些數(shù)據(jù)是不合理的。對(duì)SPSS進(jìn)行相關(guān)參數(shù)的設(shè)置,對(duì)數(shù)據(jù)進(jìn)行分析:
通過表格可以得出分值聚集在0.69分為一類共有36戶商家,3.58分為一類共有59戶商家,1.95分為一類共有192戶商家。
通過以上數(shù)據(jù)反映出以廊坊部分商戶餐館評(píng)分?jǐn)?shù)據(jù)總體上的情況,聚類分析用戶被分為三類,基于以上研究可以進(jìn)一步為客戶判別提供直觀視覺,在實(shí)際應(yīng)用中,為用戶更直觀的反映餐館商戶具體情況。
四.模型結(jié)論及改進(jìn)
通過平臺(tái)前端數(shù)據(jù)反饋,應(yīng)用層次分析法實(shí)時(shí)基于商戶的各判別因素進(jìn)行計(jì)算,對(duì)各商戶進(jìn)行綜合評(píng)估打分。同時(shí)對(duì)商戶所得分值實(shí)時(shí)采用快速聚類法進(jìn)行層次等級(jí)劃分,在初步實(shí)踐應(yīng)用中顯示出較良好的判別能力。
但在采用快速聚類分析同時(shí),模型本身對(duì) K 值敏感。K 的選擇會(huì)較大程度上影響分類效果。在聚類之前,本文方案預(yù)先設(shè)定 K 的大小為3,但是實(shí)際上很難確定分成幾類是最優(yōu)的,是當(dāng)數(shù)據(jù)量很大時(shí),預(yù)先無法判斷。在模型計(jì)算中,對(duì)離群點(diǎn)和噪聲點(diǎn)比較敏感。K-means 是隨機(jī)選擇 K 個(gè)點(diǎn)作為初始的聚類中心。我們可以對(duì)這個(gè)隨機(jī)性進(jìn)行一點(diǎn)約束,使迭代速度更快。只能聚凸的數(shù)據(jù)集。所謂的凸數(shù)據(jù)集,是指集合內(nèi)的每一對(duì)點(diǎn),連接兩個(gè)點(diǎn)的直線段上的每個(gè)點(diǎn)也在該集合內(nèi)。若采用 Bregman 距離,則可顯著加強(qiáng)此類算法對(duì)更多類型簇結(jié)構(gòu)的適用性。
針對(duì)K值的選擇,主要是k的值須預(yù)先設(shè)定,并在整個(gè)算法執(zhí)行過程中無更改。此時(shí),可以應(yīng)用 ISODATA 算法。雖有很多啟發(fā)式用于自動(dòng)確定 k 的值,但是實(shí)際應(yīng)用中,仍然基于不同的 K 值,多次運(yùn)行取平均值。從而提升等級(jí)劃分算法的可靠性。
參考文獻(xiàn):
[1]范宓.層次分析法在安全評(píng)價(jià)中的應(yīng)用[J].陜西煤炭,2011,30(6):76-77. DOI:10.3969/j.issn.1671-749X.2011.06.036.
[2]司守奎, 孫兆亮. 數(shù)學(xué)建模算法與應(yīng)用[M]. 第2版. 北京: 國(guó)防工業(yè)出版社, 2016.
[3]匡宸毅. 聚類分析及其spss實(shí)現(xiàn)[C]. 管理科學(xué)和工業(yè)工程協(xié)會(huì).探索科學(xué)2016年6月學(xué)術(shù)研討.管理科學(xué)和工業(yè)工程協(xié)會(huì):管理科學(xué)和工業(yè)工程協(xié)會(huì),2016:102.
[4]周志華.《機(jī)器學(xué)習(xí)》[J].航空港,2018,000(002):P.94-94.