趙茜茜 張洋溢 聶焱
摘要:現(xiàn)針對一種實用新型指紋鎖拉鏈,研究其市場需求,即客戶收入、喜好、年齡等對于該產(chǎn)品的需求度。使得該產(chǎn)品在投入市場之前,能有一個較準(zhǔn)確的定位?,F(xiàn)采用集成學(xué)習(xí)的思想,將兩個基礎(chǔ)預(yù)測模型,集成成一個較強的預(yù)測、分類模型,能夠為數(shù)據(jù)集建立一個較為出色的分類模型和預(yù)測模型,能夠用于預(yù)測一個新的案例是否對指紋鎖拉鏈產(chǎn)品有需求。
關(guān)鍵詞:需求預(yù)測;集成學(xué)習(xí);指紋鎖拉鏈
中圖分類號:TN919.5 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2019)07-0050-02
0 引言
日常生活中人們使用的背包上的拉鏈基本上都是沒有加鎖的,或者是旅行箱上使用的密碼鎖,但是這種密碼鎖有兩個明顯的缺點,其一是經(jīng)常會出現(xiàn)忘記密碼的情況,給人們帶來生活的不便,其二是會出現(xiàn)人們因為密碼鎖麻煩而很少去使用的情況,因此很多這樣的密碼鎖沒有起到其本質(zhì)加強防盜系數(shù)的作用,成為一種擺設(shè)。
因此推出一種安全、便捷的指紋鎖拉鏈裝置。延伸加工拉鏈產(chǎn)業(yè)鏈,降低指紋鎖成本,提高產(chǎn)品附加價值,切實提高箱包安全性能。該產(chǎn)品推向市場之前,需要對其進(jìn)行市場需求分析。
目前對于需求預(yù)測的方法多采用單一預(yù)測算法。但是任何算法都有優(yōu)劣,無法達(dá)到完美效果。因此可采用構(gòu)建并結(jié)合多個學(xué)習(xí)器來完成學(xué)習(xí)任務(wù)的思想,即集成學(xué)習(xí),來對調(diào)查問卷獲得的數(shù)據(jù)集進(jìn)行分類訓(xùn)練、學(xué)習(xí)。能夠為數(shù)據(jù)集建立一個較為出色的分類模型和預(yù)測模型,能夠用于預(yù)測一個新的案例是否對指紋鎖拉鏈產(chǎn)品有需求。
1 數(shù)據(jù)特性描述
1.1 數(shù)據(jù)來源
數(shù)據(jù)來源于調(diào)查問卷。問卷調(diào)查采用重點對象的抽樣調(diào)查形式,通過對城市的經(jīng)濟(jì)、人口、社會習(xí)俗、箱包消費、消費觀念等方面分析,將大學(xué)生群體作為本次調(diào)查的代表人群。發(fā)放問卷800份,回收521份,回收率為65.1%,可利用125份,可利用率為15.6%。
數(shù)據(jù)集的全名為對于帶有指紋鎖拉鏈的背包(包括斜挎包)的需求調(diào)查??衫脤嵗灿?25個。
1.2 具體數(shù)據(jù)闡述
數(shù)據(jù)集數(shù)據(jù)來自用戶通過線上、線下問卷形式的調(diào)查。共有七個問題,分別如表1。
現(xiàn)將前六個問題回答結(jié)果用0和1表示,第七個問題回答結(jié)果用YES和NO表示。
2 采用個體學(xué)習(xí)器進(jìn)行預(yù)測
2.1 基于誤差逆?zhèn)鞑ニ惴ǖ亩鄬痈兄獧C模型
多層感知機(Multi-Layer Perception,MLP),也叫前饋神經(jīng)網(wǎng)絡(luò),后文簡稱為神經(jīng)網(wǎng)絡(luò)模型。模型通常由一個輸入層、一個或多個隱層和一個輸出層構(gòu)成。
使用100組數(shù)據(jù)訓(xùn)練,25組數(shù)據(jù)測試。訓(xùn)練的過程就是對參數(shù)進(jìn)行不斷的調(diào)整和優(yōu)化,通常標(biāo)準(zhǔn)是均方根誤差RMSE低于0.1或是訓(xùn)練達(dá)到一定的總周期數(shù)。經(jīng)過不斷學(xué)習(xí)訓(xùn)練,選取的隱層個數(shù)及其節(jié)點數(shù)、學(xué)習(xí)率和動量如表2,訓(xùn)練次數(shù)均為5000次。
當(dāng)前BP算法訓(xùn)練并測試的結(jié)果顯示有兩個錯誤。該算法測試結(jié)果的混淆矩陣如表3。
2.2 向量機(SVM)
SVM(Support Vector Machine)中文名為支持向量機,是一個有監(jiān)督的學(xué)習(xí)模型,通常用來進(jìn)行模式識別、分類以及回歸分析。SVM方法是通過一個非線性映射p,把樣本空間映射到一個高維乃至無窮維的特征空間中(Hilbert 空間),使得在原來的樣本空間中非線性可分的問題轉(zhuǎn)化為在特征空間中的線性可分的問題。
同樣使用100組數(shù)據(jù)訓(xùn)練,25組數(shù)據(jù)測試。該算法的均方根誤差如表4。
SVM算法用于此例,效果也不是很好。測試結(jié)果顯示有4個錯誤。該算法測試結(jié)果的混淆矩陣如表5。
3 集成學(xué)習(xí)
集成學(xué)習(xí)基于反向傳播算法的多層感知機和邏輯回歸模型在測試集的效果表現(xiàn)欠佳,不能作為理想的需求預(yù)測模型?,F(xiàn)在使用集成學(xué)習(xí)的思想來處理。集成學(xué)習(xí)就是訓(xùn)練多個模型,按照一定的結(jié)合策略進(jìn)行集成。
當(dāng)然并不是所有的模型都可以用于集成學(xué)習(xí),基本條件是要個體模型有較高準(zhǔn)確率,個體學(xué)習(xí)器間的相關(guān)性小。文中已經(jīng)使用了BP神經(jīng)和支持向量機模型對指紋鎖拉鏈產(chǎn)品市場需求進(jìn)行了預(yù)測,預(yù)測效果都較高,但是沒有達(dá)到理想條件,且兩個模型之間沒有相關(guān)性,故可以用來集成。
現(xiàn)使用一種集成學(xué)習(xí)方法為預(yù)測融合法,通過基礎(chǔ)模型分別進(jìn)行一次預(yù)測,會產(chǎn)生兩種不同的預(yù)測結(jié)果,將預(yù)測結(jié)果用來訓(xùn)練一個新模型來進(jìn)行預(yù)測,從而生成一個最終的預(yù)測結(jié)果。新模型采用的算法是隨機森林。表6給出模型集成后的結(jié)果。
融合后,測試發(fā)現(xiàn),該模型測試結(jié)果準(zhǔn)確達(dá)到100%。測試結(jié)果0個錯誤。新模型測試結(jié)果的混淆矩陣如表7。
4 結(jié)語
該集成學(xué)習(xí)的思想,將兩個基礎(chǔ)預(yù)測模型,集成成一個較強的預(yù)測模型,提高了預(yù)測結(jié)果的準(zhǔn)確性。由測試結(jié)果看出,該新模型能較好的學(xué)習(xí)兩個基礎(chǔ)模型的正確預(yù)測結(jié)果,規(guī)避錯誤結(jié)果,使得最后分類結(jié)果正確率達(dá)到100%。因此通過基于集成學(xué)習(xí)的預(yù)測融合法能夠較好地對案例進(jìn)行預(yù)測得到更為準(zhǔn)確的結(jié)果。
由測試結(jié)果分析發(fā)現(xiàn),該方法仍存在很大改進(jìn)空間,可以在具體的實施中可根據(jù)不同的實際背景對模型進(jìn)行修改,根據(jù)模型的核心方法,能較為方便地解決問題。
參考文獻(xiàn)
[1] Ferreira R P , Martiniano A , Ferreira A , et al. Study on Daily Demand Forecasting Orders using Artificial Neural Network[J]. IEEE Latin America Transactions,2016,14(3):1519-1525.
[2] 殷峻暹,陳守煜,邱菊.基于遺傳與BP混合算法神經(jīng)網(wǎng)絡(luò)預(yù)測模型及應(yīng)用[J].大連理工大學(xué)學(xué)報,2002,42(5):594-598.
[3] 齊志成.基于BP神經(jīng)網(wǎng)絡(luò)模型的商洛市卷煙需求預(yù)測[J].湖南農(nóng)業(yè)科學(xué),2017(1):86-89.
[4] 劉帥,曹國忠,張鳳偉,等.基于多方法融合的需求預(yù)測與分析[J].包裝工程,2019(4):221-226.