張傳一 黃迎春 蔣華萍 項子珂 胡海雷 張政陽
摘? 要:伴隨中國老齡化社會的逐步到來,利用大數(shù)據(jù)和人工智能技術匹配養(yǎng)老資源供給與居家養(yǎng)老需求成為亟待解決的問題。分析目前居家養(yǎng)老需求,建立居家養(yǎng)老服務數(shù)據(jù)模型,采用大數(shù)據(jù)技術構建居家養(yǎng)老服務分類組別,提出居家養(yǎng)老服務復合判別分析算法,設計面向服務架構的養(yǎng)老服務發(fā)現(xiàn)與推薦算法,采用爬取網(wǎng)絡數(shù)據(jù)和仿真生成數(shù)據(jù)相結合方式驗證了所提出算法的有效性。
關鍵詞:居家養(yǎng)老? 判別分析? 服務推薦算法? 面向服務架構
中圖分類號:D669.6? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A文章編號:1672-3791(2021)05(b)-0019-05
Abstract: With the gradual arrival of Chinese aging society, it is an urgent problem to use big data and artificial intelligence technology to match the supply of old-age care resources and the demand for home-based old-age care. Analysis of the current home-based care services, the data model of home-based care services is set up, using big data technology to build home endowment service classification categories, family endowment service composite discriminant analysis algorithm, design of service-oriented architecture endowment service discovery and recommendation algorithm, using crawl way of network data and simulation data generated to verify the effectiveness of the proposed algorithm.
Key Words: Home-based care; Discriminant analysis; Service recommendation algorithm; Service-oriented architecture
伴隨著中國老齡化社會的逐步到來,養(yǎng)老問題已經(jīng)成為亟待解決的社會問題。目前養(yǎng)老方式主要有集中式養(yǎng)老和社區(qū)居家養(yǎng)老兩種方式。居家養(yǎng)老是中國目前甚至是未來最主要的養(yǎng)老方式。目前的居家養(yǎng)老在信息技術的應用上還存在許多問題,主要表現(xiàn)在社會養(yǎng)老資源供給與養(yǎng)老服務需求的不匹配問題,即:雖然存在很多網(wǎng)絡養(yǎng)老服務信息,但需要有效利用這些信息,對接居家養(yǎng)老服務供給與需求,滿足老人個性化的居家養(yǎng)老需求。為此,許多學者開展了這方面的研究,所建立的模型和方法雖然在養(yǎng)老服務匹配和推薦方面進行了技術層面的探索,但在養(yǎng)老服務推薦的準確性和有效性方面還需進一步提高。因此,該文應用大數(shù)據(jù)和人工智能技術開展了相關研究,建立了居家養(yǎng)老服務模型,提出了復合判別分析算法和服務發(fā)現(xiàn)與推薦算法。
1? 居家養(yǎng)老服務數(shù)據(jù)模型
為了能夠更好地對居家養(yǎng)老的老人所需的服務進行服務判別、服務發(fā)現(xiàn)和服務推薦,參考智慧養(yǎng)老平臺的構建準則[1]和基于行形式化描述的個性養(yǎng)老主題服務樹模型[2],建立了由老人基本信息、健康狀況、日常照料、醫(yī)療護理保健、精神咨詢慰藉、文體娛樂活動、居家安全監(jiān)控和法律金融科技支持8類指標數(shù)據(jù)模型,具體定義如下。
2? 養(yǎng)老服務需求判別分析
在獲取了影響?zhàn)B老服務需求的指標數(shù)據(jù)后,可進一步判別潛在的養(yǎng)老服務需求類型,該文提出一種基于大數(shù)據(jù)的養(yǎng)老服務需求復合判別分析方法。該方法首先采用大數(shù)據(jù)技術在可信的網(wǎng)站上爬取老人基本信息與養(yǎng)老服務需求的數(shù)據(jù),然后建立養(yǎng)老服務分類組別,最后采用提出的復合判別分析方法對養(yǎng)老服務需求進行判別分析。
大數(shù)據(jù)處理流程包括數(shù)據(jù)采集、數(shù)據(jù)預處理與存儲、數(shù)據(jù)處理與分析、數(shù)據(jù)可視化、數(shù)據(jù)應用等步驟。判別分析(Discriminant Analysis)是由費舍爾(R.A.Fishe)在1936年提出的一種多元統(tǒng)計分析方法,該方法根據(jù)觀測到的一些指標數(shù)據(jù)對所研究的對象進行分類。與聚類分別方法不同,判別分析方法是在已知組別特征情況下對待判別的實例進行分類。
針對養(yǎng)老服務需求,提出一種復合判別分析方法,該方法的基本思想是:在判別分析過程中綜合采用以下5種判別方法,如果這5種方法多數(shù)(至少3種)取得一致性的判別結果,則采用該結果;如果沒有多數(shù)結果一致,則根據(jù)訓練數(shù)據(jù)返回錯誤分類錯誤率的估計誤差來輸出判別結果,該誤差是由組的先驗概率加權的訓練中被錯誤分類的觀察的百分比,誤差最小的分類結果將被采納。參與復合分類的5種分類模型如下。
模型1(線性分類):用協(xié)方差的匯總估計,擬合每個組的多元正態(tài)密度。
模型2(對角線性分類):類似于線性分類模型,但是有一個對角協(xié)方差矩陣估計(樸素貝葉斯分類器)。
模型3(二次分類):用組分層協(xié)方差估計擬合多元正態(tài)密度。
模型4(對角二次分類):類似于二次分類模型,但具有對角協(xié)方差矩陣估計(樸素貝葉斯分類器)。
模型5(馬氏距離分類):使用具有分層協(xié)方差估計的馬氏距離。
其中,線性分類法假定表征k組類別的隨機變量:
即各組的先驗分布均為協(xié)方差矩陣相同的p元正態(tài)分布,此時由樣本得出的協(xié)方差矩陣聯(lián)合估計Σ;二次分類法也假設各組的先驗分布均為p元正態(tài)分布,但協(xié)方差矩陣并不完全相同,此時可分別得出各個協(xié)方差矩陣的估計Σi,i=1 2 …,k;馬氏距離分類法的各組協(xié)方差矩陣不完全相等,此時分別得出分組的協(xié)方差矩陣的估計,其中馬氏距離是由印度統(tǒng)計學家馬哈拉諾比斯(Mahalanobis)引入的,以下為馬氏距離的定義:設Σ表示分類指標的協(xié)方差矩陣,即
3? 基于SOA的養(yǎng)老服務發(fā)現(xiàn)與推薦算法
近年來,面向服務架構(Service Oriented Architecture,SOA)呈現(xiàn)蓬勃發(fā)展趨勢,尤其隨著互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)和人工智能技術的不斷發(fā)展和應用,采用SOA架構的Web服務、云服務、App服務等多種服務應用越來越廣泛。將SOA及其相關技術應用于居家養(yǎng)老服務對于提高服務發(fā)現(xiàn)、服務匹配和服務推薦等服務能力和質量越來越重要。在參考助老服務App軟件中服務推薦策略[3]、供需主題畫像模型匹配養(yǎng)老服務推薦系統(tǒng)[4]、基于深度學習多目標優(yōu)化養(yǎng)老服務推薦方法[5]以及家庭護理服務實踐測試結果[6]的基礎上,該文采用形式化方法表達居家養(yǎng)老服務,并設計服務發(fā)現(xiàn)與推薦策略以實現(xiàn)高效的養(yǎng)老服務資源整合。服務發(fā)現(xiàn)需建立在服務匹配的基礎上,下面給出服務匹配問題的定義。
定義9(服務匹配)給定一個服務需求集Q={q1,q2,…,qm }和服務候選集S={s1,s2,…,sn},服務匹配定義為函數(shù)f:Q×S→[0,1],使得f(qi,sj)作為衡量服務匹配程度的數(shù)量,其中:0≤f(qi,sj)≤1,f(qi,sj)=0表示服務完全不匹配,f(qi,sj)=1表示服務完全匹配。
在定義服務匹配的基礎上,服務發(fā)現(xiàn)采用基于社交媒體信息的語義服務發(fā)現(xiàn)框架,通過服務信息語義的相似度、流行度、活躍度和衰退度這4個特征作為服務發(fā)現(xiàn)的影響因素。這4個特征可分為功能性和非功能性兩種,其中相似度屬于功能性因素,流行度、活躍度和衰退度屬于非功能性因素,基于這些因素,設計了基于SOA的養(yǎng)老服務發(fā)現(xiàn)與推薦方法如下。
(1)對于功能性社交因素,利用潛語義索引(Latent Semantic Indexing,LSI)計算語義相似度。
(2)對于非功能性社交因素,即流行度、活躍度和衰退度,構造相應的評價函數(shù)對其進行度量。
(3)將功能性因素和非功能性因素整合為加權的統(tǒng)一評價模型。
(4)對于給定的服務需求,基于統(tǒng)一評價模型整合功能性和非功能性因素,生成推薦結果。
潛語義索引(LSI)是一個將查詢需求輸入和待查文檔映射到同維度語義空間的模型,進而計算二者的相似度。LSI通過奇異值分解將詞文檔矩陣Xt×d分解為3個矩陣的乘積,分別是詞矩陣Tt×n,奇異值矩陣Qn×n,以及文檔矩陣Dd×n,即:
式中,t為詞數(shù)量,d為文檔數(shù)量,n=min{t,d}。基于LSI模型服務需求輸入q與服務si之間的相似度函數(shù)如下:
式中,v為需求輸入或文檔在LSI模型中的詞向量。
在非功能因素中,流行度反映功能類似的兩個服務,用戶更傾向選擇的服務。由于不同服務的關注數(shù)量差異較大,為了將數(shù)據(jù)標準化,采用自然對數(shù)運算定義流行度評價函數(shù):
式中,nfi為服務si的關注數(shù)量;minf和maxf分別為所有服務中關注數(shù)量的最小值和最大值?;钴S度反映服務發(fā)布的頻率高低,與流行度的計算方式類似,以服務的發(fā)推數(shù)量定義服務的活躍度如下:
式中,nti代表服務si的發(fā)推數(shù)量,mint和maxt分別表示所有服務發(fā)推數(shù)量的最小值和最大值。衰減度用來動態(tài)調(diào)整候選服務的權重,其定義如下:
式中,nli為包含服務si的列表數(shù)量,參數(shù)kd為列表數(shù)平均值的自然對數(shù)。
綜上所述,服務匹配函數(shù)定義為以上4個因素的線性組合:
輸入服務需求q和服務候選集S,采用函數(shù)f(q,si)計算服務匹配度,并生成降序的推的服務列表S={st1,st2,…,stn}。
4? 仿真分析
4.1 復合判別分析仿真分析
為了驗證復合判別分析方法的有效性,采用Web爬取的數(shù)據(jù)和仿真數(shù)據(jù)生成相結合的方式生成了判別分析所需的測試數(shù)據(jù)集,進一步通過數(shù)據(jù)裁剪和整理,基于Matlab語言的判別分析工具箱,實現(xiàn)了復合判別分析的仿真。基于Web爬取數(shù)據(jù)與仿真數(shù)據(jù)的復合判別分析分類結果見圖1。
從圖1可以看出,采用復合判別分析方法能夠綜合5種判別分析結果,降低了僅使用一種判別算法的判別錯誤概率。
4.2 服務發(fā)現(xiàn)與推薦算法的仿真分析
首先將定義3~8中列出的共計35種養(yǎng)老服務需求采用隨機數(shù)仿真的方法產(chǎn)生原始需求數(shù)據(jù),如果老人對服務指標點有服務需求,則該服務指標需求量化為數(shù)值1,反之,則量化為數(shù)值0。然后對于有服務需求的指標采用提出的服務發(fā)現(xiàn)與推薦算法進行服務匹配與推薦計算。例如:假設某位老人的養(yǎng)老需求數(shù)據(jù)量化為序列Q={0 0 1 0 1 1 1 0 0 1 1 1 0 0 0 1 0 0 1 1 1 0 1 0 1 0 1 0 0 0 0 0 1 1 1},序列Q有17個服務需求點的指標為1,因此對這些服務需求點采用服務推薦算法計算服務匹配度,設服務候選集S={s1,s2,s3},則該養(yǎng)老需求的服務推薦算法的計算結果見圖2。
根據(jù)圖2的結果,選取每個服務匹配度最大的服務形成的服務推薦集合為:{s2,s3,s2,s3,s3,s3,s1,s2,s1,s1,s2,s3,s3,s1,s3,s2,s1}。
5? 結語
該文在研究居家養(yǎng)老服務需求的基礎上,建立了居家養(yǎng)老服務需求系統(tǒng)數(shù)據(jù)模型,基于大數(shù)據(jù)技術的養(yǎng)老服務分類組別的構建,提出了針對居家養(yǎng)老服務的復合判別分析方法,設計了面向服務架構的養(yǎng)老服務發(fā)現(xiàn)與推薦算法,通過Web數(shù)據(jù)爬取和仿真相結合的方式測試了所提出算法的有效性。所提出的方法和算法可為居家養(yǎng)老服務系統(tǒng)的設計提供技術途徑。
參考文獻
[1] 鄭嵐.基于物聯(lián)網(wǎng)技術的智慧養(yǎng)老平臺建設探索[J].科技創(chuàng)新導報,2019,16(23):137-138.
[2] 卜云飛.面向養(yǎng)老服務的推薦方法研究及應用[D].哈爾濱工業(yè)大學,2017.
[3] 梁詠梅.助老服務APP及服務推薦策略研究[D].江西財經(jīng)大學,2018.
[4] 董欣欣.基于供需交易主體畫像的養(yǎng)老服務推薦系統(tǒng)設計與實現(xiàn)[D].哈爾濱工業(yè)大學,2018.
[5] 張愷琪.基于深度學習與多目標優(yōu)化的養(yǎng)老服務推薦方法及實現(xiàn)[D].哈爾濱工業(yè)大學,2019.
[6] GUAY M, RUEST M, CONTANDRIOPOULOS D. Deimplementing Untested Practices in Homecare Services:A Preobservational-Postobservational Design[J].Occupational Therapy International, 2019, 2019(2):1-7.