耿洪
關(guān)鍵詞:GBOM ?改進(jìn)條件下SVM ?DRGs病種系列 ?成本預(yù)測(cè) ?模型建立
近幾年,國(guó)內(nèi)外的醫(yī)院不斷在醫(yī)療服務(wù)付費(fèi)制度的改革,常見的病種費(fèi)用和成本預(yù)測(cè)的方式較多,例如作業(yè)成本法,邊際成本法等。這些方式運(yùn)神經(jīng)網(wǎng)絡(luò),回歸等方式,加強(qiáng)了病種成本預(yù)測(cè)以及因素控制。但是這些模型的預(yù)測(cè)僅僅針對(duì)單疾病的預(yù)測(cè)有效果,對(duì)DRGs的病種預(yù)測(cè)沒有引起重視?,F(xiàn)代研究表明,病種的成本因素控制和選擇方式多依據(jù)成型的模型或者是專家理論,但是缺乏一定的試驗(yàn)樣本,導(dǎo)致成本模型預(yù)測(cè)的選擇和評(píng)估方面依舊存在問題。且強(qiáng)化研究也會(huì)消耗大量的成本,影響模型的精度。經(jīng)過實(shí)踐證明,實(shí)施DRGs能夠有效避免醫(yī)療費(fèi)用的增長(zhǎng)。通過對(duì)DRGs病種系列進(jìn)行成本預(yù)測(cè),能夠促使醫(yī)院在滿足醫(yī)療質(zhì)量的前提下,通過修改治理方案降低醫(yī)療成本。進(jìn)而推動(dòng)醫(yī)院的成本水平朝著健康的方向發(fā)展,為后期的成本優(yōu)化控制奠定了基礎(chǔ)。
DRGs病種系列內(nèi)的各種信息為成本預(yù)測(cè)提供了參數(shù),能夠?qū)?shí)例的主要特征反應(yīng)出來,開展識(shí)別、操作,本身具備層次性的特點(diǎn)。病種成本因素屬于主要影響因素,能夠直接影響預(yù)測(cè)結(jié)果。實(shí)施DRGs病種系列成本預(yù)測(cè),需要制定醫(yī)院臨床病例,以便快速響應(yīng)病人的需求,要求對(duì)應(yīng)的物料單、醫(yī)療項(xiàng)目、藥品清單等必須要清晰。由于DRGs病種系列的診斷種類較多,案例數(shù)量較為龐大,按照傳統(tǒng)的病種結(jié)構(gòu)構(gòu)建BOM將會(huì)導(dǎo)致實(shí)例變化快,會(huì)影響預(yù)測(cè)數(shù)據(jù)的精準(zhǔn)性。
本文針對(duì)SVM的病種成本預(yù)測(cè)和成本分析可分為多個(gè)階段。首先,根據(jù)原始數(shù)據(jù)學(xué)習(xí)樣本,再根據(jù)樣本的特點(diǎn)進(jìn)行量化和離散化分析,得到條件構(gòu)成的決策表。其次,借助RS理論強(qiáng)化技術(shù)研究,并得新的學(xué)習(xí)樣本集,在采用PSO的集合算法,優(yōu)化SVM的結(jié)構(gòu)參數(shù),在針對(duì)優(yōu)化后的SVM病種成本模型進(jìn)行預(yù)測(cè)分析,輸出最小條件屬性集的數(shù)據(jù)形成的測(cè)試樣本集,輸出新的預(yù)測(cè)結(jié)果。
(一)影響因素
粗糙集理論最早是在1982年提出,主要是進(jìn)行應(yīng)用于數(shù)據(jù)理論分析、被廣泛應(yīng)用在機(jī)器、人工智能等領(lǐng)域。粗糙集(RS)能夠有效處理模糊、不確定信息,其中屬性簡(jiǎn)化屬于核心??梢越柚燃?jí)管理理論,將不必要的信息剔除,簡(jiǎn)化決策表。應(yīng)用于病種成本預(yù)測(cè)模型中,能夠選出有效的病種成本影響因素。
(二)SVM病種成本預(yù)測(cè)
SVM能夠根據(jù)樣本數(shù)據(jù),將構(gòu)建風(fēng)險(xiǎn)最小化,將不可分的數(shù)據(jù)集中在高特征的空間中,促使樣本在高維空間中得到精準(zhǔn)區(qū)分,有效解決低維空間中的難題。假設(shè)成本影響因素為 ,成本預(yù)測(cè)值為 ,那么SVM的病種成本預(yù)測(cè)步驟如下:
(1)假設(shè)1的訓(xùn)練樣本集合:
(2)高維空間內(nèi)超出平面的表達(dá)式為:
SVM估算回歸函數(shù)中,借助非線性思想,在空間數(shù)據(jù)內(nèi)輸入x,將其映射在高維特征空間內(nèi),在高維空間內(nèi)開展線性回歸。SVM的預(yù)測(cè)函數(shù)為: ?。
(3)在 SVM中采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,通過使用 ,對(duì)風(fēng)險(xiǎn)進(jìn)行衡量,衡量式子為:
(4)若是借助回歸預(yù)測(cè)將上述式子的風(fēng)險(xiǎn)最小化,用SVM對(duì)病種系列的成本回歸預(yù)測(cè)可以轉(zhuǎn)化為最小值,即K(xi,x)為核函數(shù)。針對(duì)非線性情況,在特定的核函數(shù)內(nèi),可以在樣本中選定任何一個(gè)樣本作為支持向量w,其回歸預(yù)測(cè)函數(shù)為:
綜上所述,使用SVM需要確定不敏感值、核函數(shù)、懲罰因子。
(三)借助POS算法實(shí)現(xiàn)SVM參數(shù)優(yōu)化
由于SVM成本預(yù)測(cè)的精準(zhǔn)度與之間有著較大的關(guān)系,在優(yōu)化算法時(shí),需要先對(duì)各類參數(shù)組合進(jìn)行優(yōu)化,確保預(yù)測(cè)性能的最優(yōu)化。粒子算法屬于一種群體優(yōu)算法,主要是對(duì)隨機(jī)粒子進(jìn)行初始化,借助迭代選擇最優(yōu)解,接著進(jìn)行適應(yīng)度評(píng)估。若是粒子處于最優(yōu)位置,就按照相應(yīng)的格式更新粒子的速度,若是未處于最優(yōu)位置,就替換出位置偏差的粒子,在粒子達(dá)到迭代次數(shù)時(shí),就停止迭代,進(jìn)而將最優(yōu)解輸出。
考慮到SVM在解決測(cè)試中的問題、成本測(cè)算優(yōu)勢(shì),選擇30組病例作為預(yù)測(cè)數(shù)據(jù)。
藥費(fèi)構(gòu)成比例使用等頻率離散法對(duì)連續(xù)性屬性進(jìn)行離散,在遺傳算法的計(jì)算下,得到的屬性集合為{診斷、年齡、住院天數(shù)、麻醉方式、用藥占比},將獲得的原始數(shù)據(jù)進(jìn)行重新構(gòu)建,形成新的訓(xùn)練樣本,接著輸入數(shù)據(jù)進(jìn)行SVM訓(xùn)練,輸入測(cè)試數(shù)據(jù)開展成本預(yù)測(cè)。其中PSO的規(guī)模群體為40、迭代次數(shù)為400,加速常數(shù)為C1=1.5、C2=1.7,得到參數(shù) ?。通過對(duì)比以上算法得知,改進(jìn)之后的SVM測(cè)試方法得到的MAPE值最小,平均絕對(duì)百分比誤差公式為:
其中R(i)為實(shí)際值、F(i)為預(yù)測(cè)值,N代表樣本的數(shù)量。在整個(gè)預(yù)測(cè)過程中,BP神經(jīng)網(wǎng)絡(luò)的計(jì)算時(shí)間為15.98s、SVM計(jì)算時(shí)間為1.35s,改進(jìn)后SVM的計(jì)算時(shí)間為5.71s,PSO-SVM 的計(jì)算時(shí)間為7.53s。以此可見,經(jīng)過改造之后的SVM相比其他幾種預(yù)測(cè)方法在速度、精準(zhǔn)度上具備較高的優(yōu)勢(shì),因此,在DRGs病種系列成本預(yù)測(cè)上的應(yīng)用前景較為顯著。
綜上所述,本文通過建立GBOM基礎(chǔ)上的DRGs病種系列成本影響因素模型,在改進(jìn)SVM數(shù)據(jù)挖掘上的DRGs病種系列成本預(yù)測(cè)方法。通過分析了病種的成本多因素和非線性特點(diǎn),結(jié)合醫(yī)院的醫(yī)療配置相似性進(jìn)行了分析,對(duì)醫(yī)院病種成本因素進(jìn)行預(yù)測(cè),充分考慮各項(xiàng)影響因素,線性(非)特點(diǎn),通過實(shí)際案例證明,基于BGOM和改進(jìn)SVM的DRGs病種系列成本預(yù)測(cè)適用性較強(qiáng),針對(duì)一些新實(shí)例因素,能夠在最小條件屬性集內(nèi)進(jìn)行成本預(yù)測(cè)。具備顯著的應(yīng)用情景,能夠有效輔助醫(yī)院病種系列的成本預(yù)測(cè)。
參考文獻(xiàn)
[1]徐靖,劉子先,李竹梅,李惠.基于GBOM和改進(jìn)SVM的DRGs病種系列成本預(yù)測(cè)[J].工業(yè)工程與管理,2013,18(02):92-99.
[2]楊迎春,巢健茜.單病種付費(fèi)與DRGs預(yù)付模式研究綜述[J].中國(guó)衛(wèi)生經(jīng)濟(jì),2008,(06):66-70.
[3]郭富威,任苒. DRGs在美國(guó)的發(fā)展及在我國(guó)的應(yīng)用對(duì)策[J].中國(guó)醫(yī)院管理,2006,(02):32-35.