◆王煥力
(中國科學(xué)技術(shù)大學(xué)附屬第一醫(yī)院信息中心安徽 230000)
《關(guān)于加快推進(jìn)人口健康信息化建設(shè)的指導(dǎo)意見》明確要求充分利用物聯(lián)網(wǎng)、云計(jì)算、大數(shù)據(jù)等新技術(shù),提升居民健康信息化應(yīng)用水平[1]。在“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展中,第三方支付和互聯(lián)網(wǎng)醫(yī)院等信息化建設(shè)帶來醫(yī)療支付交易碎片化、數(shù)據(jù)大量化、結(jié)算賬戶分散化等問題。集團(tuán)醫(yī)院分院區(qū)財(cái)務(wù)各自為政,存在問題被進(jìn)一步放大,現(xiàn)有財(cái)務(wù)信息系統(tǒng)已經(jīng)不能滿足集團(tuán)醫(yī)院經(jīng)營管理需要[2]。利用大數(shù)據(jù)技術(shù)建立醫(yī)療支付統(tǒng)一平臺,集團(tuán)財(cái)務(wù)對分院區(qū)統(tǒng)籌管理,做好各院區(qū)的財(cái)務(wù)對賬,資金劃撥,提高財(cái)務(wù)數(shù)據(jù)透明度、加強(qiáng)財(cái)務(wù)監(jiān)管和運(yùn)行監(jiān)督、保證資金安全。同時(shí)利用大數(shù)據(jù)研究方法,對醫(yī)院財(cái)務(wù)運(yùn)行數(shù)據(jù)做分析、挖掘和利用,有效地服務(wù)于集團(tuán)醫(yī)院的經(jīng)營管理和財(cái)務(wù)決策,促進(jìn)醫(yī)院發(fā)展。
數(shù)據(jù)作為醫(yī)療支付大數(shù)據(jù)平臺的基礎(chǔ),為獲取到優(yōu)質(zhì)數(shù)據(jù),平臺采用了針對性方法進(jìn)行處理如下:
(1)大量(Volume)的醫(yī)療支付數(shù)據(jù)。平臺對醫(yī)院收入數(shù)據(jù)要求統(tǒng)一編碼規(guī)范[3],提供標(biāo)準(zhǔn)的銀行支付、移動支付、醫(yī)保支付、資金批量代付等接口,將多個分院區(qū)的門診、急診、體檢、住院、餐飲、小賣部、停車?yán)U費(fèi)等各種場景的支付數(shù)據(jù)全部納入平臺。對于支出數(shù)據(jù),平臺對接院內(nèi)資金管理系統(tǒng)、銀企直連系統(tǒng)、稽核系統(tǒng)等,最終實(shí)現(xiàn)多個分院區(qū)的資金收入與支出進(jìn)行集中和統(tǒng)一管理。
(2)種類和來源多樣(Variety)的醫(yī)療支付數(shù)據(jù)。數(shù)據(jù)按結(jié)構(gòu)可分為結(jié)構(gòu)化和非結(jié)構(gòu)化方式,其中結(jié)構(gòu)化數(shù)據(jù)包含充值交易、掛號交易、銀企直連、醫(yī)保結(jié)算等業(yè)務(wù)。非結(jié)構(gòu)化數(shù)據(jù)包括藥品供應(yīng)商提供的紙質(zhì)結(jié)算單掃描件、銀行現(xiàn)金存款單掃描件等,這些種類和來源多樣的醫(yī)療支付數(shù)據(jù)可使用分布式部署數(shù)據(jù)庫、陣列式存儲、數(shù)據(jù)切分、Cassandra(非結(jié)構(gòu)化的非關(guān)系型數(shù)據(jù)庫)等方式進(jìn)行保存。
(3)真實(shí)準(zhǔn)確(Veracity)的醫(yī)療支付數(shù)據(jù)。支付成功的訂單記錄交易檢索號或流水號;支付異常訂單可采用自動補(bǔ)償機(jī)制或事務(wù)方式進(jìn)行處理,保證交易原子性[4],杜絕單邊賬發(fā)生。平臺使用多方對賬模式(包含HIS方、支付渠道方、業(yè)務(wù)系統(tǒng)方等),平賬后將多院區(qū)歸集資金分賬數(shù)據(jù)發(fā)送至資金清算平臺,確保支付數(shù)據(jù)真實(shí)準(zhǔn)確。
醫(yī)院業(yè)務(wù)系統(tǒng)數(shù)量和種類繁多,例如為患者提供服務(wù)的線上就醫(yī)系統(tǒng)、互聯(lián)網(wǎng)醫(yī)院系統(tǒng)、醫(yī)院綜合運(yùn)營管理系統(tǒng)等,這些系統(tǒng)產(chǎn)生大量的數(shù)據(jù)需清洗后才能使用,處理方式如下:
(1)對數(shù)據(jù)進(jìn)行結(jié)構(gòu)化處理。原系統(tǒng)票據(jù)數(shù)據(jù)類型和種類的較多,大部分為紙質(zhì)結(jié)算單、紙質(zhì)對賬單等,這種非結(jié)構(gòu)化的數(shù)據(jù)基本需人工處理,無法實(shí)現(xiàn)電子化留存,無法用于后期大數(shù)據(jù)的應(yīng)用。近幾年深度學(xué)習(xí)技術(shù)的發(fā)展,單據(jù)識別(Invoice Optical Character Recognition)技術(shù)已經(jīng)逐步普及,通過OCR技術(shù)將非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)為結(jié)構(gòu)化數(shù)據(jù)處理,后期快速大數(shù)據(jù)特征提取及應(yīng)用。
(2)對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。由于各支付渠道無法統(tǒng)一接口規(guī)范,導(dǎo)致賬單格式和內(nèi)容各不相同,部分醫(yī)保類型甚至缺少對賬用的明細(xì)賬單,平臺無法對這類未清洗的數(shù)據(jù)進(jìn)行使用[5]。非標(biāo)準(zhǔn)化數(shù)據(jù)通過數(shù)據(jù)文件層、數(shù)據(jù)提取設(shè)置層、數(shù)據(jù)校驗(yàn)入庫層后可轉(zhuǎn)為標(biāo)準(zhǔn)化數(shù)據(jù)。數(shù)據(jù)文件層使用系統(tǒng)接口抓取或手工上傳文件的形式獲取到非標(biāo)數(shù)據(jù);數(shù)據(jù)提取設(shè)置層通過可視化頁面,設(shè)置數(shù)據(jù)提取規(guī)則,比如可以設(shè)置金額+就診號+日期+隨機(jī)數(shù)四者聯(lián)合作為唯一索引;數(shù)據(jù)校驗(yàn)入庫層對錯誤的數(shù)據(jù)進(jìn)行篩查,如收款交易為負(fù)數(shù)的數(shù)據(jù)不能入庫。
以往各分院區(qū)財(cái)務(wù)依據(jù)業(yè)務(wù)場景逐個對結(jié)算銀行進(jìn)行對賬,集團(tuán)再進(jìn)行匯總合并核對分院的賬,基礎(chǔ)對賬工作耗時(shí)且錯誤率高。通過醫(yī)療支付大數(shù)據(jù)平臺統(tǒng)一支付接口,集團(tuán)財(cái)務(wù)無須手動核對分院區(qū)賬務(wù),實(shí)現(xiàn)結(jié)算賬戶的統(tǒng)一管理,跨院區(qū)的單邊賬和退費(fèi)的集中處理。平臺獲取到各分院所有的支付數(shù)據(jù)后,可實(shí)現(xiàn)諸如預(yù)交金模式的資金稽核管理,通過患者分院區(qū)預(yù)交金使用明細(xì)規(guī)則出具日清分核查報(bào)表。
醫(yī)療支付大數(shù)據(jù)平臺涵蓋醫(yī)院全場景的收入與支出,數(shù)據(jù)經(jīng)過結(jié)構(gòu)化處理與正確性驗(yàn)證,可直接用于各種維度的統(tǒng)計(jì)與分析,解決以往集團(tuán)對分院區(qū)財(cái)務(wù)資金無法實(shí)時(shí)應(yīng)用分析的痛點(diǎn)。
通過支付大數(shù)據(jù)分析實(shí)現(xiàn)財(cái)務(wù)的精細(xì)化管理,例如:
(1)平臺支付數(shù)據(jù)經(jīng)標(biāo)準(zhǔn)化入庫后輸出財(cái)務(wù)標(biāo)準(zhǔn)運(yùn)營指標(biāo),按年計(jì)算醫(yī)保回款率(實(shí)際年度醫(yī)保到賬總額/年度醫(yī)保支付凈額)。
(2)使用K均值聚類算法(k-means)發(fā)現(xiàn)患者在支付環(huán)節(jié)花費(fèi)較長時(shí)間的共性原因,比如集中在某個科室且支付方式為自助機(jī)支付,那么可推測是該科室的自助機(jī)擺放位置或者數(shù)量需要調(diào)整,最終提升患者支付體驗(yàn)。
(3)還可以根據(jù)過往數(shù)據(jù)做出一些預(yù)測,例如根據(jù)以往同期商保支付數(shù)據(jù)預(yù)測當(dāng)期商保預(yù)估支付的金額后,醫(yī)院可以與商保中心溝通預(yù)支預(yù)付款,減少資金墊付[6]。
通過機(jī)器學(xué)習(xí)方法對大數(shù)據(jù)平臺數(shù)據(jù)進(jìn)行挖掘,利用預(yù)測指導(dǎo)模型對集團(tuán)財(cái)務(wù)部門實(shí)現(xiàn)指導(dǎo)和決策,具體步驟如下:
(1)確認(rèn)需要預(yù)測的問題和指標(biāo)。通過大數(shù)據(jù)預(yù)測特定患者存在支付困難,讓醫(yī)院管理團(tuán)隊(duì)及早發(fā)現(xiàn)并協(xié)助患者解決支付問題,用于減少壞賬的發(fā)生和增加資金沉淀[7]。
(2)通過對數(shù)據(jù)特征碼的特征提取和選擇評估,可以獲得一批可以用來預(yù)期要解決問題的特征。例如對于存在支付困難度的患者,特征碼可以是支付時(shí)間、年齡、支付渠道、支付方式、支付金額、支付地點(diǎn)、是否車禍患者等屬性,同時(shí)特征碼也可以是需要經(jīng)過一定統(tǒng)計(jì)計(jì)算的量,例如住院合計(jì)支付過的人數(shù)、住院預(yù)交金透支次數(shù)等,甚至還可以是一些較復(fù)雜的算法得到的結(jié)果,例如通過 KNN (knearest neighbors algorithm)算法得到的是否省外患者、是否繳費(fèi)積極患者。
(3)提取正確的特征后,通過模型建立從特征到目標(biāo)之間的關(guān)系。針對預(yù)測型的問題,單個的模型又通常叫作預(yù)測器,例如車禍患者的住院繳費(fèi)單是由多人支付完成,按照醫(yī)院經(jīng)驗(yàn)這類人群容易出現(xiàn)因糾紛而造成壞賬的情況?,F(xiàn)階段平臺以醫(yī)院經(jīng)驗(yàn)?zāi)P蜑橹鳎驗(yàn)闄C(jī)器學(xué)習(xí)尤其是監(jiān)督型學(xué)習(xí),需要大量的結(jié)果反饋,在解決很多實(shí)際問題的時(shí)候,大量的反饋需要投入過多人力資源且有可能對患者造成打擾。未來諸如神經(jīng)網(wǎng)絡(luò)(常用的如后向神經(jīng)網(wǎng)絡(luò))、線性分類器(如LR)、支持向量機(jī)(SVM)、線性回歸等算法模型同樣可用于模型到目標(biāo)的關(guān)系中。
(4)不管是根據(jù)醫(yī)院經(jīng)驗(yàn)創(chuàng)建的經(jīng)驗(yàn)?zāi)P停€是機(jī)器學(xué)習(xí)的算法模型,單一模型的預(yù)測結(jié)果往往不盡人意,例如上文車禍患者如果有多人支付的經(jīng)驗(yàn)?zāi)P?,只對車禍患者有效。但是如果將成百上千個模型融合起來,就可以取得覆蓋更全、準(zhǔn)確度更好的預(yù)測效果。模型需要大量的訓(xùn)練,訓(xùn)練需要結(jié)果反饋,結(jié)果反饋包含正確結(jié)果反饋與錯誤結(jié)果反饋,錯誤結(jié)果反饋,在實(shí)際應(yīng)用中相對比較容易,比如要和每一個模型預(yù)測結(jié)果為有支付困難的患者溝通確認(rèn),成本較高,還有可能打擾到預(yù)測錯誤的患者,但未預(yù)測到的錯誤結(jié)果(如產(chǎn)生了壞賬)更容易發(fā)現(xiàn),因此平臺采用AdaBoosting算法方法來融合模型。經(jīng)過平臺不斷調(diào)整模型和醫(yī)院對模型預(yù)測結(jié)果的及時(shí)反饋,模型訓(xùn)練一段時(shí)間后可以得到比較穩(wěn)定的預(yù)測結(jié)果。也因此醫(yī)療支付大數(shù)據(jù)平臺的建設(shè)與應(yīng)用,不光需要信息科技專業(yè)的人員,還需要具備豐富實(shí)踐經(jīng)驗(yàn)的醫(yī)院其他部門的協(xié)助,才能取到好的效果。
綜上所述,通過醫(yī)療支付大數(shù)據(jù)的探索和應(yīng)用,解決醫(yī)療信息化建設(shè)過程中產(chǎn)生的交易碎片化、數(shù)據(jù)大量化、結(jié)算賬戶分散化等問題。集中并規(guī)范了收支數(shù)據(jù),從而為集團(tuán)和分院區(qū)提供標(biāo)準(zhǔn)、準(zhǔn)確、精細(xì)化的財(cái)務(wù)指標(biāo),有效監(jiān)控了集團(tuán)院區(qū)的經(jīng)濟(jì)活動,達(dá)到精細(xì)化管理的目的,為防范和控制財(cái)務(wù)風(fēng)險(xiǎn)、提高經(jīng)濟(jì)效益和社會效益做出了突出貢獻(xiàn)。通過對醫(yī)療支付大數(shù)據(jù)應(yīng)用平臺的數(shù)據(jù)進(jìn)行挖掘與分析,優(yōu)化就醫(yī)過程的支付體驗(yàn)[8],利用機(jī)器學(xué)習(xí)預(yù)測模型預(yù)測患者未來支付能力,有效提升醫(yī)院回款速度同時(shí)降低了醫(yī)院的壞賬率,有效地服務(wù)于醫(yī)院的經(jīng)營管理和財(cái)務(wù)決策。
網(wǎng)絡(luò)安全技術(shù)與應(yīng)用2020年12期