趙辰瑄,孔翔,嚴(yán)冰悅,王志
(寧波工程學(xué)院 理學(xué)院,浙江 寧波 315211)
健康醫(yī)保卡是一個(gè)由電子健康卡和電子社??ɑソ壔フJ(rèn)、融合而成,集納了多項(xiàng)看病就醫(yī)功能的二維碼。作為浙江省“最多跑一次”改革醫(yī)療衛(wèi)生公共服務(wù)領(lǐng)域延伸、推進(jìn)政府?dāng)?shù)字化轉(zhuǎn)型的重要舉措。它的出現(xiàn)消除了醫(yī)院之間的信息壁壘,改變了省市級(jí)醫(yī)保、一卡通相互分離,患者在不同醫(yī)院就診時(shí)需要分別建檔,“多卡并存、互不通用”的現(xiàn)狀。
Logistic回歸是一個(gè)著名的線性分類算法,利用Logistic回歸可以將線性回歸問題很好地轉(zhuǎn)化成一個(gè)線性二分類問題。它通過(guò)函數(shù)將因變量Y對(duì)應(yīng)一個(gè)概率P,然后將其結(jié)果間接轉(zhuǎn)化成一個(gè)連續(xù)變量,從而可以顯著降低犯第一類錯(cuò)誤的概率,對(duì)于用來(lái)判別二分類變量問題有良好的效果。由于其算法的簡(jiǎn)單和高效,Logistic回歸模型在實(shí)際中應(yīng)用非常廣泛,主要用于各類相關(guān)問題的分類和預(yù)測(cè)。
時(shí)至今日,健康醫(yī)保卡已覆蓋浙江省所有11市559家醫(yī)療機(jī)構(gòu),全省領(lǐng)卡人數(shù)已超過(guò)2 000萬(wàn),累計(jì)用卡近500萬(wàn)次,給居民的日常生活帶來(lái)了極大的便利。但與其同時(shí),健康醫(yī)??ㄈ源嬖诔青l(xiāng)發(fā)展不均衡,老齡人口普及率較低的問題[1]。為使健康醫(yī)??艿玫礁玫男麄骼?,文章通過(guò)建立Logistic回歸模型對(duì)健康醫(yī)保卡用戶的基本特征進(jìn)行綜合分析。關(guān)于健康醫(yī)保卡的發(fā)展情況和Logistic模型的更多介紹可參見文獻(xiàn)[2-6]。
社會(huì)性別理論表明,男女兩性不僅存在著生理方面的差異,而且在心理發(fā)展的許多方面也同樣客觀地存在著一些差異。比如在情感表達(dá)方面,多數(shù)女性比男性要含蓄、細(xì)膩一些;在性格方面,女性的細(xì)致耐心更是一種風(fēng)格,它體現(xiàn)在情感、認(rèn)知等各個(gè)方面。而男性在其行為中所表露的沖動(dòng)性與攻擊性似乎又更明顯一些[7]。因此性別的差異有可能會(huì)對(duì)健康醫(yī)??ǖ倪x擇傾向產(chǎn)生影響。前期調(diào)查的結(jié)論也印證了這個(gè)觀點(diǎn),被調(diào)查者中女性使用過(guò)健康醫(yī)保卡的比例明顯高于男性,她們?cè)谌粘I钪薪佑|健康醫(yī)??ǖ臋C(jī)會(huì)更多也更愿意將它推薦給身邊的朋友。由此提出以下假設(shè):
H1:性格差異對(duì)于是否為健康醫(yī)??ㄓ脩粲兄@著的影響。
年齡分層(Age Stratification)是指社會(huì)依據(jù)年齡將人口分隔成若干層次并相應(yīng)規(guī)定各年齡層的角色、權(quán)利、義務(wù)和機(jī)會(huì)等的過(guò)程。年齡分層理論認(rèn)為,年齡是決定人行為的重要變量,可能限制個(gè)體扮演某些角色的能力,決定個(gè)體角色類型和可以得到的選擇權(quán)。年齡將人口分隔為若干年齡層,每個(gè)年齡層都有與其相適應(yīng)的一組角色、權(quán)利、機(jī)會(huì)、責(zé)任和義務(wù)。社會(huì)對(duì)各年齡層個(gè)體的角色期望亦不盡相同。通過(guò)前期的調(diào)查發(fā)現(xiàn),中青年是持有“健康醫(yī)??ā钡闹髁姡@一類人能在第一時(shí)間了解到相關(guān)政策的發(fā)展和推廣,而18歲以下和60歲以上的群體受限于所處環(huán)境和對(duì)于電子產(chǎn)品的熟悉程度,無(wú)法及時(shí)跟緊潮流。因而年齡的不同的確使居民對(duì)健康醫(yī)??ǖ倪x擇傾向產(chǎn)生了差異。由此提出以下假設(shè):
H2:年齡差異對(duì)于是否為健康醫(yī)??ㄓ脩粲兄@著的影響。
凱恩斯的絕對(duì)收入理論認(rèn)為,在短期中,收入與消費(fèi)是相關(guān)的,即消費(fèi)取決于收入,消費(fèi)與收入之間的關(guān)系也就是消費(fèi)傾向。同時(shí),隨著收入的增加消費(fèi)也將增加,但消費(fèi)的增長(zhǎng)低于收入的增長(zhǎng),消費(fèi)增量在收入增量中所占的比重是遞減的。相對(duì)收入理論則認(rèn)為,消費(fèi)者在相對(duì)地位上的變化將導(dǎo)致其收入用于消費(fèi)的部分上升,而不論其絕對(duì)收入有否變化,它理論強(qiáng)調(diào)消費(fèi)者的兩種心理行為,即攀比效應(yīng)和示范效應(yīng)。因此有理由懷疑收入的差異會(huì)影響對(duì)于健康醫(yī)??ǖ倪x擇傾向。前期的調(diào)查結(jié)果顯示,月收入在6 000~20 000元的被調(diào)查者會(huì)更多的申辦健康醫(yī)??ǎ】滇t(yī)??ㄋ邆涞墓δ芤草^符合這類人群的需求。而月收入在6 000元以下的人群的空閑時(shí)間較少,不會(huì)花費(fèi)很多的時(shí)間在關(guān)注健康醫(yī)??ㄉ?,月收入在20 000元以上的人群由于收入較高進(jìn)而健康護(hù)理層次也會(huì)相應(yīng)的提高,健康醫(yī)??ǖ墓δ茈y以吸引這類人群。由此提出以下假設(shè):
H3:月收入差異對(duì)于是否為健康醫(yī)??ㄓ脩粲兄@著的影響。
布魯納學(xué)習(xí)理論認(rèn)為,學(xué)習(xí)的實(shí)質(zhì)是一個(gè)人把同類事物聯(lián)系起來(lái),并把它們組織成賦予它們意義的結(jié)構(gòu)。學(xué)習(xí)就是認(rèn)知結(jié)構(gòu)的組織和重新組織。知識(shí)的學(xué)習(xí)就是在學(xué)生的頭腦中形成各學(xué)科知識(shí)的知識(shí)結(jié)構(gòu)。這種知識(shí)結(jié)構(gòu)是由學(xué)科知識(shí)中的基本概念、基本思想或原理組成的。知識(shí)結(jié)構(gòu)的結(jié)構(gòu)形式是通過(guò)人的編碼系統(tǒng)的編碼方式構(gòu)成的,并可通過(guò)3種再現(xiàn)模式表現(xiàn)出來(lái)。學(xué)歷的高低會(huì)影響一個(gè)人的認(rèn)知水平好壞,學(xué)歷的差異會(huì)產(chǎn)生對(duì)于健康醫(yī)??ǖ牟煌捶?。通過(guò)前期調(diào)查可以發(fā)現(xiàn),本科學(xué)歷及以上的被調(diào)查者對(duì)于健康醫(yī)保卡的認(rèn)可度較高,它們能夠迅速接受并使用這一新興事物,在生活中合理利用給自身帶來(lái)便捷。而高中及以下學(xué)歷的被調(diào)查者對(duì)于健康醫(yī)??ㄈ孕枰粋€(gè)適應(yīng)的過(guò)程。由此提出以下假設(shè):
H4:學(xué)歷差異對(duì)于是否為健康醫(yī)??ㄓ脩粲兄@著的影響。
本次調(diào)研采用分區(qū)域與分層相結(jié)合的隨機(jī)抽樣方法選取調(diào)查樣本,按照浙江省行政區(qū)劃選取下轄所有11個(gè)市作為樣本總體區(qū)域,包括:杭州市、寧波市、溫州市、紹興市、嘉興市、湖州市、金華市、麗水市、衢州市、舟山市、臺(tái)州市。為保證樣本的合理性和代表性,根據(jù)不同地級(jí)市的常住人口數(shù)量(2020)確定層權(quán),將理論樣本容量與層權(quán)相乘得出所需要的實(shí)際樣本容量以及各市所需要發(fā)放的問卷數(shù)量。根據(jù)各層分配樣本量,再在各層中分別進(jìn)行簡(jiǎn)單隨機(jī)抽樣,這樣不僅能夠降低變異性,也在了解總體內(nèi)不同層次的情況下具有可以對(duì)總體不同的層次或類別進(jìn)行單獨(dú)研究的優(yōu)點(diǎn)。本次調(diào)研共發(fā)放問卷905份,收回問卷821份,問卷回收率為90.71%,其中有效問卷786份,問卷有效率為95.74%,數(shù)據(jù)來(lái)源具有較好的代表性。對(duì)回收的問卷進(jìn)行編碼和錄入,進(jìn)行完整性、一致性、準(zhǔn)確性、可靠性審核。信度效度檢驗(yàn)結(jié)果顯示數(shù)據(jù)真實(shí)可靠,可以用于Logistic回歸分析。
受訪者中,約有51%的受訪者為男性,49%的受訪者為女性。考慮到樣本選取的隨機(jī)性,根據(jù)概率可知男女比例基本上為1:1,因此可認(rèn)為男女比例是合理的。
受訪者在18歲以下的有24人;在18~30歲之間的有157人;在31~45歲之間的有262人;在46~60歲之間的有198人;在60歲以上的有145人。受訪者的年齡段主要集中在31~45歲和46~60歲,約占總體樣本的一半。這是考慮到該年齡段人群對(duì)健康醫(yī)??ǖ氖褂幂^多,更了解健康醫(yī)保卡發(fā)展的現(xiàn)狀,所以數(shù)據(jù)真實(shí)且具有一定的可分析性。
受訪者學(xué)歷為初中及以下的人數(shù)為94人;學(xué)歷為高中、中專的人數(shù)為226人;學(xué)歷為本科、大專的有402人;學(xué)歷為碩士、博士的人數(shù)為64人??紤]不同學(xué)歷人群對(duì)健康醫(yī)保卡的接受能力不同,高學(xué)歷人群占樣本總體的多數(shù),可以保證調(diào)研結(jié)果的準(zhǔn)確性和科學(xué)性。
受訪者月收入在3 000元以下的有61人,月收入在3 000~6 000元的有309人;月收入在6 000~10 000元的有293人;月收入在10 000~20 000元的有89人;月收入在20 000元以上的有34人??紤]到被調(diào)查者月收入狀況會(huì)對(duì)健康醫(yī)??ǖ年P(guān)注度產(chǎn)生一定的影響,因此需要根據(jù)收入水平的不同在后續(xù)的研究中進(jìn)行對(duì)比分類分析。該樣本的月收入分布結(jié)構(gòu)較為分散,可以反映處于不同收入水平個(gè)體的想法與意見,因此具有較好的代表性,可以更加準(zhǔn)確地推斷總體。
依據(jù)理論分析涉及的關(guān)鍵研究變量,將第i個(gè)個(gè)體“是否是健康醫(yī)??ㄓ脩簟边@種二元選擇行為設(shè)置為因變量。當(dāng)選擇“是”時(shí),yi取值為1,當(dāng)選擇“不是”時(shí),yi取值為0。依據(jù)研究假設(shè)提出的4個(gè)觀點(diǎn),將性別、年齡、月收入、學(xué)歷設(shè)置為自變量:x1代表性別,x2-x5代表不同的年齡,x6-x9代表不同的月收入,x10-x12代表不同的學(xué)歷。分別從性別、年齡、月收入、學(xué)歷這4個(gè)角度考量對(duì)健康醫(yī)??ㄟx擇傾向的影響。
由于本次設(shè)置的問卷調(diào)查中大量數(shù)據(jù)為分類資料,例如月收入分成了5檔,如果直接編碼為5、4、3、2、1,令其作為自變量納入分析,就等價(jià)于是假設(shè)這5檔間的差距完全相等,或者說(shuō)對(duì)因變量的數(shù)值影響程度是均勻的,這樣的假設(shè)會(huì)過(guò)于簡(jiǎn)單武斷,與實(shí)際情況不符;另外對(duì)于無(wú)需多分類變量,如由于職業(yè)之間不存在數(shù)量上的高低,因此不可能為其給出一個(gè)單獨(dú)的回歸系數(shù)估計(jì)值,來(lái)表示職業(yè)每上升一個(gè)單位時(shí)因變量的變化趨勢(shì)。因此本文采用統(tǒng)計(jì)上標(biāo)準(zhǔn)的做法,采用虛擬變量進(jìn)行擬合,然后根據(jù)分析結(jié)果對(duì)模型進(jìn)行簡(jiǎn)化。在對(duì)基準(zhǔn)類的設(shè)定上,為方便錄入,原則上將最后一個(gè)選項(xiàng)設(shè)為基準(zhǔn)類,當(dāng)最后一個(gè)選項(xiàng)為其他或該選項(xiàng)的被選中頻次小于30次時(shí),以倒數(shù)第二個(gè)選項(xiàng)設(shè)定為基準(zhǔn)類。具體變量設(shè)定如表1所示。
表1 變量設(shè)定表
Logistic回歸模型是一種研究二項(xiàng)分類結(jié)果與多個(gè)互不相關(guān)的影響因子(x1,x2,…xn)之間關(guān)系的多元統(tǒng)計(jì)分析方法。該模型可通過(guò)研究滑坡易發(fā)性與用戶基本特征因子間的關(guān)系,預(yù)測(cè)被調(diào)查者是否為健康醫(yī)??ㄓ脩舻母怕?其中自變量為用戶基本特征因子指標(biāo)值(x1,x2,…xn),因變量為被調(diào)查者是否為健康醫(yī)??ㄓ脩?,分別為1和0。自變量可為連續(xù)變量、離散變量或二者任意組合,無(wú)需滿足正態(tài)分布。構(gòu)建Logistic回歸模型如下
式中:P為是健康醫(yī)??ㄓ脩舻母怕剩沪翞榻鼐?;β為回歸系數(shù)。P的輸出結(jié)果是[0,1],為了便于理解與計(jì)算,對(duì)上式左右兩端取自然對(duì)數(shù),得線性回歸方程如下:
將前期搜集到的數(shù)據(jù)中的健康醫(yī)??ㄓ脩羧后w進(jìn)行匯總,納入所有需要考慮的變量,建立二元邏輯回歸Logistic模型,擬合模型并估計(jì)參數(shù),得到各顯著變量的系數(shù)估計(jì)值、瓦爾德系數(shù)和對(duì)應(yīng)P值,具體模型估計(jì)結(jié)果如表2所示
表2 模型參數(shù)估計(jì)結(jié)果表
針對(duì)不同的健康醫(yī)保卡用戶特征,對(duì)模型結(jié)果進(jìn)行分析:
1)性別
在0.05的顯著性水平上,性別的P值為0.394,未通過(guò)顯著性檢驗(yàn)。這說(shuō)明在其它條件相同的情況下,被調(diào)查者是否為健康醫(yī)??ㄓ脩暨@一行為不存在性別差異,即男性與女性對(duì)于健康醫(yī)??ǖ倪x擇傾向沒有明顯的區(qū)別。
2)年齡
在設(shè)置虛擬變量時(shí),年齡的基礎(chǔ)類型為18歲及以下,與基礎(chǔ)類型相比,特征年齡(31~45歲)和特征年齡(46~60歲)的系數(shù)為正,說(shuō)明這兩個(gè)年齡層的人申辦健康醫(yī)??ǖ膬A向更高。同時(shí)這也與職場(chǎng)人士的生活方式及年輕人對(duì)新鮮事物的追求和接受程度有關(guān)。相對(duì)于年長(zhǎng)的人,31~60歲的人群可能由于生活方式以及消費(fèi)理念的不同,對(duì)于健康醫(yī)??ǖ拿舾卸雀?,這就使得這類人群成了健康醫(yī)??ǖ闹饕脩羧后w。
3)月收入
模型估計(jì)結(jié)果顯示,月收入通過(guò)模型系數(shù)的顯著性檢驗(yàn),這說(shuō)明月收入對(duì)是否為健康醫(yī)??ǖ挠脩粲兄@著影響。特征月收入(6 001~10 000元)和特征月收入(10 001~20 000元)的系數(shù)較大,且P值小于0.01,這說(shuō)明這兩類月收入人群是健康醫(yī)??ㄓ脩舻母怕矢摺R话銇?lái)說(shuō),月收入在6 001~20 000元之間的人群具有一定的分析辨別能力,并且健康醫(yī)??ㄋ邆涞墓δ芤草^符合這類人群的需求,所以更多的申辦健康醫(yī)???。月收入在6 000元以下的變量不顯著,可能是因?yàn)檫@類人群不會(huì)花費(fèi)很多的時(shí)間在關(guān)注健康醫(yī)??ㄉ稀T率杖朐?0 000元以上的人群由于收入較高,健康醫(yī)保卡的功能難以吸引這類人群。
4)學(xué)歷
模型估計(jì)結(jié)果顯示,學(xué)歷通過(guò)模型系數(shù)的顯著性檢驗(yàn),這說(shuō)明個(gè)人學(xué)歷水平高低對(duì)于是否是健康醫(yī)??ǖ挠脩粢灿兄欢ㄓ绊?。其中本科、大專學(xué)歷的人群顯著性最強(qiáng),它們對(duì)于健康醫(yī)保卡的功能有著更為深入的認(rèn)識(shí)。高中、中專學(xué)歷的人群對(duì)于健康醫(yī)??ㄒ灿兄欢ǖ呐d趣,可以通過(guò)宣傳和普及引導(dǎo)它們下載使用,方便自身。
利用卡方檢驗(yàn)驗(yàn)證性別的影響,建立聯(lián)立表如表3所示:
表3 性別與健康醫(yī)??ㄓ脩纛l數(shù)列聯(lián)表
通過(guò)計(jì)算可得X2=0.648。當(dāng)自由度為1,置信區(qū)間為95%時(shí),臨界值為3.841>0.648。因此假設(shè)H1:性格差異對(duì)于是否為健康醫(yī)保卡用戶有著顯著的影響——不成立。
利用卡方檢驗(yàn)驗(yàn)證年齡的影響,建立聯(lián)立表如表4所示:
表4 年齡與健康醫(yī)保卡用戶頻數(shù)列聯(lián)表
通過(guò)計(jì)算可得X2=29.513。當(dāng)自由度為4,置信區(qū)間為95%時(shí),臨界值為9.488<29.513。
因此假設(shè)H2:年齡差異對(duì)于是否為健康醫(yī)??ㄓ脩粲兄@著的影響——成立。
通過(guò)前期調(diào)查,本文提出了影響健康醫(yī)??ㄓ脩暨x擇傾向的4個(gè)假設(shè)。結(jié)果顯示年齡、月收入和學(xué)歷的差異會(huì)顯著影響是否為健康醫(yī)保卡用戶的概率,性別則沒有明顯的影響。根據(jù)模型估計(jì)結(jié)果,女性與男性對(duì)健康醫(yī)??ǖ倪x擇傾向無(wú)明顯差異,年齡在31~45歲的群體對(duì)健康醫(yī)??ㄓ懈钊氲牧私?,月收入為6 000~10 000元的群體會(huì)較多地使用健康醫(yī)???,本科、大專學(xué)歷的群體對(duì)健康醫(yī)??ǖ年P(guān)注度更高。由此得到健康醫(yī)??ㄖ饕脩舻幕咎卣鳛椋耗行约芭?,年齡31~45歲,月收入6 000~10 000元,本科、大專學(xué)歷。
為使健康醫(yī)保卡能夠在浙江省內(nèi)得到更好的推廣,提升在偏遠(yuǎn)鄉(xiāng)鎮(zhèn)地區(qū)的普及率,讓更多的百姓了解使用它,并從中獲益,針對(duì)不同人群提出以下建議。
(1)根據(jù)現(xiàn)有的健康醫(yī)??ㄓ脩艋咎卣?,在相應(yīng)的群體中進(jìn)行內(nèi)部挖掘,充分發(fā)揮潛力。在地鐵站、商場(chǎng)等人流較大場(chǎng)所顯目位置進(jìn)行廣泛宣傳,把握年輕上班族的傳播交流能力,使他們能夠了解健康醫(yī)??ǖ木唧w功能和方便之處,進(jìn)而萌生使用的想法。
(2)研究發(fā)現(xiàn)健康醫(yī)??撛谟脩舻奶卣鳛椋耗行约芭?,年齡46~60歲,月收入6 000以下,高中及以下學(xué)歷。這類人群對(duì)于健康醫(yī)??ㄓ兄^大的需求,生活中經(jīng)常用到相關(guān)功能。但是他們的接受能力和操作能力相對(duì)較弱,無(wú)法有效地使用健康醫(yī)???,因此針對(duì)這類人群需要完善引導(dǎo)措施,發(fā)動(dòng)志愿者上門去傳授使用的方法,讓他們更好理解相應(yīng)的功能。
(3)針對(duì)偏遠(yuǎn)鄉(xiāng)鎮(zhèn)地區(qū),需要政府落實(shí)獎(jiǎng)勵(lì)政策,鼓勵(lì)居民使用健康醫(yī)???,提升普及率。在大眾的傳播媒體上進(jìn)行廣泛宣傳,讓更多的人能夠知道健康醫(yī)??ǖ拇嬖?。
本文從浙江省健康醫(yī)??òl(fā)展不均衡的現(xiàn)狀出發(fā),通過(guò)搜集現(xiàn)有用戶的相關(guān)數(shù)據(jù),運(yùn)用Logistic回歸模型和卡方檢驗(yàn)對(duì)健康醫(yī)??ㄓ脩舻幕咎卣鬟M(jìn)行了分析。根據(jù)實(shí)驗(yàn)結(jié)果得出主要用戶和潛在用戶的特征,并分別針對(duì)不同的人群提出了使用建議。本研究具有良好的現(xiàn)實(shí)意義,也為其他省市推進(jìn)醫(yī)保社保體制改革提供了可復(fù)制可推廣的寶貴經(jīng)驗(yàn)。