摘 要:在“二胎”“三胎”政策頒布后,我國的高齡孕產(chǎn)婦人數(shù)逐漸增加,同時我國不孕不育率呈上升趨勢,因此輔助生殖技術越來越受到大眾關注。本文基于Multi-Aspect(即包含TF-IDF算法,循環(huán)神經(jīng)網(wǎng)絡,注意力機制技術)的融合孕產(chǎn)婦畫像模型進行設計,采用三甲醫(yī)院的案例建立初始數(shù)據(jù)庫,通過深度學習算法對數(shù)據(jù)庫中的數(shù)據(jù)進行訓練,結合互聯(lián)網(wǎng)數(shù)據(jù)回溯平臺監(jiān)測用戶在備孕期和妊娠期的實時狀態(tài),通過算法分析得出孕產(chǎn)婦的用戶畫像,確定孕婦的風險指數(shù)。該天氣指數(shù)保險產(chǎn)品采用客觀的醫(yī)院數(shù)據(jù)定損,操作性強,可有效轉移孕產(chǎn)婦在輔助生殖上的風險,促進婦女孕中保險的可持續(xù)發(fā)展。
關鍵詞:孕產(chǎn)婦;Multi-Aspect算法;輔助生殖技術
2021年5月11日,國家統(tǒng)計局公布的第七次全國人口普查數(shù)據(jù)顯示:2020年全國人口總數(shù)達到14.12億人,十年間復合年增長率約為1%;2023年全年出生人口為902萬人,人口出生率為6.39‰,出生人口數(shù)量連續(xù)六年滑落,出生率為1952年該數(shù)據(jù)公布以來最低。
“獨生子女政策”的實施導致青年人口減少,同時,中國人口預期壽命的提高也使得中國加速步入老齡化社會。從2016年到2023年,中國人口老齡化加劇,65歲以上人口的復合年增長率為4.535%。據(jù)國家統(tǒng)計局數(shù)據(jù),2023年65歲以上的人口占總人口的比重為15.4%。65歲以上的人口數(shù)量正在以相當快的速度增長,并預計在未來繼續(xù)保持增長勢頭。
面對全國人口出生率不斷下降,人口老齡化等問題,我國出臺了一系列鼓勵生育的政策,對生育問題的重視已經(jīng)上升到了國家的高度。伴隨著“三胎”政策的實施和晚婚晚育人數(shù)的增加,高齡人群的生育需求呈現(xiàn)出上升趨勢。由于高齡人群的不孕不育癥發(fā)病率較高,輔助生殖需求因此攀升。
《統(tǒng)計年鑒》顯示,截止2023年,我國20-49歲的育齡女性人數(shù)約為2.5億,據(jù)此測算,我國的不孕不育人群近5184萬人。弗若斯特沙利文數(shù)據(jù)顯示,2023年美國輔助生殖滲透率達到了30.2%,而我國僅為7%。如果我國能達到美國的滲透率,這就意味著我國輔助生殖潛在需求達1566萬人。
隨著不孕不育人數(shù)不斷增長,高齡產(chǎn)婦總數(shù)持續(xù)增加,輔助生殖技術不斷進步,越來越多的人選擇輔助生殖。中國輔助生殖市場規(guī)模逐步擴大,也逐漸暴露出輔助生殖技術未納入醫(yī)保、未納入生育保險等問題,本文將從此問題上出發(fā),討論婦女孕中保險的可持續(xù)發(fā)展方法。
一、數(shù)據(jù)來源
數(shù)據(jù)來源于原始數(shù)據(jù)庫—醫(yī)院和互聯(lián)網(wǎng)平臺。從醫(yī)院獲取以往采用輔助生殖技術孕產(chǎn)婦的情況,從互聯(lián)網(wǎng)平臺獲取孕產(chǎn)婦基本動態(tài)信息。同時Multi-Aspect的融合網(wǎng)絡畫像模型利用完整數(shù)據(jù)庫的數(shù)據(jù)來得出孕產(chǎn)婦的風險指數(shù)。同時通過《輔助生殖技術與不良妊娠結局及妊娠并發(fā)癥的研究進展》、《輔助生殖技術的出生結局》等學術論文和官方文件,收集輔助生殖技術成功率、妊娠并發(fā)癥發(fā)生率、流產(chǎn)率、新生兒發(fā)病率等相關概率數(shù)據(jù)。
二、用戶畫像建立
(一)基于Multi-Aspect的融合保險用戶畫像生成方法
1.MULTI-ASPECT。MULTI-ASPECT是集TF-IDF算法、循環(huán)神經(jīng)網(wǎng)絡和注意力機制三者為一體。隨著人工智能大數(shù)據(jù)技術、數(shù)據(jù)挖掘、機器學習和神經(jīng)網(wǎng)絡算法發(fā)展,針對結構化與非結構化數(shù)據(jù)以及多元化數(shù)據(jù)與豐富化數(shù)據(jù)的研究得到蓬勃發(fā)展。MULTI-ASPECT利用關鍵詞提取、循環(huán)神經(jīng)網(wǎng)絡等技術,從不同角度提取平臺用戶數(shù)據(jù),從而實現(xiàn)對平臺用戶特征較高準確率的預測【5】。
(a)TF-IDF(term frequency-inverse document frequency)。TF-IDF是一種用于信息檢索與文本挖掘的統(tǒng)計方法,可用于評估某個字詞對于一個文檔的重要程度,其重要性同它在文檔中出現(xiàn)的次數(shù)成正比,且同它在全部文檔構成的語料庫中出現(xiàn)的頻率成反比。
(b)循環(huán)神經(jīng)網(wǎng)絡。循環(huán)神經(jīng)網(wǎng)絡是一種獨特的神經(jīng)網(wǎng)絡結構。循環(huán)神經(jīng)網(wǎng)絡與普通網(wǎng)絡的區(qū)別在于可以很好地處理序列信息,其隱層的值不僅僅取決于當前時刻的輸入,還取決于上一時刻隱層的值,即上一時刻的隱藏層是可以影響當前時刻的隱藏層。這一特征使得循環(huán)神經(jīng)網(wǎng)絡具備可以處理前后有關聯(lián)的序列信息的優(yōu)勢。而連接網(wǎng)絡只能單獨一個一個輸入處理,且前后兩個輸入之間沒有關聯(lián)。
(c)注意力機制。注意力機制,顧名思義來源于人類視覺研究。在處理平臺多元化數(shù)據(jù)的過程中,通過模擬人類的閱讀習慣,將注意力關注到眾多詞句與圖像,提取詞句關鍵詞并且將圖像進行“解密”,輸出對圖像的描述。通過加入注意力機制,可以將源語言中每個細枝末節(jié)的信息都保存下來,靜待解碼之時,將每一個目標語言的單詞都直接從源語言的信息中選擇相關的信息作為輔助分析。
2.基于Multi-Aspect的融合網(wǎng)絡用戶畫像建立模型
關鍵詞特征提取模塊:每個用戶在互聯(lián)網(wǎng)搜索引擎輸入的內容大相徑庭,其搜索內容與用戶屬性的差別、用戶當時的需求以及用戶的喜好與困惑相關,故提取用戶搜索內容中相較其他用戶差異較大的文本作為此用戶的關鍵詞,可以在一定程度上幫助實現(xiàn)用戶特征分類。
(a)文本編碼模塊。文本編碼模塊將用戶搜索數(shù)據(jù)通過分詞和去停用詞處理后,得到一個個單獨的搜索詞。每個保險用戶的瀏覽、購買、個人信息內容天差地別,通過處理后得到的詞表數(shù)目巨大,使用詞袋模型進行表示過于稀疏,且無法表示詞語之間的內在聯(lián)系,因此使用詞向量模型生成各搜索詞較稠密的分布式向量表示。
(b)TOP 2 關鍵詞特征提取模塊。使用提取關鍵詞模塊得到的每個保險用戶搜索、瀏覽詞TF-IDF值排名前兩位的詞,將其貼上此用戶文檔最關鍵的詞匯的標簽。除此之外,因為保險用戶的搜索瀏覽數(shù)據(jù)存在因果和時序關系,所以模塊取排名前兩位的關鍵詞在原始用戶搜索文本中前后特定長度的周圍詞匯拼接成左右子句后經(jīng)由雙向循環(huán)神經(jīng)網(wǎng)絡進行特征提取。
(c)TOP N 關鍵詞特征提取模塊。TOP N關鍵詞模塊是對TOP2關鍵詞模塊的補充,是指除提取TOP 2關鍵詞及其周圍詞匯拼接成的子句特征外,進一步提取關鍵詞提取模塊中得到的排名前 N個搜索詞的特征。
(二)全文檔特征提取模塊
為避免出現(xiàn)提取關鍵詞特征模塊中的 TOP 2關鍵詞和 TOP N 關鍵詞的用戶數(shù)據(jù)特征造成信息丟失這一現(xiàn)象,該模塊將用戶的全部搜索文檔按原始順序輸入循環(huán)神經(jīng)網(wǎng)絡進行特征提取。但為屏蔽搜索文本中較通用的無意義文本,在此模塊中引入注意力機制,對重要性不同的文本分配以不同的權重,以此提高對用戶搜索數(shù)據(jù)中關鍵內容的關注度。
使用深度學習算法的理論,建立起初始數(shù)據(jù)庫,對初始數(shù)據(jù)庫中數(shù)據(jù)進行訓練。同時收集保險孕產(chǎn)婦提交到互聯(lián)網(wǎng)平臺上的信息、動態(tài)以及測量表數(shù)據(jù),利用Multi-Aspect的融合保險用戶畫像生成模型,建立全渠道用戶標簽體系,將不同孕產(chǎn)婦進行細致化分類,得出孕產(chǎn)婦不同的風險指數(shù)、保險區(qū)分等級。
三、保險精算
定價過程中需要的數(shù)據(jù)有:試管年齡分類成功率、就診率、利率、退保等。但是在我們的精算假定過程中,本文主要從試管嬰兒平均妊娠率、流產(chǎn)率、妊娠并發(fā)癥平均發(fā)生概率、新生兒平均發(fā)病率入手,并未考慮其他數(shù)據(jù)影響。
其中,精算假定如下:
(1)孕產(chǎn)婦的試管嬰兒平均妊娠率、流產(chǎn)率、妊娠并發(fā)癥平均發(fā)生概率、新生兒平均發(fā)病率會影響價格厘定,本文采用世界衛(wèi)生組織和《中國計劃生育學雜志》發(fā)布的官方數(shù)據(jù)與全球發(fā)生概率和我國發(fā)生概率相結合得出了這一部分數(shù)據(jù)。
(2)本文所針對的采用輔助生殖技術妊娠失敗所產(chǎn)生的費用較大,平均每個IVF周期數(shù)費用約為3.5-4.5萬元,故不設置免賠額。
假定r1為試管嬰兒平均妊娠失敗率;m為每份保費;C為賠付成本;e為包含合同費用、監(jiān)管費用在內的預期收益率,可以得到保費價格測算方程公式:
通過計算,保費設置為三檔,分別為3988元/人/年、10388元/人/年、28478元/人/年,對應的保額分別為5萬、8萬、50萬,這是胚胎移植手術費用的保障設置。
四、精算樣例
以浙江省某城市為例,其中20-47歲孕產(chǎn)婦約3.8萬人,根據(jù)我國2021年18%的不孕不育率,大概有6840人需要采用輔助生殖技術,經(jīng)過本組成員調查問卷調查結果得出76%的調查人員支持包含輔助生殖技術的保險,照此測算約有5200人,總投保數(shù)為5200份,以兩年期為準,低風險的占比85%,中風險占比13%,高風險占比2%(各風險指數(shù)的占比依據(jù)當?shù)匦l(wèi)生健康委員會與新聞官方網(wǎng)站數(shù)據(jù)測算得出),收取總保費約2761.1萬元,設定妊娠失敗率即為該保險的賠付率,由此可得表二。
五、解決問題
本文基于國家政策,輔助生殖技術成功率、妊娠并發(fā)癥發(fā)生率、流產(chǎn)率、新生兒發(fā)病率等相關概率數(shù)據(jù),構建婦女孕中保險產(chǎn)品設計,以期解決以下問題:
(1)解決因不育引發(fā)的家庭、社會問題。受傳統(tǒng)觀念的影響,多數(shù)盼子心切的家庭,都給不育夫婦帶來了巨大的心理壓力,同時還會引起夫妻離異、家庭不和睦、婚外戀等家庭問題,乃至非法代孕、非法買賣精子卵子等社會的問題。而“輔孕險”幫助擴大輔助生殖技術的運用,使不育夫婦妊娠生子的愿望有實現(xiàn)的可能,有助于解決由不育引發(fā)的相關問題。
(2)促進人口長期均衡發(fā)展,提高優(yōu)生優(yōu)育?!拜o孕險”響應了國家“三孩政策”的號召?!拜o孕險”充分認識到生育政策優(yōu)化以及促進人口長期均衡發(fā)展意義重大,提高優(yōu)生優(yōu)育服務水平非常必要且迫切。輔助生殖技術是實現(xiàn)優(yōu)生的重要手段,在臨床中正好能遏止遺傳病的傳遞。我國先天殘疾人口高達幾千萬,每年還有新生有遺傳缺陷人口20多萬,實行優(yōu)生對于我國人口具有重要意義。對于有遺傳缺陷的育齡夫婦,通過“輔孕險”采用輔助生殖技術的供精、供卵、供胚或胚胎移植前遺傳學診斷等方法,進而切斷導致遺傳病發(fā)生的有缺陷基因與異常染色體和后代傳遞,保證生育健康嬰兒。為我國優(yōu)生做出有效貢獻。
(3)推動輔助生殖技術發(fā)展。輔助生殖技術是人類生殖過程、遺傳病機制、干細胞定向分化等研究課題的基礎,通過“輔孕險”的基礎擴大ART的臨床應用,會為這些課題的深入研究積累經(jīng)驗,創(chuàng)造發(fā)展條件,推動醫(yī)學及生命科學的不斷發(fā)展進步。
參考文獻:
[1]陳瑩,李飛,迪力夏提·阿不力孜,等. 年齡對卵巢低反應患者輔助生殖技術治療后活產(chǎn)率的影響及其閾值效應分析[J]. 中國全科醫(yī)學,2022,25(3):264-269.
[2]丁婷(綜述),喬杰(審校). 輔助生殖技術與出生缺陷[J]. 國際生殖健康/計劃生育雜志,2013(6):442-445.
[3]郭瑞,孟煥平,戴芳芳. 輔助生殖助孕后雙胎自然減胎分析[J]. 實用婦科內分泌電子雜志,2019,6(26):47,63.
[4]李炎邁(譯),劉勇(校). 輔助生殖的妊娠結局[J]. 中國產(chǎn)前診斷雜志(電子版),2014(2):47-62.
[5]苗宇,金醒男,杜永萍.基于Multi-Aspect的融合網(wǎng)絡用戶畫像生成方法[J].計算機技術與發(fā)展,2022,32(08):20-25.
[6]謝奇君,李欣,趙純,等. 輔助生殖技術相關并發(fā)癥的研究進展[J]. 國際生殖健康/計劃生育雜志,2021,40(3):204-208.
[7]徐小璐,徐偲越,陳彩虹,等.首個完整周期人類輔助生殖技術妊娠流產(chǎn)對后續(xù)周期助孕結局的影響[J]. 鄭州大學學報(醫(yī)學版),2022,57(1):78-82.
[8]楊云,喬寵. 輔助生殖技術與復發(fā)性流產(chǎn)[J]. 中國計劃生育和婦產(chǎn)科,2017,9(11):7-9.
[9]卓朝陽,毛萌,黃海霞,等. 輔助生殖服務現(xiàn)狀與治理策略探討[J]. 中國衛(wèi)生事業(yè)管理,2021,38(6):433-436.
[10]曾倩凌,趙靜. 輔助生殖技術與不良妊娠結局及妊娠期并發(fā)癥的研究進展[J]. 中國計劃生育學雜志,2022,30(6):1451-1456.
[11]A Novel Active Learning Method Using SVM for Text Classification[J]. Mohamed Goudjil,Mouloud Koudil,Mouldi Bedda,Noureddine Ghoggali. International Journal of Automation and Computing.2018(03)