鄭彩霞,王 靜,楊 杰,代 哲,武瓊?cè)A
臨床預(yù)測(cè)模型是指利用參數(shù)、半?yún)?shù)和非參數(shù)的數(shù)學(xué)模型,預(yù)測(cè)個(gè)體臨床相關(guān)結(jié)果存在或?qū)戆l(fā)生的概率[1]。準(zhǔn)確的臨床預(yù)測(cè)模型可以幫助個(gè)體有效識(shí)別高危因素,減少疾病的發(fā)生和發(fā)展。作為一種評(píng)估風(fēng)險(xiǎn)和收益的量化工具,臨床預(yù)測(cè)模型還可以促進(jìn)醫(yī)務(wù)工作者優(yōu)化臨床決策,提升生命質(zhì)量,因此其應(yīng)用廣泛[2]。糖尿病是一種威脅全球健康的代謝紊亂性疾病;全世界約有 1/11的人群患有糖尿病[3]。利用臨床預(yù)測(cè)模型預(yù)測(cè)糖尿病及其并發(fā)癥的發(fā)生和發(fā)展,為糖尿病的早期篩查、診斷和治療等方面提供快速、科學(xué)、準(zhǔn)確的方法學(xué)工具,可以降低糖尿病患者的醫(yī)療負(fù)擔(dān)、致殘率和致死率。目前,國(guó)內(nèi)外開發(fā)了越來越多與糖尿病相關(guān)的預(yù)測(cè)模型[4-6],但缺乏系統(tǒng)分析。因此,本文對(duì)糖尿病領(lǐng)域相關(guān)文獻(xiàn)進(jìn)行可視化分析,探索糖尿病預(yù)防領(lǐng)域研究者的關(guān)注方向,有利于醫(yī)護(hù)人員早期識(shí)別高風(fēng)險(xiǎn)人群,以期為今后臨床預(yù)測(cè)模型在糖尿病研究中的應(yīng)用提供支持和參考。
本文選擇Web of Science 核心合集為數(shù)據(jù)庫(kù)來源,檢索式為:(主題=“diabetes”O(jiān)R“mellitus”O(jiān)R“diabetes mellitus”O(jiān)R“hypoglycemia”O(jiān)R“gestational diabetes”O(jiān)R“diabetic foot ulcer”O(jiān)R“diabetic nephropathy”)AND(主題=“prediction model”O(jiān)R“risk prediction”O(jiān)R“clinical prediction model”),時(shí)間限定為2010 年1 月至2021 年9 月,文獻(xiàn)類型為Article,人工剔除與研究主題不相關(guān)的文獻(xiàn)和會(huì)議記錄,最終納入3 006 篇文獻(xiàn)。
利用Web of Science核心合集數(shù)據(jù)庫(kù)的文獻(xiàn)分析功能分析文獻(xiàn)的年度分布,采用CiteSpace5.8.R3 軟件對(duì)國(guó)家、機(jī)構(gòu)、作者、關(guān)鍵詞和共被引文獻(xiàn)進(jìn)行可視化分析,將Web of Science 的文獻(xiàn)以“全記錄與引用參考文獻(xiàn)”的格式導(dǎo)出,以“純文本”格式導(dǎo)入CiteSpace 軟件。時(shí)間跨度選擇2010-2021 年,時(shí)間切片為1 年,閾值為Top N=50,裁剪方式為Path Finder、Pruning Sliced Networks 和Pruning the Merged Network。
Web of Science 數(shù)據(jù)庫(kù)收錄的2010-2121 年糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型研究文獻(xiàn)數(shù)量總體呈上升趨勢(shì),其中2010-2014 年為緩慢增長(zhǎng)期,2014-2017 年為持續(xù)增長(zhǎng)期,2017-2020 年為快速增長(zhǎng)期。2020年相關(guān)研究文獻(xiàn)數(shù)量最多(為439 篇),2021 年1-9 月已發(fā)表389 篇。
以Country(國(guó)家)和Institution(機(jī)構(gòu))為節(jié)點(diǎn)進(jìn)行分析,結(jié)果顯示,共有96 個(gè)國(guó)家和地區(qū)、318 個(gè)機(jī)構(gòu)發(fā)表了糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型研究文獻(xiàn)。其中,相關(guān)研究文獻(xiàn)數(shù)量排名前10 位的國(guó)家和機(jī)構(gòu)如表1 所示,美國(guó)相關(guān)研究文獻(xiàn)數(shù)量最多,中國(guó)次之;英國(guó)和美國(guó)中心度最大,中國(guó)和印度中心度最低。發(fā)文機(jī)構(gòu)中,瑞典Lund University(隆德大學(xué))相關(guān)研究文獻(xiàn)數(shù)量最多,中心性也最高。研究作者中,高產(chǎn)作者均來自芬蘭。對(duì)文獻(xiàn)被引頻次進(jìn)行分析,得到15 篇高被引文獻(xiàn),可概括為以下幾類:預(yù)測(cè)糖尿病的患病率、糖尿病的診斷與分類、糖尿病預(yù)測(cè)模型的驗(yàn)證和預(yù)測(cè)性能的評(píng)估,以及糖尿病研究中的機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘。
表1 糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型研究文獻(xiàn)數(shù)量排名前10 位的國(guó)家和機(jī)構(gòu)
利用CiteSpace 軟件以Keyword(關(guān)鍵詞)為節(jié)點(diǎn)進(jìn)行分析,關(guān)鍵詞共現(xiàn)圖譜如圖1 所示。表2列出了出現(xiàn)頻次排名前20 位的關(guān)鍵詞,通過刪除與主題詞相關(guān)的詞和合并同義詞,將關(guān)鍵詞分為糖尿病的診斷和預(yù)防、糖尿病的心血管并發(fā)癥、糖尿病患者的生活方式和自我管理、妊娠糖尿病,以及兒童糖尿病5 類。
圖1 糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型研究文獻(xiàn)關(guān)鍵詞共現(xiàn)圖譜
表2 糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型研究文獻(xiàn)出現(xiàn)頻次排名前20 位的高頻關(guān)鍵詞
2010-2021 年糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型研究文獻(xiàn)的關(guān)鍵詞突現(xiàn)情況如圖2 所示,得到19 個(gè)突現(xiàn)關(guān)鍵詞,其中早期關(guān)注主題為follow up(隨訪)、islet cell antibody(胰島細(xì)胞抗體)、C reactive protein(C 反應(yīng)蛋白)、coronary heart disease(冠心?。DDM(胰島素依賴性糖尿?。rtery disease(動(dòng)脈疾?。Q芯繒r(shí)間較長(zhǎng)的主題是glycated hemoglobin(糖化血紅蛋白),研究持續(xù)時(shí)間為7 年;其次是cardiovascular risk factor(心血管危險(xiǎn)因素),研究持續(xù)時(shí)間為6年。后期研究及研究前沿主要集中在peripheral arterial disease(外周動(dòng)脈疾?。idney disease(腎?。?、management(管理)、hypoglycemia(低血糖)和machine learning(機(jī)器學(xué)習(xí))等方面。
圖2 糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型研究文獻(xiàn)的關(guān)鍵詞突現(xiàn)分析
通過分析2010-2021 年糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型研究文獻(xiàn)數(shù)量,發(fā)現(xiàn)隨著糖尿病發(fā)病率及不良預(yù)后發(fā)生率的增高,對(duì)糖尿病及其并發(fā)癥的預(yù)防逐漸成為研究者關(guān)注的重點(diǎn)。近年來,糖尿病領(lǐng)域臨床預(yù)測(cè)模型相關(guān)文獻(xiàn)數(shù)量呈快速增長(zhǎng)趨勢(shì)。相關(guān)文獻(xiàn)數(shù)量和中心度的排名結(jié)果顯示,美國(guó)、英國(guó)等歐美國(guó)家在糖尿病臨床預(yù)測(cè)模型方面的研究取得了一定的成果,影響力較大。其中瑞典、芬蘭、丹麥等北歐國(guó)家雖然人口較少,但糖尿病預(yù)測(cè)相關(guān)研究十分集中且成熟,該領(lǐng)域有影響的研究機(jī)構(gòu)約一半來自北歐國(guó)家。芬蘭和瑞典都有糖尿病預(yù)防相關(guān)研究中心,并提倡精準(zhǔn)醫(yī)學(xué),即針對(duì)到每個(gè)人基因、環(huán)境和生活方式等個(gè)體差異的一種新型疾病治療和預(yù)防方法[7],以促進(jìn)更準(zhǔn)確的治療和預(yù)防。
我國(guó)相關(guān)研究文獻(xiàn)數(shù)量方面排在世界第2 位,研究成果頗豐,說明我國(guó)在該領(lǐng)域具備較強(qiáng)的科研能力,然而中心性較低且無高產(chǎn)作者和機(jī)構(gòu),說明研究相對(duì)較為分散,缺乏權(quán)威性核心研究機(jī)構(gòu);同時(shí)我國(guó)與其他國(guó)家的合作交流較少,國(guó)際影響力有待進(jìn)一步擴(kuò)大。我國(guó)應(yīng)加強(qiáng)與歐美國(guó)家及機(jī)構(gòu)的合作,借鑒芬蘭、瑞典等北歐國(guó)家的糖尿病預(yù)防模式。目前已有研究表明,芬蘭版糖尿病風(fēng)險(xiǎn)評(píng)估量表在靈敏度和預(yù)測(cè)性能上優(yōu)于中國(guó)版[8],未來我國(guó)應(yīng)在糖尿病發(fā)病病因的預(yù)測(cè)方面深入研究,以取得突破性進(jìn)展。
3.2.1 心血管疾病
從關(guān)鍵詞頻次和突現(xiàn)情況看,2020-2121 年“冠心病”“動(dòng)脈疾病”“心血管危險(xiǎn)因素”“外周動(dòng)脈疾病”等關(guān)鍵詞持續(xù)出現(xiàn),說明糖尿病并發(fā)心血管疾病是研究者重點(diǎn)關(guān)注的內(nèi)容。糖尿病是心血管疾病的公認(rèn)危險(xiǎn)因素,心血管疾病也是糖尿病主要的死亡原因[9]。針對(duì)糖尿病患者的心血管并發(fā)癥,除了控制血糖外,及時(shí)預(yù)測(cè)和嚴(yán)格控制心血管危險(xiǎn)因素也很重要[10]。風(fēng)險(xiǎn)預(yù)測(cè)是評(píng)估心血管疾病高危個(gè)體的關(guān)鍵手段,有利于醫(yī)務(wù)人員對(duì)高危個(gè)體進(jìn)行健康教育和制定個(gè)體化的治療方案[11]。目前國(guó)外構(gòu)建的2 型糖尿病心血管病臨床預(yù)測(cè)模型主要分為兩類,一類是基于一般人群建立的模型,另一類是基于2 型糖尿病人群建立的模型。有學(xué)者采用這兩類模型在我國(guó)2 型糖尿病人群中進(jìn)行驗(yàn)證,發(fā)現(xiàn)模型預(yù)測(cè)的校準(zhǔn)度較差,可能與種族和文化不同、基線特征存在較大差異有關(guān)[12]。我國(guó)目前尚缺乏靈敏度、校準(zhǔn)度和預(yù)測(cè)性能高的針對(duì)糖尿病患者開發(fā)的心血管疾病預(yù)測(cè)模型。
3.2.2 自我管理
從關(guān)鍵詞頻次分析看,“肥胖”“生活習(xí)慣”“管理”等生活方式和自我管理類關(guān)鍵詞出現(xiàn)頻次較高,說明加強(qiáng)糖尿病防治的重要方法是加強(qiáng)自我管理和改變生活方式[13]?;颊叩淖晕夜芾韺?duì)預(yù)防2 型糖尿病并發(fā)癥和降低死亡率至關(guān)重要,我國(guó)一項(xiàng)針對(duì)3 個(gè)省社區(qū)糖尿病人群的調(diào)查發(fā)現(xiàn),患者在飲食管理、合理運(yùn)動(dòng)和血糖監(jiān)測(cè)方面依從性較低,自我管理能力有待提高,醫(yī)護(hù)人員對(duì)糖尿病患者的健康教育有所欠缺[14]。糖尿病患者的自我管理是控制血糖的重要因素,應(yīng)以不同形式加強(qiáng)對(duì)患者的健康教育,降低患者再入院率和并發(fā)癥的發(fā)生率。
3.2.3 妊娠期糖尿病
從關(guān)鍵詞頻次分析看,妊娠期糖尿?。╣estational diabetes mellitus,GDM)也是研究熱點(diǎn)。GDM 的發(fā)病率逐年增高,一項(xiàng)Meta 分析結(jié)果顯示,中國(guó)GDM 的總發(fā)病率已上升至14.8%[15]。GDM主要發(fā)生在妊娠中期和晚期,常出現(xiàn)圍產(chǎn)期并發(fā)癥,如巨大兒、肩難產(chǎn)和新生兒低血糖,主要危險(xiǎn)因素有高齡、孕前超重肥胖及口服葡萄糖耐量測(cè)試(OGTT)結(jié)果異常,早期進(jìn)行干預(yù)可有效改善不良妊娠結(jié)局[16-17]。近年來,有較多國(guó)內(nèi)外學(xué)者聯(lián)合多項(xiàng)指標(biāo)構(gòu)建了妊娠期糖尿病早期預(yù)測(cè)模型,預(yù)測(cè)疾病的發(fā)生風(fēng)險(xiǎn),進(jìn)行早期篩查和預(yù)警。這些模型有一定的預(yù)測(cè)價(jià)值,但仍需要大樣本驗(yàn)證,從而將預(yù)測(cè)性能較好的模型應(yīng)用于臨床[18]。
3.3.1 糖尿病腎病
從共被引文獻(xiàn)分析和關(guān)鍵詞突現(xiàn)情況看,“糖尿病腎病”是近幾年的研究熱點(diǎn)和趨勢(shì)。糖尿病腎病(diabetic nephropathy,DN)是糖尿病微血管病之一,是全球終末性腎病(end stage renal disease,ESRD)的主要原因。DN 患者的死亡率比無腎病的糖尿病患者高約30 倍,并且絕大多數(shù)DN 患者在達(dá)到ESRD 之前多死于心血管疾病[19]。如何延緩DN 發(fā)展為ESRD 是目前研究的重點(diǎn),我國(guó)已有多位學(xué)者開發(fā)并驗(yàn)證了DN 的診斷模型,預(yù)測(cè)性能較好[20-22],在改善DN 預(yù)后方面具有一定的價(jià)值,可推廣應(yīng)用,以進(jìn)行早期預(yù)警,降低ESRD 的發(fā)生率。
3.3.2 低血糖
從關(guān)鍵詞突現(xiàn)情況看,“低血糖”是近幾年的研究熱點(diǎn)和趨勢(shì)。作為糖尿病最常見的并發(fā)癥,低血糖會(huì)增加心血管事件和死亡的風(fēng)險(xiǎn)[23],在近一半的病例中,患者無癥狀[24]。因無法預(yù)測(cè)和干預(yù)低血糖事件,導(dǎo)致低血糖反復(fù)發(fā)生,患者防御能力受損,從而出現(xiàn)惡性循環(huán),增加嚴(yán)重低血糖的發(fā)生風(fēng)險(xiǎn)[25]。因此,預(yù)測(cè)低血糖是改善糖尿病患者生活質(zhì)量的重要措施。
3.3.3 機(jī)器學(xué)習(xí)
從共被引文獻(xiàn)分析和關(guān)鍵詞突現(xiàn)情況看,“機(jī)器學(xué)習(xí)”是未來構(gòu)建糖尿病預(yù)測(cè)模型的新趨勢(shì)。機(jī)器學(xué)習(xí)起源于計(jì)算機(jī)科學(xué),它賦予計(jì)算機(jī)以一定的預(yù)測(cè)能力,廣泛應(yīng)用于醫(yī)療保健領(lǐng)域[24]。常用的機(jī)器學(xué)習(xí)算法包括K 近鄰、樸素貝葉斯、邏輯回歸、支持向量機(jī)、決策樹、集成的樹模型和人工神經(jīng)網(wǎng)絡(luò)[26]。在糖尿病領(lǐng)域,機(jī)器學(xué)習(xí)算法是從豐富的糖尿病相關(guān)數(shù)據(jù)中提取信息的有效手段,已廣泛應(yīng)用于糖尿病診斷及管理,尤其是糖尿病并發(fā)癥的預(yù)測(cè)和防治[27]。與傳統(tǒng)的logistic 回歸算法相比,機(jī)器學(xué)習(xí)算法在處理高度計(jì)算復(fù)雜和高度不確定的臨床大數(shù)據(jù)時(shí)能力較強(qiáng),可將高維數(shù)據(jù)簡(jiǎn)化,大大降低運(yùn)算成本[28],已經(jīng)成為構(gòu)建臨床預(yù)測(cè)模型常用的算法。
本文基于Web of Science 收錄的糖尿病臨床預(yù)測(cè)模型相關(guān)研究文獻(xiàn),對(duì)國(guó)際糖尿病風(fēng)險(xiǎn)預(yù)測(cè)模型相關(guān)研究進(jìn)展進(jìn)行了分析,反映了該領(lǐng)域近2020-2021 年的研究熱點(diǎn)與前沿。我國(guó)相關(guān)研究數(shù)量較多,但尚未形成核心研究機(jī)構(gòu)且影響力不夠。未來我們應(yīng)結(jié)合自身特點(diǎn)開發(fā)適用于我國(guó)人群的糖尿病預(yù)測(cè)模型。本文的局限性在于僅分析了1 種數(shù)據(jù)庫(kù)收錄的文獻(xiàn),后期研究將在數(shù)據(jù)獲取和分析角度等方面進(jìn)一步完善,以期能夠更加準(zhǔn)確、全面地揭示該領(lǐng)域的特征。