• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

      ?

      臨床研究數(shù)據(jù)清理經(jīng)驗和實例

      2018-09-03 01:43:12路甲鵬
      中國循環(huán)雜志 2018年8期
      關(guān)鍵詞:核查邏輯錯誤

      路甲鵬

      前幾期《臨床研究系列講座》文章針對研究設(shè)計、實施和質(zhì)量控制進(jìn)行了詳細(xì)的闡述,對開展臨床研究設(shè)計和實施具有重要指導(dǎo)作用。然而,“殘酷”的現(xiàn)實告訴我們,再嚴(yán)謹(jǐn)?shù)脑O(shè)計、再嚴(yán)格的研究管理和質(zhì)量控制也無法避免“錯誤”數(shù)據(jù)的出現(xiàn)。所以,數(shù)據(jù)清理是臨床研究的必要過程,對提高數(shù)據(jù)分析效率和研究結(jié)果可靠性具有重要意義。但數(shù)據(jù)清理的局限性在于只能針對錄入到數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行清理,若臨床研究中漏報不良事件,則無法通過數(shù)據(jù)清理發(fā)現(xiàn)。因此,臨床研究需要研究設(shè)計、實施管理、質(zhì)量控制以及數(shù)據(jù)清理等環(huán)節(jié)的相輔相成,才能確保研究質(zhì)量。本文擬匯總既往數(shù)據(jù)清理經(jīng)驗,介紹臨床研究數(shù)據(jù)清理的流程和關(guān)鍵點(diǎn),并以“冠心病醫(yī)療結(jié)果評價和臨床轉(zhuǎn)化研究(China PEACE)”數(shù)據(jù)清理過程為例說明臨床研究數(shù)據(jù)清理的邏輯順序及注意事項,為臨床研究者開展數(shù)據(jù)清理提供借鑒。

      1 臨床研究數(shù)據(jù)清理的具體流程

      數(shù)據(jù)清理是研究過程中針對數(shù)據(jù)重復(fù)或缺失、異常值、邏輯錯誤三類數(shù)據(jù)問題進(jìn)行識別、查找原因及處理的過程。其中,連續(xù)變量的異常值主要是指變量取值超出臨床所能接受的合理范圍,如收縮壓為700 mmHg(1 mmHg=0.133 kPa);分類變量的異常值是指變量取值與病例報告表(Case Report Form,CRF)編碼范圍不一致,如CRF中性別變量編碼:男性為1,女性為2,但實際可能出現(xiàn)性別為0或3等異常值。邏輯錯誤的范圍較廣,如日期先后順序錯誤、不同來源同一變量取值不一致、不同時間點(diǎn)變量取值不符合實際等問題。數(shù)據(jù)清理包括數(shù)據(jù)問題核查、確定產(chǎn)生數(shù)據(jù)問題的原因、以及處理問題數(shù)據(jù)三個核心過程[1]。通過這三個核心過程的反復(fù)循環(huán),不斷提升數(shù)據(jù)質(zhì)量。

      數(shù)據(jù)問題核查:數(shù)據(jù)問題核查可通過人工檢查和電腦程序檢查兩種方式實現(xiàn),建議通過電腦程序在CRF或人工錄入的數(shù)據(jù)庫中進(jìn)行核查,能夠提高效率、避免新錯誤的產(chǎn)生。在正式開始數(shù)據(jù)清理前,負(fù)責(zé)數(shù)據(jù)清理的研究人員應(yīng)根據(jù)研究方案、CRF以及數(shù)據(jù)清理計劃編寫和測試邏輯核查程序。對于數(shù)值變量,應(yīng)在程序中定義異常值的范圍,比如收縮壓在60~250 mmHg范圍以外為異常。對于主要結(jié)局指標(biāo)相關(guān)變量、日期變量以及多個來源同一變量,應(yīng)在程序中定義邏輯錯誤的判定條件,比如研究記錄某受試者出院后發(fā)生結(jié)局事件,則該結(jié)局事件發(fā)生的日期應(yīng)在出院日期之后,否則為邏輯錯誤。通過邏輯核查程序輸出報告,分類變量用頻數(shù)和百分比表示,連續(xù)變量用描述統(tǒng)計量(如均值、標(biāo)準(zhǔn)差、最大值、最小值等)表示,也可以采用箱圖、散點(diǎn)圖等展示數(shù)據(jù)分布,旨在便于研究人員發(fā)現(xiàn)“錯誤”數(shù)據(jù)。同時產(chǎn)生數(shù)據(jù)質(zhì)疑表,應(yīng)包括“錯誤數(shù)據(jù)”所對應(yīng)的變量、原值、錯誤類型、對應(yīng)的受試者ID、研究單位信息以及日期等,方便記錄數(shù)據(jù)質(zhì)疑的整個過程。

      確定產(chǎn)生數(shù)據(jù)問題的原因:該過程對不斷改進(jìn)數(shù)據(jù)清理過程具有重要作用,應(yīng)由主要研究者、負(fù)責(zé)數(shù)據(jù)清理的研究人員、數(shù)據(jù)分析人員及其他主要研究人員共同參與?;跀?shù)據(jù)核查報告和質(zhì)疑表,研究人員可以結(jié)合臨床研究方案、CRF以及臨床實踐,深入剖析每個或每類“錯誤”數(shù)據(jù)的原因以及產(chǎn)生問題的環(huán)節(jié),進(jìn)而確定處理“錯誤”數(shù)據(jù)的策略。此外,不僅要從某個變量角度出發(fā),還要從研究單位的角度出發(fā),分析“錯誤”數(shù)據(jù)是否存在研究單位聚集性,有利于發(fā)現(xiàn)研究實施過程中存在的問題,消除系統(tǒng)誤差,例如經(jīng)常出現(xiàn)數(shù)據(jù)異常的研究單位是否是因為研究人員變動,培訓(xùn)不到位所致等。最后,該過程還可以幫助研究人員對已建立的邏輯核查程序進(jìn)行優(yōu)化,包括數(shù)值變量合理取值范圍是否需要調(diào)整,是否需要增加新的邏輯核查條件等。例如,數(shù)據(jù)質(zhì)疑表中記錄某受試者收縮壓為700 mmHg,分析原因發(fā)現(xiàn)可能為研究者填寫錯誤,可以由研究者核對后修改。但在該過程中主要研究者和負(fù)責(zé)數(shù)據(jù)清理的研究人員應(yīng)考慮如何避免在發(fā)生類似錯誤,比如在電子CRF中增加邏輯核查程序。

      處理問題數(shù)據(jù):每次數(shù)據(jù)核查完成后,研究人員應(yīng)將產(chǎn)生的質(zhì)疑表以電子或紙質(zhì)文檔的形式發(fā)送給各研究單位。各研究單位工作人員對每個疑問進(jìn)行認(rèn)真核對,并逐一答復(fù)。負(fù)責(zé)數(shù)據(jù)清理的人員檢查返回的質(zhì)疑表后,根據(jù)質(zhì)疑表對數(shù)據(jù)進(jìn)行處理。處理方式包括更正、刪除或保留原值。若無法找到異常值所對應(yīng)的正確數(shù)值,則刪除該異常值。若研究單位對可能存在問題的數(shù)值變量進(jìn)行再次測量,且兩次結(jié)果相近,可用兩次測量結(jié)果的均值替換原有數(shù)值。若質(zhì)疑表有未被解決的質(zhì)疑,將以新的質(zhì)疑表形式再次發(fā)出。如果數(shù)據(jù)缺失為隨機(jī)缺失,在后續(xù)分析過程中可采用均值或多重填補(bǔ)等方法進(jìn)行填補(bǔ)[2]。如果數(shù)據(jù)缺失超過30%,建議盡量不使用該變量。如果是結(jié)局事件出現(xiàn)缺失,如患者是否死亡變量缺失,則不能填補(bǔ)。

      2 臨床研究數(shù)據(jù)清理的關(guān)鍵點(diǎn)

      明確數(shù)據(jù)清理計劃:研究人員在設(shè)計階段應(yīng)制定數(shù)據(jù)清理計劃,用于指導(dǎo)數(shù)據(jù)清理的各項工作。數(shù)據(jù)清理計劃具體內(nèi)容應(yīng)包括數(shù)據(jù)清理的時間安排和頻率、數(shù)據(jù)清理內(nèi)容、不同類型數(shù)據(jù)問題(如缺失、異常值或邏輯錯誤等)的處理方法、數(shù)據(jù)問題的反饋糾正流程、數(shù)據(jù)庫鎖定及存儲、各環(huán)節(jié)的具體責(zé)任人以及文件管理等。根據(jù)研究需要,還包括紙質(zhì)或電子CRF交接流程、數(shù)據(jù)錄入方法以及質(zhì)量控制、數(shù)據(jù)庫安全等內(nèi)容。

      盡早開始數(shù)據(jù)清理:絕大多數(shù)數(shù)據(jù)問題是在研究實施過程中出現(xiàn)的,有些數(shù)據(jù)缺失或異常很難彌補(bǔ)。而對數(shù)據(jù)問題的處理需要各研究單位進(jìn)行核實、更正,甚至需要研究受試者的配合。此外,若由于CRF設(shè)計有誤導(dǎo)致的數(shù)據(jù)問題,可通過修改CRF避免數(shù)據(jù)錯誤的再次出現(xiàn)。因此,數(shù)據(jù)清理應(yīng)在數(shù)據(jù)采集開始后盡早開始,不應(yīng)在研究數(shù)據(jù)采集結(jié)束后才進(jìn)行數(shù)據(jù)清理。

      做好數(shù)據(jù)清理記錄:首先,應(yīng)記錄清理數(shù)據(jù)庫的基本信息,如數(shù)據(jù)庫產(chǎn)生的日期、樣本量等。數(shù)據(jù)清理過程中所產(chǎn)生的數(shù)據(jù)質(zhì)疑表和邏輯核查報告應(yīng)進(jìn)行歸檔保存。數(shù)據(jù)質(zhì)疑表作為數(shù)據(jù)更改的原始記錄必須由各研究單位負(fù)責(zé)回復(fù)疑問的工作人員、負(fù)責(zé)數(shù)據(jù)清理研究人員簽名確認(rèn),并進(jìn)行妥善保存。在數(shù)據(jù)庫中進(jìn)行問題數(shù)據(jù)處理應(yīng)保留修改記錄。

      數(shù)據(jù)庫和邏輯核查程序的版本管理:數(shù)據(jù)清理后可能會根據(jù)數(shù)據(jù)清理發(fā)現(xiàn)的問題對CRF進(jìn)行修改,將導(dǎo)致數(shù)據(jù)庫結(jié)構(gòu)、邏輯核查程序均發(fā)生相應(yīng)變化。因此,無論采用紙質(zhì)還是電子CRF,均應(yīng)對每次數(shù)據(jù)清理的數(shù)據(jù)庫和邏輯核查程序進(jìn)行版本管理,提高數(shù)據(jù)清理效率,便于跟蹤和回溯數(shù)據(jù)清理過程。

      3 臨床研究數(shù)據(jù)清理實例

      China PEACE中的前瞻性急性心肌梗死研究是一項前瞻性疾病注冊登記研究,在全國約40家二級和三級醫(yī)院連續(xù)入選超過4 000例急性心肌梗死患者并進(jìn)行出院后隨訪,采集患者社會經(jīng)濟(jì)學(xué)、疾病診斷、質(zhì)量及其預(yù)后等信息,旨在評價各項冠心病治療措施在國人中使用的實際影響因素、安全性、有效性和效價比,建立適合國人并簡單易行的風(fēng)險評估模型,以最優(yōu)化的臨床實踐模式和醫(yī)療資源配置改善急性心肌梗死患者的預(yù)后[3]。

      數(shù)據(jù)來源及內(nèi)容:(1)調(diào)查問卷:人口學(xué)信息、社會經(jīng)濟(jì)學(xué)信息、既往病史、危險因素、健康狀況評價量表以及出院后發(fā)生的結(jié)局事件。(2)病歷:疾病診斷、發(fā)病情況、心電圖、冠狀動脈造影等輔助檢查報告、院內(nèi)治療措施、藥物治療、出院醫(yī)囑、院內(nèi)結(jié)局事件等。(3)冠狀動脈造影影像。(4)生物樣本。由于數(shù)據(jù)來源和數(shù)據(jù)庫結(jié)構(gòu)(醫(yī)囑、隨訪事件等數(shù)據(jù)庫為一對多的結(jié)構(gòu))的不同,最終形成六個數(shù)據(jù)庫:調(diào)查問卷、病歷、醫(yī)囑、隨訪事件、各研究單位實驗室檢查結(jié)果和中心性實驗室檢查結(jié)果。

      數(shù)據(jù)清理邏輯順序和注意事項:該研究的主要目的是分析識別影響我國急性心肌梗死患者主要心血管事件發(fā)生的影響因素,建立風(fēng)險預(yù)測模型,為改善臨床實踐提供循證支持。圍繞該研究目的,我們按照如下邏輯順序,針對數(shù)據(jù)重復(fù)或缺失、異常值和邏輯錯誤三類問題開展數(shù)據(jù)清理:

      首先,關(guān)注研究的關(guān)鍵變量和主要結(jié)局指標(biāo),如受試者ID、時間變量、隨訪期間事件。結(jié)合病案號等客觀記錄信息,清理受試者ID錯誤、重復(fù)或各來源數(shù)據(jù)ID不一致等問題,確保受試者ID的唯一性。臨床研究包含多個時間變量,如發(fā)病日期、入院日期、各項檢查日期、出院日期、事件日期和死亡日期。為了遵循臨床實踐的邏輯順序,選擇入院日期和出院日期作為優(yōu)先清理的時間變量,并作為清理其他時間或判定醫(yī)療服務(wù)質(zhì)量的基準(zhǔn)。例如,急性心肌梗死醫(yī)療質(zhì)量研究會關(guān)注入院24小時內(nèi)用藥情況,可通過比較入院具體時間和院內(nèi)醫(yī)囑中記錄的首次開藥時間判斷是否給予及時藥物治療。此外,關(guān)注出院日期、事件日期、死亡日期的前后邏輯關(guān)系,對判定院內(nèi)或院外死亡,院內(nèi)或院外心血管事件具有決定作用。隨訪期間心血管事件的清理主要是心血管事件的類型(死亡事件或其他事件)和發(fā)生時間。心血管事件的診斷是否正確,應(yīng)由臨床專業(yè)醫(yī)師判定,不在數(shù)據(jù)清理的范疇。

      其次,清理心血管事件相關(guān)的醫(yī)院、醫(yī)療服務(wù)和患者水平影響因素。部分患者水平影響因素可以從病歷和調(diào)查問卷兩個來源獲取,可以相互補(bǔ)充。例如既往病史,通常調(diào)查問卷采集的信息比病歷記錄的更全面。如果出現(xiàn)病歷和調(diào)查問卷數(shù)據(jù)的不一致,需根據(jù)臨床診療實踐和研究經(jīng)驗進(jìn)行判斷,以更可靠的數(shù)據(jù)來源為準(zhǔn),比如患者職業(yè)應(yīng)以調(diào)查問卷為準(zhǔn),醫(yī)保支付類型以病歷為準(zhǔn)。如果數(shù)據(jù)清理時遇到?jīng)]有證據(jù)支持的數(shù)據(jù)問題,可暫時不清理,撰寫報告或科研論文寫作時,根據(jù)實際需求再單獨(dú)處理(表 1)。

      表1 研究實施過程中可暫時不進(jìn)行處理的數(shù)據(jù)錯誤情況

      綜上所述,臨床研究數(shù)據(jù)清理貫穿研究的整個過程,對于彌補(bǔ)研究設(shè)計或?qū)嵤┻^程中存在的問題、提高研究數(shù)據(jù)質(zhì)量具有重要作用。臨床研究人員應(yīng)高度重視數(shù)據(jù)清理的重要性,緊緊圍繞研究目的,把握關(guān)鍵環(huán)節(jié)開展數(shù)據(jù)清理工作。

      猜你喜歡
      核查邏輯錯誤
      對某企業(yè)重大危險源核查引發(fā)的思考
      刑事印證證明準(zhǔn)確達(dá)成的邏輯反思
      法律方法(2022年2期)2022-10-20 06:44:24
      在錯誤中成長
      邏輯
      創(chuàng)新的邏輯
      關(guān)于設(shè)計保證系統(tǒng)適航獨(dú)立核查的思考
      基于無人機(jī)影像的營造林核查應(yīng)用研究
      女人買買買的神邏輯
      37°女人(2017年11期)2017-11-14 20:27:40
      不犯同樣錯誤
      采用保留被測件進(jìn)行期間核查的方法
      开阳县| 连平县| 噶尔县| 灵石县| 密山市| 博湖县| 望奎县| 济宁市| 天长市| 友谊县| 宁津县| 舞钢市| 吴旗县| 镶黄旗| 澄城县| 克什克腾旗| 峨眉山市| 巍山| 康平县| 红河县| 黎平县| 南投县| 平和县| 定安县| 兴仁县| 肇州县| 儋州市| 沽源县| 星座| 旺苍县| 阿拉善左旗| 三原县| 永寿县| 蓬溪县| 施秉县| 韩城市| 沙洋县| 沿河| 天柱县| 多伦县| 淮安市|