(中山大學(xué)附屬第一醫(yī)院期刊中心《中華顯微外科雜志》編輯部,廣東廣州510080)
醫(yī)學(xué)論文來稿中統(tǒng)計(jì)方法的誤用及分析
楊俐敏,常湘珍,張方晨,劉小林,汪華僑
(中山大學(xué)附屬第一醫(yī)院期刊中心《中華顯微外科雜志》編輯部,廣東廣州510080)
分析中華顯微外科雜志2012年1月至2013年6月收到的網(wǎng)絡(luò)投稿的文章,篩選出有統(tǒng)計(jì)內(nèi)容的研究型文章,對其數(shù)據(jù)類型、使用的統(tǒng)計(jì)方法、是否有統(tǒng)計(jì)錯誤等進(jìn)行觀察和總結(jié),分析錯誤原因.共有85篇文章納入研究,占全部論文的15.07%;其中基礎(chǔ)類46篇(占基礎(chǔ)類論文的54.12%),臨床類39篇(占臨床類論文的10.18%);計(jì)量資料49篇,計(jì)數(shù)資料21篇,計(jì)數(shù)/計(jì)量資料11篇,等級資料4篇.出現(xiàn)統(tǒng)計(jì)錯誤的有19篇(29.09%),其中基礎(chǔ)類6篇(占基礎(chǔ)類論文的13.04%),臨床類13篇(占臨床類論文的33.33%).結(jié)果表明:國內(nèi)醫(yī)學(xué)研究越來越多,水平也越來越高,但對統(tǒng)計(jì)的基本原理的認(rèn)識以及統(tǒng)計(jì)方法的正確使用還有待于提高.
醫(yī)學(xué)論文;統(tǒng)計(jì)方法;錯誤分析
醫(yī)學(xué)論文是記錄醫(yī)學(xué)科研成果的主要載體,是反映醫(yī)學(xué)科研機(jī)構(gòu)影響力、科技發(fā)展水平的重要標(biāo)志,也是醫(yī)院綜合實(shí)力的重要表達(dá)[1].統(tǒng)計(jì)學(xué)應(yīng)用的情況可以很好的反映論文的科學(xué)性,間接體現(xiàn)科學(xué)實(shí)驗(yàn)和臨床經(jīng)驗(yàn)的合理性,故在醫(yī)學(xué)研究以及論文寫作中的地位越來越重要,成為評價醫(yī)學(xué)論文質(zhì)量的重要指標(biāo)[2].國外在上世紀(jì)中葉有研究指出,半數(shù)以上的論文存在統(tǒng)計(jì)學(xué)問題,國內(nèi)的問題則更加嚴(yán)重[3-4].筆者對《中華顯微外科雜志》2012年1月至2013年6月的564篇網(wǎng)上投稿進(jìn)行了分析總結(jié),歸納論文中常見的統(tǒng)計(jì)學(xué)問題,希望引起作者及同行的注意,以便在寫作和審稿時避免和發(fā)現(xiàn)類似錯誤.
1.1 資料來源
收集《中華顯微外科雜志》2012年1月至2013年6月的564篇網(wǎng)上投稿,其中基礎(chǔ)類論文85篇,臨床類論文383篇,解剖類論文26篇,其他類(包括綜述、紀(jì)要、病例報(bào)告、重復(fù)投稿等)70篇,所有稿件均經(jīng)過專家評審和編輯處理.
1.2分析方法
重閱每篇稿件的初稿、審稿意見、編輯修改意見,選出統(tǒng)計(jì)分析的文章,記錄文章類型、資料類型、統(tǒng)計(jì)方法等,對出現(xiàn)的統(tǒng)計(jì)錯誤的原因進(jìn)行分析、歸類.
2.1 統(tǒng)計(jì)結(jié)果
共有85篇論文涉及統(tǒng)計(jì)分析,占全部論文的15.07%;其中基礎(chǔ)類46篇(占基礎(chǔ)類論文的54.12%),臨床類39篇(占臨床類論文的10.18%);計(jì)量資料49篇,計(jì)數(shù)資料21篇,計(jì)數(shù)/計(jì)量資料11篇,等級資料4篇.涉及的統(tǒng)計(jì)方法有t檢驗(yàn)、方差分析、卡方檢驗(yàn)、秩和檢驗(yàn)、精確概率法、單因素方差分析、回歸分析等.
出現(xiàn)統(tǒng)計(jì)錯誤的有19篇(29.09%),其中基礎(chǔ)類6篇(占基礎(chǔ)類論文的13.04%),臨床類13篇(占臨床類論文的33.33%).
2.2 統(tǒng)計(jì)錯誤的表現(xiàn)
(1)缺統(tǒng)計(jì)方法:出現(xiàn)統(tǒng)計(jì)錯誤的19篇論文中,有13篇有應(yīng)用統(tǒng)計(jì)對所得數(shù)據(jù)進(jìn)行分析,但文中未指明用了何種統(tǒng)計(jì)方法.
(2)檢驗(yàn)水準(zhǔn)不明:19篇論文中有5篇文內(nèi)同時出現(xiàn)兩個檢驗(yàn)水準(zhǔn)(0.05和0.01).
(3)統(tǒng)計(jì)方法錯誤:如對計(jì)量資料僅做統(tǒng)計(jì)描述而未進(jìn)行分析,以及采用非參數(shù)檢驗(yàn)方法代替參數(shù)檢驗(yàn)方法,降低了檢驗(yàn)效能(如兩組手術(shù)前后恢復(fù)情況的計(jì)量資料對比,錯誤的采用了秩和檢驗(yàn),而應(yīng)該用配對t檢驗(yàn)).
(4)其他:如摘要中有統(tǒng)計(jì)的內(nèi)容而正文內(nèi)未說明,文內(nèi)沒有統(tǒng)計(jì)分析卻有“無明顯差異”的結(jié)論等.
2.3 統(tǒng)計(jì)學(xué)錯誤的分析
投稿論文涉及的統(tǒng)計(jì)學(xué)錯誤主要包括以下幾種:①缺統(tǒng)計(jì)方法:主要原因是對統(tǒng)計(jì)及統(tǒng)計(jì)方法的重要性認(rèn)識不足.人們認(rèn)識事物時常常會用到的分析方式有兩種:定性和定量.后者是在前者的基礎(chǔ)上,運(yùn)用了數(shù)學(xué)的方式對事物進(jìn)行描述和分析,使認(rèn)識由模糊變得清晰,由抽象變得具體,從而使研究變成一門科學(xué).而統(tǒng)計(jì)學(xué)進(jìn)一步升華了認(rèn)識過程,通過對數(shù)據(jù)的整理分析以達(dá)到推測對象的本質(zhì).這其中統(tǒng)計(jì)方法的應(yīng)用尤其重要,直接決定了結(jié)論是否正確.沒有統(tǒng)計(jì)方法的描述而只有統(tǒng)計(jì)結(jié)果,一是文章內(nèi)容不完整,二是使讀者無從判斷研究結(jié)論是否正確,降低了文章的效能.②檢驗(yàn)水準(zhǔn)不明:主要原因是對統(tǒng)計(jì)原理的理解不正確.檢驗(yàn)水準(zhǔn)是在做假設(shè)檢驗(yàn)時預(yù)先對P值確定的一個概率值,根據(jù)P與а的關(guān)系來判斷對H0和H1的取舍.所以常用的檢驗(yàn)水準(zhǔn)0.05和0.01,以及不常用的0.001,在統(tǒng)計(jì)學(xué)上的意義是一樣的.通俗的說,P值小于0.01并不比小于0.05表示差異更大,小于0.05而大于0.01也并不意味著差距沒有統(tǒng)計(jì)學(xué)意義,區(qū)別只在于統(tǒng)計(jì)之初對于а值的設(shè)定是多少.③統(tǒng)計(jì)方法使用錯誤:主要原因是對各種方法的適用條件把握不準(zhǔn).需要在研究中不斷的練習(xí)和提高.
3.1 醫(yī)學(xué)論文統(tǒng)計(jì)學(xué)應(yīng)用的現(xiàn)狀
醫(yī)學(xué)統(tǒng)計(jì)學(xué)在我國尚處于發(fā)展階段.國內(nèi)較早對醫(yī)學(xué)期刊中的統(tǒng)計(jì)學(xué)問題進(jìn)行定量分析是在1986年,當(dāng)時統(tǒng)計(jì)方法的使用率是71.3%,但在外科學(xué)研究中的使用率較低[5].國內(nèi)醫(yī)學(xué)核心期刊中,統(tǒng)計(jì)圖/表是應(yīng)用最廣泛的統(tǒng)計(jì)描述方法.從其后的研究來看,醫(yī)學(xué)論文中統(tǒng)計(jì)學(xué)的應(yīng)用越來越廣泛,所用的方法也越來越高級,但各專業(yè)之間統(tǒng)計(jì)方法使用率的不同一直存在[6-8].楊燕等[9]經(jīng)研究認(rèn)為,不同類型的醫(yī)學(xué)期刊所常用的統(tǒng)計(jì)描述各不相同,其中衛(wèi)生類、內(nèi)科學(xué)類、綜合類常用的統(tǒng)計(jì)描述為統(tǒng)計(jì)圖/表,比率分別為83.2%、87.1%、57.6%;藥學(xué)類、基礎(chǔ)類常用的統(tǒng)計(jì)描述為相對數(shù)(率、構(gòu)成比等),比率分別為36.1%、56.3%;而臨床類、中醫(yī)學(xué)類、外科學(xué)類常用的統(tǒng)計(jì)描述為均數(shù)±標(biāo)準(zhǔn)差,比率分別為63.3%、54.5%、31.7%.中華顯微外科雜志是以外科學(xué)類為主、以基礎(chǔ)類為輔的期刊,研究數(shù)據(jù)以計(jì)量資料為主,統(tǒng)計(jì)描述以均數(shù)±標(biāo)準(zhǔn)差為主,與文獻(xiàn)報(bào)道一致[9].
3.2 醫(yī)學(xué)論文常用的幾種統(tǒng)計(jì)學(xué)方法及其特點(diǎn)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)是一門不斷發(fā)展的方法學(xué),所涉及的統(tǒng)計(jì)分析方法都有所需的設(shè)計(jì)、適用條件和結(jié)果的意義.數(shù)據(jù)資料的統(tǒng)計(jì)分析方法與科研設(shè)計(jì)的方法及資料類型密切相關(guān),不同類型的資料所用的統(tǒng)計(jì)方法各不相同.例如t檢驗(yàn)常用于計(jì)量資料中隨機(jī)設(shè)計(jì)的2個樣本均數(shù)的比較,也可用于推斷樣本均數(shù)代表的總體均數(shù)與已知總體均數(shù)有無統(tǒng)計(jì)學(xué)意義,以及配對設(shè)計(jì)的兩個樣本均數(shù)的比較,理論上要求樣本來自正態(tài)分布的總體且兩樣本總體方差齊性,實(shí)際工作中往往達(dá)不到這個條件,只要兩樣本的分布為單峰且近似正態(tài)分布,亦可使用[10].兩組以上計(jì)量資料的均數(shù)比較則一般采用方差分析,其條件是各組資料都來自正態(tài)分布的總體且方差齊性.與t檢驗(yàn)一樣,也需要進(jìn)行正態(tài)性和方差齊性檢驗(yàn)[11].當(dāng)資料的總體分布不符合正態(tài)分布或者分布類型未知,以及按等級分組資料,多采用秩和檢驗(yàn).計(jì)數(shù)資料(頻數(shù)表資料)一般使用卡方檢驗(yàn),多用于兩個和多個率的比較.后兩個檢驗(yàn)方法對數(shù)據(jù)的要求較低,檢驗(yàn)效能也相應(yīng)較低.
本研究涉及的有統(tǒng)計(jì)內(nèi)容的文章僅85篇,使用的統(tǒng)計(jì)方法已經(jīng)涵蓋了大多數(shù)常用的方法.雖然同一組數(shù)據(jù)可以用不同的方法進(jìn)行統(tǒng)計(jì)分析,但應(yīng)用的方法不同,檢驗(yàn)的效能不同,得出的結(jié)論也有可能大相徑庭.
3.3常用的統(tǒng)計(jì)學(xué)軟件
隨著計(jì)算機(jī)技術(shù)的不斷普及,辦公自動化軟件的組件和專業(yè)的統(tǒng)計(jì)軟件越來越多.Microsoft公司開發(fā)的EXCEL系統(tǒng)除了有強(qiáng)大的電子表格處理和文字、數(shù)據(jù)庫管理以及圖表處理功能之外,還可進(jìn)行統(tǒng)計(jì)描述和統(tǒng)計(jì)分析,如集中和離散趨勢、t檢驗(yàn)、方差分析、卡方檢驗(yàn)、非參數(shù)檢驗(yàn)以及回歸性分析,可以勝任一般的統(tǒng)計(jì)分析之用[13-14].專業(yè)的統(tǒng)計(jì)軟件,如SAS、SPSS等,具有多平臺自適應(yīng)技術(shù),其數(shù)據(jù)管理能力更為強(qiáng)大,統(tǒng)計(jì)方法更全面,計(jì)算精度更高.其缺點(diǎn)是相對比較復(fù)雜,操作人員須經(jīng)培訓(xùn)才能應(yīng)用自如、充分發(fā)揮其作用.新開發(fā)的實(shí)用醫(yī)學(xué)統(tǒng)計(jì)軟件包(Practical Package for Medicial Statistics,PPMS)運(yùn)行穩(wěn)定,功能和應(yīng)用較為便捷和簡單,更適用于非統(tǒng)計(jì)專業(yè)的醫(yī)學(xué)研究者使用,但目前應(yīng)用仍較少[15].實(shí)際應(yīng)用中應(yīng)根據(jù)統(tǒng)計(jì)分析的需要合理選用.
醫(yī)學(xué)實(shí)驗(yàn)研究分為實(shí)驗(yàn)設(shè)計(jì)、收集資料、整理資料和分析資料幾個步驟,統(tǒng)計(jì)學(xué)內(nèi)容主要涉及分析資料的步驟,包括統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷.其關(guān)鍵是分析資料的類型,選擇正確的分析方法.醫(yī)學(xué)論文中統(tǒng)計(jì)方法的選擇和結(jié)果表達(dá)的正確與否,決定了實(shí)驗(yàn)研究的質(zhì)量和可信度.提高醫(yī)學(xué)論文中統(tǒng)計(jì)學(xué)應(yīng)用的質(zhì)量,將是一項(xiàng)長期而艱巨的工作.
[1]吳鷺萍.1995-2004年廈門市醫(yī)藥衛(wèi)生論文產(chǎn)出的計(jì)量分析[J].中華醫(yī)學(xué)圖書情報(bào)雜志,2007,1(16):73-77.
[2]胡良平,郭秀花,劉惠剛.醫(yī)學(xué)統(tǒng)計(jì)學(xué)是評價醫(yī)學(xué)科技論文質(zhì)量優(yōu)劣的重要依據(jù)[J].中華口腔醫(yī)學(xué)雜志,2001,36(3):229-232.
[3]Glantz A.Biostatistics:How to detect,correct and prevent errors in the medical literature[J].Circulation,1980,61(1):1-7.
[4]劉清海,方積乾.國內(nèi)外醫(yī)學(xué)論文統(tǒng)計(jì)學(xué)報(bào)告質(zhì)量的比較研究[J].中國科技期刊研究,2008,19(2):236-239.
[5]王紹賢,史凡,王濱燕,等.中華醫(yī)學(xué)會五種主要雜志1984年論文中常見的統(tǒng)計(jì)問題分析[J].中華醫(yī)學(xué)雜志,1986,66(9):548-554.
[6]張功員.醫(yī)學(xué)碩士學(xué)位論文中統(tǒng)計(jì)學(xué)應(yīng)用情況分析[J].第四軍醫(yī)大學(xué)學(xué)報(bào),2002,23(16):1530-1532.
[7]鄭曰忠,時冀川.七種眼科文獻(xiàn)中統(tǒng)計(jì)方法的應(yīng)用現(xiàn)狀分析[J].眼科研究,2002,20(4):367-369.
[8]劉清海.醫(yī)學(xué)論文科學(xué)水平的評價探討[J].中華醫(yī)學(xué)科研管理雜志,2008,21(2):82-85.
[9]楊燕,李娟生,劉小寧,等.近5年國內(nèi)不同醫(yī)學(xué)類核心期刊中統(tǒng)計(jì)方法應(yīng)用的分析[J].現(xiàn)代預(yù)防醫(yī)學(xué),2010,37(1):10-12.
[10]馬斌榮.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].3版.北京:人民衛(wèi)生出版社,2003:30.
[11]張知洪,莫建坤,雷達(dá),等.醫(yī)學(xué)論文中常用統(tǒng)計(jì)分析方法的合理選擇[J].檢驗(yàn)醫(yī)學(xué)與臨床,2011,8(11):1387-1388.
[12]蔡麗君,溫仲民.Excel數(shù)據(jù)分析在醫(yī)學(xué)統(tǒng)計(jì)中的應(yīng)用[J].南通醫(yī)學(xué)院學(xué)報(bào),2009,29(2):134-135.
[13]周穎.如何用EXCEL進(jìn)行醫(yī)學(xué)統(tǒng)計(jì)分析[J].中國鄉(xiāng)鎮(zhèn)企業(yè)會計(jì),2011,19(2):154-156.
[14]周曉彬,張健.醫(yī)學(xué)統(tǒng)計(jì)軟件系統(tǒng)PPMS 1.5的應(yīng)用舉例[J].齊魯醫(yī)學(xué)雜志,2011,26(6):502-505.
Misapplication and analysis of statistics in medical papers
YANG Li-min,CHANG Xiang-zhen,ZHANG Fang-chen,LIU Xiao-lin,WANG Hua-qiao
(Editorial Department of Chinese Journal of Microsurgery,Journal Center of the First Affiliated Hospital of Sun Yat-sen University,Guangzhou 510080,Guangdong,China)
The paper analyzed the data type,statistical methods and errors of online submissions of Chinese Journal of Microsurgery form January 2012 to June 2013.There were totally 564 papers,including 85 basic articles, 383 clinical articles,26 anatomy articles,and 70 others,and 85 papers were analyzed(85/564,15.07%),in which were 46 basic articles(46/85,54.12%)and 39 clinical articles(39/383,10.18%).There were 49 measurement data,21 enumeration data,11 measurement/enumeration data,and 4 ranked data.19 papers occurred errors,in which were 6 basic articles(6/46,13.04%),and 13 clinical articles(13/39,33.33%).The results show that the understanding of the basic principles of statistics and proper use of statistical method needs improving.
medical paper;statistical method;error analysis
G232.3
:A
:1007-5348(2014)10-0076-03
(責(zé)任編輯:邵曉軍)
2014-05-21
楊俐敏(1978-),女,湖北宜昌人,《中華顯微外科雜志》編輯部編輯,博士,主要從事編輯學(xué)和統(tǒng)計(jì)學(xué)的研究.