孫少杰,龍 偉,仝 建,李 蒙
(南昌大學信息工程學院,南昌330031)
血細胞特性曲線擬合方法的研究
孫少杰,龍 偉,仝 建,李 蒙
(南昌大學信息工程學院,南昌330031)
針對血液分析儀對血細胞各個參數檢測線性偏差較大的問題,提出一種血細胞特性曲線分段擬合算法。根據血液分析儀檢測值與理論值的對應關系,針對不同段的數據,進行分段線性擬合,再根據2條線性曲線段銜接處的3個數據點,采用最小二乘法多項式擬合算法進行過度曲線擬合,實現不同線性段間的平滑過渡,從而避免不同曲線交叉點的跳躍現象。實驗結果表明,該方法簡單、實用,擬合后的血細胞線性偏差優(yōu)于血液分析儀行業(yè)標準的要求,滿足臨床應用的需要。
血細胞檢測;分段曲線擬合;最小二乘法;血液分析儀;線性偏差;數據采集
血液分析儀是通過對血液標本的檢測,對血液中有形成分進行定性、定量分析,并提供相關信息的儀器[1]。目前的血液分析儀大多采用電阻抗法原理對單位體積血液中所含白細胞、紅細胞、血小板個數進行計數[2-3]。理論上單位體積血液中所含細胞個數與濃度呈線性關系。然而,受試劑、數據采集、樣本濃度、采樣負壓等綜合因素影響,測試結果與臨床應用結果不符[4],難以滿足行業(yè)標準對線性偏差的要求。因此,需要對血細胞曲線進行線性擬合,對測試的實際值進行校正,從而切實反映符合臨床應用的結果。
目前,常用的曲線擬合方法有:最小二乘法(Least Square Method,LSM)曲線擬合,NURBS曲線擬合,BP神經網絡擬合算法,RBF神經網絡擬合算法,遺傳算法擬合算法等[5]??傮w上曲線擬合方法可分為2類:(1)由與數據的背景資料規(guī)律相適應的解析表達式約束的曲線擬合(主要是最小二乘法擬合);(2)由幾何算法或神經網絡的拓撲結構確定數據關系的曲線擬合(主要是神經網絡擬合)。前者適用于處理具有嚴謹數學基礎的線性問題,工程應用較多、擬合后的算法簡潔,較適用于需對數據進行實時處理的情況;后者多用于處理復雜的非線性問題,但由于沒有理論曲線模型的限制,從而不能直接用于對理論模型有嚴格要求的曲線擬合問題,并且網絡結構的選擇和處理結果具有一定的主觀性[6-7]。另外,神經網絡曲線擬合算法復雜,運算處理時間長,難以應用于需對大量數據進行在線實時處理的系統中,多應用于實驗室理論研究。
目前各血液分析儀生產廠家對血細胞特性曲線的擬合沒有公開統一的方法,部分廠家采用分段直線擬合,問題是分段擬合線段的直線斜率不一樣,當一個標本值在2條線段的交點附近時,存在明顯跳動,即2次測試的結果分別落在2個線段范圍內時,結果差異比較大。
針對上述方法的缺陷,本文根據單位體積血液中所含細胞個數與濃度呈線性關系這一特點,采用最小二乘法對血細胞特性曲線進行分段線性擬合,并對不同段的擬合曲線交叉點進行平滑處理,避免了交叉點附近的數據跳躍現象。
2.1 LSM多項式擬合原理
最小二乘法多項式擬合是按偏差平方和最小的原則選取擬合曲線的方法[8-10]。對給定的數據(xi, yi)(i=0,1,…,m),求一個n(n≤m)次廣義多項式:
其中,pn(x)為n次廣義多項式;ak為多項式xk的系數;k為0,1,…,n,且n≤m。
使誤差ri=pn(xi)-yi(i=0,1,…,m)的平方和最小,即:
其中,I為誤差平方和;ri為xi點的理論值與真實值的誤差;pn(xi)為xi點的理論值;yi為xi點對應的真實值;min為最小。
滿足式(2)的pn(x)稱為最小二乘法擬合多項式。特別的,當n=1時,稱為最小二乘法直線擬合或線性擬合。式(2)是關于參數a0,a1,…,an的多元函數,可轉變成為求I=I(a0,a1…,an)的極值問題。由多元函數求極值的必要條件,得:
式(4)是關于a0,a1,…,an的線性方程組,用矩陣表示為:
式(5)稱為正規(guī)方程組或法方程組。
方程組式(5)的系數矩陣是一個對稱正定矩陣[11],故存在唯一解。從式(5)中解出 ak(k=0, 1,…,n),從而可以求得多項式式(1)的解。
在實際應用中,n<m或n≤m;當n=m時所得的擬合多項式就是拉格朗日或牛頓插值多項式。
2.2 分段點選取方法
分段點選取對分段曲線擬合至關重要,且分段數據段的長短直接影響擬合后的計算數據與理論數據之間的相關性。數據段越短、分段越多,則計算后的數據與理論數據之間的相關性越高,但此時數據段點之間的分段點增加,運算過程中判斷條件復雜,不利于血液分析儀實時性要求。本文根據實際測試數據曲線的特點,將其分成2段進行擬合。然后用分段點及其前后2個點進行過度曲線擬合。
3.1 血液分析儀線性偏差的檢測方法
臨床檢驗中對血液分析儀線性偏差的檢驗,通常采用將高值質控或標本稀釋5個濃度,依次將稀釋后的5個濃度在儀器上各測試3次,用各濃度3次測試的平均值通過回歸方程計算其線性偏差的方法,來評估儀器對各參數檢測的線性程度[1]。本文以血小板為例進行血小板線性曲線分段擬合,白細胞、紅細胞的線性曲線分段擬合方法與血小板方法相同。
3.2 基礎實驗數據的獲取
為了更準確地反映血小板測試值與理論值的對應關系,將高值質控品樣本稀釋12個濃度,將稀釋后的樣品標本,從高濃度到低濃度依次在待擬合曲線的血液分析儀樣機上進行測試,每個濃度標本測試3次,記錄儀器所采集的血小板細胞個數。根據高值質控品的靶值,分別計算12個濃度樣本的理論值。血小板測試值與理論值如表1所示,血小板單位為109個/L。
表1 各濃度樣品理論值與測試值數值
3.3 血小板線性曲線分段擬合
3.3.1 分段數據點的選取
根據表1血小板理論值與測試平均值,畫出以測試平均值為自變量x,以理論值為因變量y的曲線圖,如圖1所示。
圖1 血小板測試平均值與理論值對應散點
根據圖1曲線圖趨勢,可在第9個數據點將整條曲線分成2段,根據2段數據分別擬合為不同的多項式曲線。經數據分析后可知,擬合多項式的次數越高越能反映血小板的實際曲線,但根據實際計算后發(fā)現,3次以上的曲線比3次曲線改善不大,而低于3次多項式的曲線擬合后的線性偏差較大,因此,對2段數據曲線的擬合均采用3次多項式,故擬合多項式的次數n=3。
3.3.2 第1段數據段擬合
設第1段數據段多項式為:y1=a0+a1x+a2x2+a3x3,根據式(5)可得正規(guī)方程組為:
求解式(6)可得:a0=-0.623,a1=1.033,a2= -6.9E-4,a3=3.83E-6。因此,擬合后的多項式應為:
根據血小板測試結果為整數值的特征,最終擬合后的第1段曲線為:
3.3.3 第2段數據段擬合
設第2段數據段多項式為:y2=b0+b1x+b2x2+b3x3,根據式(5)可得正規(guī)方程組為:
求解式(9)可得:b0=0.000 1,b1=-2.777,b2=0.025,b3=-3.955E-5。因此,擬合后的第2段曲線多項式應為:
3.3.4 分段點過渡曲線的擬合
為了保證2段曲線交叉點附近的數據點在2段曲線上平滑地過渡,利用第60%,70%,80%這3個點擬合一條3次多項式過渡曲線。設過去曲線多項式方程為:
根據式(5)可得正規(guī)方程組為:
求解式(11)可得:c0=-6.48E-14,c1= 5.086,c2=-0.033 68,c3=7.068 7E-5。因此,擬合后的第2段曲線多項式應為:
3.3.5 曲線交點的求解
根據式(8)、式(10)、式(12)可求得式(8)與式(10)的交點為x1=232,式(10)與式(12)的交點為x2=258。即:
(1)當x≤232時,y1=1.033x-0.000 69x2+ 0.000 003 836x3;
(2)當 232<x<258時,y2= -2.777x+ 0.025x2-0.000 039 55x3;
(3)當x≥258時y3=5.086x-0.033 68x2+ 0.000 070 687x3。
血小板測試平均值經過擬合后的曲線計算結果如表1中擬合后的測試平均值所示,血小板線性曲線擬合前后測試值對比曲線如圖2所示。
圖2 血小板線性曲線擬合前后測試值對比曲線
由圖2可知,稀釋后的高值質控樣本,每個濃度對應的理論值應該為一條直線,而實際的測試結果在40%的濃度點開始逐漸低于理論值,達不到臨床測試要求。擬合后的測試平均值曲線,基本與理論值直線重合,且其相關系數R=0.994,接近于1,所以擬合程度較好[12],滿足了臨床測試要求。
在擬合好血小板線性曲線后,用擬合后的曲線分別在4臺儀器上進行線性偏差的驗證。按《YY/ T0653-2008血液分析儀》線性測試方法,用高值質控品稀釋5個濃度,分別是100%,75%,50%,25%, 10%。然后按濃度從高到底的順序依次在準備好的4臺試驗儀器上進行測試,每個濃度測試3次,用回歸方程計算其線性偏差,線性偏差結果如表2所示。行業(yè)標準對儀器的要求為:測試值范圍PLT>100時,偏差要求<10%,測試范圍PLT<100%時,偏差要求<10。
由表2可知,血液分析儀行業(yè)標準對血小板線性偏差的要求為:當血小板個數大于100×109個/L時,偏差要求不超過±10%;當血小板個數小于100× 109個/L時,偏差要求不超過±10×109個/L。4臺樣機的血小板測試值,經過擬合的3次多項式計算后,線性偏差最大值為-3.44×109個/L,線性偏差結果優(yōu)于血液分析儀行業(yè)標準要求,滿足了儀器對血小板線性的要求。
為驗證擬合曲線后的臨床測試效果,分別用醫(yī)院的樣本在擬線后的4臺儀器上進行了測試,并計算了其可比性,測試數據如表3所示。
表2 線性曲線驗證結果及行業(yè)標準線性偏差要求
表3 擬合后的血小板線性曲線臨床標本驗證對比
由表3結果可知,血小板的測試值隨著血小板靶值的不同而變化,可明確區(qū)分出血小板值小于100×109個/L及血小板值大于300×109個/L的非正常標本[13]。根據血液分析儀行業(yè)標準要求,血小板在100×109個/L~300×109個/L之間的可比性不超過±8%,由表3中4臺儀器可比性可知,其中可比性最大值為3.60%,可比性優(yōu)于血液分析儀行業(yè)標準要求,滿足了臨床測試要求。
隨著血液分析儀的普及,臨床應用對儀器的各方面性能要求越來越高。血液分析儀對各個參數檢測的線性與否直接影響醫(yī)生對患者的病情判斷,因此,提高儀器的線性有很大的現實意義和臨床意義。本文根據血液分析儀檢測值與理論值的對應關系,針對不同段的數據,進行分段線性擬合,再根據2條線性曲線段銜接處的3個數據點,采用最小二乘法多項式擬合算法進行過度曲線擬合,實現不同線性段間的平滑過渡,從而避免不同曲線交叉點的跳躍現象,很好地解決了血液分析儀血細胞檢測線性偏差大的問題。通過實踐證明,擬合后的曲線有效地提高了血液分析儀對各個血細胞參數檢測的線性偏差,優(yōu)于血液分析儀行業(yè)標準《YY/T 0653-2008血液分析儀》要求,且滿足了臨床測試要求,同時,擬合后的算法簡潔,適用于不同的儀器。
[1] 國家食品藥品監(jiān)督管理局.中華人民共和國醫(yī)藥行業(yè)標準YY/T 0653-2008:血液分析儀[S].2008.
[2] Davies R,Karuhn R,Graf J.Studies on the Coulter Counter Part II:Investigations into the Effect of Flow Direction and Angle of Entry of a Particle on Both Particle Volume and Pulse Shape[J].Powder Technology,1975,12(2):157-166.
[3] 樂家新,周建山,蘭亞婷.血細胞分析儀檢測原理[J].中華檢驗醫(yī)學雜志,2004,27(3):205-208.
[4] 張春光,黃民雙.血細胞計數分析儀的信號處理[J].自動化與儀器儀表,2000,(3):27-29.
[5] 平書偉.關于曲線擬合的方法探討[J].機電信息, 2011,(12):112-113.
[6] 喬立山,王玉蘭,曾錦光.實驗數據處理中曲線擬合方法探討[J].成都理工大學學報:自然科學版,2004,31 (1):91-95.
[7] 賈丹丹,李 宏.基于神經網絡和小波分析的血細胞識別算法[J].計算機應用與軟件,2009,26(8):29-31.
[8] 呂 游,劉吉臻,趙文杰,等.基于分段曲線擬合的穩(wěn)態(tài)檢測方法[J].儀器儀表學報,2012,33(1):194-200.
[9] Waterhouse W C.Gauss’s First Argument for Least Squares[J].Archive for History of Exact Sciences, 1990,41(1):41-52.
[10] 田 垅,劉宗田.最小二乘法分段直線擬合[J].計算機科學,2012,39(6):482-484.
[11] 王 剛,楊洪耕.基于最小二乘法的正交多項式級數在諧波估計中的應用[J].繼電器,2006,34(12): 25-29.
[12] 謝印忠,莊松林,張保洲.基于線陣CCD的光譜儀定標研究[J].儀器儀表學報,2011,32(3):546-550.
[13] 葉應撫,王毓三,申子瑜.全國臨床操作檢驗規(guī)程[M].3版.南京:東南大學出版社,2006.
編輯 顧逸斐
Research on Blood Cells Characteristic Curve Fitting Method
SUN Shao-jie,LONG Wei,TONG Jian,LI Meng
(School of Information Engineering,Nanchang University,Nanchang 330031,China)
According to the linear deviation problem of blood cells parameters detection for the hematology analyzer,a piecewise curve fitting method of blood cells is put forward in the paper.Based on the one-to-one relationship between the original value for all kinds of blood cells which are detected by the hematology analyzer and the theoretical value,for piecewise linear fitting according to the data of different period.In order to avoid the jump phenomena of different curve intersection,using three data points of the two linear curve segment intersection to fitting polynomial by Least Square Method(LSM),to realize the smooth transition between different linear segment.Experimental results show that the algorithm is simple,practical and the fitting curve linear deviation is better than the requirements of hematology analyzer industry standard.In addition,it can fully meet the needs of the clinical application.
blood corpuscle examination;piecewise curve fitting;Least Square Method(LSM);hematology analyzer; linear deviation;data acquisition
1000-3428(2014)10-0287-05
A
TP273
10.3969/j.issn.1000-3428.2014.10.053
國家自然科學基金資助項目(61261011)。
孫少杰(1987-),男,碩士,主研方向:計算機控制,嵌入式智能儀表技術;龍 偉,教授;仝 建、李 蒙,碩士。
2013-08-28
2013-11-12E-mail:bluesnowssj@163.com
中文引用格式:孫少杰,龍 偉,仝 建,等.血細胞特性曲線擬合方法的研究[J].計算機工程,2014,40(10):287-291.
英文引用格式:Sun Shaojie,Long Wei,Tong Jian,et al.Research on Blood Cells Characteristic Curve Fitting Method[J]. Computer Engineering,2014,40(10):287-291.