李 成黃 歡孫 嘯周國(guó)華
1)(生物電子學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室 東南大學(xué)生物醫(yī)學(xué)工程學(xué)院,南京 210096)2)(華東生物醫(yī)學(xué)技術(shù)研究所,南京 210002)
凝膠微球芯片實(shí)驗(yàn)數(shù)據(jù)分析方法的設(shè)計(jì)與應(yīng)用
李 成1,2黃 歡2孫 嘯1*周國(guó)華2
1)(生物電子學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室 東南大學(xué)生物醫(yī)學(xué)工程學(xué)院,南京 210096)2)(華東生物醫(yī)學(xué)技術(shù)研究所,南京 210002)
在一種使用凝膠微球芯片新技術(shù)進(jìn)行基因突變分析的生物學(xué)方法中,芯片上紅綠兩種顏色微球個(gè)數(shù)的比例代表了正?;蚺c突變基因的比例。針對(duì)微球芯片掃描的圖像,發(fā)展一種新的方法對(duì)圖像進(jìn)行處理和分析,自動(dòng)識(shí)別不同顏色的微球,得到分別代表野生型和突變型的紅色微球和綠色微球的各自個(gè)數(shù),并開發(fā)了相應(yīng)軟件。取單色通道,然后灰度化,使用迭代法和大津法進(jìn)行二值化的閾值選取,再用中值濾波算法進(jìn)行噪聲雜點(diǎn)消除,最后進(jìn)行信號(hào)點(diǎn)識(shí)別及計(jì)數(shù)。通過對(duì)掃描圖像的人工計(jì)數(shù)和軟件計(jì)數(shù)結(jié)果的對(duì)比,新的方法相對(duì)于人工計(jì)數(shù)結(jié)果的偏差率小于10%。實(shí)踐表明,新方法在處理和分析微球芯片圖像時(shí),目標(biāo)識(shí)別結(jié)果達(dá)到要求,相應(yīng)軟件已在大腸癌早期診斷的生物學(xué)研究中應(yīng)用,提高了分析效率。
圖像分析;微球芯片;圖像識(shí)別
Abstract:In hydrogel bead-array to analyze gene mutation,the proportion of red beads’number to green beads’represents the proportion of mutant genes to wild type genes.Based on the scanning images of a bead array,we developed a new analyzing method to recognize different color beads and count out the number of these beads representing different genes automatically.A corresponding software was also developed to improve the counting efficiency.A single color channel was selected first.Then the color image was transferred into gray one.The iterative and Otsu algorithms were used to calculate the threshold value which was used in binaryzation.Then median filtering was used to get rid of noises.Finally signal points were recognized and numbers were counted automatically.The deviation rate of the automatic results to manual counting results could be controlled less than 10% based on the result comparison of the software and manual work.The recognizing and counting results obtained by the proposed method meet the requirement.The software has been applied in early diagnosis of colon cancer.
Key words:image analysis;bead-array;image identification
近年來,從基因突變角度進(jìn)行疾病的早期診斷,正成為一個(gè)研究熱點(diǎn)。然而,由于在癌癥早期階段,突變的基因豐度遠(yuǎn)低于正常的野生型基因豐度,給癌癥的早期診斷帶來了一定的難度[1]。到現(xiàn)在為止,已經(jīng)有一些針對(duì)基因突變的檢測(cè)手段,如DNA測(cè)序、數(shù)字化PCR等方法,但都存在一定的局限。例如:DNA測(cè)序不適用于突變量小于20%的突變樣本的檢測(cè)[2],靈敏度不高;數(shù)字化 PCR法則通過將DNA模板稀釋分配到小孔中進(jìn)行擴(kuò)增[3-4],而每個(gè)小孔最多只能擴(kuò)增一分子野生型或突變型基因,小孔數(shù)目的有限性局限了這種方法的靈敏度。如今,一種改進(jìn)的微乳液 PCR法[5]得到應(yīng)用,由于這種方法在油包水的微孔中進(jìn)行單分子擴(kuò)增,避免了小孔數(shù)量引起的局限性,從而大大提高了檢測(cè)的靈敏度。但是,這種方法要用到流式細(xì)胞儀去獲得檢測(cè)結(jié)果,因而成本非常昂貴。最近,筆者采用了一種新的微乳液PCR和水凝膠微球芯片技術(shù)進(jìn)行相關(guān)基因表達(dá)量分析的實(shí)驗(yàn)方法[6],這種方法結(jié)合了微乳液PCR方法,保證了檢測(cè)的高靈敏度,同時(shí)又通過微球芯片技術(shù),避免使用流式細(xì)胞儀分析結(jié)果,大大降低了成本。這種新的實(shí)驗(yàn)方法對(duì)于組織樣本中的微量突變響應(yīng)非常靈敏,同時(shí)成本很低,從而為癌癥早期診斷的普及提供了一種可能。
這種方法的大概步驟為:首先,采用微球介導(dǎo)的微乳液克隆擴(kuò)增技術(shù),對(duì)樣本進(jìn)行擴(kuò)增,最終實(shí)現(xiàn)在每個(gè)微囊中僅包含有一分子模板和一個(gè)微球,達(dá)到單分子擴(kuò)增;接著,收集微球,并用水凝膠固定在玻璃芯片上,再通過蓋玻片的壓力,使微球均勻地平鋪在芯片表面,制成單層微球芯片;然后,加入分別與野生型和突變型擴(kuò)增產(chǎn)物特異性互補(bǔ)的熒光探針進(jìn)行雜交;最后,掃描成像。
在掃描的微球芯片圖像中,包括紅綠兩種顏色的點(diǎn),分別代表結(jié)合有野生型和突變型DNA片段的微球,紅點(diǎn)和綠點(diǎn)的比例就代表了野生型和突變型基因的比例,圖像中這些代表微球的點(diǎn)統(tǒng)稱為信號(hào)點(diǎn)。本研究的目的即通過圖像處理的各種算法,自動(dòng)識(shí)別圖中紅綠兩種顏色的微球,并分別計(jì)數(shù)。計(jì)數(shù)前先要進(jìn)行必要的預(yù)處理,圖1就是經(jīng)過圖像預(yù)處理后僅顯示單色信號(hào)點(diǎn)的灰度圖。從中可見,凝膠固定的微球隨機(jī)分布,大部分代表微球的信號(hào)點(diǎn)孤立且邊緣清晰可見,這部分的微球識(shí)別較為容易。但是還有相當(dāng)數(shù)目的微球并沒有如實(shí)驗(yàn)所設(shè)想的成為完全的單層微球,而是出現(xiàn)部分疊加,有些甚至疊加成團(tuán),導(dǎo)致圖像上的信號(hào)點(diǎn)出現(xiàn)粘連,這部分微球的識(shí)別和計(jì)數(shù)就成為需要主要解決的問題。另外,實(shí)驗(yàn)中選用的是直徑為34 μm的瓊脂糖微球作為引物結(jié)合載體,但由于實(shí)驗(yàn)過程中不可避免的誤差,導(dǎo)致圖像上代表微球的信號(hào)點(diǎn)大小不一。圖像上還可以看到一些雜點(diǎn)或干擾條紋,由實(shí)驗(yàn)過程中不可避免的因素造成。所以,在圖像識(shí)別和計(jì)數(shù)過程中,也應(yīng)盡量去除這部分干擾。
圖1 凝膠微球芯片的單色灰度圖像Fig.1 Single-color grayscale image of a hydrogel beads array
根據(jù)以上分析的實(shí)驗(yàn)圖像特點(diǎn),分預(yù)處理和目標(biāo)識(shí)別兩個(gè)模塊進(jìn)行圖像處理,流程如圖2所示。
圖2 方法流程Fig.2 Flowchart of the method
1.1.1 顏色通道選擇
因?yàn)閳D像上信號(hào)點(diǎn)主要有紅色和綠色,為避免相互影響,應(yīng)分別計(jì)數(shù),先使圖像呈單色顯示。分析實(shí)驗(yàn)圖像,為熒光掃描儀掃描后輸出的24位的bmp格式,紅、綠、藍(lán)三種顏色通道各占8位,色階值范圍0~255。所以,若要單色顯示,只要使另外兩種顏色通道的色階值為0即可。
1.1.2 灰度化
圖像上主要分背景和信號(hào)點(diǎn),預(yù)處理的目的是提取信號(hào)點(diǎn)并剔除噪聲,轉(zhuǎn)化為二值圖像。在二值化以前,需要分析圖像單色通道的色階值分布特征,故先轉(zhuǎn)化為灰度圖,為下一步二值化的分析做好準(zhǔn)備。將圖像中的紅、綠、藍(lán)各色階值統(tǒng)一用之前單色通道的色階值代替,即可轉(zhuǎn)化為灰度圖。
1.1.3 二值化
將圖像上的灰度值置為0或255,這樣以后的圖像不再涉及像素的多級(jí)值,使處理變得簡(jiǎn)單,而且數(shù)據(jù)的處理和壓縮量較小。這里,把背景設(shè)為255(白色),而信號(hào)點(diǎn)的值設(shè)為0(黑色),并采用閾值分割,所有灰度大于或等于閾值的像素被判定為背景,其余像素為信號(hào)點(diǎn)內(nèi)的有效像素。該方法的設(shè)計(jì)難點(diǎn)在于如何進(jìn)行粘連信號(hào)點(diǎn)的分割,而閾值選擇的恰當(dāng)與否對(duì)分割的效果起著決定性的作用。筆者參考了一些常見的閾值分割算法,如雙峰法、迭代法、大津法[7],根據(jù)圖像特征,選擇迭代法和大津法分別進(jìn)行分割閾值的計(jì)算,并繪出了圖像的灰度直方圖,最終由用戶在參考多種算法結(jié)果的基礎(chǔ)上決定分割閾值。
1)迭代法選擇閾值是基于逼近的思想,其實(shí)現(xiàn)步驟如下。
步驟1:求出圖像的最大灰度值和最小灰度值,記為Zmax和 Zmin,令初始閾值為
步驟2:根據(jù)閾值Tk將圖像像素分為第1族和第2族,分別求出兩者的平均灰度值Z1和Z2。
步驟3:求出新閾值Tk+1=(Z1+Z2)/2。
步驟4:若指定一個(gè)極小值ε,有|Tk+1-Tk|<ε,若逼近之值基本滿足要求,則Tk+1即為最后的迭代結(jié)果,否則令Tk=Tk+1,重新執(zhí)行上面的計(jì)算過程,直到|Tk+1-Tk|<ε。
2)大津法屬于最大類間方差法,是自適應(yīng)計(jì)算單閾值的簡(jiǎn)單、高效算法。其原理是對(duì)目標(biāo)灰度圖像的直方圖進(jìn)行分析,把閾值作為分界線將直方圖分成兩個(gè)部分,并從小到大不斷移動(dòng),每次移動(dòng)后就比較新分割的兩部分到分界線的距離,當(dāng)閾值使分界線在兩部分之間的距離最大時(shí),此時(shí)的閾值即所求閾值。對(duì)一幅灰度圖用公式來表達(dá),設(shè)t為分割閾值,前景點(diǎn)數(shù)占圖像總像素的比例為w0,平均灰度為u0,背景點(diǎn)數(shù)為w1,平均灰度為u1。圖像的總平均灰度為
從最小灰度值到最大灰度值遍歷t,當(dāng)t使函數(shù)G=w0(u0-u)2+w1(u1-u)2的值最大時(shí),t即為分割的最佳閾值。
1.1.4 中值濾波
該算法是基于排序統(tǒng)計(jì)理論的一種能有效抑制噪聲的非線性信號(hào)處理技術(shù),基本原理是把數(shù)字圖像或數(shù)字序列中一點(diǎn)的值用該點(diǎn)的一個(gè)鄰域中各點(diǎn)值的中值代替,讓周圍的像素值接近真實(shí)值,從而消除孤立的噪聲點(diǎn)。在本軟件中,將窗口大小設(shè)為3像素×3像素,進(jìn)行逐個(gè)像素掃描,當(dāng)前像素點(diǎn)的值則被以其為中心的9個(gè)像素點(diǎn)的中間值取代,從而一些獨(dú)立的噪聲點(diǎn)被去除,而有效信號(hào)點(diǎn)的邊緣被保護(hù)。
完成預(yù)處理后,下面就開始識(shí)別信號(hào)點(diǎn)。如果信號(hào)點(diǎn)是一個(gè)個(gè)分開的無(wú)粘連連通域,對(duì)每個(gè)信號(hào)點(diǎn)內(nèi)的像素遞歸尋找鄰接的有信號(hào)值的像素,通過分析遞歸返回的變量,就可得到微球的個(gè)數(shù)和面積。但實(shí)際圖像中的部分信號(hào)點(diǎn)是粘連在一起的,用上述方法無(wú)法準(zhǔn)確統(tǒng)計(jì)個(gè)數(shù)。分析圖像特征,由于選取的都是直徑34 μm的微球,所以信號(hào)點(diǎn)大小比較均勻,使用一定大小的圓點(diǎn)標(biāo)識(shí)信號(hào)點(diǎn),進(jìn)而轉(zhuǎn)化為求圓點(diǎn)的個(gè)數(shù),分割結(jié)果較好。
1.2.1 小面積區(qū)域標(biāo)識(shí)
由于同一次實(shí)驗(yàn)選取的微球大小基本一致,在預(yù)處理過程中加入了統(tǒng)計(jì)分析功能,對(duì)所有的單連通區(qū)域求取平均面積供用戶參考,再由用戶確定一個(gè)面積參數(shù),對(duì)像素?cái)?shù)目小于此參數(shù)的單連通域都標(biāo)識(shí)為單個(gè)微球,認(rèn)為是一個(gè)獨(dú)立且有效的信號(hào)點(diǎn)。
1.2.2 粘連微球中心定位
假設(shè)微球在圖像中的形狀都近似圓形,由于與熒光染料特異性結(jié)合的DNA片段在微球上的擴(kuò)增一般都假設(shè)均勻,所以反映在平面圖像上,越中心的位置染料聚集密度越高,從而信號(hào)強(qiáng)度應(yīng)當(dāng)越高。據(jù)此分析,同樣建立了一個(gè)3像素×3像素的窗口進(jìn)行逐個(gè)像素掃描,并挑選連通區(qū)域內(nèi)信號(hào)值最高的像素點(diǎn)為中心點(diǎn),循環(huán)找到信號(hào)值最高的像素,即認(rèn)為是信號(hào)點(diǎn)的擬定中心。之后再使用圓形與當(dāng)前連通區(qū)域進(jìn)行形狀匹配,不斷微調(diào)圓心位置,直到匹配程度最高。
1.2.3 信號(hào)點(diǎn)標(biāo)識(shí)
在假定的信號(hào)點(diǎn)中心處嘗試?yán)L制標(biāo)識(shí)圓,且要滿足兩個(gè)判斷條件:一是在所要繪制的標(biāo)識(shí)圓區(qū)域內(nèi),均有信號(hào)值;二是對(duì)當(dāng)前信號(hào)點(diǎn)區(qū)域繪制標(biāo)識(shí)圓時(shí),不與任意先前的標(biāo)識(shí)圓發(fā)生粘連。這樣繪制的每一個(gè)標(biāo)識(shí)圓將代表一個(gè)有效的信號(hào)點(diǎn),且將圖像上粘連的信號(hào)點(diǎn)數(shù)目轉(zhuǎn)化為無(wú)粘連的標(biāo)識(shí)圓的數(shù)目。圖3為圖1中信號(hào)點(diǎn)的識(shí)別結(jié)果,其中空心黑圈代表識(shí)別出的標(biāo)識(shí)圓邊緣??梢钥吹剑行盘?hào)點(diǎn)幾乎全部成功識(shí)別,且標(biāo)識(shí)圓完全沒有疊加,進(jìn)而可以實(shí)現(xiàn)準(zhǔn)確計(jì)數(shù)。
圖3 信號(hào)點(diǎn)的識(shí)別結(jié)果Fig.3 The recognizing result of signal spots in the example image
1.2.4 標(biāo)識(shí)圓計(jì)數(shù)
使用成熟的單連通域遞歸算法,即可完成計(jì)數(shù)任務(wù)。當(dāng)逐行掃到有信號(hào)的像素時(shí),開始8個(gè)方向的遞歸尋找,只要和此像素連通的其他信號(hào)像素均在輔助矩陣中進(jìn)行標(biāo)注。下面繼續(xù)掃描信號(hào)像素點(diǎn)進(jìn)行計(jì)數(shù)時(shí),就不會(huì)將之前標(biāo)注過的像素點(diǎn)計(jì)算在內(nèi),從而實(shí)現(xiàn)了標(biāo)識(shí)圓的準(zhǔn)確計(jì)數(shù)。
圖3中標(biāo)識(shí)符的自動(dòng)計(jì)數(shù)結(jié)果為947,而對(duì)原圖的人工計(jì)數(shù)結(jié)果為955。經(jīng)過實(shí)驗(yàn)人員的驗(yàn)證,這兩種方法所產(chǎn)生的結(jié)果差異是滿足實(shí)驗(yàn)分析要求的。
1.2.5 信號(hào)點(diǎn)識(shí)別結(jié)果修正
由于微球的大小并不完全一樣,而且實(shí)驗(yàn)過程中可能發(fā)生各種操作誤差、熒光染料雜交、信號(hào)點(diǎn)粘連等情況,上面的算法識(shí)別結(jié)果不一定完全正確,因而適當(dāng)?shù)娜斯ぽo助識(shí)別修正是必要的。一些被錯(cuò)誤繪制的標(biāo)識(shí)符應(yīng)當(dāng)可以被操作者去除,而另一些沒有被成功識(shí)別的信號(hào)點(diǎn)可以被操作者增繪標(biāo)識(shí)符。如果操作人員要得到更準(zhǔn)確的結(jié)果,可以修正后重新進(jìn)行計(jì)數(shù)。
采用水凝膠微球芯片技術(shù),進(jìn)行了糞便脫落細(xì)胞中大腸癌相關(guān)基因表達(dá)量檢測(cè)的研究。大腸癌是最常見的消化道惡性腫瘤,篩查是早期發(fā)現(xiàn)大腸癌和提高大腸癌患者生存率的關(guān)鍵。目前用于普查篩選方法主要是結(jié)腸鏡和大便隱血試驗(yàn),而這兩種方法對(duì)大腸癌的早期診斷均不十分理想;如今國(guó)際上糞便脫落細(xì)胞的檢測(cè)為一種無(wú)創(chuàng)性檢查,對(duì)大腸癌的診斷具有重要意義。筆者采用基于微球的微乳液“克隆”PCR法,同時(shí)擴(kuò)增待測(cè)大腸癌相關(guān)基因COX2(或c-myc)的cDNA和一個(gè)看家基因betaactin的cDNA,并通過雙色熒光技術(shù),分別為擴(kuò)增后的微球標(biāo)記上紅色或綠色,用以標(biāo)識(shí)微球上被擴(kuò)增的是待測(cè)癌癥基因還是看家基因;再用水凝膠法,將這些克隆PCR產(chǎn)物(即表面包埋有DNA分子的微球)制備成微球芯片。由于看家基因beta-actin的表達(dá)量基本不變,故紅色和綠色微球個(gè)數(shù)的比例高低表示待測(cè)基因的相對(duì)表達(dá)量,從而實(shí)現(xiàn)了一種新的大腸癌早期診斷的實(shí)驗(yàn)方法。這種方法產(chǎn)生了大量的結(jié)果圖像,用人工進(jìn)行計(jì)數(shù)顯然不可能。所以,為了驗(yàn)證自動(dòng)計(jì)數(shù)方法的實(shí)用性,從上述研究中挑選了10幅圖像進(jìn)行人工計(jì)數(shù)和自動(dòng)計(jì)數(shù)的對(duì)比。本研究認(rèn)為,經(jīng)過人工識(shí)別修正后的再次計(jì)數(shù)為人工計(jì)數(shù)結(jié)果,且認(rèn)為是準(zhǔn)確結(jié)果,設(shè)為M;而原圖不經(jīng)修正的第一次自動(dòng)識(shí)別結(jié)果可認(rèn)為是自動(dòng)計(jì)數(shù)結(jié)果,設(shè)為A。自動(dòng)計(jì)數(shù)相對(duì)于人工計(jì)數(shù)的偏差率W為
同時(shí),也計(jì)算了平均偏差率,有
具體結(jié)果見表1。
對(duì)10幅典型圖像的計(jì)數(shù)結(jié)果的平均偏差率為3.94%。觀察對(duì)比結(jié)果,第2組綠球(12.5%)和第4組綠球(20.7%)識(shí)別的偏差率較大。
表1 人工和自動(dòng)計(jì)數(shù)結(jié)果對(duì)比Tab.1 Comparison of manual and auto-counting results
對(duì)于第二組綠球和第四組綠球識(shí)別的偏差率較大的情況,主要是因?yàn)橄鄳?yīng)的掃描圖像中出現(xiàn)了與其他圖像相比比例較高的混色球。所謂混色球,是指實(shí)驗(yàn)時(shí)同一個(gè)微球上同時(shí)擴(kuò)增了正常和突變的基因片段,沒能達(dá)到真正的單分子擴(kuò)增,導(dǎo)致兩種顏色的熒光探針同時(shí)發(fā)光,人工識(shí)別時(shí)就出現(xiàn)漏查。在這種情況下,自動(dòng)計(jì)數(shù)在計(jì)數(shù)綠球時(shí)將混色球計(jì)入的選擇應(yīng)當(dāng)認(rèn)為是正確的。通過圖4中的示意,對(duì)第4組數(shù)據(jù)進(jìn)行具體的原因分析。觀察圖4(b)中綠球的識(shí)別后圖,右上角3個(gè)箭頭所指的微球成功識(shí)別,但在原圖中觀察,對(duì)應(yīng)微球均為混色球,并且由于紅色強(qiáng)度較高,掩蓋了較弱的綠色,導(dǎo)致人工識(shí)別時(shí)漏查3個(gè)綠球;同時(shí),灰度圖中左下方箭頭所指的綠球發(fā)光面積較大,造成識(shí)別圖中多標(biāo)識(shí)了兩個(gè)信號(hào)點(diǎn),因而多查了2個(gè)綠球另外,而發(fā)光面積與實(shí)驗(yàn)所選微球是否大小不均、微球雜交受污染程度都會(huì)影響偏差率。由于此圖本身的綠球數(shù)目比較少,所以偏差率超過了20%,大大超過了平均偏差率。
圖4 較大差異結(jié)果組對(duì)應(yīng)圖像。(a)綠球?qū)?yīng)灰度圖;(b)識(shí)別后圖Fig.4 Corresponding imagesofthedatasetwith comparatively big difference.(a)Corresponding grayscale image of green beads;(b)Image after recognizing
通過對(duì)其他各組數(shù)據(jù)的分析,偏差也大都與實(shí)驗(yàn)圖像的質(zhì)量相關(guān),表明實(shí)驗(yàn)過程及掃描所成圖像的質(zhì)量是本方法能夠正確應(yīng)用的基礎(chǔ)。另外,當(dāng)實(shí)驗(yàn)中每次采用的微球大小不均導(dǎo)致圖像中信號(hào)點(diǎn)大小不一時(shí),面積較大的信號(hào)點(diǎn)內(nèi)有可能滿足同時(shí)繪制兩個(gè)標(biāo)識(shí)圓的條件,導(dǎo)致多查;面積較小的信號(hào)點(diǎn)又有可能滿足不了半徑確定的標(biāo)識(shí)圓的繪制條件(即繪制范圍內(nèi)都有信號(hào)值,同時(shí)又不能與其他標(biāo)識(shí)圓發(fā)生粘連),導(dǎo)致漏查。還有其他一些因素,如熒光染色不均勻、一個(gè)微球雜合了兩種顏色的熒光染料、信號(hào)點(diǎn)粘連程度較深等,都會(huì)對(duì)自動(dòng)計(jì)數(shù)方法的偏差率產(chǎn)生影響。但正如10組對(duì)比數(shù)據(jù)和圖2的識(shí)別結(jié)果所示,其中占大多數(shù)的孤立信號(hào)點(diǎn)都可以準(zhǔn)確識(shí)別,而數(shù)量其次的粘連程度不深的信號(hào)點(diǎn)群的識(shí)別效果也較好,只有極少數(shù)的粘連程度較深的信號(hào)點(diǎn)識(shí)別有誤,因而所建立的自動(dòng)計(jì)數(shù)方法的結(jié)果已經(jīng)比較準(zhǔn)確,可滿足實(shí)驗(yàn)過程無(wú)大差錯(cuò)、掃描圖像質(zhì)量較好的結(jié)果分析要求。
另外,根據(jù)基因COX-2的表達(dá)量進(jìn)行大腸癌早期診斷,有一個(gè)相對(duì)于看家基因比例的判斷閾值,若COX-2基因與看家基因的表達(dá)量比例在此閾值上下10%的范圍內(nèi),都建議去做更精準(zhǔn)的醫(yī)學(xué)檢驗(yàn)。在本方法中,計(jì)數(shù)的平均偏差率達(dá)到3.94%,因而在凝膠微球芯片用于大腸癌早期診斷的臨床應(yīng)用中,需要擴(kuò)大要求進(jìn)行醫(yī)學(xué)檢驗(yàn)的范圍,即兩者表達(dá)量的比例在閾值上下15%的范圍建議進(jìn)行進(jìn)一步的醫(yī)學(xué)檢驗(yàn),這樣即可滿足初步篩查的要求。
由于閾值選擇的適當(dāng)與否對(duì)分割效果起到?jīng)Q定性作用,所以這里對(duì)迭代法和大津法這兩種閾值分割算法進(jìn)行專門討論。迭代法所得閾值對(duì)圖像的分割效果較好,能夠區(qū)分出圖像的前景和背景的主要區(qū)域,但對(duì)圖像的細(xì)微區(qū)域區(qū)分度不高;而大津法適應(yīng)性強(qiáng),對(duì)圖像的分割質(zhì)量具有一定保障,是一種穩(wěn)定和通用的閾值分割算法,但在兩群物體的灰度差不明顯的情況下,會(huì)丟失圖像的一些整體信息[7]。為了驗(yàn)證兩種方法對(duì)計(jì)數(shù)結(jié)果的影響,針對(duì)上面的10幅例圖,對(duì)比了兩種方法分割后的計(jì)數(shù)結(jié)果,如表2所示。
表2 迭代法和大津法計(jì)算閾值分割結(jié)果對(duì)比Tab.2 Comparison of segmentation results based on threshold values calculated by iterative and Otsu algorithms
分析上面的結(jié)果對(duì)比,可知這兩種閾值分割算法的應(yīng)用主要有兩種情況。
1)在質(zhì)量較好的圖像中,由于目標(biāo)和背景區(qū)別顯著,所以兩種算法分割后的計(jì)數(shù)結(jié)果差別不大。即使兩種算法計(jì)算的閾值差別較大,計(jì)數(shù)結(jié)果仍然相近,如2組綠球、3組紅球、3組綠球、5組紅球等。在這種情況下,兩種閾值分割算法的效果都滿足要求。
2)對(duì)于目標(biāo)和背景差別不大的圖像,兩種算法分割后計(jì)數(shù)的結(jié)果差別比較大。即使兩者計(jì)算的閾值相近,但由于部分信號(hào)點(diǎn)強(qiáng)度低于計(jì)算的閾值,導(dǎo)致部分信號(hào)點(diǎn)丟失,計(jì)數(shù)結(jié)果偏低,如1組綠球、6組紅球、8組紅球、9組紅球等。在這種情況下,大津法則體現(xiàn)了其優(yōu)勢(shì),計(jì)算的閾值能夠分割出更多的有效信號(hào)點(diǎn),從而更加接近真實(shí)值。
分析質(zhì)量較好的圖像時(shí),兩種閾值分割算法的效果都較好,區(qū)別不大;而分析質(zhì)量較差、目標(biāo)和背景區(qū)別不大的圖像時(shí),大津法的分割效果更好。
針對(duì)凝膠微球芯片圖像,本研究提出了一種實(shí)用且高效的微球自動(dòng)計(jì)數(shù)方法。此方法執(zhí)行速度快,智能化程度高,大大提高了微球計(jì)數(shù)的效率,并已成功用于利用凝膠微球芯片進(jìn)行大腸癌相關(guān)基因表達(dá)量的研究中,為微球芯片圖像分析提供了一種新的思路。
[1]Lleonart ME,Cajal SR,Groopman JD,et al.Sensitive and specific Detection of K-ras mutations in colon tumors by short oligonucleotide mass analysis [J].Nucleic Acids Res,2004,32:e53.
[2]Bar-Eli M,Ahuja H,Gonzalez-Cadavid N,et al.Analysis of NRAS exon-1 mutations in myelodysplastic syndromes by polymerase chain reaction and direct sequencing[J].Blood,1989,73,281-283.
[3]Seung MD,Giovanni T,Constance J,et al.Detecting colorectal cancer in stool with the use of multiple genetic targets[J].Cancer Inst,2001,93,858-865.
[4]Vogelstein B,Kinzler KW.Digital PCR[J].Proc Natl Acad Sci USA,1999,96:9236-9241.
[5]Margulies M,Egholm M,Altman W,et al.Genome sequencing in microfabricated high-density picolitre reactors[J].Nature,2005,437,376-380.
[6]Huang Huan,Qi Zongtai,Deng Lili,et al.Highly sensitive mutation detection based on digital amplification coupled with hydrogel bead-array[J].Chem Commun(Camb),2009,4094-4096.
[7]蔣先剛.數(shù)字圖像處理工程軟件設(shè)計(jì)[M].北京:中國(guó)水利水電出版社,2006.
Design and Application of the Method for Analyzing Experimental Data from Hydrogel Bead-Array
LI Cheng1,2HUANG Huan2SUN Xiao1*ZHOU Guohua2
1(State Key Laboratory of Bioelectronics,Southeast University,Nanjing 210096,China)2(Huadong Research Institute for Medicine and Biotechnics,Nanjing 210002,China)
R318
A
0258-8021(2010)04-0492-06
10.3969/j.issn.0258-8021.2010.04.003
2010-03-01,
2010-04-23
國(guó)家自然科學(xué)基金資助項(xiàng)目(30470454);南京科學(xué)技術(shù)發(fā)展項(xiàng)目支持(200801087)
*通訊作者。 E-mail:xsun@seu.edu.cn