王夢(mèng)洲,王秋杰(通訊作者)
(重慶市中藥研究院 重慶 400065)
互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,促使全球就進(jìn)入了大數(shù)據(jù)時(shí)代,大數(shù)據(jù)具有“四V”特征,包括:Volume、Variety、Value、Velocity,中文解釋為大規(guī)模、多種類、低價(jià)值密度、高處理速度。中藥是我國(guó)歷史文化的重要產(chǎn)物,但目前很多人對(duì)中藥的認(rèn)識(shí)比較宏觀,限制了中藥創(chuàng)新發(fā)展,這也是大數(shù)據(jù)時(shí)代,中藥發(fā)展速度比較慢的主要原因。中藥和配伍變化非常復(fù)雜,研究難度比較大,限制了中藥創(chuàng)新發(fā)展。但大數(shù)據(jù)技術(shù)的應(yīng)用,可通過(guò)全范圍信息資源分析,來(lái)認(rèn)識(shí)中藥、充分挖掘中藥的隱藏價(jià)值和發(fā)展規(guī)律,促使中藥更好的發(fā)展,更好的造福人類。
對(duì)于大數(shù)據(jù)目前學(xué)術(shù)界仍然沒有給出統(tǒng)一的定義,普遍都是從數(shù)據(jù)利用價(jià)值的角度來(lái)認(rèn)識(shí)大數(shù)據(jù)。大數(shù)據(jù)的特點(diǎn)主要體現(xiàn)在“大”字上,具有“四V”特征,大數(shù)據(jù)的本質(zhì)是從海量數(shù)據(jù)集合或者數(shù)據(jù)庫(kù)來(lái)獲得知識(shí),或者自己所需的數(shù)據(jù)。將不同領(lǐng)域、不同格式、不同形成方式的數(shù)據(jù)匯總到一個(gè)平臺(tái),形成數(shù)據(jù)庫(kù),尋找各行各業(yè)或者各項(xiàng)事物發(fā)展的規(guī)律,并預(yù)測(cè)在未來(lái)某一段時(shí)間內(nèi)發(fā)生的概率,然后進(jìn)行人為干預(yù),促使其向著人們所期望的方向發(fā)展。在大數(shù)據(jù)時(shí)代,數(shù)據(jù)發(fā)生了翻天覆地的變化,不僅僅表現(xiàn)在數(shù)據(jù)處理方式和數(shù)據(jù)處理速度上,而是從大數(shù)據(jù)技術(shù)研發(fā)的角度出發(fā),準(zhǔn)確把控未知的發(fā)展趨勢(shì),以便更好的占領(lǐng)時(shí)代發(fā)展市場(chǎng),實(shí)現(xiàn)持續(xù)發(fā)展。
經(jīng)過(guò)數(shù)千年的發(fā)展,我國(guó)形成了非常龐大的中藥數(shù)據(jù)資源,包括中藥的數(shù)量、種類、分布范圍、蘊(yùn)藏量、變化趨勢(shì)、中藥栽培、不同中藥的市場(chǎng)需求量、重要質(zhì)量等,中藥資源數(shù)據(jù)非常龐大,僅憑人力難以對(duì)各項(xiàng)數(shù)據(jù)進(jìn)行有效整理和提取[1]。利用大數(shù)據(jù)技術(shù),能夠創(chuàng)新出新的中藥資源數(shù)據(jù)統(tǒng)計(jì)方式,并對(duì)現(xiàn)有的抽樣技術(shù)進(jìn)行改進(jìn),從而提升中藥資源數(shù)據(jù)統(tǒng)計(jì)、調(diào)查、匯總、分析的科學(xué)性和有效性。利用大數(shù)據(jù)技術(shù)來(lái)整合和共享中藥資源數(shù)量及質(zhì)量,能夠大幅度縮短中藥資源調(diào)查周期,提升調(diào)查效率,更好地節(jié)約人力、物力、財(cái)力等,為中藥事業(yè)發(fā)展,造福全人類提供新的技術(shù)支持。
中藥資源數(shù)據(jù)是我國(guó)發(fā)展重要產(chǎn)業(yè)的關(guān)鍵,從我國(guó)數(shù)千年的中藥發(fā)展歷程來(lái)看,限制中藥事業(yè)發(fā)展的因素主要體現(xiàn)在兩個(gè)方面,其一是中藥的質(zhì)量,其二是中藥的數(shù)量。由于經(jīng)過(guò)數(shù)千年的發(fā)展,形成了龐大的中藥資源數(shù)量,傳統(tǒng)粗放式的發(fā)展思維難以適應(yīng)中藥創(chuàng)新發(fā)展需求。但通過(guò)大數(shù)據(jù)技術(shù)具有的新思維、新理念,既能促使中藥資源研究領(lǐng)域持續(xù)健康的發(fā)展,也有助于探索中藥資源發(fā)展的新方向和新方法。大數(shù)據(jù)時(shí)代為中藥創(chuàng)新發(fā)展提供了新的技術(shù)支持,比如:利用大數(shù)據(jù)技術(shù),能夠?qū)χ兴庂Y源的自然生態(tài)進(jìn)行更加深入的研究,有利于形成更加規(guī)范、標(biāo)準(zhǔn)的中藥種植體系,同時(shí)對(duì)中藥材市場(chǎng)流通提供了完善的技術(shù)體系。
雖然大數(shù)據(jù)時(shí)代,為中藥創(chuàng)新提供了新的發(fā)展機(jī)遇,迎來(lái)了新的發(fā)展空間,但目前我國(guó)對(duì)大數(shù)據(jù)的應(yīng)用還是只是“冰山一角”,大數(shù)據(jù)技術(shù)還處于發(fā)展的初級(jí)階段,很多技術(shù)標(biāo)準(zhǔn)、規(guī)范體系還不夠完善。從應(yīng)用本質(zhì)上來(lái)看,大數(shù)據(jù)技術(shù)和中藥資源現(xiàn)有的創(chuàng)新方法及思路之間,具有既相互聯(lián)系,又有一定區(qū)別的關(guān)系。再加上大數(shù)據(jù)技術(shù)基礎(chǔ)理論框架不夠完善、基礎(chǔ)設(shè)施不夠先進(jìn)、法律法規(guī)不夠成熟,大數(shù)據(jù)到底是否能夠?yàn)橹兴巹?chuàng)新發(fā)展更好的條件猶未可知[2]。及我國(guó)各地中藥資源管理主體存在較大的差別、中藥資源缺乏高素質(zhì)人才、存在潛在的安全威脅等問題的影響,致使很多地區(qū)在中藥創(chuàng)新中不愿意融合大數(shù)據(jù)技術(shù),害怕傳承了數(shù)千年中藥資源數(shù)據(jù)被不法分子盜取或者亂用。
中醫(yī)藥信息學(xué)是門全新的學(xué)科,是大數(shù)據(jù)時(shí)代,信息學(xué)和中藥學(xué)相互結(jié)合的產(chǎn)物,中醫(yī)藥信息學(xué)主要研究?jī)?nèi)容是中醫(yī)藥信息的運(yùn)動(dòng)規(guī)律,主要研究方法是中醫(yī)藥信息學(xué)方法,主要研究目標(biāo)是提升中醫(yī)藥信息獲取速度、轉(zhuǎn)化速度、傳播速度以及綜合利用能力。大數(shù)據(jù)和中醫(yī)藥信息學(xué)有很多相似之處,都具有信息量非常龐大的特點(diǎn),將大數(shù)據(jù)技術(shù)融合到中醫(yī)藥信息學(xué)中,能夠在龐大的中醫(yī)藥信息資源庫(kù)中,快速、準(zhǔn)確提取出有價(jià)值、有用的數(shù)據(jù)和信息,為中醫(yī)藥信息學(xué)發(fā)展提供更好的科研服務(wù)。
中醫(yī)藥信息交流和傳遞的主要途徑是各種中醫(yī)藥期刊及文獻(xiàn),利用大數(shù)據(jù)技術(shù)對(duì)中醫(yī)藥期刊和文獻(xiàn)進(jìn)行全方位的分析處理,建立起中醫(yī)藥數(shù)據(jù)庫(kù),就能實(shí)現(xiàn)數(shù)據(jù)共享,提升中醫(yī)藥信息傳播的效率和速度。比如:DartGrid語(yǔ)義網(wǎng)絡(luò)平臺(tái),能夠動(dòng)態(tài)化集成大規(guī)模異質(zhì)異構(gòu)的數(shù)據(jù)庫(kù)資源,能夠?qū)崿F(xiàn)虛擬組織的協(xié)同共建和數(shù)據(jù)共享,形成了中醫(yī)藥科學(xué)設(shè)計(jì)中心平臺(tái),為中醫(yī)藥信息交流和傳遞提供了良好的平臺(tái)支持。此外,在大數(shù)據(jù)時(shí)代,文獻(xiàn)載體及傳播形式都實(shí)現(xiàn)了數(shù)字化,目前很多中醫(yī)藥期刊都采用了采編系統(tǒng),可對(duì)發(fā)送來(lái)的稿件提前進(jìn)行預(yù)處理,大大保證了中醫(yī)藥期刊的質(zhì)量[3]。通過(guò)大數(shù)據(jù)技術(shù)“一切數(shù)據(jù)平臺(tái)”的發(fā)展理念,還能構(gòu)件一個(gè)安全、完善的中醫(yī)藥核心期刊評(píng)價(jià)體系,以便從海量期刊和文獻(xiàn)中,找到最適合、最符合中藥創(chuàng)新理念的精品期刊,這也是大數(shù)據(jù)技術(shù)中藥創(chuàng)新領(lǐng)域的主要應(yīng)用之一。
預(yù)防疾病是中醫(yī)藥一直追求的最佳治療效果,是一門研究群體的學(xué)科,經(jīng)常通過(guò)統(tǒng)計(jì)學(xué)方法來(lái)收集人群數(shù)據(jù),為保證數(shù)據(jù)的準(zhǔn)確性和有效性,需要用到大量的樣本量,大大增加了人力成本。將大數(shù)據(jù)挖掘技術(shù)應(yīng)用到中醫(yī)藥預(yù)防疾病中,能夠有效解決這一問題,可利用大數(shù)據(jù)來(lái)檢測(cè)人群健康,以便更好的掌握疾病預(yù)防和發(fā)展趨勢(shì),及時(shí)發(fā)現(xiàn)那些隱形信息。比如:利用大數(shù)據(jù)理念和相關(guān)技術(shù),就能實(shí)現(xiàn)基于本體的中醫(yī)藥學(xué)語(yǔ)言系統(tǒng)來(lái)處理各種數(shù)據(jù),從海量的數(shù)據(jù)中發(fā)現(xiàn)和預(yù)測(cè),預(yù)防疾病過(guò)程中隱形關(guān)聯(lián)知識(shí),大數(shù)據(jù)在中醫(yī)藥預(yù)防疾病中的應(yīng)用,會(huì)隨著大數(shù)據(jù)技術(shù)的發(fā)展,應(yīng)用效果更加顯著,未來(lái)可期。
利用大數(shù)據(jù)挖掘技術(shù),能夠快速準(zhǔn)確地找到中藥治療疾病的用藥規(guī)律,實(shí)現(xiàn)對(duì)癥下藥,為疾病治療提供更加準(zhǔn)確的信息和數(shù)據(jù)。比如利用大數(shù)據(jù)技術(shù),能夠從海量數(shù)據(jù)中快速找到疾病的發(fā)病規(guī)律、治病過(guò)程等,對(duì)中藥種類、藥性、藥味、用量等進(jìn)行分析研究,從而得到此類疾病的用藥規(guī)律和依據(jù)。此外,利用大數(shù)據(jù)技術(shù)還能快速找到中藥治療各種疾病的特點(diǎn)和規(guī)律,不斷累積醫(yī)療經(jīng)驗(yàn),更好的為人類服務(wù)。
隨著我國(guó)中藥在醫(yī)學(xué)界創(chuàng)造了相應(yīng)的醫(yī)療奇跡,中藥和制劑作為藥物形式,得到了國(guó)際上的認(rèn)可。但我國(guó)中藥開發(fā)現(xiàn)狀還比較滯后,如何在中藥數(shù)據(jù)庫(kù)中,開發(fā)出像“青蒿素”一樣被國(guó)際認(rèn)可、社會(huì)效益高的藥物,是目前中藥創(chuàng)新中亟待解決的問題。需要先提升中藥在創(chuàng)新新藥方面的概率,通過(guò)分析中藥的藥性味功能、藥理作用、化學(xué)成分、治療疾病、用藥部位、產(chǎn)地等,再通過(guò)關(guān)聯(lián)性規(guī)律,挖掘出相互之間的聯(lián)系,就能大幅度提升中藥在創(chuàng)制新藥方面的命中率,利用大數(shù)據(jù)技術(shù),為中藥新藥的開發(fā)提供了一個(gè)新思路。
綜上所述,大數(shù)據(jù)時(shí)代是互聯(lián)網(wǎng)技術(shù)發(fā)展到一定程度的必然趨勢(shì),在大數(shù)據(jù)時(shí)代,為中藥創(chuàng)新提供了新的機(jī)遇和發(fā)展條件,大數(shù)據(jù)和中藥在很多方面都具有一定的共性,將先進(jìn)的大數(shù)據(jù)應(yīng)用到中藥創(chuàng)新中,能夠大幅度提升中藥創(chuàng)新質(zhì)量,解決傳統(tǒng)中藥數(shù)據(jù)信息管理難度大、數(shù)據(jù)信息種類多等特性,而且有助于提升研發(fā)新中藥成功的概率,契合我國(guó)中藥創(chuàng)新發(fā)展的需求,也符合時(shí)代發(fā)展特征,值得大范圍推廣應(yīng)用。