王珊
想象一下:手機將通過分析人類的通話狀態(tài)診斷是否患有阿爾茨海默病;浴缸將通過掃描對內(nèi)臟的健康狀況作以評估;方向盤可以通過駕駛中的微小行為斷定司機是否有帕金森癥……
2016年8月,一名60多歲的日本患者突然身體不適,被緊急送到日本東京大學醫(yī)學研究院。經(jīng)過多次化驗與檢測,醫(yī)生診斷,他患上了急性骨髓性白血病。
然而,對癥治療幾個月后,病情沒有緩解,病人的情況繼續(xù)惡化,甚至漸漸喪失了意識。
IBM的醫(yī)療人工智能Watson(沃森)被請來幫忙。“研讀”患者所有的醫(yī)療資料10分鐘后,Watson給出它的結(jié)論:患者的確患上了白血病,但不是急性骨髓性白血病,而是另一種罕見的白血病。
這是IBM大中華區(qū)總裁陳黎明在公開場合常講的一個故事。Watson是IBM推出的認知型人工智能。所謂認知,即它可以自主地學習輸入給它的大量數(shù)據(jù),包括論文、專著等知識型數(shù)據(jù),以及圖片、視頻等影像數(shù)據(jù);所謂人工智能,則是它可以自主地根據(jù)所學習到的數(shù)據(jù),與現(xiàn)實情況進行比對,進而做出決策?!癢atson是為商業(yè)而生的人工智能平臺,它能夠改變我們的職業(yè)和行業(yè)?!标惱杳髡f。
由計算機輔助醫(yī)生進行醫(yī)學診段,并不是一件新鮮事。心電圖就是通過計算機識別出心臟傳遞出的信號,變成顯示在紙張或電腦屏幕上的一排連續(xù)的、變化的線條。X射線透視技術(shù)、CT、B超等技術(shù)也同樣有計算機的參與。計算機完成檢測,并將人體運轉(zhuǎn)的生物學信號,轉(zhuǎn)變成可視的、單純的線條、符號或影像,作為醫(yī)生診斷的依據(jù)。
德國漢諾威消費電子、信息及通信博覽會上,IBM和軟銀合作推出的Watson版人工智能機器人pepper與參觀者對話。
但這樣的診斷并沒有自主學習的機制。一臺檢測過3000位病人的計算機,并不比只檢測過30位病人的計算機更聰明。它們只是依據(jù)事先輸入的程序運轉(zhuǎn)。
人工智能最大的不同,在于它運轉(zhuǎn)的規(guī)則不是事先輸入的程序,而是依托龐大的后臺數(shù)據(jù)庫,根據(jù)正在檢測的病人情況,“思考”出針對每一個病人的單獨的結(jié)論。在人工智能領(lǐng)域,這被稱為“深度學習”。
與普通的醫(yī)生學習相比,計算機的深度學習具有強大的優(yōu)勢。培養(yǎng)一名醫(yī)生,需要4年的本科學習,3年的研究生訓練,以及從實習醫(yī)生、住院醫(yī)生到門診醫(yī)生的大量醫(yī)學實踐。培養(yǎng)一名優(yōu)秀的醫(yī)生,至少需要十年時間。
而一旦計算機的“深度學習”網(wǎng)絡(luò)建成,它便可在短時間內(nèi),自主閱讀所輸入給它的大量醫(yī)學論文及病例,且夜以繼日,不眠不休。
以Watson為例,它可以在17秒時間內(nèi)閱讀3469本醫(yī)學專著、248000篇論文、69種治療方案、61540次實驗數(shù)據(jù)以及106000份臨床報告,并最終提出三個最優(yōu)選的治療方案。而一名醫(yī)療人員,平均每年最多只能閱讀200至300份醫(yī)療文獻著作。
Watson的認知計算有著比深度學習更廣闊的外延,陳黎明解釋說:認知計算能夠?qū)崿F(xiàn)大規(guī)模學習、針對問題的推理和思考,進行自然語言交互,增強和擴充人類在專業(yè)知識方面的學習能力,與人類合作解決人類和機器無法單獨解決的問題。認知創(chuàng)新代表了信息技術(shù)未來的發(fā)展方向,是開啟商業(yè)和社會發(fā)展新時代的鑰匙。
不過,IBM并不打算用Watson取代人類醫(yī)生。它只負責給出建議,最終的決策,仍需要醫(yī)生負責。
“人工智能的概念是增強人類的智能?!盜BM公司董事長、總裁及CEO 羅睿蘭解釋說,正如蒸汽機增強了人類的體力,電話增強了人類的通話能力,計算機增強了人類的計算能力,“機器的協(xié)助并沒有取代人類的活動,它只是擴展了人的技能和專業(yè)水平?!?h3>“訓練”Watson
將Watson訓練成一個醫(yī)療專家,花了整整12年。
2005年,IBM研究院意識到,十年之后,醫(yī)療和機器學習的結(jié)合將會成為重要的研究領(lǐng)域。他們從心血管疾病和乳腺疾病的醫(yī)療影像識別開始做起,后來聚焦在癌癥的診斷上。
據(jù)統(tǒng)計,2015 年全球新增的癌癥病例為1410 萬,死于癌癥的人數(shù)高達820 萬人。由于環(huán)境惡化、壽命延長等因素,預計未來20 年,全球內(nèi)新發(fā)病例的增加幅度將高達70%。
計算機曾以顯示影像、符號等方式,對醫(yī)療服務(wù)給予幫助,但要真正成為給出診斷的醫(yī)生,它首先需要學習的是如何閱讀這些影像。
試想一下,一名醫(yī)學院的學生是如何學習理解這些醫(yī)學影像的:他們先從書本或教材中獲得病癥的特征,然后在不斷的實踐中,將這些知識與現(xiàn)實情況加以對應(yīng)。遇上疑難問題,他們依靠老師、前輩和醫(yī)學病例,反復對比和討論,直至得出結(jié)論。
但計算機的理解方式完全不同。它不會因為有人告訴它“這是一只貓”,就在遇到下一張相同或類似影像時,立該意識“這也是一只貓”。它的理解方式是機械的。它首先需要大量閱讀同一類型的影像,從中提取出同質(zhì)的特征,記憶、保存,直至它可以在遇到同類影像時,立刻做出識別。
但深度學習或者認知計算最大的不同,是計算機有能力自主地處理這一過程。人們需要做的,只是輸入數(shù)以百萬計的分類過的影像信息,然后等待它宣告學習完成。放在人類社會中,它就是一名優(yōu)等生,無須老師和家長的督促,也能自覺、快速地完成所布置的作業(yè)。錯誤自然也會出現(xiàn),但在一次次類似“考試”的檢測之后,準確率便會隨之提高。
為了訓練和培養(yǎng)Watson在癌癥診斷方面的能力,IBM與美國紀念斯隆-凱特琳癌癥中心合作,為Watson提供了最前沿的教材:醫(yī)院100多年來的癌癥臨床治療方面的實踐經(jīng)驗,以及基于美國國立綜合癌癥網(wǎng)絡(luò)而編制的治療指南。此外,還有美國44家醫(yī)療機構(gòu)的歷史癌癥治療案例。
Watson的主攻方向包括:肺癌、乳腺癌、胃癌、結(jié)腸癌、直腸癌、子宮頸癌等高發(fā)癌癥?!芭嘤枴?2年后,它已掌握了超過 290 種醫(yī)學專業(yè)期刊的全部內(nèi)容,超過200本腫瘤專著,超過1500萬頁的論文數(shù)據(jù),還有字典、百科全書、新聞、文學以及其他可以建立知識庫的參考材料。
但“培養(yǎng)”一名機器醫(yī)生也不是一帆風順的。2011年時,Watson的醫(yī)學知識水平還與醫(yī)學院二級學生的水平相當。3年后,Watson的疾病診斷率達到73%。
2017年,為檢驗Watson的診斷水平,北卡羅來納大學教堂山分校的耐德·沙普利斯博士研究了1000余名患者的數(shù)據(jù),發(fā)現(xiàn)在99%的病例中,Watson提出了與分子腫瘤專家團相同的治療建議。IBM旗下沃森健康(Watson Health)副總裁史蒂夫·哈維(Steve Harvey)先生介紹說,在30%的案例中,Watson還發(fā)現(xiàn)了癌癥專家錯過的一些細節(jié)。
帕姆66歲,患轉(zhuǎn)移性膀胱癌8年,嘗試過許多不同的療法,一直沒有痊愈。她已經(jīng)沒有什么選擇了。
醫(yī)生提出用Watson來幫忙,試圖去發(fā)現(xiàn)診斷中的一些醫(yī)生可能會忽略的東西。對于帕姆來說,也許,機器人醫(yī)生能帶來奇跡。
Watson看了上萬張腫瘤掃描的圖像,它們來自不同的病人。最后,在帕姆的腫瘤掃描片中,Watson標出了一段突變的基因。這是醫(yī)生之前沒有發(fā)現(xiàn)的。他們根據(jù)這個發(fā)現(xiàn)制訂了新的診療方案。
如今,這套使用在帕姆身上的方案已經(jīng)引入中國。中國是癌癥發(fā)病和死亡大國。全國腫瘤登記中心統(tǒng)計顯示,2015 年中國因癌癥死亡的病例超過200萬例,新增400余萬例,平均下來,每天的新增癌癥診斷病例約有1.2萬例。
“中國醫(yī)療健康領(lǐng)域面臨的一個突出挑戰(zhàn)是,優(yōu)質(zhì)健康醫(yī)療資源配置不均,除了要在政策和體制上想辦法之外,我們更要向科技創(chuàng)新要解決方案?!标惱杳魉懔讼拢耙粋€好的醫(yī)生的培養(yǎng)需要25到30年左右,但選擇工作時,他會首先選擇去大城市的三甲醫(yī)院工作,老少邊窮地區(qū)的醫(yī)療問題依然不能得到解決。”
中國試圖用遠程醫(yī)療來解決問題,然而遠距離診斷、治療和咨詢同樣會受到資源不足的限制,一個醫(yī)生一次只能面對一個病人。Watson的存在,或許能夠彌補這種局限。未來的Watson醫(yī)生,將會成為這樣一套通用系統(tǒng):看得懂醫(yī)學檢驗報告、醫(yī)學圖像資料,還能夠讀懂基因圖譜,甚至可以將當?shù)厣瞽h(huán)境和場景結(jié)合到對患者的診療過程中,最后給出一個或者多個診療建議。更妙的是,培養(yǎng)每一位醫(yī)生,都需要從零開始,但Watson能夠在不斷學習中不斷分身,同時學習和關(guān)注多種疾病。
Watson并不是IBM在認知計算方面與中國的唯一合作領(lǐng)域。2016年年初,羅睿蘭在一次演講中提出,IBM將轉(zhuǎn)型為“認知計算解決方案與云平臺公司”,自此,“認知計算”被提升到一個新的戰(zhàn)略高度,成為IBM市場戰(zhàn)略中最重要的關(guān)鍵詞。這也是Watson進軍中國最重要的背景。
2014年,IBM開始與北京市政府合作實施“綠色地平線”計劃。這是一項利用人工智能對大數(shù)據(jù)的分析和學習能力,對空氣質(zhì)量進行分析與預測的計劃。在計算機的輔助下,北京實現(xiàn)了提前72小時逐時高精度空氣質(zhì)量預報,還將空氣質(zhì)量變化趨勢預測分析的最長期限提高到10日。人類可以提前了解空氣污染的演變過程及影響,從而作出應(yīng)對措施。
類似的技術(shù)甚至可以應(yīng)用在時尚界。Watson曾與設(shè)計師張卉山合作,為李宇春設(shè)計了中國第一套“認知禮服”。這套禮服或許是中國時尚界最具科技含量的時裝了。Watson 分析了李宇春2013年以來每次出鏡的形象,同時閱讀了她全部的微博和上百萬條粉絲評論,最終建立了一個李宇春的“時尚形象”與粉絲及公眾評論之間的關(guān)聯(lián)模型,為設(shè)計師總結(jié)出來一整套“李宇春的時尚特質(zhì)”。設(shè)計師確定設(shè)計方向后,Watson瀏覽了30萬張圖片,根據(jù)設(shè)計師的構(gòu)思,從廓形、面料、顏色等方面分析,從中挑選了3000幅禮服圖片供設(shè)計師參考。
整個設(shè)計周期,只用了一個星期。
據(jù)IBM的預測,到2020年,全球每人每天產(chǎn)生的數(shù)據(jù)約為2.4GB。形象點說,每人每月生產(chǎn)的數(shù)據(jù)可以填滿一部64GiPhone手機。這其中,不再是以數(shù)字、符號類易于讀取的結(jié)構(gòu)化數(shù)據(jù)為主,大量是圖像、視頻等難以被量化、沒有固定的長度和格式的非結(jié)構(gòu)化數(shù)據(jù)。根據(jù)IBM的預測,2017年的非結(jié)構(gòu)化數(shù)據(jù)將占到數(shù)據(jù)總量的80%。以2015年全球智能手機用戶20億人計算,如此巨大的數(shù)據(jù),對于人工智能的計算能力是非常大的考驗。
許多企業(yè)也在預測到這種前景后謀求轉(zhuǎn)型升級。IBM與萬達的合作就是一個證明。從房地產(chǎn)轉(zhuǎn)型全面消費領(lǐng)域的萬達公司,打算快速把萬達所有產(chǎn)業(yè)與互聯(lián)網(wǎng)技術(shù)融合,帶動所有產(chǎn)業(yè)快速發(fā)展。萬達希望通過與IBM的合作實現(xiàn)互聯(lián)網(wǎng)化運營,同時優(yōu)化升級實體商業(yè)供應(yīng)鏈,并對大型商業(yè)中心的基礎(chǔ)設(shè)施做智能化聯(lián)接。
比如,在購物中心層面,利用Watson的認知計算能力,未來店面或許會遍布視覺傳感器、客流分析系統(tǒng)等技術(shù),可以實時輸出特定人群預警、定向營銷及服務(wù)建議、實時貨品調(diào)整提醒、以及用戶行為及消費分析報告。
而在餐飲行業(yè),智能排隊等位系統(tǒng)、室內(nèi)找位導航系統(tǒng),以及消費者用餐喜好推薦系統(tǒng),都將根據(jù)Watson獲得的數(shù)據(jù)得到優(yōu)化,進而提供更高效的服務(wù)?!叭f達將成為Watson在中國落地的重要的基礎(chǔ)設(shè)施?!标惱杳髡f。
并非一切都如此樂觀。大數(shù)據(jù)是人工智能與各領(lǐng)域契合的原料,也是人工智能前進的動力,然而是否將所有數(shù)據(jù)開放,是一個敏感話題。
“各個國家都存在數(shù)據(jù)孤島的問題,如何讓數(shù)據(jù)依法有序合規(guī)地開放,是行業(yè)治理命題。要想人工智能在特定的場景下發(fā)揮作用,僅靠IBM是做不了的?!标惱杳髡f。
收購相關(guān)數(shù)據(jù)公司是一個不錯的選擇。2015年4月,IBM宣布設(shè)立沃森健康(Watson Health)部門,同時收購了醫(yī)療分析公司Explorys與醫(yī)療管理軟件公司Phytel,以增強Watson在醫(yī)療領(lǐng)域的分析能力。
這年8月,IBM又以10億美元收購了醫(yī)療成像軟件公司Merge Healthcare,為Watson提供了海量的醫(yī)療圖像數(shù)據(jù)。如今Watson能夠識別許多病癥,與這筆收購獲得的數(shù)據(jù)有密不可分的關(guān)系。
陳黎明曾對媒體如此表示:“很多領(lǐng)域IBM的產(chǎn)品并不適合中國國情,但我想不去交流、不去溝通,永遠不知道可不可行,通過交流、互動,也許可以找到一些可行的方案?!?/p>
數(shù)據(jù)的開放與共享可以為人工智能帶來意想不到的發(fā)展?;氐结t(yī)學領(lǐng)域,或許可以試想這樣一個世界——手機將通過分析我們的通話狀態(tài)診斷是否患有阿爾茨海默病;浴缸將通過掃描對內(nèi)臟的健康狀況作出評估;方向盤可以通過駕駛中的微小行為斷定司機是否有帕金森癥;只要照一下鏡子,就可以了解自己的皮膚狀況。
抵達這個愿景的路程固然漫長,但我們畢竟已經(jīng)踏上了起點。