張配豪
能不能打造一個(gè)“機(jī)器人全科醫(yī)生”?它通過(guò)人工智能更好地為醫(yī)療服務(wù),讓老百姓更加便捷、精準(zhǔn)地就診,讓醫(yī)生從繁雜的重復(fù)勞動(dòng)中解放出來(lái)。
看履歷,80后的張超運(yùn)氣不錯(cuò)。數(shù)學(xué)專(zhuān)業(yè)本科畢業(yè)之后順利保研,研究生期間有幸被交換到了新加坡國(guó)立大學(xué),開(kāi)始與“互聯(lián)網(wǎng)人工智能”正式結(jié)緣,畢業(yè)之后即成功拿到百度的offer,后來(lái)成為一名做到百度自然語(yǔ)言處理部資深研發(fā)工程師、文本知識(shí)挖掘方向負(fù)責(zé)人。
但是,和大多數(shù)“醫(yī)療”領(lǐng)域創(chuàng)客不同,他之前與醫(yī)學(xué)并無(wú)任何淵源,卻創(chuàng)立了“康夫子”智能診療系統(tǒng)。他希望未來(lái)能打造出“機(jī)器人全科醫(yī)生”,通過(guò)人工智能更好地為醫(yī)療服務(wù),讓老百姓更加便捷、精準(zhǔn)地就診,讓醫(yī)生從繁雜的勞動(dòng)中解放出來(lái)。
初次創(chuàng)業(yè),走了彎路
2014年底,已經(jīng)在百度工作了五個(gè)年頭的張超,“不想讓謹(jǐn)慎把激情給磨沒(méi)了”,他開(kāi)始對(duì)創(chuàng)業(yè)躍躍欲試。
有了創(chuàng)業(yè)的念頭,人的大腦往往會(huì)不自覺(jué)地捕捉商機(jī),而靈感有時(shí)候就來(lái)自日常?!坝卸螘r(shí)間我比較忙,太太發(fā)現(xiàn)我有掉頭發(fā)的跡象,于是建議我多吃點(diǎn)黑芝麻,可能會(huì)有幫助。出于好奇心和職業(yè)本能,我當(dāng)即在百度搜了一下——黑芝麻的營(yíng)養(yǎng)與功效。不搜不知道一搜嚇一跳,我發(fā)現(xiàn)醫(yī)療健康類(lèi)問(wèn)題往往在百度上會(huì)翻看很多頁(yè)結(jié)果,但呈現(xiàn)的內(nèi)容實(shí)際上良莠不齊。當(dāng)時(shí)我就想,能不能用我的技術(shù)提供一個(gè)更好的解決方案呢?”
經(jīng)過(guò)一段時(shí)間的思考,張超產(chǎn)生了利用人工智能代替網(wǎng)民整理頁(yè)面的有效信息,以提升用戶體驗(yàn)的想法。于是,他拉著幾個(gè)關(guān)系不錯(cuò)的哥們兒,走上創(chuàng)業(yè)之路。而百度的標(biāo)簽讓張超和小伙伴們?cè)谵o職創(chuàng)業(yè)之初便獲得了來(lái)自唯獵資本的種子輪投資。
當(dāng)時(shí)他們瞄準(zhǔn)的是對(duì)營(yíng)養(yǎng)最為看重的一個(gè)群體——孕婦人群來(lái)構(gòu)建知識(shí)圖譜,團(tuán)隊(duì)以孕婦的飲食分析為切入口,上線孕食App。推出了一個(gè)“飲食記錄分析”的功能,用戶記錄飲食情況后,系統(tǒng)根據(jù)內(nèi)化的營(yíng)養(yǎng)學(xué)知識(shí)圖譜輸出分析報(bào)告以及飲食建議。
但這次嘗試沒(méi)有成功,而是以失敗告終:“首先,市場(chǎng)需求把握地不太準(zhǔn)確,營(yíng)養(yǎng)類(lèi)的東西并不是剛需。其次,這個(gè)生意就算可以做也做不成一個(gè)大生意,不符合團(tuán)隊(duì)的野心。另外這個(gè)項(xiàng)目和技術(shù)匹配度不是很高,人工智能的發(fā)揮空間不大。”這是張超后來(lái)總結(jié)的教訓(xùn)。
“全科醫(yī)生”指明轉(zhuǎn)型方向
時(shí)間到了2015年底,經(jīng)過(guò)一個(gè)春節(jié)假期的休整,團(tuán)隊(duì)開(kāi)始思考如何轉(zhuǎn)型的問(wèn)題。
接下來(lái)到底做什么,文本分析、知識(shí)圖譜構(gòu)建是團(tuán)隊(duì)的強(qiáng)項(xiàng),健康領(lǐng)域也是團(tuán)隊(duì)一直比較看好的方向。張超和小伙伴都陷入了迷茫,每天都在思考:“如果飲食建議不是剛需,看病該是剛需了吧?!焙髞?lái)基本上定了一個(gè)方向——輔助醫(yī)生。
那段時(shí)間,張超和小伙伴隔三差五往醫(yī)院跑,有時(shí)候假裝患者去“窺探”一下醫(yī)生的工作流程,或者找認(rèn)識(shí)的醫(yī)生朋友尋求建議。團(tuán)隊(duì)也會(huì)幫一些醫(yī)療文獻(xiàn)機(jī)構(gòu)梳理文本,跑跑數(shù)據(jù)。實(shí)地調(diào)研之后他就蒙著頭朝這個(gè)方向想,把看病的環(huán)節(jié)都想了一遍,從剛開(kāi)始掛號(hào)到醫(yī)生診斷、開(kāi)藥,腦子里零零碎碎拼湊了一些產(chǎn)品的功能,直到閃過(guò)到一個(gè)詞——“全科醫(yī)生”。
在分級(jí)診療中,“科科通”的全科醫(yī)生承擔(dān)著“健康守門(mén)人”的角色,然而中國(guó)的全科醫(yī)生還較為緊缺。截至2016年年底,全國(guó)累計(jì)招收規(guī)范化培養(yǎng)全科醫(yī)生3.7萬(wàn)人,培訓(xùn)合格的全科醫(yī)生共有20.9萬(wàn)人,不足醫(yī)生總數(shù)的7%,而在歐美發(fā)達(dá)國(guó)家,這一比例約為30%。這一社會(huì)現(xiàn)狀終于讓張超看到了創(chuàng)業(yè)的機(jī)會(huì)——打造人工智能與醫(yī)療相結(jié)合的“機(jī)器人全科醫(yī)生”。
“這個(gè)機(jī)器人不提供診療服務(wù),而是提供分診導(dǎo)診服務(wù)。計(jì)算機(jī)在消化被喂養(yǎng)的飼料即醫(yī)療文獻(xiàn)、論文、病例等后,在內(nèi)部構(gòu)建知識(shí)圖譜,針對(duì)病人輸出初步的自診報(bào)告以及就診醫(yī)院、科室建議;針對(duì)醫(yī)生,則可以輸出臨床決策輔助報(bào)告,以提高醫(yī)生的診斷效率。醫(yī)生每天要大量的重復(fù)性勞動(dòng),全國(guó)有那么多診所,只要有一部分用,就已經(jīng)很了不起了?!睆埑瑢?duì)記者說(shuō)。
“機(jī)器人全科醫(yī)生”該怎樣煉成
切到了一個(gè)痛點(diǎn)比較明確的醫(yī)療入口。接下來(lái)要做的就是讓機(jī)器人做全科醫(yī)生讓機(jī)器人像醫(yī)生一樣去學(xué)習(xí)。
對(duì)此,張超表示,康夫子智能診斷是經(jīng)過(guò)3大步驟訓(xùn)練出來(lái)的。
第一步是知識(shí)抽取。就好像一個(gè)醫(yī)學(xué)專(zhuān)業(yè)的學(xué)生要在學(xué)校學(xué)習(xí)足夠的知識(shí)之后再去醫(yī)院實(shí)習(xí)。讓計(jì)算機(jī)閱讀理解海量醫(yī)療文獻(xiàn),抽取針對(duì)某種知識(shí)總結(jié)出上萬(wàn)條書(shū)寫(xiě)規(guī)律。如針對(duì)”疾病<—>癥狀”的關(guān)系,文獻(xiàn)中描述方式為:“(X疾病)的癥狀有(Y癥狀)”,“(X疾?。┡R床表現(xiàn)為(Y癥狀)”,“(X疾?。┤菀滓穑╕癥狀)等不適癥狀”等等?!爸R(shí)規(guī)律”自動(dòng)發(fā)現(xiàn)技術(shù)和高性能抽取工具,正是康夫子的技術(shù)壁壘。
第二步是邏輯和經(jīng)驗(yàn)。就是解決如何將學(xué)到的知識(shí)融會(huì)貫通的問(wèn)題。在計(jì)算機(jī)吸收了疾病、癥狀、檢驗(yàn)結(jié)果、醫(yī)院、醫(yī)生、誘因、遺傳史、過(guò)敏史等不同種類(lèi)的知識(shí)點(diǎn)之后,需要對(duì)其中的關(guān)系進(jìn)行邏輯推理。如某種疾病包含某種癥狀,某種疾病由某個(gè)誘因產(chǎn)生等。
第三步是語(yǔ)意。與患者溝通的能力,也是一個(gè)醫(yī)生所必須具備的能力。即醫(yī)學(xué)專(zhuān)業(yè)術(shù)語(yǔ)與大眾語(yǔ)言的對(duì)應(yīng),所以要對(duì)話交互。在對(duì)話交互上,嘗試從病情描述、醫(yī)患交互等數(shù)據(jù)中還原醫(yī)患對(duì)話邏輯,并借助深度學(xué)習(xí)技術(shù)連接患者通俗語(yǔ)言和醫(yī)療專(zhuān)業(yè)化表述。比如“厭食”屬于醫(yī)學(xué)專(zhuān)業(yè)術(shù)語(yǔ),對(duì)應(yīng)的大眾語(yǔ)言是“吃不下飯”。
打鐵還組自身硬,縷清思路之后,關(guān)鍵得有靠譜的團(tuán)隊(duì)。張超對(duì)靠譜有一套衡量指標(biāo),他稱為“熟練工種的數(shù)量”,即團(tuán)隊(duì)中有多少人在該領(lǐng)域有深厚的技術(shù)積累。康夫子團(tuán)隊(duì)中聯(lián)合創(chuàng)始人張沖是前百度高級(jí)研發(fā)工程師,擁有豐富的架構(gòu)、工程開(kāi)發(fā)經(jīng)驗(yàn);技術(shù)合伙人栗曉華是前百度NLP高級(jí)研發(fā)工程師、前Quiexy高級(jí)數(shù)據(jù)科學(xué)家,擁有豐富自然語(yǔ)言處理、機(jī)器學(xué)習(xí)等領(lǐng)域工作經(jīng)驗(yàn);醫(yī)學(xué)總監(jiān)鄭雪怡,畢業(yè)于北京大學(xué)醫(yī)學(xué)部,臨床8年專(zhuān)業(yè)博士,北京大學(xué)第一醫(yī)院住院醫(yī)師3年經(jīng)歷,積累了豐富的專(zhuān)業(yè)經(jīng)驗(yàn)。
步入正軌,大步向前
找到剛需,擁有技術(shù)壁壘,團(tuán)隊(duì)靠譜。于是,天時(shí)地利人和。之后的康夫子正式步入正軌,進(jìn)入快速發(fā)展階段。
2016年3月份,康夫子開(kāi)始為B端提供知識(shí)和技術(shù)服務(wù),而他們也從原來(lái)的“飲食建議服務(wù)商”轉(zhuǎn)向成為“醫(yī)療人工智能技術(shù)、知識(shí)、數(shù)據(jù)提供商”。
2016下半年,人工智能加醫(yī)療健康成為熱門(mén)賽道,張超感受到了資本的熱情,有很多投資人找到康夫子團(tuán)隊(duì)。2016年10月,僅有5個(gè)人的康夫子獲晨興資本天使輪投資,團(tuán)隊(duì)已擴(kuò)充至近二十人。
2016年12月份,康夫子開(kāi)始該技術(shù)的推廣應(yīng)用,目前已與4家機(jī)構(gòu)談成合作,系統(tǒng)已在四家醫(yī)院內(nèi)測(cè)。預(yù)計(jì)今年年中,合作機(jī)構(gòu)會(huì)擴(kuò)大到10家左右。
截至目前,康夫子智能診療系統(tǒng)已吸收2000多萬(wàn)本醫(yī)療文獻(xiàn)、超400萬(wàn)份病例報(bào)告,可在其中提取50%~90%的知識(shí)點(diǎn)(根據(jù)內(nèi)容復(fù)雜程度有所差別),知識(shí)準(zhǔn)確率超過(guò)99%,覆蓋3000種常見(jiàn)疾病。
“實(shí)際上,目前對(duì)常見(jiàn)病典型癥狀的命中率已超過(guò)90%,超過(guò)對(duì)標(biāo)公司梅奧醫(yī)療集團(tuán)的癥狀診斷工具symptom checker10個(gè)百分點(diǎn)。當(dāng)然,我們的人工智能思維模型會(huì)越來(lái)越好。因?yàn)橥ㄟ^(guò)醫(yī)生的反饋,我們會(huì)不斷修復(fù)、不斷二次學(xué)習(xí)?!贝藭r(shí)的張超,臉上洋溢著自豪和對(duì)未來(lái)的憧憬。