高遠,張仕娜,盛博洋,董云春,龐瑞涵,晏峻峰,彭清華
〔摘要〕 ChatGPT作為現(xiàn)象級產(chǎn)品受到廣泛關(guān)注,本文從數(shù)據(jù)的數(shù)量、質(zhì)量、驅(qū)動和保護4個方面,通過闡述ChatGPT的數(shù)據(jù)特點,引發(fā)中醫(yī)智能診斷研究中數(shù)據(jù)問題的思考。中醫(yī)智能診斷研究需要建立數(shù)據(jù)共享模式和中醫(yī)診斷的數(shù)據(jù)元標準,以解決中醫(yī)智能診斷研究中數(shù)據(jù)的數(shù)量和質(zhì)量問題。多學科團隊需要基于中醫(yī)診斷知識進行推理,并且需要大數(shù)據(jù)對中醫(yī)診斷知識推理規(guī)則調(diào)整參數(shù)、優(yōu)化算法,共同構(gòu)建融合知識與數(shù)據(jù)驅(qū)動方法,實現(xiàn)認知智能的中醫(yī)智能診斷系統(tǒng),以增強計算機推理結(jié)果的邏輯性和可解釋性。中醫(yī)學者在數(shù)據(jù)共享的同時,也要保護中醫(yī)診斷數(shù)據(jù)的版權(quán)與安全。這些數(shù)據(jù)關(guān)系人民與國家的數(shù)據(jù)安全,關(guān)系我國全民健康情況和我國衛(wèi)生事業(yè)的發(fā)展趨勢。
〔關(guān)鍵詞〕 ChatGPT;中醫(yī);人工智能;辨證;數(shù)據(jù);版權(quán);安全
〔中圖分類號〕R2? ? ? ?〔文獻標志碼〕A? ? ? ? 〔文章編號〕doi:10.3969/j.issn.1674-070X.2023.07.027
Thoughts on data issues in intelligent diagnosis research of
TCM prompted by ChatGPT
GAO Yuan1,2, ZHANG Shina1,2, SHENG Boyang1,2, DONG Yunchun1,3, PANG Ruihan1,3,
YAN Junfeng1,2,3*, PENG Qinghua1,2*
1. Hunan University of Chinese Medicine, Changsha, Hunan 410208, China; 2. Institute of TCM Diagnostics, Hunan University of Chinese Medicine, Changsha, Hunan 410208, China; 3. School of Informatics, Hunan University of Chinese Medicine, Changsha, Hunan 410208, China
〔Abstract〕 As a phenomenal product, ChatGPT has received widespread attention. This paper expounds the data features of ChatGPT from aspects of data quantity, quality, driving, and protection, prompting thoughts on data issues in intelligent diagnosis research of TCM. In order to solve the problems related with data quantity and quality in intelligent diagnosis research of TCM, it is necessary to establish data sharing model and data element standard for it. Furthermore, knowledge reasoning need to be conducted based on TCM diagnostic knowledge by multidisciplinary teams; big data is needed to adjust parameters and optimize algorithms for TCM diagnostic knowledge reasoning rules; TCM intelligent diagnostic systems should be jointly built to integrate knowledge and data-driven methods. The above measures help achieve cognitive intelligence and enhance the logic and interpretability of computer reasoning results. In addition, TCM academics should protect the copyright and security of TCM diagnostic data while sharing. These data determine the data security, and concern the health situation of Chinese people and the development of health service.
〔Keywords〕 ChatGPT; TCM; artificial intelligence; pattern differentiation; data; copyright; security
2022年底,美國OpenAI公司發(fā)布聊天機器人程序ChatGPT(Chat Generative Pre-trained Transformer)受到廣泛關(guān)注。Nature發(fā)表的論文中提到:ChatGPT作為對話式人工智能(artificial intelligence, AI)對科學來說是游戲規(guī)則改變者[1]。ChatGPT在對話中會保存使用者先前的對話信息,可根據(jù)之前的信息對當前問題做出即時的個性化回答。ChatGPT這種會話方式使得人機交互變得更簡單,極簡的交互方式體現(xiàn)了極高的智能水平,將會取代傳統(tǒng)關(guān)鍵詞搜索式人機交互,成為互聯(lián)網(wǎng)應(yīng)用領(lǐng)域的新高地,尤其是在醫(yī)療領(lǐng)域的應(yīng)用,前景廣闊。
AI技術(shù)已經(jīng)成為重要的醫(yī)療輔助工具[2]。計算機模仿人類思維的智能學,可以應(yīng)用于中醫(yī)診斷領(lǐng)域,彌補中醫(yī)診斷在客觀化、標準化方面的劣勢。中醫(yī)診斷是基于四診信息對人體的健康狀態(tài)和病變本質(zhì)進行辨識,做出概括性判斷[3]。中醫(yī)智能診斷是近年來智慧醫(yī)療領(lǐng)域的熱點之一,ChatGPT依靠數(shù)據(jù)、算法和算力的成功,成為數(shù)據(jù)驅(qū)動模式的現(xiàn)象級產(chǎn)品。程京院士曾指出:“無數(shù)據(jù)則無人工智能,數(shù)據(jù)是促進人工智能賦能中醫(yī)藥的重中之重?!盵4]《“十四五”中醫(yī)藥信息化發(fā)展規(guī)劃》基本原則指出:發(fā)揮數(shù)據(jù)作為新生產(chǎn)要素的關(guān)鍵作用,推進中醫(yī)藥數(shù)據(jù)的共享與安全[5]。因此,基于數(shù)據(jù)在中醫(yī)智能診斷研究的基礎(chǔ)性地位和推動性作用,本文通過闡述ChatGPT的數(shù)據(jù)特點,引發(fā)中醫(yī)智能診斷研究中數(shù)據(jù)問題的思考。
1 數(shù)據(jù)數(shù)量問題
1.1? ChatGPT擁有海量數(shù)據(jù)
ChatGPT看似突如其來,實則是依賴OpenAI公司長期的積累。ChatGPT通過學習大量的訓練數(shù)據(jù)(包括現(xiàn)成文本和對話集合)模擬人的語言,根據(jù)上下文語境,使用AI模型生成人類可以理解的自然語言[6],進而在人機交互過程中提供會話式服務(wù),如同人類流暢回答各種問題。ChatGPT基于8000億個單詞的語料庫作為訓練數(shù)據(jù),通過訓練數(shù)據(jù)學習、提取1750億個參數(shù)。隨著訓練數(shù)據(jù)的增加、模型參數(shù)的優(yōu)化,ChatGPT處理復(fù)雜自然語言的準確性將不斷提高[7]。2022年11月30日,ChatGPT開放公眾測試,在海量跨語種的數(shù)據(jù)支持下,ChatGPT的訓練參數(shù)將進一步調(diào)整優(yōu)化,下一代ChatGPT會有更優(yōu)秀的表現(xiàn)。
1.2? 中醫(yī)智能診斷研究需要建立數(shù)據(jù)共享模式
中醫(yī)智能診斷研究經(jīng)歷了從中醫(yī)專家系統(tǒng)到傳統(tǒng)機器學習再到現(xiàn)今大數(shù)據(jù)與深度學習探索的發(fā)展過程[8]。智能診斷研究需要全面、規(guī)范、準確地收集大量的人體四診及其辨識結(jié)果的數(shù)據(jù),數(shù)據(jù)包含文本、影像、音頻、脈搏波等類型。中醫(yī)學者往往以某位專家的臨床案例或者某醫(yī)院科室的病例作為研究基礎(chǔ),建立智能診斷系統(tǒng)。然而,每項研究的樣本數(shù)據(jù)不同,中醫(yī)學者也受到傳統(tǒng)師承思想的束縛,許多研究的原始數(shù)據(jù)未公開,以致后續(xù)的中醫(yī)學者難以重復(fù)驗證,難以基于前人的研究基礎(chǔ)展開新的研究,更難以實現(xiàn)多中心、大樣本的研究。缺乏多中心、大樣本數(shù)據(jù)是智能診斷研究所面臨的一大阻礙。
智能診斷研究應(yīng)跳出傳統(tǒng)中醫(yī)的經(jīng)驗性、模糊性的論述框架,利用AI技術(shù),基于中醫(yī)思維對患者進行個性化地病情判斷。要實現(xiàn)智能診斷的精準化和高效化,需要大量的四診及其辨識結(jié)果的數(shù)據(jù)支持,這些數(shù)據(jù)的共享將促進智能診斷研究的發(fā)展。目前,中醫(yī)界尚缺乏大樣本、公開的中醫(yī)診斷數(shù)據(jù)庫。因此,為實現(xiàn)優(yōu)質(zhì)中醫(yī)藥臨床病例資源的共享,中華中醫(yī)藥學會開發(fā)建設(shè)中國中醫(yī)藥臨床案例成果庫[9],截至2023年3月12日,共收錄935篇臨床案例,但還有待進一步發(fā)展。因此,開放共享的數(shù)據(jù)支持是中醫(yī)智能診斷發(fā)展的重要前提,實現(xiàn)資源合理配置,也是推動智慧醫(yī)療發(fā)展的必要條件之一。
2 數(shù)據(jù)質(zhì)量問題
2.1? ChatGPT擁有高質(zhì)量的數(shù)據(jù)標注
高質(zhì)量的數(shù)據(jù)標注是支持ChatGPT模型訓練的關(guān)鍵[10]。ChatGPT通過“預(yù)訓練語言模型”在大數(shù)據(jù)集上進行預(yù)訓練,專業(yè)的標注人員會對ChatGPT生成的回答進行標注、評估和反饋,給出一個針對回答的分數(shù)或者標簽,這些標注數(shù)據(jù)可以作為強化學習過程中的“獎勵函數(shù)”,用來指導(dǎo)ChatGPT的參數(shù)調(diào)整,使得輸出的文本符合人的認知[11]。數(shù)據(jù)標注的質(zhì)量和準確性是AI算法有效運行的關(guān)鍵[10],沒有高質(zhì)量的數(shù)據(jù)標注,就不會有如今ChatGPT的成功。
2.2? 中醫(yī)智能診斷研究需建立中醫(yī)診斷的數(shù)據(jù)元標準
數(shù)據(jù)標注是開發(fā)AI模型預(yù)處理的一部分,中醫(yī)診斷數(shù)據(jù)不僅包含了癥狀、體征和微觀參數(shù)等信息,還包含辨病、辨證等辨識結(jié)果。數(shù)據(jù)標注需要對這些數(shù)據(jù)添加標簽為AI模型指定上下文,幫助做出準確預(yù)測。許多企業(yè)和研究機構(gòu)推出了帶標注的公開數(shù)據(jù)集[10],然而,中醫(yī)診斷數(shù)據(jù)載體豐富,具有較強的主觀性,難以實現(xiàn)匯交融合,存在同名異義、異名同義、定義內(nèi)涵外延描述不規(guī)范和定量描述較隨意等現(xiàn)象[11-13]。因此,中醫(yī)診斷數(shù)據(jù)的準確、規(guī)范表達,是智能診斷研究面臨的一大難題。數(shù)據(jù)元是數(shù)據(jù)的基本單元,建立中醫(yī)診斷的數(shù)據(jù)元標準是智能診斷研究中數(shù)據(jù)共享和交換的基礎(chǔ),以方便研究人員開展規(guī)范化的數(shù)據(jù)標注工作。
3 數(shù)據(jù)驅(qū)動問題
3.1? ChatGPT主要是以數(shù)據(jù)驅(qū)動的AI模式
ChatGPT主要運用以數(shù)據(jù)驅(qū)動的深度學習、強化學習等模型開展人類思維的模擬工作。ChatGPT支持連續(xù)多輪對話,根據(jù)輸入語句,基于詞語序列的概率相關(guān)性分布進行建模,預(yù)測下一個時刻不同語句甚至語言集合出現(xiàn)的概率分布,自動生成答案。ChatGPT相較于以往自然語言處理模型,具有更強的生成能力。但在邏輯推理復(fù)雜的領(lǐng)域,ChatGPT缺乏邏輯推理能力,回答會出現(xiàn)缺乏人類常識的情況。因此,增強計算機推理結(jié)果的邏輯性和可解釋性是ChatGPT發(fā)展的方向,也對智能診斷研究具有重要啟示。
3.2? 中醫(yī)智能診斷研究需融合知識與數(shù)據(jù)驅(qū)動的AI模式
中醫(yī)智能診斷若僅運用數(shù)據(jù)驅(qū)動的AI模式,需要巨大的算力與資金支持[11],并且缺乏邏輯推理,導(dǎo)致結(jié)果的可解釋性較低,決策者難以信任辨識結(jié)果的可靠性。中醫(yī)辨證的核心是辨證知識的表示與推理[14],然而,知識表示與推理的方法雖然可解釋性強,但存在只能解決確定性問題的局限性,難以用于具有復(fù)雜性、非線性、模糊性的中醫(yī)診斷。因此,類比中醫(yī)師的成長過程,需要先學習中醫(yī)經(jīng)典以及中醫(yī)教材,掌握中醫(yī)診斷知識,基于中醫(yī)先驗知識進行中醫(yī)診斷推理訓練,在臨床中面對一定數(shù)量的患者,鞏固強化中醫(yī)診斷思維。從AI角度,張鈸院士等[15]通過闡述AI的發(fā)展歷程,認為知識驅(qū)動方法的AI模式和數(shù)據(jù)驅(qū)動方法的AI模式均具有局限性,未來AI的發(fā)展方向需要融合知識驅(qū)動與數(shù)據(jù)驅(qū)動的AI模式。
作為大數(shù)據(jù)時代的知識工程集大成者,知識圖譜為互聯(lián)網(wǎng)時代的數(shù)據(jù)知識化組織和智能應(yīng)用提供有效的解決方案[16]。中醫(yī)學者也意識到為了能對智能診斷研究獲得良好的理論依據(jù),將知識圖譜應(yīng)用于中醫(yī)診斷領(lǐng)域。通過對中醫(yī)知識以及臨床信息構(gòu)建知識圖譜,從而進行知識表示,運用知識推理對知識圖譜中實體關(guān)系進行推理,進而建立基于中醫(yī)知識圖譜的診斷模型[17]。有研究基于中醫(yī)電子病歷,構(gòu)建融合知識圖譜的多通道中醫(yī)辨證模型[18]。還有研究基于中醫(yī)知識圖譜的端到端模型,構(gòu)建中醫(yī)證候診斷決策系統(tǒng)[19],為中醫(yī)師提供決策支持。然而,中醫(yī)診斷體系具有復(fù)雜性、經(jīng)驗性和模糊性問題,并且中醫(yī)實體關(guān)系復(fù)雜,基于知識圖譜有限的推理還不能勝任中醫(yī)辨識的復(fù)雜過程。如何構(gòu)建中醫(yī)診斷知識推理模型,成為智能診斷研究的關(guān)鍵問題。融合知識驅(qū)動與數(shù)據(jù)驅(qū)動的知識表示和推理的認知圖譜,或許是實現(xiàn)人工智能從感知智能向認知智能演進的重要方法[20]。有研究實驗證明,認知圖譜問答模型優(yōu)于其他算法模型[21],智能診斷研究未來也能走認知圖譜的技術(shù)路線[22]。但這需要中醫(yī)學、數(shù)學、人工智能、復(fù)雜系統(tǒng)等多學科專家“多層表述,逐級定量,多次迭代,逐步近似”[23],共同構(gòu)建融合知識驅(qū)動與數(shù)據(jù)驅(qū)動方法實現(xiàn)認知智能的中醫(yī)智能診斷系統(tǒng)。
4 數(shù)據(jù)保護問題
4.1? ChatGPT涉及數(shù)據(jù)版權(quán)保護與安全保護問題
OpenAI公司主要通過網(wǎng)絡(luò)爬蟲技術(shù)獲得超過萬億單詞的公共語言數(shù)據(jù)集[11]。2022年11月30日,ChatGPT開放公眾測試,用戶在ChatGPT輸入的內(nèi)容以及用戶反饋,會為下一代ChatGPT提供迭代訓練數(shù)據(jù)。換而言之,ChatGPT為用戶提供便利的同時,也獲取了用戶的數(shù)據(jù)。并且OpenAI公司擁有的數(shù)據(jù)庫和服務(wù)器均在美國,連同處于美國的亞馬遜公司都警告員工不要與ChatGPT分享機密信息,因為ChatGPT的某些回復(fù)看起來與亞馬遜的內(nèi)部情況十分相似[24]。《華爾街日報》記者Francesco Marconi就公開指責OpenAI公司,未經(jīng)授權(quán)大量使用國外主流媒體的文章訓練ChatGPT模型,并且從未支付任何費用[25]。換言之,ChatGPT是通過爬取現(xiàn)成文本和對話集合進行數(shù)據(jù)訓練并創(chuàng)作,回答并未溯源原始引用出處或者標注根據(jù)何處改編,并且可能會篡改作者原意,誤導(dǎo)用戶。OpenAI公司并不否認ChatGPT的輸出結(jié)果會侵犯他人作品的版權(quán)[26]。因此,ChatGPT涉及數(shù)據(jù)版權(quán)保護與安全保護問題。
4.2? 中醫(yī)智能診斷研究的數(shù)據(jù)版權(quán)保護問題
版權(quán),亦稱“著作權(quán)”,指原創(chuàng)作者或組織對具有獨創(chuàng)性并能以一定形式表現(xiàn)的智力成果依法享有的權(quán)利,我國的著作權(quán)保護期為50年。若在著作權(quán)保護期內(nèi)未經(jīng)作者允許擅自使用,可能會損害原創(chuàng)作者的合法權(quán)益[27]。2018年4月國務(wù)院印發(fā)的《科學數(shù)據(jù)管理辦法》指出:數(shù)據(jù)使用者應(yīng)遵守知識產(chǎn)權(quán)規(guī)定,在工作中注明所使用和參考引用的數(shù)據(jù)[28]。多位專家針對ChatGPT帶來的版權(quán)問題展開討論,ChatGPT是在受版權(quán)保護的素材里訓練的語言模型,可能涉及侵犯他人的版權(quán)[29],并且未溯源原始引用出處。但現(xiàn)階段,也很難對人工智能生成物進行法律追究,未來是否對人工智能生成物采用版權(quán)保護還有待專家們的進一步討論。
數(shù)據(jù)在共享過程中涉及大量版權(quán)問題,國內(nèi)外很多高校都致力于數(shù)據(jù)版權(quán)的管理工作[30]。中醫(yī)診斷數(shù)據(jù)包括了中醫(yī)專家經(jīng)驗和臨床診療數(shù)據(jù),蘊含著實踐經(jīng)驗、診斷方法、治療方案和科研成果等方面的內(nèi)容,反映中醫(yī)藥的獨特優(yōu)勢和前沿成果。中醫(yī)診斷數(shù)據(jù)的收集、整理和應(yīng)用具有重要的意義和價值,可以推進中醫(yī)藥文化傳播、提高人民健康水平。由于中醫(yī)診斷數(shù)據(jù)承載了中華文化以及作者的智慧和心血,是一種知識產(chǎn)權(quán),應(yīng)該受到法律的保護。數(shù)據(jù)共享和版權(quán)保護二者之間存在沖突,但并不意味著不可調(diào)和,存在對立統(tǒng)一關(guān)系。數(shù)據(jù)共享和版權(quán)保護具有共同目標——促進知識創(chuàng)新和科技發(fā)展,實現(xiàn)數(shù)據(jù)生產(chǎn)者與使用者互利共贏[31]。
4.3? 中醫(yī)智能診斷研究的數(shù)據(jù)安全保護問題
數(shù)據(jù)泄露是指未經(jīng)授權(quán)或許可,數(shù)據(jù)被泄露的行為。我國“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃明確指出,數(shù)據(jù)是國家基礎(chǔ)性戰(zhàn)略資源[31]。中醫(yī)藥在現(xiàn)代醫(yī)療領(lǐng)域中占據(jù)重要地位。大數(shù)據(jù)時代,患者的個人診療信息經(jīng)整合與分析后,具有極高的價值。對于個體而言,中醫(yī)診斷數(shù)據(jù)可用于判斷人體狀態(tài),包含生理病理特點、體質(zhì)、病和證等方面的內(nèi)容。隨著數(shù)據(jù)的不斷增長,中醫(yī)診斷數(shù)據(jù)不僅可以從全局掌握我國全民健康情況,還可以預(yù)測我國衛(wèi)生事業(yè)的發(fā)展趨勢,甚至為非我國授權(quán)的研究提供數(shù)據(jù)支持。此外,ChatGPT的服務(wù)器在國外,在大數(shù)據(jù)環(huán)境下,如果中醫(yī)診斷數(shù)據(jù)被掌握在國外公司的手中,這些數(shù)據(jù)很難受到中國法律的保護,極易被非法使用,造成損失。這將對中醫(yī)藥文化的傳承和發(fā)展帶來不利影響,也可能危及我國的數(shù)據(jù)安全和國家利益。因此,必須加強對中醫(yī)藥數(shù)據(jù)的保護和管理,確保其合法合規(guī)使用,促進中醫(yī)藥事業(yè)的健康發(fā)展。
5 結(jié)語
ChatGPT作為新一代人工智能技術(shù),將對醫(yī)療領(lǐng)域帶來巨大影響。中醫(yī)師診斷過程中需要對望、聞、問、切四診信息進行分析,融合中醫(yī)知識與臨床案例相結(jié)合的思維方式,進行辨識。因此,中醫(yī)智能診斷研究也需要基于中醫(yī)診斷規(guī)則與數(shù)據(jù)迭代,對影像、音頻、文字、脈搏波等四診信息進行多模態(tài)信息融合。OpenAI發(fā)布ChatGPT-4是大型多模態(tài)AI模型(接受圖像和文本輸入、文本輸出),ChatGPT的更新迭代速度十分迅速,已經(jīng)超乎想象。ChatGPT的數(shù)據(jù)特點是成功因素之一,中醫(yī)智能診斷研究可以從ChatGPT的成功獲得啟迪。因此,中醫(yī)智能診斷研究需要建立數(shù)據(jù)共享模式和中醫(yī)診斷的數(shù)據(jù)元標準,以解決中醫(yī)智能診斷研究的數(shù)據(jù)數(shù)量和質(zhì)量問題。多學科團隊需要基于中醫(yī)診斷知識進行知識推理,并且需要大數(shù)據(jù)支持對診斷知識的推理規(guī)則調(diào)整參數(shù)、優(yōu)化算法,共同構(gòu)建融合知識與數(shù)據(jù)驅(qū)動方法,實現(xiàn)認知智能的智能診斷系統(tǒng),以增強計算機推理結(jié)果的邏輯性和可解釋性。
ChatGPT為人們帶來便利的同時,數(shù)據(jù)版權(quán)與安全保護問題也需要引起足夠的思考。一方面,中醫(yī)診斷數(shù)據(jù)包括中醫(yī)專家診斷經(jīng)驗和臨床診療數(shù)據(jù),蘊含著實踐經(jīng)驗、診斷方法、治療方案和科研成果等方面的內(nèi)容,承載了中華文化以及作者的智慧和心血;另一方面,數(shù)據(jù)是國家基礎(chǔ)性戰(zhàn)略資源,關(guān)系人民與國家的數(shù)據(jù)安全,反映我國全民健康情況和我國衛(wèi)生事業(yè)的發(fā)展趨勢。因此,未來需要培養(yǎng)中醫(yī)學者的數(shù)據(jù)保護意識,加強數(shù)據(jù)安全人才隊伍建設(shè),加大經(jīng)費投入數(shù)據(jù)保護,建立健全數(shù)據(jù)保護的法律法規(guī),加強對中醫(yī)藥數(shù)據(jù)的管理和監(jiān)管,共同促進中醫(yī)藥信息化發(fā)展,為中醫(yī)藥現(xiàn)代化插上騰飛的翅膀。
參考文獻
[1] VAN DIS E A M, BOLLEN J, ZUIDEMA W, et al. ChatGPT: Five priorities for research[J]. Nature, 2023, 614(7947): 224-226.
[2] DUAN Y Y, LIU P R, HUO T T, et al. Application and development of intelligent medicine in traditional Chinese medicine[J]. Current Medical Science, 2021, 41(6): 1116-1122.
[3] 李燦東. 中醫(yī)診斷學[M]. 4版. 北京: 中國中醫(yī)藥出版社, 2016: 202-205.
[4] 林靜怡, 李詩翩, 郭? 義, 等. 人工智能助力中醫(yī)藥發(fā)展現(xiàn)狀、問題及建議[J]. 世界中醫(yī)藥, 2022, 17(6): 864-867.
[5] 國家中醫(yī)藥管理局. “十四五”中醫(yī)藥信息化發(fā)展規(guī)劃[EB/OL].(2022-11-25)[2023-02-18]. http://www.natcm.gov.cn/guicaisi/zhengcewenjian/2022-12-05/28427.html.
[6] 馮志偉, 張燈柯, 饒高琦. 從圖靈測試到ChatGPT: 人機對話的里程碑及啟示[J]. 語言戰(zhàn)略研究, 2023, 8(2): 20-24.
[7] 齊? 旭, 劉? 晶, 宋? 婧. 沒有百億參數(shù)的大模型,不敢奢談ChatGPT[EB/OL].(2023-02-24)[2023-02-25]. https://www.sohu.com/a/645375330_121134737.
[8] 文志華, 夏帥帥, 劉東波, 等. 中醫(yī)智能辨證診斷技術(shù)的演進與問題探討[J]. 世界科學技術(shù)(中醫(yī)藥現(xiàn)代化), 2021, 23(11): 4298-4304.
[9] 中醫(yī)藥發(fā)展研究.中國中醫(yī)藥臨床案例成果庫第一批案例成功入庫[EB/OL].(2020-02-26)[2022-01-05]. https://mp.weixin.qq.com/s/RUAqoEL0zQlI-Hfbd_AwyA.
[10] 蔡? 莉, 王淑婷, 劉俊暉, 等. 數(shù)據(jù)標注研究綜述[J]. 軟件學報, 2020, 31(2): 302-320.
[11] 李新龍, 黃培冬, 朱? 爽, 等. 智能化挖掘中醫(yī)臨床診療數(shù)據(jù)面臨的問題和挑戰(zhàn)[J]. 中華中醫(yī)藥雜志, 2022, 37(12): 6962-6965.
[12] 王天芳, 李燦東, 朱文鋒. 中醫(yī)四診操作規(guī)范專家共識[J]. 中華中醫(yī)藥雜志, 2018, 33(1): 185-192.
[13] 肖曉霞, 晏峻峰, 劉東波, 等. 中醫(yī)臨床癥狀數(shù)據(jù)元提取探析(英文)[J]. 數(shù)字中醫(yī)藥(英文), 2018(1): 37-46.
[14] 韋昌法, 晏峻峰. 從知識表示與推理方法探討中醫(yī)數(shù)字辨證發(fā)展[J]. 中華中醫(yī)藥雜志, 2019, 34(10): 4471-4473.
[15] 張? 鈸, 朱? 軍, 蘇? 航. 邁向第三代人工智能[J]. 中國科學(信息科學), 2020, 50(9): 1281-1302.
[16] 王? 萌, 王昊奮, 李博涵, 等. 新一代知識圖譜關(guān)鍵技術(shù)綜述[J]. 計算機研究與發(fā)展, 2022, 59(9): 1947-1965.
[17] 韋昌法, 羅麗琴, 晏峻峰. 中醫(yī)數(shù)字辨證配套醫(yī)案智能采集與分析系統(tǒng)構(gòu)建研究[J]. 湖南中醫(yī)藥大學學報, 2020, 40(1): 70-74.
[18] 葉? 青, 張素華, 程春雷, 等. 融合知識圖譜的多通道中醫(yī)辨證模型[J]. 科學技術(shù)與工程, 2022, 22(21): 9190-9198.
[19] YANG R, YE Q, CHENG C L, et al. Decision-making system for the diagnosis of syndrome based on traditional Chinese medicine knowledge graph[J]. Evidence-Based Complementary and Alternative Medicine, 2022, 2022: 1-9.
[20] 徐? 菁. 《人工智能之認知圖譜》重磅發(fā)布[EB/OL].(2020-08-28)[2022-02-25]. https://www.aminer.cn/research_report/5f48541f3c99ce0ab7bca8fc?download=false.
[21] 袁? 滿, 張維罡, 李明軒. 基于認知圖譜的智能問答系統(tǒng)推理模型研究[J]. 吉林大學學報(信息科學版), 2021, 39(5): 589-595.
[22] 唐恒安, 唐三歌, 唐志書. 論中醫(yī)思想體系的第二次抽象[J]. 中華中醫(yī)藥雜志, 2022, 37(9): 4897-4902.
[23] 佘振蘇, 倪志勇. 人體復(fù)雜系統(tǒng)科學探索[M]. 北京: 科學出版社, 2012: 63.
[24] 網(wǎng)易科技報道.亞馬遜警告員工不要向ChatGPT分享機密,包括正在寫的代碼[EB/OL].(2023-01-25)[2023-02-25].https://www.163.com/tech/article/HRUIJJNU00097U7T.html.
[25] Francesco Marconi. ChatGPT is trained on a large amount of news data from top sources that fuel its AI[EB/OL].(2023-02-15)[2023-02-25].https://twitter.com/fpmarconi/status/1625867414410825728?cxt=HHwWgMC4_ZLznpAtAAAA.
[26] 康添雄. ChatGPT產(chǎn)生版權(quán)糾紛的可能與不可能[EB/OL].(2023-02-20)[2023-02-25]. https://column.chinadaily.com.cn/a/202302/20/WS63f31b7ba3102ada8b22fc56.html.
[27] 中國人大網(wǎng).中華人民共和國著作權(quán)法[EB/OL].(2020-11-19)[2023-02-20].http://www.npc.gov.cn/npc/c30834/202011/848e73f58d4e4c5b82f69d25d46048c6.shtml.
[28] 國務(wù)院辦公廳. 國務(wù)院辦公廳關(guān)于印發(fā)科學數(shù)據(jù)管理辦法的通知[EB/OL].(2018-04-04)[2023-02-20].https://most.gov.cn/xxgk/xinxifenlei/fdzdgknr/fgzc/gfxwj/gfxwj2018/201804/t20180404_139023.html.
[29] 趙新樂,朱麗娜. ChatGPT爆火,帶來哪些版權(quán)問題?[EB/OL].(2023-02-16)[2023-02-25].https://ie.bjd.com.cn/5b165687a010550e5ddc0e6a/contentApp/5b16573ae4b02a9fe2d558f9/AP63ed97e4e4b03a6b6edc4a1c?isshare=1.
[30] 尹夢茹. 高??茖W數(shù)據(jù)的數(shù)字版權(quán)管理研究[J]. 圖書館研究, 2022, 52(2): 1-8.
[31] 工業(yè)和信息化部. 工業(yè)和信息化部關(guān)于印發(fā)“十四五”大數(shù)據(jù)產(chǎn)業(yè)發(fā)展規(guī)劃的通知[EB/OL].(2021-11-30)[2023-02-25]. https://twitter.com/fpmarconi/status/1625867414410825728?cxt=HHwWgMC4_ZLznpAtAAAA.
(本文編輯? 匡靜之)