隨著人工智能技術(shù)在醫(yī)療領(lǐng)域的深度滲透,如何有效整合前沿算法與領(lǐng)域知識(shí),構(gòu)建精準(zhǔn)、可解釋、可落地的智能系統(tǒng),成為行業(yè)的核心挑戰(zhàn)。華為云醫(yī)療智能體(EIHealth)團(tuán)隊(duì)的技術(shù)專(zhuān)家蘇嘉及其團(tuán)隊(duì),在這一方向上進(jìn)行了深入探索與實(shí)踐,提出了整合大規(guī)模預(yù)訓(xùn)練語(yǔ)言模型與醫(yī)療知識(shí)圖譜的創(chuàng)新路徑,以打造新一代的醫(yī)療推理與信息系統(tǒng)集成服務(wù)。
一、 技術(shù)融合的核心價(jià)值:能力互補(bǔ)
傳統(tǒng)醫(yī)療AI系統(tǒng)往往面臨兩大瓶頸:
- 數(shù)據(jù)稀疏與冷啟動(dòng)問(wèn)題:高質(zhì)量的標(biāo)注醫(yī)療數(shù)據(jù)稀缺且獲取成本高,限制了監(jiān)督學(xué)習(xí)模型的性能上限。
- 缺乏深度推理與可解釋性:純粹的統(tǒng)計(jì)模型雖在模式識(shí)別上表現(xiàn)出色,但難以進(jìn)行符合醫(yī)學(xué)邏輯的因果推理,其“黑箱”特性也讓臨床醫(yī)生難以信任。
蘇嘉團(tuán)隊(duì)提出的融合方案,正是為了破解這些難題:
- 預(yù)訓(xùn)練語(yǔ)言模型(如盤(pán)古NLP大模型):通過(guò)海量無(wú)標(biāo)注文本(醫(yī)學(xué)文獻(xiàn)、電子病歷等)進(jìn)行預(yù)訓(xùn)練,吸收了豐富的醫(yī)學(xué)語(yǔ)言模式與事實(shí)知識(shí),具備強(qiáng)大的語(yǔ)義理解與生成能力,能有效應(yīng)對(duì)數(shù)據(jù)稀疏問(wèn)題,并作為通用的醫(yī)學(xué)信息處理基座。
- 醫(yī)療知識(shí)圖譜:將結(jié)構(gòu)化的醫(yī)學(xué)知識(shí)(疾病、癥狀、藥品、檢查、基因、診療路徑等)以及它們之間的復(fù)雜關(guān)系(導(dǎo)致、治療、禁忌等)以圖的形式進(jìn)行系統(tǒng)化表征。它提供了準(zhǔn)確的領(lǐng)域先驗(yàn)知識(shí)、明確的邏輯關(guān)系,是支撐深度推理與保證結(jié)果可解釋性的基石。
二者的結(jié)合,實(shí)現(xiàn)了 “隱式知識(shí)”與“顯式知識(shí)” 、 “數(shù)據(jù)驅(qū)動(dòng)”與“知識(shí)驅(qū)動(dòng)” 的優(yōu)勢(shì)互補(bǔ),讓系統(tǒng)既擁有大模型的泛化與語(yǔ)言能力,又具備圖譜的精準(zhǔn)與推理能力。
二、 整合架構(gòu)與關(guān)鍵技術(shù)
蘇嘉在分享中闡述了華為云實(shí)踐中的典型整合架構(gòu):
- 協(xié)同的表示學(xué)習(xí):
- 將知識(shí)圖譜中的實(shí)體、關(guān)系信息注入預(yù)訓(xùn)練模型的微調(diào)過(guò)程,使模型在理解文本時(shí),能同時(shí)激活并關(guān)聯(lián)圖譜中的結(jié)構(gòu)化知識(shí)。例如,在模型編碼時(shí),除了文本Token,也引入對(duì)應(yīng)實(shí)體的嵌入表示。
- 利用預(yù)訓(xùn)練模型強(qiáng)大的上下文表征能力,反過(guò)來(lái)對(duì)知識(shí)圖譜進(jìn)行補(bǔ)全與質(zhì)量提升,發(fā)現(xiàn)潛在的新關(guān)系或糾錯(cuò)。
- “模型+圖譜”的混合推理引擎:
- 檢索增強(qiáng):當(dāng)預(yù)訓(xùn)練模型接到一個(gè)查詢(xún)(如“患者咳嗽、發(fā)熱三天,可能是什么原因?”),首先從知識(shí)圖譜中檢索出相關(guān)的實(shí)體和子圖(涉及“上呼吸道感染”、“肺炎”、“流感”等疾病及其相關(guān)癥狀、檢查)。
- 交互與推理:將檢索到的結(jié)構(gòu)化知識(shí)與大模型對(duì)原始query的深度理解相結(jié)合,共同輸入到一個(gè)推理模塊中。大模型負(fù)責(zé)復(fù)雜的語(yǔ)義解析和語(yǔ)境融合,知識(shí)圖譜則提供邏輯約束和推理路徑。例如,模型可以沿著圖譜的“并發(fā)癥”關(guān)系鏈進(jìn)行多跳推理,并結(jié)合患者年齡、病史等上下文生成診斷建議。
- 可解釋輸出:系統(tǒng)不僅能給出結(jié)論(如“疑似社區(qū)獲得性肺炎”),還能生成基于知識(shí)圖譜路徑的自然語(yǔ)言解釋?zhuān)ㄈ纭耙驗(yàn)榘Y狀A(yù)和B常共同指向疾病C,且檢查D結(jié)果支持這一判斷”),并高亮相關(guān)的知識(shí)圖譜證據(jù)。
- 面向信息系統(tǒng)集成的服務(wù)化封裝:
- 華為云將上述融合能力封裝成標(biāo)準(zhǔn)的云服務(wù)(API、SDK)或行業(yè)解決方案,以便無(wú)縫集成到醫(yī)院現(xiàn)有的信息系統(tǒng)中,如電子病歷系統(tǒng)、臨床決策支持系統(tǒng)、影像歸檔系統(tǒng)等。
- 支持私有化部署,保障敏感的醫(yī)療數(shù)據(jù)不出院,同時(shí)享受云端持續(xù)迭代的算法能力。
- 提供從數(shù)據(jù)治理、知識(shí)圖譜構(gòu)建、模型微調(diào)到應(yīng)用開(kāi)發(fā)的全鏈路工具鏈,降低醫(yī)療機(jī)構(gòu)的應(yīng)用門(mén)檻。
三、 在醫(yī)療信息系統(tǒng)集成中的典型應(yīng)用場(chǎng)景
- 智能輔助診斷與鑒別診斷:集成到醫(yī)生工作站,在書(shū)寫(xiě)病歷時(shí)實(shí)時(shí)分析患者主訴、病史、檢查結(jié)果,從知識(shí)圖譜支持的巨大疾病譜中快速篩選并排序可能診斷,給出推理依據(jù)。
- 個(gè)性化治療方案推薦:結(jié)合患者的個(gè)體化信息(基因型、過(guò)敏史、合并癥等),在診療規(guī)范知識(shí)圖譜的約束下,利用模型生成個(gè)性化的用藥、手術(shù)或康復(fù)方案建議。
- 醫(yī)療問(wèn)答與患者服務(wù):賦能醫(yī)院客服機(jī)器人或患者門(mén)戶(hù),提供精準(zhǔn)、安全的健康咨詢(xún),回答關(guān)于疾病、藥品、醫(yī)保政策等復(fù)雜問(wèn)題,答案均源自權(quán)威知識(shí)圖譜,并由大模型生成流暢回復(fù)。
- 臨床科研與文獻(xiàn)挖掘:集成到科研平臺(tái),幫助研究人員從海量文獻(xiàn)中快速提取藥物相互作用、疾病關(guān)聯(lián)等新知識(shí),用于豐富和更新知識(shí)圖譜,形成閉環(huán)迭代。
四、 挑戰(zhàn)與未來(lái)展望
蘇嘉也指出了當(dāng)前面臨的挑戰(zhàn):醫(yī)療知識(shí)圖譜的構(gòu)建與維護(hù)成本高昂;超大規(guī)模模型的計(jì)算開(kāi)銷(xiāo)與實(shí)時(shí)性平衡;以及最終臨床落地需要嚴(yán)格的合規(guī)性驗(yàn)證。
華為云蘇嘉團(tuán)隊(duì)將繼續(xù)深化這一融合方向,探索更高效的知識(shí)-模型對(duì)齊技術(shù)、更輕量級(jí)的部署方案,并推動(dòng)在區(qū)域醫(yī)聯(lián)體、公共衛(wèi)生預(yù)警等更復(fù)雜場(chǎng)景中的集成應(yīng)用。其目標(biāo)是構(gòu)建一個(gè) “懂語(yǔ)言、通知識(shí)、善推理、可信任” 的醫(yī)療人工智能底座,通過(guò)云端服務(wù)的形式,賦能千行百業(yè)的醫(yī)療信息系統(tǒng),最終提升醫(yī)療服務(wù)的效率、質(zhì)量和可及性。