天士力數(shù)智中醫(yī)藥大模型文章入選高引用研究
近日,天士力數(shù)智中醫(yī)藥團隊發(fā)表在國際權(quán)威期刊《美國醫(yī)學(xué)信息學(xué)協(xié)會雜志》的論文《Lingdan: enhancing encoding of traditional Chinese medicine knowledge for clinical reasoning tasks with large language models》,成為該刊近期被引用次數(shù)最多的文章之一,標志著中醫(yī)智能化研究已獲國際學(xué)術(shù)界廣泛關(guān)注與認可。


在全球大語言模型如ChatGPT等技術(shù)迅速發(fā)展的背景下,中醫(yī)古籍《黃帝內(nèi)經(jīng)》《本草綱目》等凝聚的千年智慧,卻因文言文表述、獨特理論體系與復(fù)雜語法,對現(xiàn)代AI構(gòu)成了顯著挑戰(zhàn)。如何讓前沿AI真正理解并運用中醫(yī)知識,成為關(guān)鍵研究問題。
為此,數(shù)智中醫(yī)藥團隊聯(lián)合北京交通大學(xué)醫(yī)學(xué)智能研究所的周雪忠教授團隊深度合作,共同研發(fā)打造真正懂中醫(yī)、會辨證、能開方的大型語言模型——靈丹(Lingdan),實現(xiàn)了在中醫(yī)臨床推理任務(wù)上的重要突破。
01
數(shù)據(jù)工程:構(gòu)建中醫(yī)知識新體系
研究團隊構(gòu)建了三大核心數(shù)據(jù)集,為AI學(xué)習中醫(yī)奠定基礎(chǔ):
中醫(yī)預(yù)訓(xùn)練數(shù)據(jù)集(TCMPT):包含1.6億個詞元,涵蓋古籍、教材、病歷、藥典、藥品說明書等多源知識;
中成藥問答數(shù)據(jù)集(TCPM Dialogue):通過“知識問答化”技術(shù)生成20萬組高質(zhì)量對話,涵蓋主治,配伍等關(guān)鍵信息;
脾胃病處方推薦數(shù)據(jù)集(SSHPR):基于廣安門醫(yī)院的臨床診療數(shù)據(jù),包含3.9萬條結(jié)構(gòu)化醫(yī)案,專注中醫(yī)處方智能推薦。
團隊還創(chuàng)新性地提出了中醫(yī)交互式診斷對話框架(TCM-IDDF),基于思維鏈技術(shù)模擬真實診療流程。
02
三大模型:實現(xiàn)中醫(yī)AI的
“理、法、方、藥”全棧能力
基于高質(zhì)量數(shù)據(jù)集,團隊研發(fā)了覆蓋不同場景的中醫(yī)AI模型系列:
靈丹預(yù)訓(xùn)練模型(Lingdan Pre-trained):在通用大模型基礎(chǔ)上注入中醫(yī)知識,構(gòu)建底層理解能力;
靈丹中成藥對話模型(Lingdan-TCPM-Chat):支持多輪辨證與中成藥推薦;
靈丹處方推薦模型(Lingdan-PR):針對中醫(yī)處方推薦任場景優(yōu)化的專業(yè)模型。
測試顯示,處方推薦模型在Top@20 F1分數(shù)上比最佳基線模型提升18.39%,展現(xiàn)出優(yōu)秀泛化能力。研究還發(fā)現(xiàn),通過隨機調(diào)整處方藥味順序進行數(shù)據(jù)增強,可顯著提升模型魯棒性、減少“AI幻覺”,體現(xiàn)了中醫(yī)“方有合群之妙用”的配伍智慧。
03
高引用背后:創(chuàng)新與實用的雙重突破
本論文獲得高頻引用,主要源于以下幾方面突破:
數(shù)據(jù)層面:與現(xiàn)有中醫(yī)AI數(shù)據(jù)集相比,靈丹數(shù)據(jù)集在數(shù)量和質(zhì)量上均超越以往模型。
方法創(chuàng)新:研究團隊提出了知識語言化和知識問答化等新方法,提升了中醫(yī)知識的結(jié)構(gòu)化表達與推理能力。
臨床實用性:模型可直接從病歷推薦處方,降低應(yīng)用門檻,更貼近實際場景。
跨領(lǐng)域價值:為其他專業(yè)領(lǐng)域的大語言模型應(yīng)用提供了可參考框架。
04
數(shù)智本草:賦能中醫(yī)藥垂直領(lǐng)域
目前,數(shù)智中醫(yī)藥團隊已經(jīng)開發(fā)了“計算+ 語言”雙模型的數(shù)智本草大模型,為中醫(yī)藥的智能化發(fā)展提供系統(tǒng)性解決方案。通過智能問答、交互計算、文檔生成和智能應(yīng)用四種模式,為用戶提供從重要機制解析到中醫(yī)藥復(fù)方及組分創(chuàng)新開發(fā)的全方位研發(fā)輔助。并涵蓋了數(shù)智中藥研發(fā)、中醫(yī)智能診療和中藥智能服務(wù)等多個場景。
作為“數(shù)智本草”大模型體系中的開源版本,靈丹大模型不僅奠定了該系列堅實的技術(shù)基礎(chǔ),更以開放協(xié)同的生態(tài)架構(gòu),助力中醫(yī)藥領(lǐng)域共創(chuàng)智能未來。
05
展望未來:開啟中醫(yī)智能化的新篇章
目前,團隊正在積極推進靈丹2.0版的研發(fā)工作,致力于在模型規(guī)模、推理能力與臨床適配性上實現(xiàn)進一步突破。
未來,天士力數(shù)智中醫(yī)藥團隊將繼續(xù)圍繞推進模型多模態(tài)化、病種全覆蓋、臨床系統(tǒng)驗證等方向深化研究,推動構(gòu)建“理、法、方、藥”一體化的智能輔助診療系統(tǒng),真正成為中醫(yī)傳承與創(chuàng)新的數(shù)字化伙伴。
【特別聲明:部分文字及圖片來源于網(wǎng)絡(luò),僅供學(xué)習和交流使用,不具有任何商業(yè)用途,其目的在于傳遞更多的信息,并不代表本平臺贊同其觀點。版權(quán)歸原作者所有,如涉版權(quán)或來源標注有誤,請及時和我們?nèi)〉寐?lián)系,我們將迅速處理,謝謝!】













