香港大學李嘉誠醫(yī)學院(港大醫(yī)學院)、InnoHK醫(yī)衞大數(shù)據(jù)深析實驗室(InnoHK D24H)及倫敦衛(wèi)生與熱帶醫(yī)學院的跨學科研究團隊,成功開發(fā)全球首個能同時進行甲狀腺癌分期及風險評級的人工智能(AI)模型,其準確率更突破90%。這項創(chuàng)新的AI模型,預計可縮減前線醫(yī)護人員診前準備約一半時間,亦能配合香港特別行政區(qū)政府推動醫(yī)療AI應用的政策。相關研究成果已發(fā)表於期刊《npj Digital Medicine》。
現(xiàn)時甲狀腺癌診斷標準主要採用以下兩大國際系統(tǒng)∶美國癌癥聯(lián)合委員會第八版(AJCC/TNM)分期系統(tǒng);美國甲狀腺協(xié)會(ATA)風險評級系統(tǒng)。然而,現(xiàn)行作業(yè)模式操作過程既耗時又欠缺效率,有可能延誤關鍵治療時機。
研究團隊成功開發(fā)一款AI輔助工具,該系統(tǒng)運用大型語言模型技術(如ChatGPT和DeepSeek),專為分析人類語言、解構臨床文件而設計,能顯著提升甲狀腺癌分期與風險評級的準確性及效率。
此模型採用4種離線開源大型語言模型,包括 Mistral、Llama、Gemma以及 Qwen。團隊通過整合4種大型語言模型的輸出結果,成功提升AI系統(tǒng)的整體表現(xiàn)。在ATA風險評級方面,準確率介乎88.5%至100%;而在AJCC癌癥分期方面,準確率亦達到92.9%至98.1%。相比傳統(tǒng)以人手審查文件方式,這項技術預計可以將醫(yī)護人員診前準備工作時間縮減約一半。
港大醫(yī)學院臨床醫(yī)學學院家庭醫(yī)學及基層醫(yī)療學系名譽副教授黃競浩博士闡釋,政府大力推動醫(yī)療AI的應用,例如醫(yī)院管理局最近推出利用大語言模型建立的醫(yī)療報告撰寫系統(tǒng)便是有力證明。為配合政府的倡議,下一步將會用大量真實病人數(shù)據(jù)評估這個AI輔助工具的表現(xiàn)。一旦驗證成功,這個AI模型可以迅速應用於臨床和醫(yī)院環(huán)境,幫助醫(yī)護提升運作和治療效率。
該項研究由港大醫(yī)學院的公共衛(wèi)生學院羅旭龢基金教授兼InnoHK D24H董事總經(jīng)理胡子祺教授、臨床醫(yī)學學院外科學系臨床助理教授兼內分泌外科主任馮文謙醫(yī)生,以及臨床醫(yī)學學院家庭醫(yī)學及基層醫(yī)療學系名譽副教授兼InnoHK D24H高級研究項目總監(jiān)黃競浩博士領導。共同第一作者包括來自InnoHK D24H的鄧皓文博士和吳婷婷博士。
圖説:港大醫(yī)學院研究團隊開發(fā)全球首個用於甲狀腺癌診斷的AI模型,準確率超過90%,能大幅縮短診前準備時間。該研究由胡子祺教授(中)及馮文謙醫(yī)生(右三)領導。