甫在《Nature Medicine》期刊上發表的研究結果表明,聯合學習 (federated learning) 打造出可以普及到各醫療機構的強大人工智慧 (AI) 模型,這項發現有望更進一步將聯合學習用在能源、金融服務、製造及其它領域。
在一項由多間醫院因新冠肺炎疫情而制定的計畫中顯示,任何產業的機構只要攜手合作,都能發展出具預測能力的 AI 模型,為準確性和通用性樹立新的標準。
由業界同儕評閱的頂尖醫療照護領域期刊《Nature Medicine》中所發表的內容,可以看到並肩合作展現能保護隱私的聯合學習技術,是如何打造在各組織中均能順暢運行的強大 AI 模型,即使是在受到機密資料或稀疏資料而綁手綁腳的產業中亦是如此。
該研究的第一作者 Ittai Dayan 博士表示:「通常在開發 AI 的過程中,使用一間醫院的資料來建立演算法時,在其它醫院不見得能正常運作。但是,使用聯合學習及其它地區客觀的多模態資料來開發模型,便能將該模型普及到其它醫院,以協助世界各地第一線的醫生。」Ittai Dayan 博士在 Mass General Brigham 帶領 AI 的發展,今年還成立醫療新創公司 Rhino Health。
醫療照護產業已正進行其它大規模的聯合學習專案,包括五名研究人員的團隊在評估乳房 X 光檢查結果,以及製藥業龍頭拜耳公司正訓練用於脾臟分割的 AI 模型。
除了醫療照護領域,聯合學習還能幫助能源公司分析地震和井壁資料、協助金融公司改善詐欺偵測模型、協助自動駕駛車研究人員打造能夠歸納不同國家駕駛行為的 AI。
聯合學習:AI 需要一群人的付出
開發 AI 模型的公司和研究機構通常無法順利取得各種可用資料,而飽受巧婦難為無米之炊的苦惱。這或許也代表,規模較小的組織或小眾研究領域缺乏足夠的資料來訓練一個準確的預測模型。就算是大型資料集,也可能因為某一組織的患者或客戶的人口統計資料、特定的資料紀錄方法,甚至使用的科學設備品牌而產生偏誤。
大多數組織必須和同行分享資料,才能蒐集到足夠的資料以訓練強大又能夠普及的模型。但在許多情況下,資料隱私法規又使他們無法在共用的超級電腦或雲端伺服器上,直接分享患者病歷或專有資料集等資料。而這就是聯合學習可以派上用場的地方。
這項在《Nature Medicine》期刊上所發表名為 EXAM (為 EMR CXR AI Model 的縮寫) 的全新研究項目,在 Mass General Brigham 與 NVIDIA 的領軍下,匯集橫跨五大洲的 20 間醫院合力訓練一個神經網路,能夠預測出現新冠肺炎症狀的患者在到達急診科等護理點的 24 及 72 小時後,可能需要補充氧氣的程度。這是迄今規模最大、最多元的臨床聯合學習研究項目之一。
集眾人之力發揮 AI 的作用
聯合學習讓 EXAM 研究案的合作對象能夠打造出一個 AI 模型,從每個參與醫院所提供的胸部 X 光影像、患者的生命徵象、人口統計資料及實驗室數值中學習,又不會看到存放在各地私用伺服器中的隱私資料。
每間醫院使用本地端的 NVIDIA GPU 來訓練同一套神經網路的副本。在訓練的過程中,每間醫院定期把更新完的模型權重發送到中央伺服器,全球版本的神經網路在這裡匯集更新後的模型,形成一個新的全球版本模型。這就像是分享試題的答案,但不透露任何用來找出答案的學習材料。
研究報告共同作者、美國國立衛生研究院介入腫瘤學中心所長、美國國立衛生研究院臨床中心介入放射科主任 Brad Wood 博士表示:「EXAM 研究案的結果告訴我們,在醫療照護領域訓練出高效能且可普及化的 AI 模型,又不用交換能辨識個人身分的隱私資料是可行的方式,這麼一來便能保護資料隱私。這些發現的影響力遠超出原先用於預測新冠肺炎的跨醫院模型,也讓我們瞭解到將聯合學習用於一般領域大有可為之處。這讓我們有了一個框架,能以更有效且合規的方式分享大數據,如果我們想要在醫學領域發揮 AI 深度學習的潛力,或許就得這麼做。」
全球版本的 EXAM 模型在與所有參與機構分享資料後,AI 模型的平均效能提高了16%。研究人員發現,與透過任何單一機構訓練的模型相比,普及性平均提高了 38%。對於擁有較小型資料集的醫院來說,效能提升尤其顯著,如下圖所示。
泰國朱拉隆功大學 (Chulalongkorn University) 與朱拉隆功國王紀念醫院 (King Chulalongkorn Memorial Hospital) 醫學 AI 中心聯合主任 Sira Sriswasdi 表示:「聯合學習讓全球各地的研究人員能夠合作朝著同一個目標前進,也就是發展一個能夠從每個人的資料中學習且進行歸納的模型。有了 NVIDIA GPU 及 NVIDIA Clara 軟體,參與這項研究的過程本身並不困難,卻能產生影響深遠的結果。」該醫院是合作進行 EXAM 研究的 20 間醫院之一。
醫療院所、新創公司從事更深入的 EXAM 研究活動
集合來自北美、南美、歐洲及亞洲等地合作單位之力,最初的 EXAM 研究只用了兩週的訓練時間,便能準確預測患者對氧氣的需求,這項洞察可以協助醫師判斷患者需要照顧的程度。
從那時起,合作單位驗證了這套 AI 模型在協助建立和訓練該模型的地點以外的地方,有著不錯的普及率且表現良好。麻塞諸塞州的另外三間醫院 ── Cooley Dickinson Hospital、Martha’s Vineyard Hospital 及 Nantucket Cottage Hospital 也都對 EXAM 進行了測試,發現使用各院獨立未公開的資料,這套神經網路也有著優秀的表現。
Cooley Dickinson Hospital 發現這套模型能預測患者到達急診室後 24 小時內對呼吸器的需求,靈敏度為 95%,特異性超過 88%。英國劍橋的 Addenbrookes Hospital 也發現了類似的結果。
根據開發原始模型的 MGH & BWH 臨床資料科學中心科學主任 Quanzheng Li 博士,Mass General Brigham 計畫在近期部署 EXAM。Mass General Brigham 的醫療網路除了與 Lahey Hospital & Medical Center 及英國的 NIHR Cambridge Biomedical Research Center 合作,也和 NVIDIA Inception 計畫成員的新創公司 Rhino Health 合作,運用 EXAM 進行前瞻性研究。
使用先前新冠肺炎患者的病歷對初版 EXAM 模型進行回顧性訓練,研究人員已經掌握有關患者最終需要多少氧氣量的真實資料。這項前瞻性研究將 AI 模型用於新入院患者的資料,朝著在真實世界環境中進行部署的目標又邁出了一步。
劍橋大學醫學院放射學系主任 Fiona Gilbert 說:「聯合學習具有變革的力量,可以將 AI 創新帶入臨床工作流程。我們與 EXAM 持續合作,目的在於讓這類全球性的合作可以重複進行且更有效率,這樣便能滿足臨床醫生處理棘手的健康問題,和日後出現傳染病疫情時的需求。」
NVIDIA NGC 軟體中心開放下載 EXAM 模型用於研究用途。剛開始使用聯合學習的企業與研究機構可以運用 NVIDIA AI Enterprise 軟體套件的 AI 工具和框架,該套件經最佳化調整且可運行於 NVIDIA 認證系統。