臺大醫院資訊室採用 Azure OpenAI 最大優點,能以較少花費享有全世界頂尖的大語言模型,驗證生成式 AI 合適的運用場景與效益。加上微軟保證使用 Azure OpenAI 服務時,不會保留所有上傳資料,可符合臺灣醫療法規。
採訪/施鑫澤‧ 文/林裕洋
擁有強大威力的生成式 AI,已在不同領域展現多元效益,也成為企業推動轉型、強化競爭力的最佳幫手。此技術在醫療產業中也有強大發展潛力,能在不同領域帶來多元效益,如在加速藥物開發與研究部分,可透過生成式 AI 能快速生成大量的分子結構,並預測其藥理特性、加速新藥的發現。 在臨床試驗設計方面,可透過生成式 AI 分析大量資料,進而設計更精準、更有效的臨床試驗,縮短藥物上市的時間。特別是在自動化影像分析部分,生成式 AI 也因可自動分析 X 光、CT、MRI 等醫療影像,可望扮演提升診斷效率和準確性的助手。
因應產業推動生成式 AI 浪潮,市面上開源大語言也愈來愈多,如 LLaMA、Falcon、StarCoder、Bloom、Vicuna 等,且有多種參數版本可選擇,能滿足不同應用情境需求。而發展智慧醫療有亮眼成績的臺大醫院,堪稱是引進生成式 AI 速度最快的代表性醫院,近來醫院選擇採用 Azure OpenAI,作為發展生成式 AI 主要方案。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]
臺大醫院資訊室高級工程師兼資訊經理溫家昶指出,我們選擇與微軟合作有三大原因,首先多數員工對微軟的開發工具都已非常熟悉,特別是在 Azure 雲端服務部分是經過全球用戶認證與肯定,穩定性與可靠度自然比多數國產品牌要好。其次,微軟技術支援相較於其他公有雲業者更直接與快速,且是由原廠工程師提供技術支援,幫助我們快速解決問題。第三點在合規與法規部分,也都符合政府要求,讓我們可以安心使用。
因此採用 Azure OpenAI,臺大醫院資訊室可在不需要硬體採購等先期大量花費下,可依使用量計費較經濟方式享有全世界頂尖的大語言模型服務,驗證生成式 AI 合適的應用場域與發揮效益。尤其微軟向臺大醫院保證使用 Azure OpenAI 服務時,不會保留用戶上傳的資料,這點有特別透過公文發函給臺大醫院保證,所以讓臺大醫院能放心在符合臺灣醫療法規下,於該平台上運用生成式 AI 進行應用驗證與測試。
選擇 Azure OpenAI 服務 嘗試雲端大型語言模型服務
微軟透過與 OpenAI 公司合作,在自家雲端平臺上提供 Azure OpenAI 服務,讓企業用戶可透過 REST API 存取 OpenAI 強大語言模型,包括 o1-preview、o1-mini、GPT-4o、GPT-4o mini、GPT-4 Turbo with Vision、GPT-4、GPT-3.5-Turbo 和 Embeddings 模型系列。前述模型各具特色優點,企業用戶可依照應用服務特性,選擇合適模型滿足特定工作,如內容產生、摘要、影像理解、語意搜尋,以及將自然語言翻譯為程式碼。Azure OpenAI 常見應用場景,大致上有客戶服務、內容生成、程式碼生成、語音助手、教育等等。
早在接觸 Azure OpenAI 之前,臺大醫院資訊室及智慧醫療中心即開始嘗試各種開源大語言模型,以及透過優化不同參數版本模型尋找適合應用場景,以便能與臺大醫院智慧醫療專案整合。隨著 2023 年 1 月微軟正式公佈 Azure OpenAI 的 API 界接服務之後,原本已長期使用 Azure Cognitive Service 的臺大醫院資訊室,也開始遞出申請使用的要求,最終於 2023 年 3 月正式通過,開始嘗試用 Azure OpenAI 服務與醫療應用結合,並立即上線以病症描述來查詢建議就診醫師的掛號 APP 功能。
溫家昶指出,前面有提到,臺大醫院原本就有在使用地端版本的大語言模型,決定嘗試 Azure OpenAI 主因之一,在於確認世界頂尖模型在相關應用當中所能做到的極限,同時可靈活快速地進行調整部署,依據不同的想法可以馬上進行驗證。生成式 AI 技術已是不可逆的趨勢,未來無論是地端大語言模型規格持續變更,又或者雲端大語言模型收費模式改變,我們都可以進行開放性的嘗試,不用擔心未來被單一模式給綁住。
臨床試驗計畫進行評估驗證 符合醫療實用性及法規要求
臺大醫院資訊室剛開始使用 Azure OpenAI 服務時,還是採用比 ChatGPT 更早期模型(Text-Davinci-003),屬於 token 數量較小的舊版本,在應用上限制較多。所以當時只將就診建議之類應用進行測試,把語言模型 API 包裝起來,再提供搜尋服務做串接臺大醫院的其他 APP。與此同時醫院也開始在內部發出問卷,了解員工對大語言模型應用的看法並規劃開發策略。隨著 GPT4 Turbo 及 GPT4o 等更精準、吞吐量更大且支援多模態的模型推出,也可以很快地透過 Azure OpenAI 平台進行整合應用並且拓展之前所無法做到的應用功能。此外,在 RAG(Retrieval Augmented Generation)技術推出後,也可以立刻透過 Azure OpenAI 進行與醫院內部資料結合的服務測試。
實際使用經驗上來看,如果要達到如其他醫院或公司所對外發表的成果,需要很多細節的技術及內部參考資料的內容處理,方可做到實用有效的結合,提供專屬應用。相關資訊同仁也在不斷的嘗試之下累積不少獨門使用經驗,達到真正可落地化使用程度。
[ 推薦文章:FHIR 標準具備多元互通框架]
醫院是受到高度監管的產業,特別是對於病患資料隱私更是重視,現今若要引進雲端平臺上的大型語言模型,將醫院資料進行 AI 推論,自然要非常警慎。所以臺大醫院內部經過很長時間討論並與微軟協調。微軟提出書面公文保證的方式,絕對不會保留相關上傳雲端資料及進行利用。相較之下,其他公有雲業平台並沒有提供相關保證的服務窗口,所以也讓臺大醫院唯一引進 Azure OpenAI 服務。
再來是與病人相關個資、敏感資料絕對不能上傳。因為醫院若要運用病患資料進行研究,必須要先取得病患的同意書,且必須向主管機關申報核可。為避免引進爭議,醫院研究人員都知道不可隨意使用病患的敏感資料。」溫家昶解釋:「至於衛教等相關應用,雖然屬於專業性服務,但因為沒有個資疑慮,反而在開發與研究上的運用相對較方便。」。目前臺大醫院在使用 Azure OpenAI 服務,不論是文字或者圖像內容,在呼叫 GPT API 資料上傳前,都先自動經過程式處理去除病人隱私資料及遮罩,遵循 HIPPA 18 項隱私項目要求。
與其他醫院不同,目前臺大醫院是以臨床試驗審查案件以及院方指定計畫的高度及嚴謹度來執行此專案,參與計畫使用大型語言模型的醫師需要簽署試驗同意書,才有權限進行功能使用。相關使用過程所累積的輸入輸出資料皆以資料庫形式完整保存,並且在事後進行輸出正確性及完整性評分,來評估大型語言模型在醫療作業的實用程度。預計確認在適當的架構及提示詞良好搭配下,再逐步開放院內使用。
優化病歷內容處理 尋找最適方案
溫家昶說,目前臺大醫院資訊室使用 Azure OpenAI 服務開發方向,主要包含病歷報告生成、非結構資料探勘以及生成檢索問答上。在病歷報告生成方面,首先是內容摘要,依據各科病症不同的任務需求,針對不同的提示詞產生預期格式整理結果,並提供客製化界面讓使用者可選擇想要的特定文件,作為原始素材輸入至大型語言模型進行整理。另外,儀器輸出檔案或圖片透過 AI 直接轉出醫師常用格式之檢查報告內容,主要以針對文字及圖表判讀為主,增加報告產出的效率及正確性。
非結構資料探勘,以處理病歷文章等非結構性內容,擷取使用者需要的關鍵訊息進行自動收集,例如病人各類風險分數計算等需求。在處理多份病歷的情況下可大幅增加作業作業效率。
[ 推薦文章:覆醫療業的生物數位分身 開創預防醫學及精準醫學新紀元]
生成檢索問答主要用在護理作業規範,運用醫院內部文件建立 RAG Index,讓 GPT 依據作業規範對護理使用者問題進行回答。建立 Index 過程特別強化原始參考文件連結,讓所有回答都有所本,除了生成回答內容外,護理師可快速點選原始文件查閱細節,了解 AI 生成內容來源。
過去醫院資訊系統對於病歷表單設計,往往為了特定作業流程及統計需求不斷的擴充細節資料庫欄位及過於細緻的結構化設計,如此往往造成系統過於複雜化且效能持續降低,也無法滿足醫療需求。在引入可大量處理非結構化資料的大型語言模型工具下,可擺脫過去需拘泥於擴增資料欄位及結構化設計的困境,同時讓醫事人員繕打病歷自由度得以擴增進行充分表達,也能避免系統效能在不斷細化下被拉低。
(本文授權非營利轉載,請註明出處:CIO Taiwan)