整併醫院數據 發揮資料最大價值
醫療資料屬於醫院的資產,成立數據處之後,與各科溝通此觀念,讓資料能由數據處統一保管,作為日後研究專案使用。
採訪/施鑫澤 文/林裕洋 刊期/2020.09
隨著資通訊技術快速成長,讓資料經濟成為世界主流,也帶動資料價值快速攀升。而隨著人類壽命逐年增加,各國際生醫研究機構也將數據科學列為核心發展項目,期盼發展預防醫學、精準醫學等項目,讓醫療費用獲得最有效的運用。為此,2019年12月16日臺北醫學大學率先成立數據處,期盼提升整體校院競爭力,同時也為促進人類健康盡一分心力。
臺北醫學大學數據長許明暉表示,北醫大向來非常重視醫療資訊與健康數據的教育與研究,早在1998年就成立亞洲第一所醫學資訊研究所,領域著重於臨床醫學資訊學、基礎醫學資訊學的研究。因應全球資料科學的快速發展,我們也在2016年成立大數據科技及管理研究所。現今在資料經濟時代下,臺北醫學大學進一步設立數據處,並設有臨床數據中心、健康資料加值中心、校務研究中心與統計中心,將為全校師生與附屬醫院同仁提供即時優質的數據服務。
數據處出面整合 滿足多元研究專案
根據臺北醫學大學公布資訊公布資料,成立資訊處的主要考量有三。首先將資訊處研究資訊組、公共衛生學院健康暨臨床研究資料加值中心、管理學院生物統計研究中心、秘書處校務研究辦公室等相關單位進行資源整合及組織重整,進而發揮資料最大功能。其次,統整臺北醫學大學臨床研究資料庫、校務研究資料庫、與校外的健保資料庫、生物資料庫與國內外的開放資料(open data),提供數據一站式服務(One-Stop Shopping),未來臺北醫學大學師生只要需要數據服務,便可向數據處提出申請。
最後,數據處也將參與國內臺灣人體生物資料庫(Taiwan Biobank)、台灣精準醫療計畫(Taiwan Precision Medicine Initiative, TPMI)等大聯盟,同時強化與其他醫院資料庫之研究合作、籌組小聯盟、啟動研究量能,進而參與如「OHDSI」(The Observational Health Data Sciences and Informatics)等國際健康數據聯盟運用資料之機制,讓數據產生更大的價值。
許明暉指出,醫院對資料保存工作向來非常重視,因此各種醫療資料都保存在各單位之中,如X光片、放射科檢驗資料等,都放在X光室、放射科等,有時會被視為各科室的資產。雖然此種做法行之有年,然這種想法並不正確。醫療資料應該是屬於醫院的資產,所以我們成立數據處之後,就必須跟各科溝通此觀念,由我們統一保管資料,作為日後研究專案使用。
加速熟悉工作流程 創造資料跨界效益
前面提到,臺北醫學大學數據處的第二個工作之一, 就是將統整該校臨床研究資料庫,即是透過整合與資料清洗工作,讓資料能滿足日後研究案所需。舉例而言,在台灣有回家過世的習俗,很多即將臨終病患會辦理出院手續,選擇留一口氣回家。如此一來,醫院中的很多病患資料並不正確,即便是癌症末期病患出院,最終也不一定真的因病過世,有可能是車禍或者是其他原因等。
病人是否死亡與死亡原因是存活分析的關鍵,而且病人過世,就醫資料就可不受個資法限制,所以取得死亡病人的病例資料,對研究單位是非常重要的工作,因此臺北醫學大學數據處接手之後,自然必須肩負申請與資料清洗的工作。衛福部有死亡人數的資訊可供申請,而相關申請流程就必須要由數據處負責辦理,才能讓病患就醫資料發揮最大價值,滿足後續研究需求。
許明暉說,不光衛福部死亡資料的確認流程,數據處必須熟悉各部會的申請流程,包含環保署、中央氣象局等等,甚至與國外單位的溝通與協調,才能讓研究單位專心在相關研究案上。以近來在全球造成超過2000萬感染的COVID-19,於台灣僅有500例不到的病歷資料,若有團隊要從事相關研究案時,則必須與國外單位合作,我們也自然要負責與美國、歐盟等單位協調,便取得團隊所需的資料等。
根據臺北醫學大學數據處初步分析,老師或研究單位申請數據之後的用途大致上可分成三部分,首先是用於論文發表用途,其次則是用於申請研究計畫經費,為後則是用發展AI模組。無論哪種模式,數據處都樂觀其成,若日後發生營利事件,屆時再透過法規修正即可,期盼透過鼓勵申請方式,讓資料能夠發揮最大加值。
非結構化資料多 各界摸索運用模式
長期以來,廣泛收集資料、加以分析,以便讓資料發揮最大價值,一直是企業積極投入的方向。早在結構化資料年代,無論是醫療、金融、製造等,均會透過資料探勘、資料倉儲等技術,從看似無關聯的資料中,找到可能相關聯的訊息。在各方業者持續投入下,市面上有各種類型工具可供選擇,能滿足不同產業應用需求。尤其在處理器效能大幅攀升下,以往要處理一個小時的資料,現在可能只需1分鐘即可完成,也讓相關應用領域不斷擴大。
至於近年來興起的非結構化資料,目前各界都在摸索最合宜的運用方式,不過近來在演算法成熟下,已經有相當不錯的應用成果出現。以人臉辨識、影像分析等為例,便已廣泛應用在人類的生活中,如許多國家都開始提供快速通關服務,民眾只要事先申請,便能運用人臉辨識技術快速完成出入境的資料審核。而臺灣引進車牌辨識技術的智慧停車場也愈來愈多,除可減少管理人員的工作負擔之外,消費者也不需要擔心票卡遺失的問題,繳費速度也比以往更快。
「由於醫療服務對象是病患,在考量病患安全的前提下,所以醫療院所對於引進新科技向來較為保守,通常是等到技術成熟之後才會引進。」許明暉解釋:「如在人臉辨識部分,主要是運用在環境監測領域,確保醫療環境的安全。然而隨著人工智慧技術成熟,許多醫療院所也希望運用在醫療場合之中,以減少醫療人員的工作負擔,以及減少人為的疏忽。」
舉例而言,在傳統病理切片的流程中, 是由病理科醫師判讀電腦影像,確認檢體屬於良性或惡性。但是當病理科醫生每天需要看大量電腦影像時,難保不會因為疲累造成判斷上的錯誤。所以若能引進輔助軟體協助,自然有助於提高準確率與效率。又如現今判斷病患是否罹患 COVID-19,最常見方式莫過於進行核酸檢測,但是花費時間相對較久、成本也較高。因此,現今有不少研究團隊開始運用技術日益成熟的影像辨識技術,期盼透過判讀X光、電腦斷層等,判別病患是否遭到COVID-19感染,降低資料判讀時間與提升準確性。
AI應用多元化 自然語言令人期待
在人工智慧、資通訊技術進步下,世界各國都積極投入智慧醫療的發展。只不過現今全球對智慧醫療的定義不同,以衛生福利部擬訂「智慧醫療區域聯防試辦計畫」,即結合資通訊網路技術,整合不同醫療機構層級的急重症資源,開創智慧遠距醫療模式,提升醫療照護效率及效能,讓醫療照護沒有距離的隔閡。此舉,可藉由結合台灣資通訊科技的強項與創新醫療服務模式,提升國內偏鄉醫療照護的可近性、即時性、效率及照護品質,並藉由跨層級機構的合作新模式,讓醫療資源有效運用,縮短城鄉差距,達到世界衛生組織揭示之健康平權之目標。
許明暉認為,人工智慧絕對是發展智慧醫療、智慧醫院的重要核心技術,不光前述的影像分析運用,自然自然語言處理也是令人期待的方向。最簡單的應用模式,莫過於為病患提供相關協助,如對話、導引等。至於進一步深入的運用,則能在醫生問診過程中,協助記錄病患相關的病歷資料,並且即時進行分析,給予醫師相關輔助,對於改善醫療品質也能帶來極大幫助。
聯邦學習興起 開啟AI模組新境界
雖然在處理器運算能力效能攀升下,現今AI演算法已經相當成熟,市面上也有免費的AI演算法可取得,也帶動各種智慧服務問世。然而AI技術能否發揮預期效益,仍然需要仰賴大量資料訓練,只是傳統AI模組訓練方式,得把大量資料上傳到伺服器、雲端平台上。然當資料來源擴大到多個單位之後,除有資料量過大的問題之外,也會有資料隱私權的問題,導致許多公司猶豫、裹足不前。因此,近來興起的聯邦學習(Federated Learning),則是讓多個單位運用同一份演算法,讓資料則能在本地端進行運算與分析,只需將最後訓練成果上傳到雲平台,達到縮短訓練AI模組兼顧資料隱私性的需求。
許明暉認為,由於醫療資料有很多隱私,所以聯邦學習可以解決資料不用離開機構的問題,所以很多醫療院所都對此技術感到興奮。畢竟醫療資料離開醫院是種挑戰,但若涉及跨國資料傳輸,則又是另一種層次的挑戰。許多醫院都面臨資料保存超過10年,卻缺乏一套合理的分析環境與方法,此時若能加入特定組織發起的聯邦學習機制,將望解封資料原有價值與可用性。
雖然聯邦學習開創AI訓練的新境界,不過在醫療領域則已經具備行之有年的應用模式。如臺北醫學大學附設醫院便參加國際健康數據聯盟,運用標準ETL工具參與多種國際研究專案,除有助於掌握全球醫療趨勢之外,也讓醫院在國際上知名度持續攀升。
儘管在AI領域,聯邦學習效益逐漸浮現,然而合適應用環境尚且沒有定論。考量到在生醫領域是講究證據,而為確認聯邦學習、傳統中央式訓練模式的優劣,在許明暉規劃中,除臺北醫學大學附設醫院之外,也將進一步整合旗下萬芳醫院、雙和醫院、新國民醫院等醫療資料,同步確認兩種AI訓練模式的實際效益,做為事後發展AI醫療的參考。