文/鄭宜芬
數位發展部 27 日舉行建構臺灣 AI 產業生態系記者會,宣布將從算力、資料、人才、行銷、資金等五大政策工具著手,構建具有全球競爭力的 AI 產業生態環境。其中「台灣主權 AI 訓練語料庫」免費提供訓練語料給國內外的 LLM,讓 TAIDE 訓練模型時不用一一洽談,另規劃提出一年期的「資料匯流與隱私強化計畫」,盼建立研究人員申請政府資料的整套機制。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]
針對發展 AI 所需的算力,數發部已經有 32 片 NVIDIA H100、8 片 AMD MI300X,共 40 片 GPU 提供給新創使用,以降低生成式 AI 開發成本,2024 年已經協助 60 家業者訓練出 88 個模型,例如醫療新創睿傳數據運用 8 萬筆資料,訓練出 X 光影像偵測胸腔病灶的 AI 檢測模型,已取得衛生福利部食品藥物管理署《軟體二級醫療器材許可證》。
研擬「促進資料創新利用發展條例」
資料方面,數發部設立政府資料開放平台,涵蓋語言、歷史、地理等資料,並且推動建置 AI 訓練語料資料庫,未來將繼續釋出更多政府資料,完善 AI 訓練語料資料庫,並依據國際趨勢,無個資的部分研擬「促進資料創新利用發展條例(草案)」,牽涉個資的則有「資料匯流與隱私強化計畫」。
臺灣繁體中文資料受限於著作權法,難有足夠的資料訓練生成式 AI 。數發部常務次長葉寧進一步說明,將建立「台灣主權 AI 訓練語料庫」,鬆綁著作權法,免費提供訓練語料給國內外的 LLM,讓他們多使用來自臺灣的訓練資料,減少 AI 廠商與内容擁有者的著作權糾紛。語料來源優先採用政府擁有著作權的非機密性文件,如施政計畫、施政報告、研究報告、政府出版品等,接著鼓勵民間自願捐贈文學作品、論文、新聞報導內容。
[ 推薦閱讀:【專訪】數位發展部部長黃彥男]
規劃「資料匯流與隱私強化計畫」
另外,數發部規劃提出一年期的「資料匯流與隱私強化計畫」,正在爭取科發基金,未來會視個案跟各部會討論資料欄位跟處理流程,依案例運用隱私強化技術來處理資料。
在人才方面,數發部自 113 年啟動 AI 人才培育計畫,強化公務人員的AI技能,並與國家文官學院合作,將 AI 素養納入公務員培訓體系。另與人工智慧學校等民間機構合作,針對電腦視覺、自然語言等主流應用領域,制定 AI 開發人才指引和認定標準,加速 AI 產業發展,奠定堅實的人才基礎。
在行銷、資金方面,數發部今年度將持續舉辦「AI 產業交流及媒合會」,促進 AI 技術在健康照護等領域的應用,並啟動了「加強投資 AI 新創方案」,已匡列 100 億國發基金,與民間資金共同投資臺灣的 AI 新創及數位經濟領域的未上市櫃公司,支持臺灣新創企業的發展。包含軟體平台、電商、遊戲及其他創新的資訊服務業,預計於 3 月 28 日正式受理案件申請。
(本文授權非營利轉載,請註明出處:CIO Taiwan)