企業推動生成式 AI 的關鍵,在於需有足夠資料、先進的 AI 演算法,以及能夠支撐 AI 專案運作的 AI 算力平台。特別是企業可運用開源資料梳理工具,確保資料的乾淨程度,才能讓 AI模型發揮預期效益。
採訪/施鑫澤·文/林裕洋·刊期/2024.07
受惠於半導體晶片邁向先進製程,提供 AI 技術所需的強大算力之後,催生 2016 年 Google AlphaGo 問世,自此帶動全球 AI 技術的蓬勃發展,更被經濟專家認為是支撐 21 世紀經濟發展的重要支柱。而 2022 年底問世的 ChatGPT 服務,不僅帶動 AI 2.0 革命,更引爆全球企業對引進生成式 AI 強烈興趣,也帶動 AI 算力等於國家算力的浪潮。
根據 IDC 公布的「2022-2023 全球算力指數評估報告」指出,在生成式 AI 應用持續多元下,IDC 預估全球 AI 算力規模將從 2022 年 195 億美元增長到 2026 年的 346.6 億美元。其中,生成式 AI 市場規模將從 2022 年的 8.2 億美元增長到 2026 年的 109.9 億美元,在整體 AI 計算市場佔比將從 4.2% 增長到 31.7%,成為驅動製造、金融、教育、醫療等行業當下與未來創新發展的重要引擎。
[ 熱門精選:網路攻擊加增!資安長角色急轉彎!如何樹立一個強大合規文化? ]
國立陽明交通大學資訊學院副院長陳添福教授表示,目前各國政府都過國家資源打造國家級算力中心發展,以滿足不同產業或專案研究需求。以臺灣為例,自然是國網中心的臺灣衫主機,如「臺灣杉二號 TAIWANIA 2」是臺灣企業與國網中心自行打造的 AI 超級電腦主機。然而無論算力擴充速度再快,基本上都難以滿足各種 AI 專案需求,因為目前 GPU 晶片市場是 NVIDA 獨大,除價格昂貴之外、晶片供應數量也不足,以至於出現讓市場瘋搶晶片的狀況。
然隨著 AMD、Intel 等業者積極投入 AI 晶片研發工作,加上 Meta、Microsoft、Google 等業者,為求讓自家 AI 應用能發揮最大效益,以及降低整體建置成本的狀況下,早已開始規劃自身專屬硬體架構。可預期未來 AI 晶片供應不足問題將逐漸舒緩,讓 AI 平台建置成本大幅降低。
資料、演算法、算力 支撐 AI 專案三大關鍵
前面提到,自從 ChatGPT 展現出前所未有的強大回應力之後,各家企業便積極想將生成式 AI 技術與商業流程結合,藉此達到提高工作效率、產品品質、降低營運成本等,進而將寶貴人力發揮最大效益。以聯發科對外發表的生成式 AI 服務平台-MediaTek DaVinci(達哥平台)為例,是基於聯發科生成式 AI 服務框架而開發的方案,最初是為集團內部打造具資料安全性、提高生產力的生成式 AI 工具。
由於獲各部分廣泛運用,並發展成可供外部企業導入的生成式 AI 服務平台與豐富生態系,目前已有數十家來自高科技、金融、電信、法律、製造、銷售等行業的企業、教育機構、新創公司等加入「MediaTek DaVinci」生態系。
[ 熱門精選:生成式 AI 發展迅速!企業策略恐落後? ]
特別是隨著商業環境競爭日趨激烈,企業推動生成式 AI 專案不僅是跟隨趨勢,也是實踐節省營運成本、減少錯誤、提升生產力等重要技術,進而提升在市場上的競爭力。以前面提到的 MediaTek DaVinci 平台,在聯發科集團滲透率達 96%、對生產力提升認同度達 88%、在軟體開發過程中,從分析需求、生成技術、編修校對文件,都可以提供充份對應的幫助。
相反,若企業對此技術仍然視而不見,仍然抱持過往保守的觀望態度,恐怕將陷入被市場淘汰的命運。然而在公司內啟動生成式 AI 專案,也代表必須在公司建置支撐該專案運算的大語言模型,在此之前公司必須具備前述資料、演算法、算力三大關鍵條件。
陳添福指出,如同啟動一般 AI 專案,企業必須要有足夠資料,即擁有大量且多樣的資料,才能滿足 AI 訓練與推論所需。其次,公司也需要有一套合適與先進的 AI 演算法,讓寶貴資料能發揮最大效益。最後,則是能夠支撐 AI 專案運作的 AI 算力平台,否則在算力不足的狀況下,光是先期 AI 訓練與推論可能就要得花上數個月之久,真正要見到 AI 專案效益恐怕得超過1年以上,早已不符合現今時代潮流。
推動生成式 AI 勢在必行 有助提升生產力
首先,企業必須重視資料的準備,然而企業在資料整理過程中,泰半沒有採取有效方法,以至於非全部資料都可直接可用。當資料不完整時,往往會影響到 AI 模型訓練結果,因此在進行 AI 模型訓練之前,必須要進行資料清洗的工作,才能確保資料的整體品質。
然而,此複雜工作若全部仰賴人工處理,往往耗時費事,所幸生成式 AI 技術可處理原始文件,市面上有不少開源資料清洗工具可使用。這些融合 AI 技術的資料清理工具,不光可節省大量時間和資源,也有助於維持資料品質,對於是企業推動 AI 專案不可或缺的重要工具。
陳添福說,現在開源工具都是朝向 No Code 發展,可以大幅降低生成式 AI 的建置時間與難度,對於提升 AI 專案品質幫助很大。不過,知識萃取仍需要仰賴資深員工的知識與經驗,才能提升生成式 AI 專案的品質與效果,建議企業可以籌組跨部門的團隊,由資深員工提供相關經驗與產業知識,協助 AI 工程師進行資料清洗工作,對於推動 AI 專案可帶來極大幫助。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]
對於過往有推動 BI 專案的企業,可望將相關經驗延續到生成式 AI 專案之中,對於提升企業可帶來極大幫助。畢竟企業知識分類程度的優劣,與 AI 模型成效習習相關,先前分類精準的資料,不光可縮短推動生成式 AI 專案的時間與成本,對於後續建立企業大腦,提升員工生產力,也同樣可帶來極大助力。
善用開源大語言模型 可加速專案推動時程
早期企業推動 AI 專案的應用範圍,泰半都是集中在影像辨識、瑕疵檢測等,期盼藉由減少錯誤發生方式,提高產品品質與減少營運成本支出。然現今企業推動生成式 AI 專案則是將做為提升效率,乃至於奠定未來企業營運成長的重要動能。
大型企業更是將此技術視為是提升市場競爭力的重要關鍵,只是多數企業都忽略訓練大型語言 AI 模型是一個非常繁瑣、耗時、高成本的過程,多數大型企業都會想要從 AI 模型訓練模型著手,而若全部從自行全部完成,加上後續推論、測試、導入等流程,可能要花上 1~2年時間才能見到成果。
特別是 AI 模型訓練過程中,對 AI 算力的需求極大,企業必須投資大量費用採購相僅有資源足夠的大型企業才有能力執行。「對於打造生成式 AI 模型,企業應該要分從訓練與推論兩個面向分別投入,而非全部都由自己全部完成,不光非常耗時、也無法得到預期的效益。」陳添福解釋:「在生成式 AI 技術爆發下,目前市面上已有很多完成基礎訓練的 AI 模型可以選擇,企業可以此為基礎結合公司內部資料,在相對規模較小的 AI 平台進行推論,不僅可縮短執行 AI 專案時間,且多數中大型企業也有足夠預算可以推動。」
目前市面上常見開源大語言模型,大致上有 BLOOM、LLaMA3、Mistral 等等,不光早被廣泛被運用,且有多種模型參數規模可選擇。企業不一定需使用參數量 175B 以上的模型,可依照自身的使用情境選擇合適參數模型微調或是以多個小模型形成MOE,達到企業自我擁有 LLM 的目的,不僅能降低基礎架構的建置成本,也能縮短 AI 模型推論時間。
借重外部 AI 專家協助 縮短錯誤學習時間
儘管開源大語言模型如雨後春筍般問世,企業可在公司內部建立大語言模型平台。看準企業對於推動 AI 專案興趣極高,但是卻面臨 AI 人才不足、資源有限等問題,公有雲端業者也提供多種大語言模型供用戶選擇。
此外,市面上也有許多可提供 AI 專案的資訊服務公司,提供平台建置、顧問服務等一站式解決方案,協助人力不足、預算有限的中小企業,也在可負擔狀況下推動 AI 專案,運用 AI 技術提升生產力與競爭力。
[ 推薦閱讀:專訪凱基證券亞太區資訊長暨資安長黃榮林 ]
陳添福指出,相較於前幾年 AI 技術萌芽階段,當 ChatGPT 問世之後,在各領域展現出對答如流、無所不知的能力後,加上各家業者快速在各領域建立成功案例,讓企業對生成式 AI 技術的興趣極高,甚至期盼藉此強化企業營運體質。然前面提到,AI 專案能否發揮效益,取決於資料、AI 演算法、算力等三大因素,因此生成式 AI 能否帶來預期效益,必須仰賴前述三者之間有效搭配,恐怕成為企業重大難題。
在兼顧市場趨勢、公司未來發展等因素,加上許多資訊服務業者都可提供一站式 AI 專案導入的狀況下,企業可以引進外部資源協助,先以顧問服務模式進行,藉由外部專業 AI 團隊協助下,從非核心部門、小規模進行推動。與外部 AI 專家合作的最大優點,在於對生成式 AI 技術尚未掌握之前,能避免一次投入過多成本,有利於進行最精準效益評估工作。
其次,外部專家泰半都有非常豐富的成功經驗,企業可藉此了解專案推動的種種細節,以及自身不足之處,對於後續推動專案可帶來極大幫助。
培育員工成 AI 專家 企業須正視此挑戰
根據 IDC 公布研究報告指出,2022 年全球在 AI 上支出將達到 4,328 億美元,涵蓋軟體、硬體和 AI 系統等。預計 2026 年,全球 AI 支出規模將成長到3,000億美元,年複合成長率(CAGR)高達 26.5%,可見整體市場對 AI 應用的需求正快速成長。
在此狀況之下,全球陷入企業瘋搶 AI 人才的浪潮。在招募優秀外部人才的狀況下,不少企業直接選擇與外部研究機構合作,讓員工逐步成為優秀 AI 人才。
目前最知名案例,莫過於運用 AI 技術推動數位轉型有成的幾家大型電子產品製造公司。這些公司為因應轉型需求,2018 年起與臺灣人工智慧學校合作,為眾多員工開設 AI 專班並著重在研發和供應鏈的智慧化。
[ 熱門精選:AI 時代 網路安全角色的演變與招募重點 ]
此大筆投資也為公司營運帶來極大營運效益,如某些公司以機臺醫生的設計理念出發,透過 AI 進行「視覺檢查」與「聽診」,為機臺設備及其零件的健康狀態進行評估診斷。
陳添福認為,這些智慧製造前段班的培育人才作法,可作為其他企業借鏡,也是必須經歷個過程。因為,企業若從外部挖掘 AI 人才,勢必會面臨不熟悉產業知識、公司特性等挑戰,還需要花時間重新了解與學習,也難保不會被其他公司挖角,所以培育自家員工成為 AI 人才絕對有必要。當然,我們也發現有不少企業擔心新員工存取核心機密的問題,不過這只能仰賴公司制定一套可行的資料存取規範,兼顧資料安全與公司未來發展。
不可否認,推動生成式 AI 專案有助於提升工作效率,陳添福建議企業主不要一次希望能帶來大幅改變,而是能從提升 10%、20% 效益著手,藉由逐步改變、逐步提升方式,找到最合適的轉型策略。國立陽明交通大學 myLLM.tw 產學聯盟服務也會是一個蠻好的起始平台與服務,企業可以快速建立自有LLM,再循序評估是否擴大投資自己開發生成式 AI,以追求更大的數位轉型成果與效益。
(本文授權非營利轉載,請註明出處:CIO Taiwan)