在LINE 台灣開發者大會上,LINE在發表三大CLOVA Chatbot、CLOVA Face 、CLOVA OCR之外,也分享打造VKS雲原生平台的心得與成果。
採訪/施鑫澤 文/林裕洋
受惠於台灣防疫成果卓越,在各種活動依然能夠順利舉辦的前提下,向來備受關注的 LINE 台灣開發者大會,在2020年12月18日順利舉辦「LINE TAIWAN TECHPULSE 2020」。本屆活動超過 1600人報名,且首次採用自行研發的人臉辨識技術進行報到流程,而近年全力發展人工智慧的LINE,除宣布將 LINE BRAIN 商用產品線和 LINE Clova 產品合併為 LINE CLOVA 之外,2021年在台灣市場將全力推廣 CLOVA Face 人臉辨識技術、CLOVA Chatbot 聊天機器人應用以及 CLOVA OCR 文字辨識技術的服務。
在LINE台灣規劃中,LINE CLOVA 關鍵佈局將聚焦4大人工智慧技術,分別是NLU(自然語言理解)、Face(臉部辨識)、OCR(光學字元辨識)、STT(語音辨識),並在此技術下發展3大人工智慧商用產品,CLOVA Chatbot、CLOVA Face 、CLOVA OCR。LINE將混搭前述不同的人工智慧商用產品,推出 LINE eKYC 和 LINE AiCall 等兩大人工智慧解決方案,不但對用戶來說更簡單易用,還能讓企業能減輕自行開發的負擔,同時提升營運效率。
打造VKS雲端原生架構 降低系統維運成本
在COVID-19疫情蔓延全球下,大舉改變民眾生活習慣與企業營運模式,也帶動各種即時通訊軟體的用戶數量暴增。根據LINE官方公佈資料顯示,LINE全球官方帳號數量2020年4月較前個月成長140%,至於視訊通話數在2020年5月較2月成長 235%。特別是原本開始採取閉門比賽的中華職棒,因為是全球第一個開打的職業賽事,帶動球迷轉往線上觀看球賽的風潮,因此2020年中華職棒在 LINE TODAY 上的觀看次數,年成長率達到 74%,總觀看次數則創下歷史新高。
面對全球用戶對LINE需求快速暴增,如LINE 直播的線上音樂會在2020年第二季較前一季相比,觀看次數成長近 300%。至於LINE 旅遊的國內票券與體驗類商品,在政府大幅推動國旅下,2020年九月、十月的連假業績,與去年同期相比成長2483%。LINE能有如此亮眼成績,背後歸功於LINE總部2020年初啟用的VKS(Veda K8s Services)平台,台灣團隊已於2020年第三季時將所有專案服務轉移到該平台上,運用 LINE 基礎設施及全球資源,可加快專案服務開發速度,讓系統具備承載瞬間大流量的能力。
LINE台灣技術長陳鴻嘉說,早期LINE運用OpenStack技術建置名為Verda的私有雲,可透過虛擬化方式支撐各式各樣的專案。為滿足快速推動專案需求,我們是以IaaS雲端基礎設施角度出發,讓開發團隊自助申請需要的部署資源。但是此種運營多年的雲平台,其實有資源容易被浪費、不易管理等大家熟知的兩大問題。
考量到特定節日可能的大量使用人潮,多數團隊泰半會提專案所需的資源,但若該服務沒有產生預定流量,就會導致資源被浪費。根據LINE官方統計,約有60%虛擬主機伺服器的處理器利用率低於10%,這代表有高達90%運算資源被浪費。其次,當伺服器需要進行維護時,技術團隊還得將虛擬化環境轉移到其他設備上,整體維護成本非常高。為此,LINE總部決定導入Kubernetes,打造雲端原生架構,除可免去基礎架構管理負擔之外,也有助於最佳化應用程式專案的效能。
VKS取代虛擬機器 部署時間大幅縮短
2020年初,LINE總部推出可提供容器化服務的VKS,此 平台具有自動平行擴展的彈性機制,當流量暴增時系統會自動增加資源,以便可承載瞬間的流量峰值,為用戶提供更平穩的服務體驗。其次,VKS 整合許多開源的生態系資源,在知識共享下,有助於提早解決問題,因此具備簡單、易用性的特性。全世界 Kubernetes 由全球社群共同維護,在開發社群非常活躍,系統整體維護成本相對較低。在台灣團隊完成所有服務重新轉換為容架化架構後,2002年第二季開始逐步把各種專案和服務搬到 VKS上,目前已全部完成搬移的工作。
陳鴻嘉指出,台灣專案數量成長非常快速,如何更有效的發揮人力資源,便成為一個重要的課題,致部分包括強化開發部署的效率,讓新進人員加入團隊後,盡快加入應用開發。以往只靠 Verda 虛擬機器時,新人大約需要一、兩週建置開發工作環境;從虛擬機器轉到 VKS 容器化平台後,新人在報到的半小時後就可以加入開發。其次,傳統應用程式的部署時間需要花上1小時,現在只需要15分鐘即可完成,若是雲端原生應用服務,則部署時間可從原本6分鐘縮短到20秒。」
截至2020年十月份,LINE 台灣已有20多個專案在 VKS 上面運作,如Line旅遊、Line購物、Line音樂等,並且部署超過 130 個 App 配置以及 50 多個叢集。根據LINE總部認定資料顯示,在全球眾多國家中,台灣團隊是在 VKS 上實施容器化技術平台最多樣、最完整的團隊。
打造 MLU平台 最佳化開發流程
本屆 LINE 台灣開發者大會的另個亮點,是 MLU(ML Universe) 機器學習平台。在數據為王、以資料發展加值服務的時代來臨,2018年LINE台灣成立資料工程研發團隊,包含資料工程師、ML工程師、ML服務工程師、資料分析師等,期盼以正規化資料獲取流程,逐步累積台灣使用者行為資料,並利用大量的去識別化資料,藉此訓練。
只是在完成機器學習模型之後,需要人工部署到線上環境,此過程仰賴資料團隊與工程團隊共同協作完成,且有許多繁瑣的重複工作,只要其中一項工作沒配合好,就可能會影響到機器學習模型的效益。為此,2020年LINE將ML融合DevOps,以MLOps概念打造MLU機器學習平臺。
除此以外,MLU 對機器學習相關專案的流程管理也是很有效的輔助平台;原先在機器學習專案的開發過程中,每個階段都是獨立運作,一個階段完成後就交棒給下一階段,每個階段成員不同,交接之間的協作不完全順暢。由於在打造MLU機器學習平台時,也同步建立一個完整的工作流程,藉由降低跨團隊溝通成本的方式,提高機器學習模型開發的速度與品質。
LINE 台灣資料工程部資深經理蔡景祥特別強調:「MLU 可讓團隊在同一個平台上,執行每個階段所需要的工作。當每個階段成員的角色都定義清楚時,團隊就能以一致的、標準化的流程開發,讓稀缺的開發人力達到最佳化部署,也讓機器學習技術規模化,並落實在各個大小專案中。」
累積豐富AI技術 CLOVA Chatbot 受期待
前面曾經提到,LINE CLOVA 是集合時下LINE人工智慧技術的而成,搭配LINE通訊軟體的高使用頻次,與相對簡單的應用介面,主要目標是打造「友善的AI」,希望更貼近使用者,解決在生活和商業上的繁瑣問題。目前 LINE CLOVA旗下,共有 CLOVA Chatbot、CLOVA Face 、CLOVA OCR 等三大產品,可分別滿足不同應用需求。
LINE運用亞洲市場利基與豐富資料推出的 CLOVA Chatbot,能更精確地判讀使用者的發話意圖和對話內容,特別擅長於可辨識相對困難的亞洲語言。根據LINE統計顯示,目前全球使用 CLOVA chatbot 服務數量超過44個,已累積問答資料庫達100萬筆,使用超過1億人次,累積使用者對話保守估計約有17億之多。
此外,LINE也提供 Chatbot builder平台,讓企業開發者減少耗費訓練成本,更彈性、快速地打造聰明的人工智慧聊天機器人,打造好之後,即使是LINE以外的服務或平台,也可以很容易地與其串接。
專為亞洲市場設計 Face、OCR功能強
由於LINE重點服務區域以亞洲為主,對於亞洲地區設計的臉部辨識技術具有一定優勢,其所推出的 CLOVA Face,可用平板、智慧型手機等各種裝置,提供更快速且智慧化的入場辨識。此服務具備四大功能,能以階段性進行辨識作業,首先,可透過影像做人臉偵測,再來能讀取臉部特徵和表情做內部校正,接續以擷取到的特徵值進行辨識和比對,最後還可藉由臉部樣貌讀取出更細微的資訊,包含年齡、性別和當下心情。
至於結合光學字元辨識與人工智慧所發展出的「CLOVA OCR」,主要是透過光學字元辨識與資料增強法(Data Augmentation),可有效提供辨識結果的準確度,並開發出不同模式的OCR產品,包含文字單元辨識極高的 general OCR,以及針對特定樣式和規格的 specialized OCR,和操作介面簡易且具有AI運算邏輯的 OCR Builder。
其中,Specialized OCR 會開發台灣最多使用者需要的樣式,如健保卡、車票、發票和身分證,更便利大眾的日常生活。而 OCR builder 則提供一個介面友善的平台,透過機器深度學習達到區域辨識和文字辨識,讓技術更簡單拓展應用面。更進一步,當OCR技術結合Face(臉部辨識),即能發展出AI解決方案 LINE eKYC,提供企業界以更數位的方式辨識用戶身分。
值得一提,過往使用STT技術難度相對較高,目前LINE提出只需建立一個NEST model,即可進行語音辨識技術,且尤其擅長辨識日常隨興的對話內容和較長的語句,並且在噪音環境內的辨識能力也相當突出。如以運用STT和NLU等技術,結合AI解決方案推出的 LINE AiCall(AI訂位技術服務),目前已於日本LINE開發者大會時正式宣布推出,將可透過AI電話訂位解決餐廳人手不足的問題,2021年可望在台灣看到成功案例。