國內監理科技藍圖 ─ 證交所
目前全球主要證券市場的監理機關,均開始運用大數據及人工智慧技術分析巨量資料,如文字探勘、自然語言處理。有助於統整篩選資料,對資料內的文字、數字等,篩選可疑資訊,產出篩選結果,以協助監理人員進一步分析。
採訪/施鑫澤‧文/林裕洋
近幾年在創新金融科技湧現下,加上證券市場朝向全球化、網路化發展,各國政府紛紛鬆綁相關法規,各種金融商品與證券交易制度的推陳出新,世界主要證券監理機關亦採循序漸進方式引進監理科技(SupTech)。值得一提,儘管監理科技與法遵科技(RegTech)等運用技術大同小異,所以有不少人將兩個名詞混淆,但這兩者其實存在相當程度的差異。
申言之,「監理科技」的使用者是金融監理機關,其目的係為應用適當的新技術,進行有效的監理工作。故有別於「法遵科技」之使用者為一般金融機構、其目的係為有效增強法遵及風險管理能力,「監理科技」與「法遵科技」的使用者及目的明顯不同。
證交所副總經理謝俊欽說,因應數位化、行動化發展,證券監理機關引進監理科技速度也愈來愈快。以資料蒐集為例,早期上市公司或金融機構申報資料係採紙本方式,由人工提交。自網路普及後,則演進至網路電子化申報,且可批次上傳,大幅提高申報效率並促進無紙化。然近十數年來由於資料量更加龐大,資料產生速度驚人,且資料來源多樣化,傳統關連式資料庫、資料倉儲、網格運算等,已無法快速處理大量資料。所以引進成熟的大數據技術,自然成為監理機關的最佳方案。
善用監理科技 全球既定趨勢
在大數據技術協助下,世界主要證券監理機關不僅能以系統化且有效率的方式蒐集、整合和管理資料,還能自動產製管理性報表和監理報告。而在導入人工智慧技術之後,監理機關更從自動報告進化至即時監控,如自然語言處理可用來處理蒐集非結構化的網路即時資訊,機器學習則可進一步即時萃取及運用上開資料,以提升早期預警能力。
謝俊欽指出,因此,目前全球主要證券市場的監理機關,均開始運用大數據及人工智慧技術分析巨量資料,如文字探勘、自然語言處理,可用於統整篩選資料,對資料內的文字、數字等,篩選可疑資訊,產出篩選結果,以協助監理人員進一步分析。
美國證管會活用文字探勘 評估公司營運風險
以美國證管會為例,在金融危機爆發後不久,隨即開始使用文字探勘技術,審查上市公司是否存在信用違約交換合約上升,所帶來的營運風險。為實現此目的,證管會人員使用文字探勘技術,並運用電腦計算上市公司在申報或提交的資料中,提及上開合約的頻率。此外,證管會人員研究分析不同期間的比較趨勢,以瞭解是否出現任何可能被用作預警的風險信號。
謝俊欽說,目前美國證管會是將文字探勘運用在上市公司監理上,包括使用簡單的字數和正則運算式的方法,對文字資料中的結構化詞句進行機器識別。如 10-K 財務報告中的管理當局討論與分析(MD&A, Management’s Discussion and Analysis)項目,該文件等同於台灣上市公司年報的致股東報告書中,陳述公司過去一整年的狀況以及未來展望。
美國證管會目標是藉由文字探勘、機器學習等技術,將文件所使用的文字區分正反兩個面向,分析個別文字的使用頻率(意即聲量),以協助確認是否存在風險。
日本提升監管效率 活用 AI 降低人力負擔
負責東京證交所(現貨市場)與大阪交易所(衍生性商品市場)上市審查及監理、交易審查及市場監視等業務的日本交易所自主規制法人,執行市場監視作業如發現疑涉違反金融商品交易法所定之市場操縱、內線交易等不法行為,即將查核結果轉呈予日本證券交易監視委員會(SESC)進一步查核。該交易所因應市場環境之變化,尤其是高頻交易等資訊科技進步之後,以往靠查核人員一件件地初步篩選查核案件的方式,明顯有效率不足的狀況,於是決定引進人工智慧技術,取代一部分初步選案工作。
「2018 年 4 月日本交易所設立電腦自動化之審查系統,採用 NEC 的 RAPID機器學習軟體,其核心技術為機器學習中之深度學習,擅長從大量且複雜的資料中自動擷取出特徵值。」謝俊欽解釋:「因此,日本交易所自主規制法人交易審查部即運用這套系統,從全年幾億筆交易中自動擷取出異常案件,一年大約只有 1 萬 2 千件供初期審查之用,至於人工審查後真正涉及不法的案件可能更少。」
證交所運用大數據 打造新聞資料庫
不光美國、日本,2016 年臺灣證交所亦運用大數據技術打造新聞資料庫及搜尋引擎平台,繼而陸續導入自然語言處理、類神經網路、支持向量機、機器學習、深度學習等人工智慧技術,迄今已邁入第7年。回顧建置此大數據平台的第一階段目標,係為建置以網路資訊驅動的視覺化與自動化資訊系統。藉由網路資訊的自動化蒐集、萃取、轉換、儲存等一系列過程,結合標的證券同期間價量走勢,產製視覺化分析介面,進而觸發警示或進一步分析。
新聞資料庫及搜尋引擎平台的系統功能設計,可分為三大功能模組,首先在網路擷取及同步監控平台,主要是針對公開資訊觀測站在內的網路公開資料,運用網路擷取技術,依使用者需求精確切割目標網頁版型,針對網頁名稱、標題、描述等欄位進行資料萃取,並儲存於資料庫中。
其次,在證券市場輿情分析系統為例,主要是運用文字探勘工具之專利技術與公開資訊蒐集工具作為基礎,進行資料擷取、資料轉換及資料載入之作業。為方便使用者全方位檢視各類主題資訊,完整掌握情資動向,證券市場輿情分析系統運用全文檢索、數位儀表板、分類樹/資訊策展、輿情警示及趨勢統計分析報表等功能,在前台首頁以視覺化圖表來呈現。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]
以數位儀表板為例,系統依監理人員所轄管區公司名單,建置客製化儀表板,讓使用者在登入系統的第一時間,即可在首頁檢視管區公司當日網路訊息的觸及率(即聲量)、多空屬性(即情緒),再輔以個股成交價、漲跌幅等參考資訊,有助於使用者在第一時間發掘風險較高或需進一步分析處理的公司、個股或新聞資訊,俾利即時掌握業務焦點。再以輿情警示為例,使用者可設定多個關鍵字詞組合作為告警條件,當系統擷取網路訊息、分析發現符合使用者設定的條件時,即自動啟動告警功能,並以電子郵件等方式通知使用者,俾利監理人員隨時掌握資訊趨勢走向,即時回應處理。
謝俊欽指出,至於第三部分的視覺化分析報表部分,則提供使用者多樣化的統計分析報表功能,可根據主題、資料類型、特定議題、熱門檢索詞彙,設定時間區間等條件,系統即自動將數字量化成統計報表,並以視覺化方式呈現。統計報表類型,包括曝光率分析、熱門主題分析、分類主題關聯地圖/智慧關聯地圖、意見領袖等,共計十餘種。
綜上,以大數據技術為核心的新聞資料庫及搜尋引擎平台之監理目標,主要是整合現有監控的網路資料來源、以大範圍且 24 小時不停機的方式,持續且有效的追蹤目標知識,提供領域相關產業之新聞與異常言論,以利使用者快速掌握輿論資訊,即時追蹤網路訊息,提供管理者迅速有效的決策及回應依據參考。
引進自然語言技術 搜尋功能大幅提升
回顧 2016 年,當時證交所建置的新聞資料庫及新聞搜尋平台,是採傳統的規則基礎(rule base)法,亦即以關鍵字進行搜尋。例如,使用者若輸入2330(公司代號)或台積電(公司簡稱),即可查找標題或內文包含上述關鍵字、亦即與「台積電」相關的新聞。只是此種做法,因公司代號或簡稱十分容易造成查找之混淆,以至於無法精準找到所需的新聞。
為使新聞檢索系統能將股市新聞自動進行個股分類,並有效過濾雜訊並精準化個股新聞訊息,因此自 2017 年起,證交所導入前述自然語言處理、類神經網路、支持向量機、機器學習、深度學習等人工智慧技術,進行個股新聞自動分類演算,用以改善前述「規則式分類」之瓶頸及缺點。證交所的新聞檢索系統的語意分析模型,主要是由 3 種次模型組成,先以財經新聞分類模型(類神經網路)判斷是否為財經新聞。若確認為財經新聞,再以個股新聞分類模型(類神經網路、支持向量機、規則基礎的混合模型)對該篇新聞進行股票名稱及股票代號的貼標(Tagging)動作,最後依照最佳化邏輯取出最適合之單一分類結果及多分類結果,呈現予使用者。
在作法上,委外廠商先從證交所提供 8 萬則人工分類的個股新聞資料中,提取特徵、機器學習並建立初始模型。當網路新聞被擷取進系統後,即自動進行斷字抽詞、分析詞組向量,最後賦予個股貼標。前述語意分析系統經由證交所投入領域知識,結合廠商最新人工智慧技術,經由長達兩年的共同研發,2019 年上線時,即有 8 成以上的精確度,近幾年訓練資料不斷累增,重複機器學習的結果,精確度仍在持續提升中。
除此之外,證交所自 2021 年起研究以人工智慧技術建構情緒(利多/利空)指標自動分類模型,即運用類神經網絡、文字探勘等技術,進行個股新聞「利多/利空」分數的自動分類演算。而 2022 年度將前述功能模組整合至現有新聞資料庫及搜尋引擎系統,堪為導入人工智慧科技的另一成功案例。
在新聞以人工智慧自動賦予個股貼標之後,監理人員就能在系統中快速搜尋到屬於其管區公司或個股的股市新聞。該系統可進一步將前述新聞搜尋結果,結合個股漲跌幅、新聞聲量、多空情緒等指標,以視覺化儀表板及電子郵件推播等方式,協助監理人員即時掌握業務重點並辨識風險。
借重 RPA 減輕人力負擔
由於自動化工作流程之成本效益日益顯著,自動化已成為企業韌性與風險管理的全球熱門議題。因此,近年來證交所積極導入機器人流程自動化(Robotic Process Automation,簡稱 RPA),主要是模擬人類在電腦介面上按規則自動執行作業流程,善於處理成熟穩定、遵循明確規則及高度手動、重複性或高頻率、多系統切換之流程,代替或輔助人類完成電腦操作,進而有效重置人力配置,降低成本、減低人為誤差、提升效率及資訊穩定性。
以證交所上市一部為例,自 2020 年起積極導入流程自動化,截至 2021 年底已完成 11 項流程自動化作業之導入,廣泛應用於管理性報表編製、自動化寄發提醒通知及稽催、緊急通報等各項監理職能,經評估每年可節省同仁作業時間約 604 小時,個別項目節省時間之比例則約 13%~100% 不等。
除了節省作業時間外,RPA 自眾多分散來源自動擷取資料,更可降低數據錯誤風險、縮短龐雜資訊梳理時間、釋放人力時間以投入更需聚焦與專業分析判斷之工作、有效增進監理效率、縮短資訊彙報時間。
持續導入新興科技 建置數位化環境
證交所自 2016 年導入大數據及人工智慧系統,未來除將持續規劃引進新興科技,精進資料探勘分析之深度、廣度,更將結合並深化監理業務面之實務應用。
隨著市場狀況轉變、法規制度演進以及資訊科技進步,都將對證券市場帶來潛在的衝擊。因此,證券監理單位唯有持續導入新興科技、建置數位化環境,才能有效強化對證券市場的監理效能與預警能力,進而保障投資大眾權益,實現證券交易法第1條「發展國民經濟,並保障投資」之目標。
(本文授權非營利轉載,請註明出處:CIO Taiwan)