受惠於向量儲存、AutoML 和 Lakehouse 增強功能,以及 JSON 及 JavaScript 支援,客戶可更加輕鬆地使用 MySQL HeatWave
Oracle 宣布推出 MySQL HeatWave 的重大增强功能,包括支援向量儲存、生成式 AI、新的資料庫內機器學習功能、MySQL Autopilot 增強功能、新的 HeatWave Lakehouse 功能、JavaScript 支援、JSON 查詢加速,以及支援新的分析運算符。向量儲存目前處於私人預覽中,客戶將能夠藉此利用大型語言模型 (LLM) 及其專有資料的強大功能,其比僅使用公開資料來訓練的模型更準確。透過生成式 AI 和向量儲存功能,客戶可以以自然語言與 MySQL HeatWave 交互,並在 HeatWave Lakehouse 中高效搜尋各種檔案格式的文件。
Oracle 首席企業架構師 Edward Screven 表示:「今天所推出的 MySQL HeatWave 增强功能,是我們在解決客戶資料、分析和人工智慧等迫切問題方面的重要里程碑。我們之前已為 HeatWave 新增了具有高性價比的即時分析、自動化機器學習、湖倉一體和多雲功能。現在,向量儲存和生成式 AI 為客戶帶來了强大的 LLM 功能,讓客戶透過直觀的方式與企業資料進行交互,並獲得業務所需的準確答案。」
對於希望跨各種資料類型和來源執行分析、交易處理、機器學習和生成式 AI 的客戶而言,MySQL HeatWave 中的新增功能,可用於 MySQL 相容的工作負載和非 MySQL 工作負載。
生成式 AI 和向量儲存 (私人預覽)
向量儲存擷取各種格式的文件 (如 PDF),並將其儲存為透過編碼器模型產生的嵌入。針對指定的使用者查詢,向量存放區透過對儲存的內嵌與內嵌查詢執行相似性搜尋,來識別相似的文件。這些文件用於增強提供給 LLM 的提示,以提供更相關的答案。
MySQL HeatWave AutoML
MySQL HeatWave 提供資料庫內機器學習,並具備完全自動的訓練模型管道。客戶不需要將資料移轉至個別的機器學習服務,就能輕鬆、安全地將機器學習訓練、推理及解釋套用到儲存在 MySQL HeatWave 內的資料。新增功能包括:
- HeatWave Lakehouse 支援:除了 MySQL 資料庫中的資料以外,客戶現在還可以利用 HeatWave AutoML 來訓練、推理及解釋物件儲存的中資料,並使用更廣泛的資料集來進行機器學習。
- 文字欄支援:客戶能夠在文字欄上執行機器學習任務 (異常偵測、預測、分類、迴歸及推薦系統),進一步擴大客戶所能運用的 HeatWave AutoML 資料語料庫。
- 增強的推薦系統:在 Bayesian Personalized Ranking (BPR) 的協助下,HeatWave AutoML 現在能夠根據隱式反饋 (過去的購買、瀏覽行為) 和顯式反饋 (評分、讚好) 來產生個人化推薦。舉例來說,分析師可以預測使用者喜歡的項目、喜歡特定項目的使用者,以及項目評分。
- 訓練進度監控:客戶現在可以使用 HeatWave AutoML 監控模型訓練的進度,更妥善地管理資源。
MySQL Autopilot
MySQL Autopilot 是 MySQL HeatWave 的內建功能,運用機器學習支援的自動化來協助改善效能與擴展性,無需具備資料庫調整專業知識。此功能從執行的查詢中學習,以改進未來查詢的執行計畫。MySQL Autopilot 的全新增強功能包括:
- MySQL Autopilot 索引 (有限可用性):協助客戶消除耗時任務,包括為 OLTP 工作負載建立合適的索引,以及隨著工作負載的變化而不斷維護索引。MySQL Autopilot 會自動確定客戶應建立或從表中刪除的索引,以最佳化 OLTP 吞吐量,並使用機器學習根據各個應用程式工作負載進行預測。此外,Autopilot 索引可以預測推薦索引的預期改進成效,不僅無需建立索引,也不會對使用者的租用戶產生運算或儲存開銷。
- 自動壓縮:協助客戶判斷每個資料欄的合適的壓縮演算法,藉由更快速的資料壓縮和解壓縮,提升載入和查詢效能。由於記憶體使用量減少,客戶可以降低高達 25% 的成本。
- 自適應查詢執行:協助客戶在查詢開始執行後優化查詢的執行計畫,將即席查詢的效能提高高達 25%。該功能使用從查詢的部分執行中獲得的資訊來調整資料結構和系統資源,然後根據執行時的實際資料分佈,獨立優化每個 HeatWave 節點的查詢執行。
- 自動載入和卸載:Autopilot 會自動將應用程式工作負載中使用的資料欄載入到 HeatWave,並自動卸載從未或很少查詢的表格,進而釋放記憶體,並降低客戶的成本,而且無需手動執行此任務。
其他 MySQL HeatWave 增強功能
- JavaScript 支援 (有限可用性):客戶能夠用 JavaScript 編寫預存程序和函數,並在 MySQL HeatWave 中執行。這樣一來,開發人員可以更輕鬆地用 JavaScript 編寫豐富的應用程式邏輯,並透過在 MySQL 資料庫內執行程式來提高效能。由於資料不會從資料庫傳輸到客戶端,而且程式碼是在 GraalVM 運行時中即時 (JIT) 編譯的,因此也提高了 JavaScript 應用程式的效能。
- JSON 加速:開發人員和 DBA 現在可以利用 HeatWave 對儲存在 MySQL資料庫中 的 JSON 文件進行即時分析,從而將查詢速度提高幾個數量級。
- 新的分析運算符:在新的分析運算符 (包括 CUBE、Hyper Log Log Log、Qualify 及 Table 範例) 的協助下,客戶可以將更多的工作負載移轉至 MySQL HeatWave。
- 批量攝取到 MySQL HeatWave:支援並行建立索引子樹,同時從 CSV 檔批量載入資料,協助客戶將資料攝取效能提高,其效能比 Amazon Aurora 高出 10 倍。因此,客戶可以更快地查詢資料,並更快地釋放用於載入資料的系統資源,從而降低成本。
NAND Research 首席分析師兼創始合夥人 Steve McDowell 表示:「MySQL HeatWave 工程團隊無疑正在加速發展人工智慧和機器學習創新。現在,客戶不僅能夠以全面自動化的方式,使用資料庫和物件儲存中的資料進行機器學習模型訓練,還可以使用全新的 AI 和向量儲存功能,以自然語言與 HeatWave 進行交互。相關的模型訓練除了使用公開提供的資料外,也使用企業本身的資料,協助客戶獲取準確且符合業務目的的答案。客戶可以靈活地選擇 LLM,體現了 MySQL HeatWave 工程團隊的開放式協作策略。」
MySQL HeatWave 是非常重要的雲端服務,可在單一 MySQL 資料庫服務中提供事務處理、即時分析、機器學習、資料湖查詢,並進行以機器學習為基礎的自動化。MySQL HeatWave 是 Oracle 分散式雲端策略的核心,在 OCI 和 Amazon Web Services 上原生提供,同時可作為 Oracle Database Service for Azure 的一部分,並透過 OCI Dedicated Region 在客戶的資料中心内提供。