文/鄭宜芬
Google 上個月推出了 Gemini 2.0 Flash 的實驗版本,標誌著代理式 AI 時代的到來。這款專為開發人員設計的模型,具備低延遲與更強的效能,可用於高效能應用。此外,Google AI Studio 也更新了 2.0 Flash Thinking Experimental,結合 Flash 的運算速度與處理複雜問題的推理能力,以提升效能。
[ 加入 CIO Taiwan 官方 LINE 與 Facebook ,與全球 CIO 同步獲取精華見解 ]
Google DeepMind 技術長 Koray Kavukcuoglu 表示,Gemini 2.0 Flash 現已適用於桌機與行動裝置上的 Gemini 應用程式,並透過 Google AI Studio 和 Vertex AI 向所有開發人員開放,讓開發者能夠使用這項技術開發生產力應用程式。
同時,Google 也推出了 Gemini 2.0 Pro 的實驗版本,這是Google目前在撰寫程式與處理複雜指令方面表現最佳的模型。開發者可在 Google AI Studio 和 Vertex AI 上使用,Gemini Advanced 使用者亦可透過 Gemini 應用程式使用。
此外,Google 也推出了全新模型 Gemini 2.0 Flash-Lite,這是Google目前成本效益最佳的版本,並已在 Google AI Studio 和 Vertex AI 提供公開預覽。
Gemini 應用程式的使用者可在桌機與行動裝置的模型選單中找到 2.0 Flash Thinking Experimental。
Kavukcuoglu 進一步指出,所有模型在發布時均支援多模態輸入與文字輸出,未來幾個月內將陸續擴展至更多模態。
2.0 Flash:全新改版 正式登場
Flash 系列模型首次亮相於 2024 年的 Google I/O 大會,是開發人員關注的核心技術。該模型針對大規模、高頻率任務進行優化,具備 100 萬 Token 的上下文窗口,能夠進行多模態推理。
Kavukcuoglu 表示,使用者現在可以透過 Google 的 AI 產品體驗 2.0 Flash。該模型在關鍵基準測試中展現出更佳的效能,並即將推出圖像生成與語音轉文字功能。開發者可透過 Gemini 應用程式、Google AI Studio 或 Vertex AI 上的 Gemini API 使用該技術。
2.0 Pro Experimental:程式碼效能和複雜提示表現優異
Google 先前釋出 Gemini 2.0 的實驗版本,如 Gemini-Exp-1206,並收集了開發者的反饋,發現其在程式撰寫方面具有優勢。
為回應這些需求,Google 推出 Gemini 2.0 Pro 實驗版本。該模型在處理程式碼與複雜指令方面表現最佳,並具備更強的世界知識理解與推理能力。它擁有 200 萬 Token 的上下文窗口,能夠分析與理解大量資訊,並且支援 Google 搜尋與程式碼執行工具。
開發者可透過 Google AI Studio 和 Vertex AI 使用這款模型,Gemini Advanced 使用者亦可透過桌機與行動裝置的模型選單進行選用。
2.0 Flash-Lite:Google目前成本效益最高的模型
在 1.5 Flash 的基礎上,Google希望在維持成本和速度的同時持續提升品質,因此推出了新模型 2.0 Flash-Lite,在相同的速度和成本下,品質比 1.5 Flash 更出色,並且在大多數基準測試中的表現相較 1.5 Flash 更好。兩者同樣具備 100 萬 Token 的上下文窗口與多模態輸入能力,能為約四萬張圖片生成相應的標題。
目前,開發者可在 Google AI Studio 和 Vertex AI 以公開預覽的方式體驗 Gemini 2.0 Flash-Lite。
責任和安全工作
Kavukcuoglu表示,隨著 Gemini 模型系列的功能日益強大,Google將持續投入更多資源,確技術應用的安全性。舉例來說, Gemini 2.0 系列採用了全新的強化學習技術,透過模型自我評估回應內容,以提升準確性與針對性,並加強對敏感指令的處理能力。
此外,Google也會利用自動化的紅隊測試來評估安全風險,包括間接提示注入(Indirect Prompt Injection)帶來的風險,確保模型的安全。
Google 未來將持續改進 Gemini 2.0 系列模型,並推出更多更新與強化功能,以提升使用體驗與應用價值。
(本文授權非營利轉載,請註明出處:CIO Taiwan)