DeepSeek 在 AI 領域對比與發展

文／洪為璽

洪為璽 200x300 — ◤ 作者洪為璽博士，現為國立政治大學資訊管理學系教授兼CINTES研究中心主任，專長為資訊策略管理、資訊安全管理與大型資訊系統導入與應用。

人工智慧技術的發展迅速，導致語言模型在各個領域的應用日益廣泛。其中，DeepSeek和 ChatGPT 是目前最熱門的話題之一，受到了業界和使用者的關注，以下簡述 DeepSeek 的背景與 AI 研發現況。

內容目錄 隱藏

DeepSeek 橫空出世

模型架構

優勢與應用

未來趨勢

結論

DeepSeek 橫空出世

中國大陸的人工智慧公司 DeepSeek 是由梁文峰於 2023 年 7 月創立，此公司的目標以低成本模式研發並實現微薄獲利。2023 年 11 月，DeepSeek 發布了第一個 AI 模型 DeepSeek-v1，此後，DeepSeek 持續研發，並快速推出新版本，最新的 DeepSeek-R1 在邏輯推理速度上取得了重大突破，DeepSeek 聲稱該模型的性能已經達到了與 OpenAI 的 GPT-4 相當的性能，且僅花費了約 600 萬美元的訓練成本。

[ 加入 CIO Taiwan 官方 LINE 與 Facebook ，與全球CIO同步獲取精華見解 ]

此項發布震驚了許多國家與企業，尤其是 AI 技術研發的龍頭「META」公司，而矽谷創投家兼特朗普顧問馬克‧安德森將 DeepSeek-R1 形容為「人工智慧的斯普特尼克（Sputnik）時刻」，描述 DeepSeek-R1 的亮相讓美國意識到自己的技術落後，從而促使了競賽的全面爆發，美國的積極應對與行動，顯示出人工智慧領域競爭日益白熱化，本篇文章將探討 DeepSeek 和 ChatGPT 在模型架構、計算效率、推理能力、未來趨勢等方面的比較。

模型架構

DeepSeek 和 ChatGPT 在技術架構上均基於 Transformer，簡單來說是一種讓 AI 理解和處理語言的技術，但兩者在模型設計與訓練方法上有所不同，以下分為兩點來說明。

第一，架構類型：
DeepSeek-R1 採用混合專家架構（Mixture of Experts, MoE），這是一種能夠根據不同任務需求選擇啟動特定「專家」子網絡的模型架構。換句話說，當模型在處理任務時，能分配最合適的專家來參與計算，進而提升計算效率並降低資源消耗。而 ChatGPT（GPT-4）採用了 Transformer 架構，是基於自注意力機制（Self-Attention），此機制是指 AI 能捕捉句子或段落中遠距離詞彙之間的關係，並更新詞彙的含意，這是目前主流且成熟的深度學習模型架構之一。
第二，參數規模與推理模式：
一般而言參數越多，模型通常會更強大，能夠學習更複雜的模式，但也會增加計算資源的需求。DeepSeek-R1 總參數量為 6,710 億（671B），但每次推理時實際啟用的參數僅約 370 億（37B）。這種設計提高了計算效率，降低了推理成本。ChatGPT（GPT-4）則是每次推理都會使用全部參數，因此推理時的計算負擔較高，但對於需要長時間一致性的應用較為穩定，例如長篇寫作或是連貫性推理等。

優勢與應用

了解 DeepSeek 和 ChatGPT 模型架構後，雖然兩者在基礎架構上都基於 Transformer，但它們的訓練方式與推理策略不同，彼此具有不同的優勢，以下將 DeepSeek 和 ChatGPT 的計算效率與推理能力進行比較，並舉例適合的應用場景與說明。

首先，我們先來了解 DeepSeek 的優勢，根據上一段模型架構分析，DeepSeek 採用 MoE（Mixture of Experts）架構，讓不同「專家」子模型負責特定任務，這使得 DeepSeek 適合處理高精確度計算與運算的任務，以下舉兩個例子。

第一，專業領域數據分析：
因為 DeepSeek 具備強大的數學運算與數據處理能力，加上採用混合專家架構，所以非常適合進行特定領域的數據分析與預測。以投資公司為例，分析師每天需要分析上百支股票的市場數據，包括價格波動、交易量、技術指標等，可以將歷史數據與即時市場數據輸入模型，讓 DeepSeek 進行分析與預測，並根據歷史走勢預測趨勢，而ChatGPT雖然能撰寫報告，但在數據計算上不如DeepSeek精確。
第二，數學邏輯推理：
在 DeepSeek 提供的測試數據上，我們發現數學解題的能力已經並肩 ChatGPT，甚至精準度更高於 ChatGPT。以數學 AI 助手為例，學校希望透過 AI 提供學生更高效的學習體驗，特別是幫助學生在數學考試中提高解題能力，使用 DeepSeek 可以有效率的提供學生精準的答案與推理過程。ChatGPT 雖然也能解決數學邏輯問題，但某些複雜演算法的實現可能不夠精確，特別是在處理邏輯較為複雜的數據結構問題時。

再來，我們介紹 ChatGPT 的優勢，根據上一段模型架構分析，ChatGPT 基於自注意力機制，能夠捉句子或段落中遠距離詞彙之間的關係，因此在自然語言推理與長篇邏輯推理上有強大的優勢，並且在創意生成、設計創作的能力上優於 DeepSeek，以下舉兩個例子。

第一，強大的創意行銷：
可口可樂公司使用 ChatGPT 來生成廣告文案、社群媒體貼文，並分析消費者互動數據，以最佳化行銷策略，並且舉辦全球行銷活動「Create Real Magic」中，鼓勵消費者使用 AI 生成可口可樂主題的創意作品，提升品牌影響力。
第二，自然語言處理能力：
以 MESA 為例，MESA 是一款專為 Shopify 商家設計的工作流程自動化應用程式，將 Shopify 與 ChatGPT 等多種應用程式整合，實現各種自動化工作流程，能夠自動回應客戶問題，且根智慧生成推薦內容等功能，此整合凸顯了 ChatGPT 強大的自然語言處理能力。

未來趨勢

隨著 AI 技術快速的發展與激烈競爭，企業對於 AI 的需求日益增長，DeepSeek 的出現無疑影響了整個市場，而不同 AI 產品間的定位與市場分工也逐漸清晰，以下將根據兩者 AI 的性質討論，並分析未來趨勢。

首先分析 DeepSeek，DeepSeek 的優勢在於便宜的價格，但特定領域的表現上卻匹敵 ChatGpt，加上開源的性質，能夠讓使用者免費下載並做修改和部署，以下是兩者性質分析，並分為兩方面看未來的趨勢。。

第一，中小企業 AI 的普及：
目前許多中小企業正在面臨智慧轉型，而中小企業不一定能負擔市面上主流 AI 的價格，但 DeepSeek 的價格改變了市場，成為中小企業更有性價比的選擇，而且技術門檻低，開源技術使開發者能調整與優化，滿足中小型企業的靈活需求。
第二，產業專業化：
因為 DeepSeek 的強項是分析特定專業領域的資料，加上開源的特性，能夠讓企業客製化訓練屬於自己的模型，並且支持本地部署，不用上傳至 OpenAI 伺服器，降低重要資料外洩的風險。

接下來依據性質分析 ChatGPT 的未來趨勢，分為以下兩點，

第一點，AI 深度整合：
ChatGPT 服務的範圍與 DeepSeek 不同，已經擁有全球性的影響力，因此 ChatGPT 正朝向「企業 AI 服務」方向發展，使 AI 能快速且便利的流入企業之中。例如，Microsoft 365 Copilot 是專門針對 Office 應用的 AI 工具，基於 GPT 技術開發，且經過 Microsoft 深度整合，針對企業實際應用做了優化，可以自動生成 Word 內容、分析 Excel 數據、摘要 Outlook 電子郵件、整理 Teams 會議記錄等功能。
第二點，個性化 AI：
雖然 ChatGPT 的優勢不在於開源，但 ChatGPT 可以提供簡單、易用的客製化 AI 工具，這使技術門檻降低，不用專業技術團隊也能讓企業打造個性化 AI，並且降低 AI 部署的技術成本。例如，Radfield Home Care 是一家居家護理服務的公司，他們將 ChatGPT 整合到行銷和人力資源操作中，還在短短三天內開發了定制軟體，節省了聘請外部開發人員的成本，Radfield Home Care 在無需擁有專業技術團隊的情況下，成功地開發了客製化的 AI 應用，這展現了 ChatGPT 如何降低成本與 AI 的整合便利性。

結論

根據上述分析，DeepSeek 和 ChatGPT 各自擁有不同的技術特點與應用優勢，DeepSeek-R1 在數學推理、邏輯分析及數據處理方面表現突出，特別適用於數據分析、邏輯推理等專業領域。

而 ChatGPT 則在語言理解、創意寫作及多語言客服上具有強大優勢，已廣泛應用於行銷、企業溝通和客戶服務。

DeepSeek 目前以開源模式提供，允許企業與研究機構進行私有化部署，這對於有數據安全需求的使用者而言是一大優勢，此外，其強調技術透明度，使得 AI 模型的可控性更高，可能更受關注 AI 風險管理的企業與研究團隊青睞。

[ 閱讀洪為璽的所有文章]

另一方面，ChatGPT 持續流入企業進行整合，進一步擴展企業級應用，提供更高效的自動化與解決方案。透過與雲端服務的結合，ChatGPT 可幫助企業提升生產力，並在大型組織內部推動更有效率的決策。

整體而言，DeepSeek 以開源與技術透明度為特色，而 ChatGPT 則專注於生態整合與多功能應用。隨著 AI 技術持續發展，兩者在市場上將形成競爭與互補並存的趨勢，加速 AI 的進步，在未來只會有更多的 AI 工具，如何善用這些 AI 工具將成為現代中每個人的課題。

(本文授權非營利轉載，請註明出處：CIO Taiwan)

標籤: AI ChatGPT DeepSeek 人工智慧

DeepSeek 在 AI 領域對比與發展

【影】數位憑證皮夾 3 月底沙盒測試開源且採分散式架構

戰無不勝！華碩Radeon RX 9070 XT / 9070系列顯示卡重磅出擊

相關文章

從原則邁向 IT 系統實踐之路（上）落實隱私應始於設計

AI Agent 未來企業的現在進行式？

政府對範疇三的指引彙整

戰無不勝！華碩Radeon RX 9070 XT / 9070系列顯示卡重磅出擊

數位及平面

關注社群

合作夥伴

關於我們

CIO Taiwan 歡迎你回來！

歡迎註冊 CIO Taiwan 網站會員

找回密碼

7/28 活動延期通知

保護混合雲架構安全 Cloudflare 資安能力獲肯定

AI 國際標準呼之欲出，ISO 42001 即將公告 AI 管理解方

【專訪】金管會金融科技發展與創新中心副執行秘書胡則華

第十屆金融CIO高峰會冬季場會後報導

善用企業專網解決各產業痛點與需求

伊雲谷 NeoEdge 平台，啟動雙軸轉型最佳方案

文章分類

熱門標籤

活動

影音

DeepSeek 在 AI 領域對比與發展

DeepSeek 橫空出世

模型架構

優勢與應用

未來趨勢

結論

【影】數位憑證皮夾 3 月底沙盒測試 開源且採分散式架構

戰無不勝！華碩Radeon RX 9070 XT / 9070系列顯示卡重磅出擊

相關文章

數位及平面

關注社群

合作夥伴

關於我們

CIO Taiwan 歡迎你回來！

歡迎註冊 CIO Taiwan 網站會員

找回密碼

7/28 活動延期通知

您已閒置超過 3 分鐘了，為您推薦其他文章！點擊空白處、ESC 鍵或關閉回到網頁

文章分類

熱門標籤

活動

影音

【影】數位憑證皮夾 3 月底沙盒測試開源且採分散式架構