NVIDIA DGX Spark 全新上市!將強大的 AI 超級運算能力帶到您的桌面,讓您無需資料中心資源,也能輕鬆處理大型 AI 模型!
NVIDIA於2025年3月18日的GTC大會上正式發布了DGX Spark,這是一款革命性的桌面AI超級電腦,前身為在2025年1月CES展會上初次亮相的Project Digits。NVIDIA稱DGX Spark是「世界上最小的AI超級電腦」,專為研究人員、數據科學家、機器人開發者和學生打造,將數據中心級的AI計算能力帶入桌面環境。這款體積小巧但功能強大的設備,可以讓用戶在本地開發、微調和執行大型AI模型,無需依賴雲端服務。

硬體規格
DGX Spark搭載了專為桌面環境優化的NVIDIA GB10 Grace Blackwell超級晶片,此晶片是與聯發科合作開發的成果。GB10包含了20核心Armv9處理器(10個Cortex-X925核心和10個Cortex-A725核心)以及搭載最新CUDA核心和第5代Tensor核心的Blackwell GPU。這款系統提供了128GB 256位LPDDR5x統一記憶體,記憶體頻寬高達273 GB/s,並配備1TB或4TB NVMe M.2 SSD儲存空間。
在連接方面,DGX Spark配備一個HDMI 2.1a端口、一個10GbE RJ45網路端口(通過ConnectX-7 Smart NIC)、WiFi 7和藍牙5.3支持,以及4個USB4 Type-C端口。GB10超級晶片採用NVIDIA NVLink-C2C互連技術,提供CPU+GPU一致性記憶體模型,頻寬是第五代PCIe的5倍,這讓超級晶片能夠在GPU和CPU之間高效訪問數據,優化記憶體密集型AI開發工作負載的性能。
DGX Spark體積非常小,尺寸僅為150 x 150 x 50.5毫米,重量為1.2公斤,外觀類似於Mac mini,但功耗為170瓦特,可通過標準壁式電源插座供電。

性能與功能
DGX Spark提供高達1,000 TOPS(每秒1萬億次操作)的AI計算性能(FP4精度),能夠處理最新一代的AI推理模型,包括NVIDIA Cosmos Reason世界基礎模型和NVIDIA GR00T N1機器人基礎模型。系統運行基於Ubuntu 22.04的NVIDIA DGX OS,預裝了完整的NVIDIA AI軟體堆疊。
單台DGX Spark可以處理參數量高達200億的大型語言模型,而通過NVIDIA ConnectX網絡技術,連接兩台DGX Spark系統還能處理高達405億參數的更大型模型(例如最新的Llama 3.1 405B模型)。NVIDIA的完整AI平台使DGX Spark用戶可以無縫地將模型從桌面遷移到DGX Cloud或任何加速云或數據中心基礎設施,幾乎不需要代碼更改,從而讓原型設計、微調和迭代工作流程變得前所未有的簡單。
與DGX Station的比較
除了DGX Spark,NVIDIA還發布了功能更強大的DGX Station,這是一款外觀類似傳統桌面PC的高性能AI工作站。DGX Station是首款搭載NVIDIA GB300 Grace Blackwell Ultra Desktop超級晶片的桌面系統,擁有784GB的一致性記憶體空間,能夠加速大規模訓練和推理工作。
DGX Station還配備了NVIDIA ConnectX-8 SuperNIC,支持高達800Gb/s的網絡連接,能夠實現多台DGX Station的高速連接以處理更大的工作負載,並為AI工作負載提供網絡加速的數據傳輸。與體積更小、價格更親民的DGX Spark相比,DGX Station提供了數據中心級別的性能,適合更為專業和要求更高的AI開發應用場景。

應用場景與目標用戶
DGX Spark主要針對學術研究人員、數據科學家、機器人開發者和學生等用戶群體。這款設備能夠讓用戶在本地環境中開發AI模型原型、微調參數以及執行推理工作負載,無需依賴雲端服務,從而提高開發效率並降低成本。
在實際應用中,DGX Spark可用於自然語言處理、電腦視覺、機器人控制等多種AI領域的研究和開發。例如,研究人員可以使用DGX Spark微調大型語言模型以適應特定領域的需求,或者開發和測試機器人控制算法。DGX Spark的高性能和便攜性使其成為連接邊緣設備和雲端AI系統的理想橋樑。
可用性與價格
DGX Spark的建議零售價為3,000美元,從2025年3月18日起已在美國、英國、法國、意大利、德國和西班牙通過合作夥伴開放預訂。ASUS、Dell、HP Inc.和Lenovo等全球系統製造商將提供DGX Spark產品,預計於2025年5月開始出貨。
而功能更強大的DGX Station預計將在2025年晚些時候通過ASUS、BOXX、Dell、HP、Lambda和Supermicro等製造合作夥伴推出,目前尚未公布其價格,但據估計可能在10,000至50,000美元之間。
市場意義
DGX Spark的推出標誌著AI超級計算正式進入個人桌面領域,這對AI技術的普及和發展具有重要意義。在過去,高性能AI計算通常需要大型數據中心或昂貴的雲端服務,而DGX Spark讓更多開發者和研究人員能夠負擔得起本地AI開發環境,從而促進AI創新和應用的繁榮。
NVIDIA DGX Spark與同期推出的DGX Station共同構成了NVIDIA個人AI超級電腦的產品線,為不同需求和預算的用戶提供選擇。隨著這些產品的推出,可以預見AI開發將變得更加普及,更多創新應用將會出現,進一步推動AI技術在各行各業的應用和發展。

技術規格總結
參數 | DGX Spark 規格 |
---|---|
處理器 | NVIDIA GB10 Grace Blackwell Superchip |
CPU | 20核Armv9處理器(10個Cortex-X925核心和10個Cortex-A725核心) |
GPU | Blackwell架構,第5代Tensor核心 |
AI計算性能 | 高達1,000 TOPS(FP4精度) |
記憶體 | 128GB 256位LPDDR5x,頻寬273 GB/s |
儲存 | 1TB或4TB NVMe M.2 SSD |
網絡 | 10GbE RJ45端口,WiFi 7和藍牙5.3 |
接口 | HDMI 2.1a,4個USB4 Type-C端口 |
電源 | 170瓦特 |
尺寸 | 150 x 150 x 50.5 毫米 |
重量 | 1.2公斤 |
操作系統 | NVIDIA DGX OS(基於Ubuntu 22.04) |
價格 | 3,000美元 |
上市時間 | 2025年5月 |
NVIDIA GB10 Superchip:DGX Spark 內 AI 性能增強的核心技術
NVIDIA GB10 Superchip 是 DGX Spark(前身為 Project DIGITS)桌面級 AI 超級電腦的核心元件,為這款緊湊型裝置提供了卓越的 AI 運算能力。本文將深入探討 GB10 Superchip 如何通過其獨特的架構設計、記憶體系統、互連技術和專用處理核心,顯著提升 DGX Spark 的 AI 性能表現,使其能夠應對現代 AI 工作負載的需求。
先進架構設計與處理能力
GB10 Superchip 採用 NVIDIA Grace Blackwell 架構設計,並專為桌面環境進行了優化。這款超級晶片整合了 Blackwell GPU 與 Grace CPU,形成了一個高效的系統級晶片(SoC)。其 GPU 部分搭載了最新一代 CUDA 核心和第五代 Tensor 核心,並支援 FP4 精度,為 AI 工作負載提供了強大的計算能力。
GB10 的 Grace CPU 部分包含了 20 個能源效率極高的 Arm 架構核心,這是 NVIDIA 與聯發科技(MediaTek)合作開發的成果。其中包括針對高性能計算優化的核心,能夠處理複雜的 AI 工作負載並高效管理系統資源。與傳統分離式 CPU-GPU 設計相比,這種整合式架構大幅降低了處理延遲,同時提升了整體系統效率。
NVIDIA 聲稱 GB10 Superchip 能夠提供高達 1,000 TOPS(每秒 1 萬億次操作)的 AI 計算性能(在 FP4 精度下),有些資料還提到它可以達到 1 petaflop 的 AI 性能。這一驚人的計算能力使 DGX Spark 能夠流暢地運行最新一代的 AI 推理模型,包括 NVIDIA Cosmos Reason 世界基礎模型和 NVIDIA GR00T N1 機器人基礎模型。
NVLink-C2C:革命性的互連技術
GB10 Superchip 採用了 NVIDIA 的 NVLink-C2C 晶片間互連技術,這是提升其 AI 性能的關鍵因素之一。這項技術為 CPU 和 GPU 之間提供了一致性記憶體模型,其頻寬是第五代 PCIe 的 5 倍。這種高頻寬互連使超級晶片能夠在 GPU 和 CPU 之間高效訪問數據,從而優化記憶體密集型 AI 開發工作負載的性能。
NVLink-C2C 互連技術不僅提高了數據傳輸效率,還實現了 CPU 和 GPU 之間的記憶體一致性。這意味著開發人員可以更輕鬆地管理複雜的 AI 工作流程,無需擔心 CPU 和 GPU 之間的數據同步問題。這種一致性記憶體模型特別適合大型語言模型(LLM)等需要頻繁在 CPU 和 GPU 之間傳輸大量數據的 AI 應用場景。
統一記憶體架構與儲存系統
DGX Spark 配備了 128GB 的統一系統記憶體,採用 LPDDR5X 規格設計,提供高頻寬性能。這種統一記憶體架構使 CPU 和 GPU 能夠共享同一記憶體空間,消除了傳統架構中數據在不同記憶體區域之間複製所帶來的開銷。
在儲存方面,DGX Spark 提供高達 4TB 的 NVMe SSD 儲存空間。這種高速儲存系統能夠快速讀取和寫入大型數據集和模型參數,進一步提升了 AI 工作負載的整體性能。充足的儲存容量也允許開發人員在本地保存多個大型模型,便於比較和迭代開發。
有了這樣的記憶體和儲存配置,DGX Spark 能夠處理參數量高達 200 億的大型語言模型。這使得研究人員和開發者能夠在桌面環境中直接開發、微調和執行先進的 AI 模型,而無需依賴雲端服務。
ConnectX 網絡技術實現擴展能力
GB10 Superchip 搭配 NVIDIA ConnectX 網絡技術,進一步增強了 DGX Spark 的 AI 性能和擴展能力。通過 ConnectX 網絡技術,可以將多台 DGX Spark 系統連接起來,形成更強大的計算集群。
例如,將兩台 DGX Spark 系統連接在一起,可以處理參數量高達 405 億的超大型模型(如 Llama 3.1 405B 模型)。這種擴展能力使 DGX Spark 能夠適應不斷增長的 AI 模型規模和複雜性,為用戶提供了靈活的擴展路徑。
ConnectX 技術還支援 NCCL、RDMA 和 GPUDirect 等先進網絡功能,這些功能可以加速分佈式 AI 訓練和推理過程,提高多設備協作的效率。這使得 DGX Spark 不僅是一個獨立的計算設備,還可以成為更大規模 AI 系統的一部分。
完整的 AI 軟體堆疊支持
GB10 Superchip 的性能優勢不僅來自於硬體設計,還得益於 NVIDIA 完整的 AI 軟體堆疊支持。DGX Spark 預裝了基於 Ubuntu 22.04 的 NVIDIA DGX OS,以及完整的 NVIDIA AI 軟體堆疊。
這些軟體工具優化了硬體資源的使用,包括 GPU 加速庫、深度學習框架和開發工具。透過這些優化的軟體,GB10 Superchip 能夠充分發揮其硬體潛力,為 AI 工作負載提供最佳性能。
NVIDIA 的完整 AI 平台使 DGX Spark 用戶可以無縫地將模型從桌面遷移到 DGX Cloud 或任何加速雲或數據中心基礎設施,幾乎不需要代碼更改。這種無縫遷移能力大大簡化了從原型設計到大規模部署的過程,提高了 AI 開發的效率。

功耗優化設計
值得注意的是,儘管 GB10 Superchip 提供了強大的計算能力,但它的功耗設計非常高效。DGX Spark 的總功耗僅為 170 瓦特,可以通過標準壁式電源插座供電。這種優化的功耗設計使 DGX Spark 能夠在桌面環境中長時間運行,而不會產生過多的熱量或需要特殊的散熱設備。
GB10 Superchip 的高效能源利用率,很大程度上歸功於 Grace CPU 採用的 Arm 架構設計。Arm 核心以其優異的性能/功耗比著稱,這使得 GB10 能夠在較低功耗下提供高計算性能。
結論
NVIDIA GB10 Superchip 通過其創新的架構設計、高效的互連技術、統一的記憶體系統和完整的軟體支持,顯著提升了 DGX Spark 的 AI 性能。它不僅使 DGX Spark 能夠處理最先進的 AI 模型,還提供了良好的擴展性和靈活性,滿足不同用戶的需求。
GB10 Superchip 代表了 NVIDIA 將數據中心級 AI 計算能力帶入桌面環境的重要一步。透過這款超級晶片,DGX Spark 成為了一款真正意義上的個人 AI 超級電腦,為研究人員、開發者和學生提供了前所未有的 AI 計算資源。隨著 AI 技術的不斷發展,GB10 Superchip 將繼續推動個人 AI 計算的邊界,為 AI 創新提供強大支持。
NVIDIA DGX Cloud 與 DGX Spark 整合的優勢
NVIDIA 最近推出的 DGX Spark 桌面級 AI 超級電腦與 DGX Cloud 平台的整合為 AI 開發者、研究人員和數據科學家提供了一個無縫連接的端到端 AI 開發解決方案。這種整合帶來了多方面的顯著優勢,使從桌面開發到雲端部署的 AI 工作流程更加高效和靈活。
無縫模型遷移與工作流程連續性
使用 DGX Spark 與 DGX Cloud 整合的最顯著優勢是模型的無縫遷移能力。NVIDIA 的完整 AI 平台使 DGX Spark 用戶可以輕鬆地將模型從桌面遷移到 DGX Cloud 或任何加速雲或數據中心基礎設施,幾乎不需要代碼更改。這種無縫遷移能力大大簡化了從原型設計、微調到迭代的工作流程。
開發者可以在 DGX Spark 上開始開發工作,然後在需要更多計算資源時,輕鬆將工作負載遷移到 DGX Cloud 平台。這種從桌面到雲端的連續性消除了傳統 AI 開發中常見的環境差異和遷移障礙。

從桌面到雲端的擴展性
DGX Spark 單獨可以處理參數量高達 200 億的大型語言模型,但當需要處理更大規模模型或更高性能需求時,DGX Cloud 提供了理想的擴展路徑。這種靈活的擴展能力使開發團隊能夠根據項目需求選擇最合適的計算資源。
DGX Cloud 作為一個高性能、全托管的 AI 平台,提供了在領先雲服務上的加速計算集群,可以無縫接收從 DGX Spark 遷移的工作負載。這種擴展性使團隊能夠在不同規模的項目之間靈活轉換,無需重新設計工作流程。
統一的 AI 平台體驗
DGX Spark 和 DGX Cloud 都是 NVIDIA 完整 AI 解決方案的一部分,共享相同的 NVIDIA AI 軟體堆疊。這種一致性確保了在兩個平台之間的技能和經驗可以直接轉移,減少了學習曲線和培訓成本。
統一平台體驗也意味著開發人員可以在 DGX Spark 上開發和測試的模型可以在 DGX Cloud 上以相同的方式運行,無需重新配置或調整。這大大提高了團隊協作效率和項目推進速度。
跨平台的 NVIDIA 專業支持
DGX Cloud 提供對 NVIDIA AI 專家的直接訪問,這些專家可以幫助優化工作負載,加快 AI 開發進程。這種專業支持同樣適用於從 DGX Spark 遷移到雲端的模型和應用。
NVIDIA 的專家支持可以幫助團隊解決複雜的 AI 挑戰,優化模型性能,並提供最佳實踐建議。這對於加速 AI 專案實施並實現更快投資回報至關重要。

部署選項的靈活性
DGX Spark 與 DGX Cloud 的整合提供了極大的部署靈活性。開發者可以在本地 DGX Spark 上進行開發和測試,然後根據需要選擇部署到 DGX Cloud 或其他雲基礎設施。
DGX Cloud 支持多種領先的雲服務提供商,使用戶可以選擇最適合其需求和預算的雲平台。此外,還提供靈活的期限和可擴展的資源,使團隊能夠根據項目需求調整資源配置。
成本效益優化
使用 DGX Spark 進行本地開發和測試可以顯著節省雲計算成本。團隊可以在本地環境中完成大部分開發工作,只在需要更大規模計算或部署時才遷移到 DGX Cloud。
DGX Cloud 還優化了 GPU 利用率,提高了 AI 投資的回報率。通過智能資源分配和監控工具,管理員可以確保計算資源被最有效地利用,減少浪費,提高整體成本效益。
生產力提升
DGX Cloud 提供簡單直觀的用戶界面,用於調度、監控和分配計算資源。這使管理團隊能夠清晰地查看 AI 工作負載,並設置策略驅動的控制,最大化資源效率。
兩個平台都針對 AI 工作負載進行了優化,減少了設置和配置時間。開發人員可以花更少的時間配置基礎設施,更多的時間專注於 AI 開發和創新。這種效率提升對於快速迭代和推進 AI 專案至關重要。
總結
NVIDIA DGX Cloud 與 DGX Spark 的整合為 AI 開發團隊提供了一個完整、高效的開發到部署解決方案。從無縫模型遷移、靈活擴展性到統一平台體驗和專業支持,這種整合為現代 AI 開發工作流程帶來了顯著優勢。無論是初創企業、研究機構還是大型企業,都可以通過這種整合方案加速 AI 創新並提高投資回報率。
可用性: DGX Spark 系統現已開放預約。
DGX Station 預計將於今年稍後由華碩、BOXX、戴爾、惠普、Lambda 和 Supermicro 等製造合作夥伴推出。
觀看NVIDIA GTC 主題演講以了解更多信息。
常見問題 (FAQ)
1. NVIDIA DGX Spark 是什麼?
NVIDIA DGX Spark 是 NVIDIA 推出的革命性桌面AI超級電腦,搭載 NVIDIA GB10 Grace Blackwell 超級晶片,提供高達 1,000 TOPS 的 AI 計算性能,支持大型 AI 模型的開發與執行,適用於研究人員、數據科學家、機器人開發者和學生等用戶群體。
2. DGX Spark 的硬體規格有哪些?
DGX Spark 配備了 20 核 Armv9 處理器、128GB LPDDR5x 統一記憶體、高達 4TB NVMe 固態硬碟、HDMI 2.1a 輸出以及最新的 CUDA 和 Tensor 核心,整體尺寸僅 150 x 150 x 50.5 毫米,功耗為 170 瓦特。
3. DGX Spark 可以處理多大的 AI 模型?
DGX Spark 可單獨處理參數量高達 200 億的大型語言模型,通過 NVIDIA ConnectX 技術連接兩台 DGX Spark 系統後,可處理高達 405 億參數的模型,例如 Llama 3.1 405B 模型。
4. DGX Spark 的應用場景有哪些?
DGX Spark 適用於自然語言處理、電腦視覺、機器人控制等多種 AI 領域的應用。研究人員可以用於微調 AI 模型,機器人開發者可以開發和測試控制算法,學生可以學習和探索 AI 模型開發。
5. NVIDIA DGX Spark 的售價和上市日期為何?
DGX Spark 的建議零售價為 3,000 美元,預計於 2025 年 5 月開始出貨,可在 NVIDIA 合作夥伴如 ASUS、Dell、HP Inc. 和 Lenovo 購買預訂。