以下是 Nvidia GTC 2025 - Jensen Keynote 的逐字稿 - 黃仁勳的GTC 2025演講,以下是按時間順序翻譯的主要內容

2025年3月GTC主題演講 - NVIDIA執行長黃仁勳

更智能的製造方式

這就是智能的製造方式 — 一種新型的令牌工廠,AI的基礎構件。令牌開啟了新的前沿,邁入一個充滿無限可能的非凡世界。令牌將圖像轉化為科學數據,繪製外星大氣圖,並引導未來的探索者。令牌將原始數據轉化為預見,讓我們能夠為未來做好準備。令牌解讀物理定律,讓我們能夠更快、更遠地前進。

Token 可以在疾病爆發前預見它,幫助我們解開生命的語言,了解人類的構成。令牌連接各個點,讓我們能夠保護最珍貴的生物,將潛力轉化為豐收,幫助我們收穫財富。令牌不僅教會機器人如何移動,還帶來喜悅,為我們提供幫助,讓生活觸手可及。我們共同邁出下一個偉大的飛躍,勇敢地前往無人曾去過的地方。而這一切從這裡開始。

開場及介紹

歡迎NVIDIA創始人兼CEO黃仁勳登場。

「歡迎來到GTC!這是一個令人驚嘆的年份,我們有很多難以置信的事情要談論。首先,我要感謝所有的贊助商,所有參與這次會議的了不起的人們。幾乎每個行業都有代表—醫療保健、交通、零售,當然還有整個計算機行業。」

GeForce和CUDA的演進

「GTC始於GeForce。這是GeForce 5090,不可思議的是,25年後,GeForce仍然在全球售罄。與49系列相比,它的體積小了30%,散熱效率提高了30%,性能更是難以比較。原因在於人工智能。GeForce為世界帶來了CUDA,CUDA使AI成為可能,而AI現在反過來革命化了計算機圖形學。」

人工智能的發展

「人工智能取得了非凡的進步,僅僅十年時間。它始於感知AI—計算機視覺、語音識別,然後是生成式AI。在過去5年,我們主要關注生成式AI,教AI如何從一種形態轉換到另一種形態—文本到圖像、圖像到文本、文本到視頻、氨基酸到蛋白質、特性到化學物質等各種方式。」

「生成式AI從根本上改變了計算的方式,從檢索計算模型轉變為生成計算模型。過去,我們提前創建內容,存儲多個版本,然後在使用時檢索適當的版本。現在,AI理解背景、理解我們的要求、理解請求的含義,並生成它所知道的內容。如果需要,它會檢索信息,增強其理解,然後為我們生成答案。它不再是檢索數據,而是生成答案,這從根本上改變了計算的方式。」

代理式AI與推理

「在過去幾年,人工智能發生了重大突破,我們稱之為代理式AI(agentic AI)。代理式AI意味著AI具有代理能力,可以感知和理解環境背景,非常重要的是,它可以推理如何回答或解決問題,並能規劃行動、使用工具。因為它現在理解多模態信息,它可以訪問網站,查看網站的格式、文字和視頻,甚至播放視頻,從中學習,然後利用這些新獲得的知識來完成工作。」

「代理式AI的基礎是推理(reasoning),而下一波浪潮已經開始,我們將談論物理AI(physical AI)—理解物理世界的AI,它理解摩擦、慣性、因果關係和物體永續性。這種理解三維物理世界的能力將開啟AI的新時代,我們稱之為物理AI,它將使機器人技術成為可能。」

AI計算需求的爆炸性增長

「每個階段、每個浪潮都為我們所有人開啟了新的市場機會。AI的三個基本問題是:如何解決數據問題、如何在沒有人工干預的情況下解決訓練問題、以及如何擴展。」

「去年,幾乎整個世界都錯估了一件事—AI的計算需求比我們去年這個時候想像的要大100倍。推理AI需要生成更多的令牌,而不是簡單地一次性輸出答案。它需要逐步推理、檢查一致性、嘗試不同方法等,從而產生數百倍的令牌量。」

「為了應對這一挑戰,我們需要解決兩個基本問題:數據從何而來,以及如何不受人工參與的限制。近年來的重大突破是可驗證結果的強化學習。我們有許多已經解決的問題,知道答案,比如二次方程、畢達哥拉斯定理等。我們可以生成數百萬個不同的例子,讓AI嘗試數百次,逐步解決,使用強化學習獎勵它越做越好。結果是,我們需要生成數萬億個令牌來訓練模型。」

數據中心基礎設施的轉變

「世界的數據中心建設正在走向一個轉折點。我之前說過,我預計數據中心建設將達到萬億美元規模,我相當確定我們很快就會達到這個目標。兩個動態正在同時發生:首先,大部分增長可能會加速,因為通用計算已經走到盡頭,我們需要一種新的計算方法;其次,人們越來越認識到,未來的軟件需要資本投資。」

「這是一個非常重要的理念:過去我們編寫軟件並在計算機上運行,未來計算機將為軟件生成令牌。計算機已經成為令牌的生成器,從基於檢索的計算轉變為基於生成的計算,從舊式數據中心轉變為新式基礎設施,我稱之為AI工廠。它們是AI工廠,因為它們只有一個工作—生成這些令牌,然後我們將其重構為音樂、文字、視頻、研究、化學品或蛋白質等各種類型的信息。」

CUDA和加速計算

「數據中心的一切都將被加速,不僅僅是AI。我最喜歡的一張幻燈片是CUDA X庫。20年前,這是我們唯一的幻燈片,一個接一個的庫。加速計算需要框架,正如AI需要框架一樣。我們稱之為CUDA X庫,為各個科學領域提供加速框架。」

CUDA X

「CuNumeric是世界上下載次數最多的Python庫numpy的零更改加速;Kitho是計算光刻庫,與台積電、三星、ASML等合作;Aerial是我們的5G庫,將GPU變為5G無線電;CuOpt是數學優化庫;C-DASS是我們的稀疏求解器,對CAE非常重要;CuDF是結構化數據的數據框架;Warp是物理Python庫。」

「這些庫使加速計算成為可能。CUDA已經使它成為可能,它現在無處不在—每個雲、每個數據中心、世界上每家計算機公司提供的產品。因此,通過使用這些庫,您的軟件可以觸及每個人。」

AI的發展路徑

「AI始於雲端,因為AI需要基礎設施,雲數據中心擁有基礎設施和卓越的計算機科學研究,這是AI在雲中起飛的完美環境。但AI不會僅限於此,它將無處不在。」

「今天,我們宣布思科、NVIDIA、T-Mobile(世界上最大的電信公司)、Cerebrus和ODC將在美國建立一個完整的無線網絡堆棧。每年,世界上約有1000億美元的資本投資用於無線網絡和為通信提供的數據中心。未來,毫無疑問,這些將是加速計算與AI融合的系統。」

汽車和自動駕駛

「AI將進入每個行業。最早進入AI的行業之一是自動駕駛車輛。我們已經研究自動駕駛汽車十多年了,我們構建的技術被幾乎每家自動駕駛汽車公司使用。今天,我很高興宣布,通用汽車已選擇NVIDIA合作,共同建設他們未來的自動駕駛汽車車隊。」

「自動駕駛車輛的時代已經到來,我們期待與通用汽車在三個領域構建AI:製造AI、企業AI以及車載AI。我們為通用汽車提供AI基礎設施,與他們合作構建AI。」

Nvidia Halos
Physical AI Foundation Model - Digital Twin

Blackwell和計算架構

「Blackwell已全面投產。這是一次計算機架構的根本轉變。三年前,我們展示了Grace Hopper系統,稱為Ranger,它是世界上第一個NV Link 32。我們試圖解決擴展問題—分佈式計算是關於使用大量不同的計算機一起工作解決非常大的問題,但在擴展出去之前,你需要先進行擴展。」

「這是我們擴展的方式。這是上一代系統架構HGX,它革命化了我們所知道的計算,革命化了人工智能。這是8個GPU,每個就像這個。這是兩個Blackwell GPU在一個Blackwell包中,下面有8個這樣的。這連接到我們稱為NV Link 8的系統。」

「我們想要進一步擴展,所以我們做了非常出色的工程工作,重新設計了NV Link的工作方式和擴展的工作方式。我們將NV Link系統分離出來,放在機箱中央,有18個這樣的交換機,在9個不同的機架中。計算現在在這裡,這相當於這兩個東西的計算能力。通過液冷,我們可以將所有這些計算節點壓縮到一個機架中。」

「這是整個行業的重大變化。我要感謝所有從集成NV Link到分離式NV Link、從風冷到液冷的根本性轉變,從每台計算機約60,000個組件到每個機架600,000個組件,120千瓦全液冷。結果,我們在一個機架中擁有一個Exaflops計算機。」

推理和令牌生成

「我們的目標是擴展,現在看起來像這樣。我們實際上想要建造這個芯片,只是沒有理論限制可以做到這一點,沒有工藝技術可以做到這一點。它有130萬億個晶體管,其中200億用於計算,所以你不能很快地合理構建這個。解決這個問題的方法是將其分解為Grace Blackwell NV Link 72機架。」

「我們做了最終的擴展,這是世界上曾經做過的最極端的擴展。這台機器中可能的計算量,記憶體帶寬570兆位元組每秒,一切都是以T計量的,一切都是萬億,你有一個Exaflops,即每秒百萬萬億次浮點運算。」

「我們想要解決的極端問題被許多人誤解為簡單,實際上它是終極極端計算問題,稱為推理。推理是一個工廠的令牌生成,一個工廠是創造收入和利潤的,或者缺乏的。所以這個工廠必須以極端的效率、極端的性能構建,因為這個工廠的一切直接影響你的服務質量、收入和盈利能力。」

「在X軸上是每秒令牌數,當你向chatGPT輸入提示時,產生的是令牌,這些令牌被重新組合成單詞。我們已經確定,如果你想要你的AI更聰明,你想要生成大量令牌—這些令牌是推理令牌、一致性檢查令牌、提出大量想法選擇最佳想法的令牌。但如果你花太長時間回答問題,客戶不會再回來。」

「在大批量業務中,你會批量處理大量客戶需求,為每個人製造一個特定版本供以後消費。對於生成令牌的AI工廠也是如此。一方面,你希望客戶的服務質量盡可能好—聰明且超快的AI;另一方面,你試圖讓你的數據中心為盡可能多的人生成令牌,以最大化你的收入。」

Dynamo操作系統和AI工廠

Blackwell系統現在是擴展的NV Link 72。首先,我們必須將這個模型(它不小,例如R1是6800億參數,下一代模型可能是萬億參數)分佈在整個GPU系統上。我們可以使用張量並行、流水線並行、專家並行等,配置這台計算機的方式必須改變,以獲得最大吞吐量。」

NVIDIA Dynamo

「今天,我們宣布NVIDIA Dynamo,它做了所有這些事情。它本質上是AI工廠的操作系統。過去,我們運行數據中心的操作系統是像VMware這樣的東西,我們會協調一堆不同的企業應用程序。但在未來,應用不是企業IT,而是代理程序,操作系統不是像VMware那樣的東西,而是像Dynamo這樣的東西。這個操作系統不是運行在數據中心上,而是運行在AI工廠上。」

「我們之所以稱它為Dynamo,是因為Dynamo是啟動上一次工業革命的第一個儀器—能源工業革命。水進來,電出來,非常神奇。水進來,你點火,變成蒸汽,出來的是這個無形但極其有價值的東西。所以我們決定將這個操作系統、這個極其複雜的軟件稱為NVIDIA Dynamo。它是開源的,我們很高興有這麼多合作夥伴與我們一起工作。」

Blackwell的性能提升

「我現在向你展示我剛才所說的一切的好處。工廠圖表中,X軸是每秒令牌數—用戶體驗,Y軸是工廠的每秒令牌數吞吐量。你想要超智能的AI,並且你想要生產大量這樣的AI。」

「這是Hopper,它可以為每個用戶每秒生產約100個令牌,這是8個GPU,通過Infiniband連接。我將其標準化為每兆瓦每秒令牌數。它可以為這個一兆瓦數據中心生產10萬令牌每秒,或者如果批處理非常高,客戶願意等待很長時間,它可以為該AI工廠生產約250萬令牌每秒。」

「Blackwell使用NV Link 8、相同的計算和FP8,然後我們引入了一個新的精度,使用4位浮點數來量化模型,使用更少的能量做同樣的事情。然後我們使用NV Link 72擴展,接著添加Dynamo,Dynamo可以進一步擴展。」

「這兩個亮點部分是你的最大Q,你可能會在那裡運行你的工廠操作,你試圖找到最大吞吐量和最大質量AI之間的平衡—最聰明的AI,最多的數量。如果你看這兩個方框下面,Blackwell比Hopper好得多。記住,這不是ISO芯片,這是ISO功率—這是終極的摩爾定律。在一代中,ISO功率提高了25倍。」

「這個彩虹圖令人難以置信,這是有趣的部分。看所有不同的配置,Pareto前沿下面有數百萬個點,我們可以將數據中心配置成做這些事情,我們可以以各種方式並行和分割工作,我們找到了最優解,即Pareto前沿。」

「每一個因為顏色而顯示它是一個不同的配置,這就是為什麼這個圖片非常清楚地表明你想要一個可編程架構,它盡可能同質可替換,因為工作負載在整個前沿劇烈變化。頂部有專家並行8批處理3000,中間有專家並行64,底部有張量並行16專家並行4批處理2。計算機的配置在整個光譜上都在變化。」

The more you buy the more you save

「對於推理模型,Blackwell比Hopper的性能提高了40倍。我以前說過,當Blackwell開始大量出貨時,你無法贈送Hopper,這就是我的意思。這是有道理的,如果你仍在考慮購買Hopper,不要害怕,但我是首席收入破壞者。有些情況下Hopper是可以的,這是我能對Hopper說的最好的話,但不多。」

數據中心和AI工廠

「這是一個100兆瓦工廠的樣子,基於Hopper,你有45,000個設備,1,400個機架,它每秒生產3億個令牌。使用Blackwell,你有8,000個設備,270個機架,每秒生產80億個令牌。」

「記住,一切都在AI工廠的背景下,雖然我們談論芯片,但你總是從擴展開始,完整的擴展,你能擴展到最大值是多少。」

「世界正在競相建設最先進的大規模AI工廠。建立一個AI gigafactory是非凡的工程壯舉,需要數萬名來自供應商、建築師、承包商和工程師的工人,建造、運輸和組裝近50億個組件和超過20萬英里的光纖,幾乎是地球到月球的距離。」

「NVIDIA Omniverse藍圖用於AI工廠數字孿生,使我們能夠在物理建設開始前設計和優化這些AI工廠。這項工作傳統上是在孤島中完成的,Omniverse藍圖讓我們的工程團隊並行和協作工作,讓我們探索各種配置以最大化TCO和功率使用效率。」

NVIDIA的路線圖和光子晶片

「我們現在正在全面生產Blackwell,世界各地的計算機公司正在大規模生產這些令人難以置信的機器。在今年下半年,我們將輕鬆過渡到升級版本,我們有Blackwell Ultra NV Link 72,它的flops提高了1.5倍,記憶體是原來的1.5倍,網絡帶寬是原來的2倍。」

「這是唯一一個產品公告,我們的路線圖一年一次,這樣你就可以計劃你的AI基礎設施。我們正在建設三個AI基礎設施:雲AI基礎設施、企業AI基礎設施和機器人AI基礎設施。」

「我們宣布NVIDIA的第一個共封裝光子矽系統,它是世界上第一個1.6兆比特每秒的CPO。它基於一種稱為微環諧振調制器的技術,完全使用我們與台積電合作已有一段時間的這種令人難以置信的工藝技術構建。」

「我們決定投資MRM,因為與用於電信的莫安德相比,MRM的密度和功率更好。這項技術太神奇了,我們過去5年承擔了令人難以置信的技術風險,提交了數百項專利,並授權給我們的合作夥伴,以便我們都能建造它們。」

企業計算和邊緣AI

「為了將AI帶到世界的企業,我們需要一種新型計算機。這就是PC在AI時代應該是什麼樣子—20 petaflops,72個CPU核心,芯片到芯片接口,HBM記憶體,以及PCI Express插槽用於你的GeForce。」

「這稱為DGX Station,DGX Spark和DGX Station將由所有OEM提供—HP、Dell、Lenovo、Asus,將為世界各地的數據科學家和研究人員製造。這是AI時代的計算機,這就是未來計算機的樣子,未來計算機將運行的樣子。」

「我們還將革命化計算堆棧的其餘部分。計算有三大支柱:計算、網絡和存儲。存儲必須完全重新發明,從基於檢索的存儲系統變為基於語義的檢索系統、基於語義的存儲系統。存儲系統必須在後台不斷嵌入信息,將原始數據嵌入到知識中,然後當你訪問它時,你不是檢索它,你只是與它交談,你問它問題,你給它問題。」

物理AI和機器人技術

「物理AI和機器人技術發展如此之快,每個人都應該關注這個領域,這很可能是所有行業中最大的行業。在其核心,我們面臨著相同的挑戰:如何解決數據問題、什麼是模型架構、以及如何擴展。」

「在機器人領域,我們創建了一個稱為Omniverse的系統,它是我們的物理AI操作系統。我們今天向其添加了兩項技術:一個是Cosmos,使用Omniverse來調節Cosmos,使用Cosmos生成無數環境,使我們能夠創建數據,這些數據是有根據的、由我們控制的,但同時又是系統無限的。」

「第二件事是,我們需要一個令人難以置信的物理引擎。大多數物理引擎是為各種原因而設計的,可能是為了用於大型機械,或者為虛擬世界、視頻遊戲等設計的,但我們需要一個專為非常精細的剛體和軟體而設計的物理引擎,能夠訓練觸覺反饋和精細運動技能以及執行器控制。」

「今天,我們宣布一個非常特別的合作夥伴關係,它是三家公司的合作:DeepMind、迪士尼研究和NVIDIA,我們稱之為Newton。」

「我們還有另一個令人驚嘆的消息—今天我們宣布Groot N1是開源的。」

總結與未來展望

「總結一下,我們談論了幾件事:一、Blackwell已經全面投產,客戶需求是驚人的,原因很好,因為AI有一個轉折點,由於推理AI和代理系統的訓練,我們必須在AI中做的計算量要大得多;二、Blackwell NV Link 72與Dynamo相比Hopper的AI工廠性能提高了40倍,推理將是下一個十年最重要的工作負載之一;三、我們有年度路線圖,已經為你規劃出來,以便你可以計劃你的AI基礎設施;四、我們正在建設三個AI基礎設施—雲AI基礎設施、企業AI基礎設施和機器人AI基礎設施。」

「謝謝大家!謝謝讓這個視頻成為可能的所有合作夥伴!謝謝讓這個視頻成為可能的每個人!祝你們GTC愉快!」

全新 Rubin 架構亮相 GTC 2025

GTC 2025預計將發表Nvidia的下一代Rubin架構,代表AI運算的一大飛躍。業界消息顯示,新架構將具備更先進的推理能力,進一步拓展AI應用的可能性。

Vera Rubin NVL 144
Nvidia 下一代的 AI GPU Structure - Rubin

隨著活動日益臨近,分析師預期將公佈與量子運算以及AI模型相關的最新消息。據傳Nvidia已向特定合作夥伴透露Rubin的部分細節,顯示重大突破即將到來。

ThreadsのTenten™ - AI & Generative Future (@tenten.co)
🚀 AI的未來就在這裡!NVIDIA的GTC2025於3月17-21日舉行,黃仁勳將發表關於AI智能體、機器人技術和下一代運算能力的開創性主題演講。 💻 我們迫不及待想看到Blackwell Ultra GPU和Vera Rubin超級芯片架構的揭幕!🔥 據傳B300比前代產品強大50%! 此外,創新的PTFE材料正在革新AI服務器設計,創造了100億美元的市場機會。 GTC Live here: https://www.youtube.com/watch?v=pgLdJq9FRBQ 🌟 #GTC2025

GTC 2025 重點消息概要:

公佈時間 產品或消息重點
03:12 AM 展示 Omniverse Cosmos 作業系統用於 AI 數位雙胞胎
03:09 AM 發表 Nvidia Isaac GROOT N1,人形機器人基礎模型,以及 GR00T合成資料生成工具
03:04 AM Nvidia Llama Nemotron Reasoning AI 模型,可跨平台運作
03:02 AM 合作廠商推出 GPU 加速儲存方案,包含戴爾 Dell 全新的產品線
03:00 AM DGX Station,被稱為「AI時代的電腦」
02:54 AM 公布新版 GPU 路線圖,Blackwell 後的新世代將以 Richard Feynman 命名
02:43 AM 發表 Spectrum-X Silicon Photonics Ethernet 交換器,單埠提供 1.6 Tbps 速度
02:39 AM 公佈 Rubin Ultra NVL576 系統,2027 下半年推出,具576個 GPU 的高端規模
02:37 AM Vera Rubin NVL 144,2026 下半年推出
02:35 AM Blackwell Ultra NVL72,2025 下半年推出,效能提升巨大
02:19 AM 推出 Nvidia Dynamo,AI 工廠作業系統
01:55 AM 宣布 Grace Blackwell 正式投入大規模量產
01:49 AM Nvidia 宣佈與通用汽車(GM)結盟,投入自駕車市場
01:27 AM 提及 AI 資料中心市場規模將超過1兆美元

本次演講中呈現的重要觀點:

  • AI 產業已進入極高速的擴張時期,強化推理性能與更智慧的代理人型AI(Agentic AI)將是下一波發展重點。
  • 未來的資料中心將不再只是儲存資料與檔案的地方,而是產生智慧「token」的 AI 工廠,進一步產生各種內容、研究及應用。
  • 實體 AI 與自動化將因全球面臨長期勞動力缺口(預估約缺少5000萬人)而快速發展。
  • 新一代硬體(如Blackwell系列)及先進系統如NVLink將提供極大的AI計算能力,推動AI走向前所未見的規模與速度。
Share this post
Erik

With over 15 years of experience in technology, and the startup industry, I am passionate about AI and driving innovation.

Loading...