金年會(huì)-谷歌部署新的Axion CPU和第七代Ironwood TPU
發(fā)布時(shí)間:2025-11-30 jinnianhui
谷歌部署新的Axion CPU和第七代Ironr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e
?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ood TPU —— 訓(xùn)練和推理 Pod 擊敗 Nvidia GB300 并塑造“AI 超級(jí)計(jì)算機(jī)”模型 作者: 時(shí)間:2025-11-07 來源:
加入技術(shù)交流群
掃碼加入和技術(shù)大咖面對(duì)面交流海量資料庫查詢
今天,GoogleCloud 推出了新的面向 AI 的實(shí)例,由自己的 Axion CPU 和 Ironr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ood TPU 提供支持。新實(shí)例旨在訓(xùn)練和大規(guī)模 AI 模型的低延遲推理,這些新實(shí)例的主要特點(diǎn)是 AI 模型的高效擴(kuò)展,這得益于 Google 基于 Ironr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ood 的系統(tǒng)的非常大的擴(kuò)展世界規(guī)模。
數(shù)百萬個(gè)用于訓(xùn)練和推理的 Ironr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ood TPU。Ironr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ood是 Google 的 7th一代張量處理單元 (TPU),可提供 4,614 FP8 TFLOPS 的性能,配備 192 GB HBM3E 內(nèi)存,提供高達(dá) 7.37 TB/s 的帶寬。Ironr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ood 吊艙可擴(kuò)展至 9,216 個(gè) AI 加速器,為訓(xùn)練和推理提供總共 42.5 FP8 ExaFLOPS,遠(yuǎn)遠(yuǎn)超過了 Nvidia GB300 NVL72 系統(tǒng)的FP8 能力,即 0.36 ExaFLOPS。該吊艙使用專有的 9.6 Tb/s 芯片間互連網(wǎng)絡(luò)進(jìn)行互連,總共攜帶約 1.77 PB 的 HBM3E 內(nèi)存,再次超過了 Nvidia 競(jìng)爭(zhēng)平臺(tái)所能提供的功能。
谷歌尚未公布其 Axion CPU 的完整芯片規(guī)格:沒有確認(rèn)每個(gè)芯片的核心數(shù)量(超過 96 個(gè) vCPU 和 C768A Metal 實(shí)例的 5 GB DDR4 內(nèi)存),沒有公開的時(shí)鐘速度,也沒有公開的工藝節(jié)點(diǎn)該部件的詳細(xì)信息。我們所知道的是,Axion 是圍繞 Arm Neoverse v2 平臺(tái)構(gòu)建的,與現(xiàn)代 x50 CPU 相比,其設(shè)計(jì)旨在提供高達(dá) 60% 的性能提升和高達(dá) 86% 的能效,以及比“當(dāng)今云中最快的基于 Arm 的通用實(shí)例”高出 30% 的性能。有報(bào)道稱,該 CPU 每核提供 2 MB 的私有 L2 緩存、80 MB 的 L3 緩存、支持 DDR5-5600 MT/s 內(nèi)存以及節(jié)點(diǎn)的統(tǒng)一內(nèi)存訪問 (UMA)。
運(yùn)行 Google Axion CPU 和 Ironr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ood CPU 的服務(wù)器配備了該公司定制的 Titanium 品牌控制器,可從主機(jī) CPU 卸載網(wǎng)絡(luò)、安全和I/O 存儲(chǔ)處理,從而實(shí)現(xiàn)更好的管理,從而提高性能。
一般來說,Axion CPU 可以為 AI 服務(wù)器和通用服務(wù)器提供服務(wù),以執(zhí)行各種任務(wù)。目前,谷歌提供三種 Axion 配置:C4A、N4A 和 C4A 金屬。
C4A 是 Google Axion 驅(qū)動(dòng)的實(shí)例系列中的第一個(gè)也是主要產(chǎn)品,也是當(dāng)今唯一普遍可用的產(chǎn)品。它提供多達(dá) 72 個(gè) vCPU、576 GB DDR5 內(nèi)存和 100 Gbps 網(wǎng)絡(luò),搭配高達(dá) 6 TB 本地容量的 Titanium SSD 存儲(chǔ)。該實(shí)例經(jīng)過優(yōu)化,可在各種應(yīng)用程序中實(shí)現(xiàn)持續(xù)的高性能。
接下來是 N4A 實(shí)例,它也針對(duì)數(shù)據(jù)處理、Web 服務(wù)和開發(fā)環(huán)境等一般工作負(fù)載,但它可擴(kuò)展到 64 個(gè) vCPU、512 GB DDR5 RAM 和 50 Gbps 網(wǎng)絡(luò),使其成為更實(shí)惠的產(chǎn)品。
另一個(gè)預(yù)覽模型是 C4A Metal,這是一種裸機(jī)配置,可能直接向客戶公開完整的 Axion 硬件堆棧:多達(dá) 96 個(gè) vCPU、768 GB DDR5 內(nèi)存和 100 Gbps 網(wǎng)絡(luò)。該實(shí)例適用于專用或許可證受限的應(yīng)用程序或 Arm 原生開發(fā)。
完整的定制芯片產(chǎn)品組合這些新產(chǎn)品建立在谷歌十年來定制芯片開發(fā)的基礎(chǔ)上,從最初的 TPU開始,一直延續(xù)到Y(jié)ouTube 的 VCU、Tensor 移動(dòng)處理器和 Titanium 基礎(chǔ)設(shè)施。Axion CPU——谷歌首款基于 Arm 的通用服務(wù)器處理器——完善了該公司的定制芯片產(chǎn)品組合,而 Ironr:破高膙轔?f然揩襮嫛蟿F鳩5pep=k?確矅?鷜%?疆淴恤4G?緬暑皚`x鵏 ]]穸?頺t諏?鷓?$% 燾???烊所?炎m豩=2(?r蜨R庀汬}T廞 ??ヱq鵒黮}劷:q{|?e ?%坖D覑眤丬鯇M(纈s6/搇t巗紹g.晾飽S閽?dt邊潫Lg妔譫ood TPU 為與市場(chǎng)上最好的人工智能加速器的競(jìng)爭(zhēng)奠定了基礎(chǔ)。
-金年會(huì)





