NVIDIA执行长黄仁勋于GTC 2025短暂介绍下一代加速运算产品计画,一如黄仁勋在COMPUTEX 2024的NVIDIA主题演讲提及,NVIDIA将在2026年下半年公布包括Vera CPU与Rubin GPU等下一代架构,以及在2027年公布Rubin Ultra增强版GPU;然而此次黄仁勋再进一步的公布更多关于Vera与Rubin的相关细节,最值得关注的是Vera Rubin的NVL机架系统将扩展自144个GPU,而预计在2027年公布的Rubin Ultra NVL机架系统将以NVLink贯串高达576个GPU,进一步扩展单一机架内部高速互连的规模,此外预告Rubin之后的架构将以美国知名物理学家Richard Feynman的Feynman作为代号。
▲黄仁勋介绍基于Vera Rubin超级晶片以及Vera Rubin NVL144系统
NVIDIA预计在2026年下半年公布下一代的CPU与GPU平台,包括Vera CPU与Rubin GPU;Vera将采用88核客制化Arm核心,并提供176个执行绪,意味着Vera将支援超执行绪技术;而Rubin将是双光罩尺寸的大型GPU,具备288GB HBM4记忆体以及提供高达50PF的FP4算力;基于Vera Rubin超级晶片的机架系统将利用频宽高达260TB/s的NVLink 6使高达144个GPU互联,并以NVIDIA ConnectX-9提供高达28.8TB/s的频宽,系统称为Vera Rubin NVL144,Vera Rubin NVL144具备高达13TB/s的HBM4记忆体传输速度,高达75TB的高速记忆体,可提供高达3.6 EF FP4推论性能、1.2 EF的FP8训练,相较GB300 NVL72提升3.3倍性能。
▲Rubin Ultra将达到4光罩尺寸
预计在2027年下半年推出的Rubin Ultra不仅只是增强记忆体的Rubin,同时进一步扩展晶片规模,达到4光罩尺寸,并具备1TB的HBM4e记忆体与100PF的FP4推论性能,届时将同样搭配88核Vera CPU构成超级晶片;同时NVIDIA也将推出以1.5 PB/s频宽的NVLink7贯串576个Rubin Ultra的Rubin Ultra NVL576系统,将具备4.6PB/s传输速度的HBM4e记忆体、365TB的高速记忆体,预期可达到15 EF的FP4推论性能与5 EF的FP8训练性能。
发表评论 取消回复