目录

  • Blackwell架构产品全面投入生产
  • 算力堆叠依然有其必要性,而且将持续扩大
  • 持续提供充足算力产品

NVIDIA 执行长黄仁勋再次强调,运算能力是支撑人工智慧技术发展的根本,并表示 NVIDIA 已做好准备,迎接 AI 时代的挑战

在此次GTC 2025活动上,NVIDIA执行长黄仁勋除了强调Blackwell架构设计的加速器产品已经全面投入生产,预计今年下半年就会进入市场应用,另一方面也重申在人工智慧技术发展趋势之下,算力推进依然相当重要,而NVIDIA也依旧会坚持先前提出的一年节奏 (One Year Rhythm)技术成长发展目标,因此不仅预计在2026年接续推出下一款Rubin显示架构产品,更计画在2028年推进以美国知名物理学家Richard Feynman命名的Feynman显示架构。

Blackwell架构产品全面投入生产

虽然先前以Blackwell架构设计的加速器产品曾因设计缺陷导致延后出货,但在后续与台积电合作解决问题后,黄仁勋表示目前Blackwell架构产品已经全面投入生产,并且将与诸多业者合作推出多款伺服器应用产品,同时也将与各家云端供应商合作,而Blackwell架构产品也将应用在电信网路、边缘运算,乃至于自驾车、机器人市场,借此加速更多人工智慧技术应用发展。

▲目前GPU加速设计已经广泛应用在诸多领域 ▲Blackwell显示架构产品全面投入生产,最快会在今年底进入市场布署应用

除了强调Blackwell架构产品全面投入量产,黄仁勋也说明即便人工智慧技术加快运算执行效率,但在运算本质上仍需以算力支撑,意味背后的运算技术堆叠依然有其必要性。

黄仁勋以大型自然语言模型推论婚宴上的不同嘉宾座位安排为例,虽然目前多数的大型自然语言模型可以在挺少的词元吞吐过程得出答案,但给出结果可能无法符合需求,或是根本给出错误答案。

如果要让大型自然语言模型依照不同宾客关係、需求,在座位安排上做到最佳调整,在推论过程不可避免地必须用到更多词元进行更深层的推论,运算次数也相对会增加许多。而此时如果希望运算速率、反应时间可以加快的话,背后必然需要堆叠更多算力,而非仅只是仰赖人工智慧运算。

▲以婚宴上的宾客座位安排为例,如果要让人工智慧以深思熟虑形式推理运算,过程中必须产生超过20倍的词元量,并且需要花费150倍以上的算力

算力堆叠依然有其必要性,而且将持续扩大

在进一步说明中,黄仁勋表示人工智慧发展重点包含「认知」与「推论」,前者在于如何知晓、理解所「获取」资讯,并且由后者进行分析、思考得出合理解答,而目前的人工智慧技术在将使用者下达指令转为词元进行输入后,在执行过程会持续产生更多词元,并且于后续推论过程再以这些词元进行输入,经过多次反覆推论过程得出最合适解答。

这样的流程中,意味要能「深思熟虑」得出合理推论解答的人工智慧,其运算过程必须处理更大量的词元,而为了处理大量词元,必须花费更高算力资源,甚至如果要能更快让人工智慧得出解答,算力必须更进一步堆叠。

而纵使NVIDIA提出能让人工智慧加速运算的开源推论软体NVIDIA Dynamo,并且能使整体人工智慧运算成本降低,但从长远发展来看,人工智慧技术背后的算力需求依然会以倍数成长,甚至会有更庞大的算力需求产生。

▲此次提出的开源推论软体NVIDIA Dynamo,主要是针对既有人工智慧运算进行最佳化,但实际提升幅度依然有限,主要还是仰赖后续算力堆叠 ▲依照NVIDIA的作法,针对机器人的运作可以透过不同人工智慧运作方式加快其工作执行流畅度,并且提升其运作判断正确度,例如在开源提供的Issac GR00T N1便是透过直觉运算的系统让机器人可以直觉反应动作,并且透过另一组深思熟虑系统进行更完整的任务推论,借此让机器人在提升动作流畅度之余,同时也能让工作判断更为正确

因此,黄仁勋在GTC 2025主题演讲中表示,虽然Hopper显示架构的加速器设计才刚问世几年,但在当前算力成长需求的趋势下,目前能给予他的评价已经不多,因为接下来的发展已经要从当前的Blackwell进展到接下来的Rubin,甚至也即将跨入到下一代的Feynman显示架构。

若以Hopper显示架构的算力表现为标准,Blackwell显示架构的算力约成长68倍,而接下来的Rubin则有高达900倍的成长差距,同时若以Hopper作为每次运算成本的标准,则可以发现Blackwell在相同效能所需花费成本仅有Hopper的0.13倍,Rubin更仅有Hopper的0.03倍,意味在相同开销之下,Blackwell、Rubin 所能推动算力更高。

▲Hopper推出时已经有相当不错的算力表现,但目前进入Blackwell发展阶段,则是将算力以扩展方式大幅提升 ▲接下来将推出的Rubin将有更高算力提升 ▲NVIDIA预期Rubin将能带动更大规模的人工智慧加速运算

持续提供充足算力产品

相较去年将更多重点放在Blackwell显示架构深度说明,此次GTC 2025有更多重心则是放在扩大Balckwell显示架构应用生态,同时也说明Blackwell架构产品已经顺利进入量产,预计今年下半年就会陆续进入市场布署应用。

另一方面,NVIDIA也强调即使在人工智慧技术发展成长趋势下,背后算力堆叠才是实际「真理」,即便借由软体、模型框架等方式进行最佳化,实际提升幅度依然有限。而在这些算力需求之下,NVIDIA持续提供充足算力产品,并且将以完整的产品蓝图规划推进算力成长。

▲此次公布内容中,NVIDIA也与台积电等供应鏈合作推出共同封装光学 (CPO)设计的网路交换器,借此改善资料密集网路中日益增长的频宽密度、通讯延迟、铜线传输距离限制,以及能源效率等问题 ▲目前NVIDIA已经针对不同运算场景提供以GPU加速运算资源 ▲机器人预期是接下来更多业者竞争市场,而NVIDIA也同样针对此需求提供加速运算技术

点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部