来源:互联网 更新时间:2025-03-19 10:05
皮衣老黄,带着最强AI芯片GB300闪亮登场“AI超级碗”GTC,燃爆全场!
性能方面,和去年发布的GB200相比,推理性能是其1.5倍。
据悉,GB300将在今年的下半年出货。
除此之外,老黄还预览(2026年下半年发货)了英伟达下一代AI超级芯片,名字大变样——Vera Rubin。
其实它的命名规则和Grace Blackwell(GB)类似:Grace是CPU,Blackwell是GPU。
而Vera Rubin中的Vera是CPU,Rubin是GPU。根据老黄的说法:
几乎所有细节都是新的。
从预览的性能来看,Vera Rubin整体性能更是GB300的3.3倍。更具体一些:
Vera:CPU的内存是Grace的4.2倍,内存带宽是Grace的2.4倍。
Rubin:将配备288GB的HBM4。
在Vera Rubin之后的下一代GPU(2027年下半年),英伟达会将其命名为Rubin Ultra,性能直接拉到GB300的14倍。
一个直观的对比,如下图所示:
更多的具体性能对比,是这样的:
性能上的提升,也正应了老黄在现场说的那句话:
大规模推理是一种极限计算。Inference at-scale is extreme computing.
不仅如此,就连Rubin之后的下一代GPU,老黄也给亮出来了——将以Feynman来命名。
而纵观整场GTC,我们可以轻松提炼老黄提及最多的几个关键词:tokens、推理和Agentic AI。
但除此之外,还有一个比较有意思的关键词——DeepSeek。
英伟达官方博客称:
实现了DeepSeek-R1推理性能世界纪录。
每个用户每秒可处理超过250个token;实现每秒超过30000个token的最大吞吐量。
但这项纪录采用的是B200,英伟达表示随着Blackwell Ultra等新GPU的出现,纪录还将继续被打破。
而老黄在现场体现传统LLM和推理LLM的区别时,也是拿着DeepSeek-R1来举例:
嗯,微妙,着实有点微妙。
那么除了一系列新GPU之外,还有什么?我们继续往下看。
推出两款个人AI超级计算机
首先,第一款个人AI超级计算机,叫做DGX Spark。
它就是老黄在今年1月份CES中发布的那个全球最小的个人AI超级计算机Project Digits,这次取了个正式的名字。
DGX Spark售价3000美元(约21685元),大小和Mac Mini相当。
它采用的是英伟达GB10芯片,能够提供每秒1000万亿次的AI运算,用于微调和推理最新AI模型。
其中,GB10采用了NVLink-C2C互连技术,提供CPU+ gpu的相干内存模型,带宽是第五代PCIe的5倍。
值得一提的是,英伟达官网已经开发预定了哦~
至于第二款个人AI超级电脑,则是DGX Station。
DGX Station所采用的,正是今天推出的GB300,也是首个采用这款芯片的AI电脑。
其性能如下:
拥有784GB的相干内存空间
拥有英伟达的ConnectX-8超级网卡,支持高达800Gb/s的网络速度
拥有Nvidia的CUDA-X AI平台,可访问NIM微服务和AI Enterprise
用老黄的话来说就是:
aff同人文登录入口在哪里?
非遗小知识:“下方”指的是以下哪种民间传统游戏
仙剑世界公众号抽奖活动怎么参加
多服用退烧药能更快退烧吗
我国民间有本命年穿红色的习俗,寓意为
以下哪种技术是用键盘和鼠标“起高楼、架长桥
贵州非遗“花脸龙”是以下哪两种表演形式的结合
似锦姜家有几个女儿
小米SU7 Ultra车主90%来自传统豪车 56E用户占比过半
《180天重启计划》顾云苏的结局是什么
百味食光兑换码2025
DLsite中文登录入口是什么-DLsite中文登录网页地址一览
蚂蚁庄园今日答案2月21日(今日已更新)
光遇2.20每日任务怎么做
《异度之刃X:终极版》新截图:场景震撼 画面精美
神隐之子解谜攻略
鸣潮2.1老人鱼海鱼王刷新点介绍
《死亡搁浅2》开发进度更新 多位主演日语配音工作完成
《妮姬:胜利女神》联动EVA开启 女神换新装
哪种营养对神经系统健康极为重要
手机号码测吉凶
本站所有软件,都由网友上传,如有侵犯你的版权,请发邮件haolingcc@hotmail.com 联系删除。 版权所有 Copyright@2012-2013 haoling.cc