
来源:米乐app下载 发布时间:2026-03-19 18:04:01
米乐app下载官网:
本年有450家企业资助、1000场技能分会、2000位演讲者、110台机器人,这样的规划现已不像一场技能会议,更像
这次他没有直奔芯片发布,而是花了整整一个小时,从25年前的GeForce游戏显卡讲起,讲到20年前的CUDA,讲到10年前的RTX烘托技能,讲到云核算协作伙伴,再讲到今日的爆火OpenClaw和token经济。
AI从感知到生成到推理再到履行,每一步都需求生成更多token,耗费更多算力。
纵轴是Token吞吐量(每瓦产出多少Token),横轴是Token速率(每秒生成多少Token)。
吞吐量代表你的工厂产能,速率代表AI的“聪明程度”,模型越大、上下文越长、考虑越深,速率就越低,但每个Token越值钱。
而黄仁勋自己说说的35倍。对此,Semi Analysis创始人揭露表明:“黄仁勋在sand bagging(成心保留余地)”。
由于每座数据中心的功率都是物理束缚,一座1GW的AI工厂永久都不或许变成2GW。在固定功率下,谁的每瓦token产出更高,谁的token成本就更低。
350倍不是靠芯片上多塞几个晶体管完结的。当算力密度卷到这个程度,瓶颈早就搬运到了芯片之外:散热和互联。
关于水,Vera Rubin选用100%液冷计划,连NVLink交换机都泡在液冷体系里。
传统交换机里,电信号从芯片出来,经过PCB走线,抵达光模块,在光模块里完结电-光转化,再经过光纤传出去。每一次转化都有推迟,每一段铜线都有损耗。
CPO把这条链路压缩到极致:光学器材直接封装到芯片上,电子在硅片外表就转化成光子。 没有光模块,没有铜线中转。英伟达和TSMC联合发明晰一种叫CoUP的封装工艺,现在全球只要英伟达在量产。
要让72块GPU完结260TB/s的全对全带宽,假如还用传统铜缆,信号跑不了太远,机架尺度便是物理极限。
NVLink 72在高吞吐区间简直无敌,72块GPU全对全互联,带宽拉满。
Groq的架构和英伟达GPU截然相反:它是一颗确定性数据流处理器,静态编译、编译器调度,没有动态调度,片上堆了500MB的巨量SRAM,只干一件事,推理。
前者极致快,后者极致大。单独用Groq,装不下万亿参数模型和海量KV cache;单独用Rubin,推不到极速token生成。
结果在最高价值的推理层级上,再提高35倍吞吐量。一起解锁了此前底子不存在的新推理层级,千token/秒等级的极速生成。
黄仁勋给出了配比主张:假如你的作业负载主要是高吞吐,100%上Vera Rubin就够了。假如你有很多编程、工程级token生成需求,拿出25%的数据中心功率给Groq。
发布会的最终一部分,老黄画风一转,开端聊人类历史上最受喜欢的开源项目OpenClaw。
OpenClaw能做什么,老黄举例有人帮60岁的父亲主动化了整个精酿啤酒生意,蓝牙衔接酿制设备,主动生成出售网站,顾客能够直接下单“龙虾拉格啤酒”。
但老黄更介意的是它的实质。他用操作体系的言语从头界说了OpenClaw:
Agent在企业网络中能拜访灵敏信息、履行代码、对外通讯,“你把这三件事连起来大声说出来,再想一想……”
所以英伟达与OpenClaw协作推出了企业版NeMo Claw,加上了战略引擎、网络护栏、隐私路由器。
在发布会上,关于外界十分重视的下一代核算架构Feynman(费曼),老黄也做了预告,并表明核算架构,年年都会有新东西。
老黄着重,无论是铜线、光学仍是CPO,未来都需求更高的容量与带宽,这正是Feynman的中心打破。
此外,他还泄漏,NVIDIA正与协作伙伴联合开发英伟达Space One,一台将布置在太空的数据中心核算机,敞开“太空算力”的新篇章。

版权所有 © Copyright 米乐app下载官网-米乐体育app官网下载-最新版安装 京ICP备14037209号-2 京公网安备京ICP备14037209号-2 友情推荐: 米乐app下载 | 米乐app下载官网 | 米乐体育app官网下载