arzh-CNenfrdejakoplptesuk
搜索找到4120  社会讨论  tg2 f2 lin2 in2 X 图标 3 y2  p2 TIK steam2

Nvidia GB300 NVL72 性能提升创纪录 - DeepSeek R45 比 GB1 提升 200%

Nvidia 正式发布其全新 Rack-Scale 系统的 MLPerf 基准测试结果 布莱克威尔 Ultra GB300 NVL72,宣布 生产率提高45% DeepSeek R1 与上一代相比的推理能力 GB200该系统结合了更新的架构、加速的张量单元和一系列软件级优化,这使得 Nvidia 能够 在所有关键测试中取得第一名,包括 Llama 3.1 405B、Llama 3.1 8B 和 Whisper。

布莱克威尔 Ultra GB300

映衬 全球数据中心的GB200部署, 新版本 GB300 与 Blackwell 建筑公司合作 Ultra 进一步提供显著增加的带宽 GPU - 130 TB/秒 通过 1,8 TB/秒 NVLink 机架中的 72 个图形系统之间。这使得即使是最大的语言模型也能高效扩展,同时在高处理量下保持稳定的延迟。

增长的关键因素包括 更新的张量核提供 人工智能任务的注意力操作速度提高 2 倍,FLOPS 增加 50%以及积极使用该格式 NVFP4 用于量化权重。这使得 减小模型体积 不会损失准确度并加快计算速度,尤其是在 DeepSeek R1 上的推理任务中。

Nvidia 表示,这些改进可以使 布莱克威尔 Ultra 构建所谓的 “人工智能工厂”其中,功率优化直接影响加工盈利能力。根据他们的声明, GB300 的运行速度比 Hopper 加速器快 5 倍在 AMD 和华为的竞争解决方案的背景下,这一点尤其重要,它们在 AI 加速器领域也表现出增长势头。

考虑到 GB300 将于本月开始交付,创纪录的 MLPerf 结果的发布似乎是 Nvidia 加强其在企业 AI 解决方案领域领导地位的战略行动的一部分。