IT之家 3 月 19 日闪讯速报,英伟达发布最强 AI 加快卡--Blackwell GB200东京热qvod,本年发货。
英伟达在今天召开的 GTC 开荒者大会上,防卫发布了最强 AI 加快卡 GB200,并经营本年晚些时刻发货。
GB200 继承新一代 AI 图形处理器架构 Blackwell,黄仁勋在 GTC 大会上示意:“Hopper 诚然照旧尽头出色了,但咱们需要更刚劲的 GPU”。
英伟达当前按照每隔 2 年的更新频率,升级一次 GPU 架构,从而大幅普及性能。英伟达于 2022 年发布了基于 Hopper 架构的 H100 加快卡,而当今推出基于 Blackwell 的加快卡愈加刚劲,更擅所长理 AI 关联的任务。
Blackwell GPU黄仁勋示意,Blackwell 的 AI 性能可达 20 petaflops,而 H100 仅为 4 petaflops。Nvidia 示意,非凡的处理能力将使东谈主工智能公司大略考验更大、更复杂的模子。
Blackwell GPU 体积广泛,继承台积电的 4 纳米(4NP)工艺蚀刻而成,整合两个落寞制造的裸晶(Die),共有 2080 亿个晶体管,然后通过 NVLink 5.0 像拉链相似系结芯片。
英伟达示意每个 Blackwell Die 的浮点运算能力要比 Hopper Die 越过 25%,况兼每个封装中有两个 Blackwell 芯片,总性能提高了 2.5 倍。淌若处理 FP4 八精度浮点运算,性能还能提高到 5 倍。取决于多样 Blackwell 确立的内存容量和带宽设立,职责负载的本色性能可能会更高。
英伟达使用 10 TB / sec NVLink 5.0 鸠合每块 Die,官方称该链路为 NV-HBI。Blackwell complex 的 NVLink 5.0 端口可提供 1.8 TB / 秒的带宽,是 Hopper GPU 上 NVLink 4.0 端口速率的两倍。
GB200英伟达示意 GB200 包含了两个 B200 Blackwell GPU 和一个基于 Arm 的 Grace CPU 构成,推理大谈话模子性能比 H100 普及 30 倍,资本和能耗降至 25 分之一。
NVIDIA Grace Blackwell 出产板NVIDIA Grace Blackwell 开荒板IT之家征引英伟达官方讲明,考验一个 1.8 万亿个参数的模子往时需要 8000 个 Hopper GPU 和 15 兆瓦的电力。如今,Nvidia 首席实施官示意,2000 个 Blackwell GPU 就能完成这项职责,耗电量仅为 4 兆瓦。
在参数为 1,750 亿的 GPT-3 LLM 基准测试中,Nvidia 称 GB200 的性能是 H100 的 7 倍,而考验速率是 H100 的 4 倍。
英伟达还面向有大型需求的企业提供制品处事,提供齐备的处事器出货,举例 GB200 NVL72 处事器,提供了 36 个 CPU 和 72 个 Blackwell GPU,并完善提供一体水冷散热决策,可杀青共计 720 petaflops 的 AI 考验性能或 1,440 petaflops(又称 1.4 exaflops)的推感性能。它里面使用电缆长度累计接近 2 英里,共有 5000 条落寞电缆。
拳交小说机架上的每个托盘包含两个 GB200 芯片或两个 NVLink 交换机,每个机架有 18 个 GB200 芯片和 9 个 NVLink 交换机,英伟达称,一个机架悉数可赈济 27 万亿个参数模子。而看成对比,GPT-4 的参数模子约为 1.7 万亿。
该公司示意,亚马逊、谷歌、微软和甲骨文齐已经营在其云处事家具中提供 NVL72 机架,但不了了它们将购买若干。
英伟达示意亚马逊 AWS 已经营采购由 2 万片 GB200 芯片组建的处事器集群,不错部署 27 万亿个参数的模子。
Nvidia 也乐于为公司提供其他贬责决策。底下是用于 DGX GB200 的 DGX Superpod,它将八个系统打得火热,悉数领有 288 个 CPU、576 个 GPU、240TB 内存和 11.5 exaflops 的 FP4 狡计能力。
英伟达称,其系统可推广至数万 GB200 超等芯片,并通过其新式 Quantum-X800 InfiniBand(最多 144 个鸠合)或 Spectrum-X800 以太网(最多 64 个鸠合)与 800Gbps 收集鸠合在一谈。
英伟达当前并未公布 GB200 以及整套决策的售价信息。
告白声明:文内含有的对外跳转赓续(包括不限于超赓续、二维码、口令等容颜)东京热qvod,用于传递更多信息,节俭甄选时辰,成果仅供参考,IT之家整个著述均包含本声明。