(原标题:博通5nm新芯片:撑捏铜缆,叫板英伟达)
若是您但愿不错持续碰头,迎接标星储藏哦~
开首:内容由半导体行业不雅察(ID:icbank)编译自nextplatform,谢谢。
除了光纤在数据中心汇集结受到的温雅除外,铜缆仍然是短距离传输的王者。原因很简便:那些在短距离和长距离数据中心距离上将工作器融会到交换机和交换机互相融会的光纤收发器终点崇高。而且它们在现场也时时出现故障,导致大领域 HPC 模拟和 AI 覆按运行失败。
因此,时刻和经济告捷的决窍是唯有在统统必要时才使用光学器件,并坚捏使用铜线和不错在所使用的系统的任何情况下尽可能平直驱动它的培育。
莫得什么比Nvidia 于 3 月推出的 DGX GB200 NVL72 超等计较机节点更能证明这一原则了,它使用其“Grace”CG100 Arm 工作器 CPU 和一双“Blackwell”GB100 GPU 加快器,并用 5184 条粗大的铜缆系结在通盘,这些铜缆用于在全对全竖立中互连 72 个 Blackwell GPU。NVL72 系统中枢的九台 NVLink Switch 4 交换机中的 200 Gb/秒 SerDes 不错通过铜线平直驱动 1.8 TB/秒的 NVLink 5 端口,而无需重定时器,天然也无需资料数据中心汇集结使用的光收发器。
在发布会上,Nvidia 谀媚首创东谈主兼首席引申官黄仁勋透露,NVL52 系统的功率为 120 千瓦,但若是 Nvidia 使用光学器件,重定时器和光收发器将使 NVL72 系统的功率预算再加多 20 千瓦。他莫得清醒本钱,但咱们觉得光学器件将权贵加多机架级系统的采集互连代码(可能翻倍),同期也会加多节点级故障的可能性。
博通是向数据中心交换阛阓销售商用硅片的领军企业,其基于“Thor”系列 NIC 芯片的采集接口卡业务领域远大,因此它终点温雅铜线和光纤及其布线。出于相似的本钱和可靠性原因,Nvidia 也作念出了上述 NVL72 计较节点的采选。
博通软件家具和生态系统细腻东谈主 Hasan Siraj 告诉The Next Platform :“一个 4,000 个节点的集群将在其互连中领有 9,200 个光纤培育。”他将带光纤的 InfiniBand 与不带光纤的以太网进行了比较和对比。“每个超大领域提供商王人会告诉你,每个客户也会告诉你,它们会发生故障,故障率高达 5%。但即使这么的集群的故障率为 2%,每个月也会发生梗概 15 次光纤故障。固然 InfiniBand 可能是一种无损结构,但由于这些光纤培育发生故障,它内容上会变得有损。而且 InfiniBand 在这些故障中还有另一个问题。与以太网比拟,由于它是一种静态结构,它从这些故障中复原的时候要长 30 倍。InfiniBand 有一个挽救结构惩办器,但您必须回过甚来找出下一个道路是什么。而以太网内容上是一种动态结构——您领有范围网关公约 (BGP) 和双向转发检测 (BFD) 等功能,况兼咱们在硅片中作念了一些责任,不错在 10 纳秒内从这些硬件故障中复原。统统这些王人有助于裁汰 AI 功课的完成时候。”
要点是,您要幸免复返检查点并从该点再行加载系统景况,然后从那儿再走运行 HPC 模拟或 AI 覆按。况兼您要尽可能幸免在采集盘算推算中使用过多的光学器件以遗弃故障,这意味着平直从 NIC 驱动以太网端口并尽可能使用平直融会铜缆 (DAC)。
这便是 Broadcom 的“Thor”系列 NIC 芯片的全部内容,它刚刚进行了更新。
“Thor 1” ASIC 于 2010 年头推出,并于往时秋季驱动提供样品。Thor 1 承袭台积电的 16 纳米工艺蚀刻而成,用于插入 PCI-Express 4.0 工作器插槽的采集适配器,其 SerDes 可驱动原生 56 Gb/秒信号,结合 PAM-4 编码,在遗弃编码支拨后,可驱动一双 100 Gb/秒端口。
“Thor 2” NIC 芯片与 NVLink Switch 4 ASIC 一样,八成平直从 ASIC 上的 SerDes 驱动铜缆,该芯片于 2022 年推出,万生优配官网,万生配资公司,万生股票策略,股票资讯,股票策略,股票配资2023 年出样,现已驱动出货。计划到这些机器的领域(咱们传闻过的最大集群中有 20,000 到 60,000 个 GPU),低功耗是 AI 汇集结终点进攻的身分,因此 Broadcom 通过将 Thor 2 NIC 芯片消弱到 5 纳米 TSMC 工艺,真实冲破了功耗极限。(这个尺寸弥散小,不错大大从简功耗,但不是崇高的 4 纳米或 3 纳米工艺,这些工艺尚未闇练或低廉。)
以下是 2022 年 Thor ASIC 的对比图,那时 Thor 1 芯片已干涉分娩两年,而博通则透露了一些关联 Thor 2 系列的信息:
如您所见,Thor 2 芯片 SerDes 具有原生 112 Gb/秒信号,并在顶部进行 PAM4 编码,在遗弃编码支拨后,八成驱动单个 400 Gb/秒端口、一双 200 Gb/秒端口或四个 100 Gb/秒端口。到咫尺戒指,统统 Thor 芯片王人具有多主机功能,允许将上行链路上的带宽分拨到两个或四个主机上。如您所见,Thor 芯片还保证了较长的时刻和经济寿命,Thor 1 至少不错使用到 2036 年——是的,那是从咫尺起的十几年——而 Thor 2 的使用时候将远远畸形这个数字,但咫尺尚不笃定。
Thor 2 适配器插入 PCI-Express 5.0 插槽。Broadcom 很乐意向超大领域计较公司、云构建商、HPC 中心和任何其他东谈主出售整张适配器卡,或者仅仅 ASIC,致使为那些念念要创建我方的 NIC 的东谈主提供盘算推算中的 IP。
单端口 Thor 2 BCM957608-N1400G 适配器的外不雅如下,它撑捏一个 400 Gb/秒端口。
还有 Thor 2 BCM957608-P2200G 适配器,可驱动两个 200 Gb/秒端口:
Siraj 透露,有了 Thor 2,Broadcom 将成为惟逐一家撑捏线性可插拔光学器件的 NIC 提供商,这仅仅一种花哨的说法,即若是您需要使用光学器件在数据中心中驱动更长的距离,NIC 不错平直驱动光学器件。但阐发 Siraj 的说法,Thor 2 还不错平直驱动长达 5 米的铜缆,而大大王人 NIC 竞争敌手只可驱动 2.5 米长的铜缆。Siraj 说,这大大诽谤了电力需求——最多比竞争敌手少了一半。
Thor 2 芯片还撑捏 RoCE v2 RDMA,它肖似于 InfiniBand 内置的 RDMA,但在以太网上运行。Siraj 透露,借助 Thor 3 ASIC,博通将承袭超等以太网定约时刻,并将端口速率擢升到 800 Gb/秒。Thor 3 预测将于来岁推出,与工作器中 PCI-Express 6.0 外设插槽的预期录用大致同步。
点这里加温雅,锁定更多原创内容
*免责声明:本文由作家原创。著作内容系作家个东谈主不雅点,半导体行业不雅察转载仅为了传达一种不同的不雅点,不代表半导体行业不雅察对该不雅点赞同或撑捏,若是有任何异议,迎接相干半导体行业不雅察。
今天是《半导体行业不雅察》为您共享的第3780期内容,迎接温雅。
『半导体第一垂直媒体』
及时 专科 原创 深度
公众号ID:icbank
可爱咱们的内容就点“在看”共享给小伙伴哦