改变AI服务器：探索界面互连芯片技术的创新突破-香港服务器租用

改变AI服务器：探索界面互连芯片技术的创新突破

发布时间：2024-03-07 21:53:10 分类：帮助文档

改变AI服务器：探索界面互连芯片技术的创新突破

根据TrendForce的数据，AI服务器的出货量约为130,000台，占全球服务器总出货量的约1%。随着微软、Meta、百度和字节跳动等主要制造商相继推出基于生成式AI的产品和服务，订单量显著增加。预测显示，在ChatGPT等应用的持续需求推动下，从2023年到2027年，AI服务器市场预计将保持每年12.2%的复合年增长率。在这种背景下，AI服务器的发展尤为引人注目。
DGX H100：开拓AI领域的先驱性进展
DGX H100是英伟达（NVIDIA） DGX系统于2022年发布的最新版本，也是英伟达（NVIDIA） DGX SuperPOD的核心。该系统采用8个H100 GPU和6400亿个晶体管，其AI性能是上一代的6倍，尤其是在新的FP8精度方面表现出色。此外，DGX服务器还可提供900GB/s带宽，彰显了AI能力的显著提升。
DGX H100服务器采用IP网卡，既可作为网卡，又可作为PCIe扩展交换机，符合PCIe 5.0标准。此外服务器还包括CX7，以2张卡的形式提供，每张卡含有4个CX7芯片，并提供2个800G OSFP光模块端口。对于GPU互连（H100），NVSwitch芯片起到关键作用。每个GPU向外扩展18个NVLink，实现每个链路双向带宽达到50GB/s，总共达到900GB/s的双向带宽。这些带宽分布在4个内置的NVSwitch芯片上，每个NVSwitch对应4-5个OSFP光模块。每个OSFP光模块使用8个光通道，传输速率为100Gbps/通道，因此总速率达到800Gbps，实现高速数据传输。

CPU、GPU等组件互连：采用PCIe交换机和重定时芯片进行连接
PCIe交换机技术的演进：克服通道限制
PCIe交换机（也称为PCIe集线器）是一个关键组件，用于通过PCIe通信协议连接PCIe设备。它通过扩展和聚合功能，使多个设备能够连接到1个PCIe端口，可在很大程度上克服PCIe通道数量局限的问题。目前，PCIe交换机广泛应用于传统存储系统，并在各种服务器平台上越来越受欢迎，为系统内的数据传输速率提供显著改善。
随着时间的推移，PCIe总线技术的进展意味着PCIe交换机速率的逐渐增加。最初由英特尔于2001年作为第三代I/O技术以"3GIO"的名义推出，经过PCI-SIG的评估后在2002年更名为"PCI Express"。2003年正式发布的PCIe 1.0成为一个重要的里程碑，支持每通道传输速率为250MB/s，总传输速率为2.5 GT/s。在2022年，PCI-SIG正式发布了PCIe 6.0规范，将总带宽提升至64 GT/s。

PCIe重定时行业的主导趋势
在AI服务器中，为了确保GPU和CPU连接时的信号质量，至少需要使用一个重定时芯片。一些AI服务器选择使用多个重定时芯片，比如Astera Labs就在其AI加速器配置中集成了4个重定时芯片。

目前，PCIe重定时市场具有巨大的潜力，有三家领先品牌和许多潜在竞争对手。目前，Parade Technologies、Astera Labs和澜起科技是这个蓬勃发展市场的主要参与者，占据重要的地位。值得注意的是，作为PCIe部署的早期使用者，澜起科技是中国内地唯一能够大规模生产PCIe 4.0重定时的供应商。此外，澜起科技在PCIe 5.0重定时的开发方面也取得了稳步进展。

此外，Renesas、TI和微芯科技等芯片制造商也积极参与PCIe重定时产品的开发。根据官网站信息，Renesas提供2款PCIe 3.0重定时产品，分别是89HT0816AP和89HT0832P。TI提供了一款16Gbps 8通道PCIe 4.0重定时产品- DS160PT801。此外，微芯科技在2020年11月推出了XpressConnect系列的重定时芯片，旨在实现PCIe 5.0的32GT/s速率。
GPU之间的互连：NVLink和NVSwitch
全球主要芯片制造商非常重视推广高速接口技术。其中，英伟达（NVIDIA）的NVLink、AMD的Infinity Fabric和英特尔的CXL都做出了重要贡献。
NVLink是由英伟达（NVIDIA）开发的高速互连技术。它旨在加速CPU与GPU、GPU与GPU之间的数据传输速率，提升系统性能。从2016年到2022年，NVLink经历多次升级，已经发展到第四代。2016年，英伟达（NVIDIA）配合Pascal GP100 GPU的发布推出第一代NVLink。NVLink采用了高速信号互连（NVHS）技术，主要用于GPU之间和GPU与CPU之间的信号传输。GPU之间通过差分阻抗电信号以NRZ（不归零）形式进行编码传输。第一代NVLink单链路实现了40GB/s的双向带宽，单个芯片可以支持4个链路，总双向带宽达到160GB/s。

NVLink不同阶段的发展
NVLink技术经历多次迭代，推动了高速互连的创新。2017年，基于Volta架构推出第二代NVLink。它实现每个链路50GB/s的双向带宽，每个芯片支持6个链路，总双向带宽达到300GB/s。2020年，基于Ampere架构的第三代发布，总双向带宽达到600GB/s。在2022年，基于Hopper架构的第四代推出。这一迭代转向使用PAM4调制的电信号，每个链路保持50GB/s的双向带宽，每个芯片支持18个链路，总双向带宽达到900GB/s。
NVSwitch的发展推动实现高性能GPU互连
在2018年，英伟达（NVIDIA）推出NVSwitch的最初版本，为增强带宽、减少延迟和促进服务器内多个GPU之间的通信提供解决方案。第一代NVSwitch采用TSMC的12nm FinFET工艺制造，拥有18个NVLink 2.0接口。通过部署12个NVSwitch，1个服务器可以容纳和优化16个V100 GPU之间的互连速率。

目前，NVSwitch已经发展到第三代，采用TSMC的4N工艺制造。每个NVSwitch芯片配备了64个NVLink 4.0端口，使GPU之间的通信速率达到了900GB/s。通过NVLink Switch互连的GPU可以集体作为一个具有深度学习能力的高性能加速器运行。
总结
PCIe芯片、重定时芯片和NVSwitch等接口互连芯片技术的发展很大程度上增强CPU和GPU之间以及GPU之间的互动能力。这些技术的相互作用凸显了人工智能服务器的动态景观，为高性能计算的进步做出贡献。

上一篇云服务器租用费用是多少

下一篇香港沙田数据中心

服务器好不好怎么判断 VMware虚拟机安装Linux教程(超详细) 万网g1怎么设置伪静态超过500m的邮件怎么发送服务器奔溃了怎么办 sftp常用命令介绍【linux】linux服务器判断域名、IP、端口、URL是否有效如何修改VPS服务器上Linux系统的时区服务器被ddos攻击怎么办

香港云服务器租用推荐

服务器租用资讯: ·广东云服务有限公司怎么样; ·广东云服务器怎么样; ·广东锐讯网络有限公司怎么样; ·广东佛山的蜗牛怎么那么大; ·广东单位电话主机号怎么填写; ·管家婆花生壳怎么用; ·官网域名过期要怎么办; ·官网邮箱一般怎么命名; ·官网网站被篡改怎么办

服务器租用推荐: ·美国服务器租用; ·台湾服务器租用; ·香港云服务器租用; ·香港裸金属服务器; ·香港高防服务器租用; ·香港服务器租用特价