随着人工智能(AI)以前所未有的速度渗透到我们生活的方方面面,数据中心正面临着一场前所未有的变革。AI模型训练和推理所需的算力呈指数级增长,这直接推动了对更强大、更高效的数据中心基础设施的需求。在这一浪潮中,数据中心内部各组件之间的互连技术扮演着至关重要的角色,其性能直接影响了AI系统的整体效率。作为连接CPU、GPU、加速器和存储设备的关键接口,PCI Express (PCIe) 技术正不断演进,以满足日益增长的AI工作负载需求。PCIe 6.0 的出现,标志着数据中心互连技术进入了一个新的时代,它不仅提高了数据传输速率,也对未来的AI发展产生了深远的影响。
PCIe 6.0 的核心突破在于其令人瞩目的数据传输速率。该规范于2022年1月正式发布,其最显著的特点就是将数据传输速率提升至每通道64 GT/s(Gigatransfers per second),这相当于 PCIe 5.0 的两倍。理论上,一个 x16 的 PCIe 6.0 接口可以实现高达 256 GB/s 的双向带宽。这种带宽的飞跃,为AI系统提供了更广阔的数据传输通道,从而能够更快地处理海量数据,加速AI训练和推理过程。实现这一速度提升的关键在于采用了脉冲幅度调制 4 (PAM4) 信号编码技术。PAM4 通过在每个信号周期内传输四个不同的电压级别,有效地将数据密度加倍,从而提升了带宽。然而,PAM4 并非完美无缺,它对噪声的容忍度较低,这使得信号完整性方面的挑战变得更加突出。为了确保数据传输的可靠性,业界正在积极开发和部署 ReDriver 技术。Diodes Incorporated 近期推出了业界首款达到 PCIe 6.0 协议速度(高达 64 GT/s)的 ReDriver™,型号为 PI3EQX64904。这款 ReDriver 不仅支持 PCIe 6.0,还向下兼容 PCIe 5.0/4.0/3.0 协议,为现有数据中心的升级提供了灵活性和可扩展性。Synopsys 和 Broadcom 也成功展示了 64 GT/s 的 PCIe 6.x 互操作性,进一步验证了该技术的可行性和成熟度。这些 ReDriver 产品通过对信号进行均衡和整形,有效提高了 PAM4 信号的质量,确保了高速数据传输的可靠性。ReDriver技术的应用是克服PAM4挑战的关键,它使得PCIe 6.0在实际应用中能够稳定可靠地运行。
AMD在推动 PCIe 6.0 技术的发展和应用方面扮演着至关重要的角色。作为一家领先的芯片制造商,AMD 不仅在硬件层面积极布局,还在软件和生态系统建设方面投入了大量资源。Keysight Technologies 的测试工具,包括 64 GBaud High-Performance BERT 和 59 GHz UXR-Series Oscilloscope,帮助 AMD 成功完成了高达 64 GT/s 的 PCI Express 电性合规性测试,为 AMD 预生产服务器 CPU 的发布奠定了坚实的基础。此外,AMD 的 Instinct MI325X 加速器和即将推出的 MI500 系列 GPU 都将充分利用 PCIe 6.0 的高带宽优势,为 AI 训练和推理提供更强大的性能。这表明 AMD 正在将 PCIe 6.0 技术集成到其核心产品线中,以满足不断增长的 AI 算力需求。更为重要的是,AMD 正在积极构建一个开放的 AI 生态系统。在 AMD Advancing AI 2025 大会上,AMD 展示了其全面的 AI 解决方案,包括第五代 EPYC 处理器、Instinct MI325X 加速器、下一代网络解决方案以及 Ryzen AI PRO 处理器。AMD 与 Meta、OpenAI、xAI、Oracle、Microsoft 等众多合作伙伴共同构建开放的 AI 生态系统,旨在为客户提供更灵活、更高效的 AI 解决方案。这种生态系统的建设对于促进 AI 技术的普及和应用至关重要。例如,AMD 还推出了 Ryzen AI MAX+ 395 处理器,这款 APU 集成了强大的 CPU 和 GPU,并支持 AI 加速功能,为轻薄笔记本电脑带来了卓越的 AI 性能,这标志着 AI 技术正在向更广泛的消费级设备渗透。
尽管 PCIe 6.0 技术取得了显著进展,但其大规模应用仍然面临着一些挑战。实施成本较高是其中一个主要的障碍。例如,PCIe 6.0 SSD 在 PC 领域的普及预计要到 2030 年左右,这主要是由于控制器芯片、接口和相关元件的制造成本仍然较高。此外,PCIe 6.0 的信号完整性要求更高,对电路板设计和制造工艺提出了更高的要求。由于信号传输速率的提升和 PAM4 技术的应用,电路板需要更加精细的设计和更高级的材料,以减少信号衰减和干扰。这些挑战意味着 PCIe 6.0 的普及需要克服技术和经济上的双重障碍。然而,我们必须看到,随着AI技术的不断发展,对更高带宽的需求将持续增长,这将推动 PCIe 技术的不断进步。PCIe 7.0 规范已经开始制定,预计将进一步提升数据传输速率至 128 GT/s。Molex 已经展示了 PCIe 7.0 的 cabling 解决方案,预示着未来数据中心互连技术的进一步发展。这些新技术的发展将为 AI 系统的性能提升提供持续的动力。Supermicro 推出的新型 AI 服务器,通过采用 AMD 最新的 GPU,实现了 1.8 倍的性能提升和 40% 的功耗节省,充分展示了 PCIe 6.0 技术在实际应用中的巨大价值。这表明,尽管面临挑战,PCIe 6.0 及其后续技术将在未来的 AI 领域发挥着关键作用,促进 AI 创新和应用,最终推动整个科技行业的发展。
PCIe 6.0 不仅仅是一种技术升级,更是 AI 驱动的未来数据中心的基石。AMD 等厂商的积极布局和生态建设,正在加速 PCIe 6.0 技术的普及和应用,为 AI 时代的到来奠定坚实的基础。可以预见,在未来几年内,随着技术的不断进步和成本的降低,PCIe 6.0 将逐渐成为数据中心互连的主流技术,为 AI 应用提供更强大的性能和更高效的解决方案。进一步展望未来,随着 PCIe 7.0 及更高版本的不断涌现,数据中心将实现更高的连接速度和更强大的计算能力,从而推动 AI 技术在各个领域的广泛应用,例如自动驾驶、医疗诊断、金融分析等等。数据中心互连技术的持续创新,将为 AI 的发展注入源源不断的动力,最终塑造一个更加智能和高效的未来。
发表评论