Post

Perplexity开源推理底座pplx-garden,绕过英伟达网络税实现多卡极速通信

币界网
币界网
币界网消息,Perplexity AI正式开源高性能推理基础设施工具包pplx-garden。该项目核心是自研的Rust点对点通信库fabric-lib,旨在打破英伟达专属通信协议的硬件绑定,帮助开发者在无需昂贵网络交换机的前提下,实现万亿参数大模型在异构多显卡集群上的极速运行。fabric-lib完美适配NVIDIA ConnectX-7网卡,并支持AWS EFA传统以太网卡,将多卡网络带宽提升至400 Gbps。为解决AWS EFA乱序传输问题,Perplexity首创immcounter计数器同步机制,实现高效的「零拷贝」数据流转。pplx-garden在异步强化学习训练中,仅需1.3秒完成万亿参数模型的权重同步与下发,显著提升工程效益。

Disclaimer: OKX Orbit content is provided for informational purposes only. Learn more

Replies

No comments yet. Be the first to reply!