
帖子
Perplexity开源推理底座pplx-garden,绕过英伟达网络税实现多卡极速通信

币界网消息,Perplexity AI正式开源高性能推理基础设施工具包pplx-garden。该项目核心是自研的Rust点对点通信库fabric-lib,旨在打破英伟达专属通信协议的硬件绑定,帮助开发者在无需昂贵网络交换机的前提下,实现万亿参数大模型在异构多显卡集群上的极速运行。fabric-lib完美适配NVIDIA ConnectX-7网卡,并支持AWS EFA传统以太网卡,将多卡网络带宽提升至400 Gbps。为解决AWS EFA乱序传输问题,Perplexity首创immcounter计数器同步机制,实现高效的「零拷贝」数据流转。pplx-garden在异步强化学习训练中,仅需1.3秒完成万亿参数模型的权重同步与下发,显著提升工程效益。
相关快讯
AI 初创公司 Groq 正为新实体筹集 6.5 亿美元资金
热钱轮动加速:从比特币到黄金,再到AI与存储半导体
英伟达发布Gamma-World,多智能体世界模型支持四人协作与实时24 FPS
AI 与头部科技股延续强势走向,Gate 拓展全球资产交易覆盖能力
SpaceX自研C语言AI训练框架接近完工,将用于训练Grok v5
外国投资者连续第八周买入日本股票
美股交易造富链上巨鲸:某地址430万本金涉足美股,两个月翻超280%
「光子股神」:英伟达入股助力诺基亚转型AI基础设施,近一个月内部人士积极增持
引入AlphaGo搜索,全新MCTS视频生成框架长视频时长超Sora
年化营收猛增至6亿美元,AI推理服务商Baseten拟以110亿美元估值融资10亿美元