Painonsiirto on yksi suurimmista pullonkauloista suoritettaessa hajautettua RL:ää suurikapasiteettisissa malleissa. Ensimmäinen Perplexity Research -blogimme selittää, kuinka Perplexityn päättelyinsinöörit valjastivat RDMA:n pisteestä pisteeseen -viestinnän avatakseen erittäin nopeat parametripäivitykset biljoonan parametrin malleille. Valjastamalla matalan tason RDMA-primitiivejä, staattista ajoitusta ja putkilinjausta nopeutamme päivityksiä suuruusluokkaa, vain 1,3 sekuntiin päivitystä kohden.