Il trasferimento del peso è uno dei maggiori colli di bottiglia quando si esegue il RL distribuito su modelli ad alta capacità.
Il nostro primo blog di Perplexity Research spiega come gli ingegneri dell'inferenza di Perplexity hanno sfruttato la comunicazione RDMA punto a punto per sbloccare aggiornamenti ultra-rapidi dei parametri per modelli da trilioni di parametri.
Sfruttando le primitive RDMA a basso livello, la pianificazione statica e il pipelining, acceleriamo gli aggiornamenti di un ordine di grandezza, a soli 1,3 secondi per aggiornamento.
Introduzione all'API di ricerca Perplexity
Abbiamo costruito un indice di ricerca di miliardi di pagine web per fornire informazioni di qualità in tempo reale dal web.
Ora gli sviluppatori hanno accesso a tutta la potenza del nostro indice, fornendo i risultati più accurati in millisecondi.
Presentiamo Perplexity Email Assistant.
Ora chiunque può avere un assistente personale nella propria email che programma riunioni, redige risposte e etichetta le priorità.
Perplexity Email Assistant è ora disponibile su Gmail e Outlook per tutti gli abbonati a Perplexity Max.