Introducendo Exa Deep: inserire un agente in ogni ricerca Per ogni query, un agente funziona in un ciclo fino a raccogliere tutte le informazioni, quindi restituisce un output strutturato. Le valutazioni mostrano che Deep è ottimale di Pareto con una latenza di 4-60 secondi, ideale per ricerche rapide e a basso costo!
Abbiamo ottimizzato Exa Deep per costi e velocità. Sotto il cofano, un agente scompone ogni ricerca in un piano con più turni di sotto-ricerche parallele. Le sotto-ricerche utilizzano il nostro endpoint Exa Instant <200ms per ridurre la latenza.
Deep è altamente controllabile. Può gestire query di input complesse con istruzioni complesse. Puoi definire uno schema di output e Deep restituisce JSON strutturato con citazioni a livello di campo:
80