Présentation d'Exa Deep : un agent dans chaque recherche Pour chaque requête, un agent fonctionne en boucle jusqu'à ce qu'il recueille toutes les informations, puis renvoie une sortie structurée. Les évaluations montrent que Deep est optimal de Pareto avec une latence de 4 à 60 secondes, idéal pour des recherches rapides et rentables !
Nous avons optimisé Exa Deep pour le coût et la vitesse. En coulisses, un agent décompose chaque recherche en un plan avec plusieurs tours de sous-recherches parallèles. Les sous-recherches utilisent notre point de terminaison Exa Instant <200ms pour réduire la latence.
Deep est hautement contrôlable. Il peut gérer des requêtes d'entrée complexes avec des instructions complexes. Vous pouvez définir un schéma de sortie, et Deep renvoie un JSON structuré avec des citations au niveau des champs :
101