Introductie van Exa Deep: een agent in elke zoekopdracht plaatsen Voor elke query draait een agent in een lus totdat hij alle informatie verzamelt, en retourneert vervolgens gestructureerde output. Evals tonen aan dat Deep Pareto-optimaal is bij 4-60s latentie, ideaal voor snelle, kostenefficiënte research!
We hebben Exa Deep geoptimaliseerd voor kosten en snelheid. Onder de motorkap decomprimeert een agent elke zoekopdracht in een plan met meerdere rondes van parallelle sub-zoekopdrachten. Sub-zoekopdrachten maken gebruik van onze <200ms Exa Instant-endpoint om de latentie te verminderen.
Deep is zeer controleerbaar. Het kan complexe invoervragen met complexe instructies aan. Je kunt een uitvoerschema definiëren, en Deep retourneert gestructureerde JSON met citaties op veldniveau:
95