Introduktion till Exa Deep: att sätta en agent i varje sökning För varje fråga körs en agent i en loop tills all information samlats in, och returnerar sedan strukturerad utdata. Utvärderingar visar att Deep är Pareto-optimalt med 4–60 sekunders latens, idealiskt för snabb och kostnadseffektiv forskning!
Vi optimerade Exa Deep för kostnad och hastighet. Under huven delar en agent upp varje sökning till en plan med flera omgångar av parallella delsökningar. Delsökningar använder vår <200 ms Exa Instant-endpoint för att minska latensen.
Deep är mycket kontrollerbart. Den kan hantera komplexa inmatningsfrågor med komplexa instruktioner. Du kan definiera ett utdataschema, och Deep returnerar strukturerad JSON med fältnivåreferenser:
172