Apresentando o Exa Deep: colocando um agente dentro de cada pesquisa Para cada consulta, um agente executa em um loop até reunir todas as informações, então retorna uma saída estruturada. As avaliações mostram que o Deep é ótimo em Pareto com latência de 4-60s, ideal para pesquisas rápidas e econômicas!
Otimizar o Exa Deep para custo e velocidade. Por trás das cenas, um agente decompõe cada pesquisa em um plano com várias rodadas de sub-pesquisas paralelas. As sub-pesquisas utilizam nosso endpoint Exa Instant <200ms para reduzir a latência.
Deep é altamente controlável. Ele pode lidar com consultas de entrada complexas com instruções complexas. Você pode definir um esquema de saída, e o Deep retorna JSON estruturado com citações a nível de campo:
84