Escrevi sobre quão surpreendentemente eficaz é o pensamento do GPT-5 ao usar sua ferramenta de busca apoiada pelo Bing, ilustrado com 8 exemplos das últimas 48 horas.
Comecei a chamá-lo de meu Goblin de Pesquisa.
Estou mais uma vez chocado com o quão melhor é o desempenho de recuperação de imagens que você pode obter se incorporar resumos altamente opinativos de uma imagem, um resumo que saiu de um modelo de linguagem visual, do que usando as próprias incorporações do CLIP. Se você disser ao LLM que o resumo será incorporado e usado para fazer buscas a montante. Um sistema meu passou de 28% de recall em 5 usando CLIP para 75% de recall em 5 usando um resumo do LLM. E levei apenas cerca de 40 minutos para melhorar o prompt de sumarização.
Minhas notas sobre Kimi-K2-Instruct-0905, também conhecido como Kimi K-2.1 - uma melhoria incremental no modelo de pesos abertos de trilhões de parâmetros anterior do Moonshot, agora com o dobro do comprimento de contexto (256k, em vez de 128k)