Artigo na última edição do jornal interno da CIA. LLMs em simulações de guerra. "nos testes, observamos que as respostas geradas com o Mistral 7B frequentemente tendiam para a negociação diplomática, mesmo quando o comportamento era inconsistente com a persona atribuída."
"Na nossa pesquisa pós-jogo, os participantes deram à experiência uma classificação média de 4,25 em 5. Todos os entrevistados concordaram que o seu assistente de IA "parecia preciso", o que significa que forneceu resultados contendo informações fiáveis."
55