Desenvolvemos o FACTS Benchmark Suite com @GoogleResearch. 📊 É o primeiro teste abrangente da indústria que avalia a factualidade de LLM em quatro dimensões: conhecimento interno do modelo, pesquisa na web, fundamentação e entradas multimodais.