Hemos desarrollado la FACTS Benchmark Suite con @GoogleResearch. 📊 Es la primera prueba integral de la industria que evalúa la factualidad de los LLM en cuatro dimensiones: conocimiento del modelo interno, búsqueda en la web, fundamentación y entradas multimodales.