Abbiamo sviluppato il FACTS Benchmark Suite con @GoogleResearch. 📊 È il primo test completo del settore che valuta la factualità dei LLM su quattro dimensioni: conoscenza interna del modello, ricerca web, ancoraggio e input multimodali.