Olemme kehittäneet FACTS Benchmark Suiten @GoogleResearch:n kanssa. 📊 Se on alan ensimmäinen kattava testi, joka arvioi LLM:n faktuaalisuutta neljässä ulottuvuudessa: sisäinen mallitieto, verkkohaku, maadoitus ja multimodaaliset syötteet.