FACTS Benchmark Suite'i @GoogleResearch ile birlikte geliştirdik. 📊 Bu, LLM'nin gerçekçiliğini dört boyutta değerlendiren sektörün ilk kapsamlı testidir: dahili model bilgisi, web araması, topraklama ve çoklu modal girdiler.