1/LLM hodnotící jiné LLM zní efektivně... dokud se nezeptáte, kdo určuje pravidla. Zaujatost, náznaky a efekty prodejců se rychle objevují.
2/ V Inference Labs věříme, že samotné hodnocení musí být ověřitelné. Pokud AI posuzuje AI, potřebujeme kryptografické důkazy, ne metriky "věřte mi".
79