1/ LLM-y oceniające inne LLM-y brzmią efektywnie… dopóki nie zapytasz, kto ustala zasady. Szybko pojawiają się uprzedzenia, sugestie i efekty dostawców.
2/ W Inference Labs wierzymy, że sama ocena musi być weryfikowalna. Jeśli AI ocenia AI, potrzebujemy dowodu kryptograficznego, a nie metryk opartych na zaufaniu.
76