auto badanie pamięci eval dla niestandardowego agenta pi, BARDZO fajna struktura jak na razie testuję również tę umiejętność kodu /autoresearch claude (link w odpowiedziach) podobno przekształca agentów w kompletny pipeline automatycznego badacza EVALuję to w odniesieniu do rzeczywistych zbiorów danych pamięci z rzeczywistymi uruchomieniami agentów, szczególnie pod kątem tego, jak dobrze potrafią zapamiętać bazę kodu przekażę wyniki
OK CLAUDE BOI !!!
to jest takie fajne
886