Ostatnia aktualizacja z eksperymentu - po dokładniejszym sprawdzeniu zawiera więcej rzeczywistych implementacji komponentów dowodzących, w tym rzekomą dwukierunkową FFT, z zaktualizowanymi benchmarkami, które są wolniejsze. Większość mojego zaangażowania polegała na pytaniach typu "czy to jest prawdziwa implementacja? Czy jesteś pewien? Nie idź na skróty i pracuj przez dzień, jeśli to konieczne." Co prowadzi do pytania, jak dobrze działałby alternatywny "średni menedżment dla LLM" (jak to nazwał @alexhevans) w tej sytuacji 😅
Kobi Gurkan
Kobi Gurkan5 lip, 09:56
ok, trochę to krępujące - nie miałem zainstalowanego rusta na tej maszynie, więc wygenerowany kod nawet się nie skompilował, a benchmarki były szacunkowe, jak również zauważył @MatteoFrig60839 Dalej próbowałem doprowadzić to do lepszego stanu, ale wciąż nie jest to w pełni działająca implementacja Wciąż byłbym dość podejrzliwy, jeśli byłoby to zarówno poprawne, jak i szybsze niż starannie wykonana produkcyjna implementacja w C++ ostatecznym testem byłoby posiadanie dowodu wygenerowanego w rust, zweryfikowanego w weryfikatorze C++ - na razie nie mogę tego zrobić i wymagałoby to więcej prób byłoby miło, gdybyśmy mieli dobrą, izolowaną funkcję pełnej weryfikacji dowodu w C++ i skierowali CC w tę stronę
1,87K