Giudici VLM auto-miglioranti senza annotazioni umane