Självförbättrande VLM-domare utan mänskliga annotationer