RubricHub Açık uçlu üretim modellerini eğitmek için ~110k örnek içeren büyük ölçekli bir rubrik veri seti. Otomatik bir kaba ve ince çerçeve kullanarak yüksek ayrımcı değerlendirme kriterleri oluşturur ve Qwen3-14B'nin HealthBench'te GPT-5'i geçmesini sağlar.