RubricHub Rozsáhlá rubricová datasada s ~110 tisíci instancemi pro trénování modelů otevřené generace. Používá automatizovaný hrubý až jemný rámec k vytváření vysoce diskriminačních hodnotících kritérií, což umožňuje Qwen3-14B překonat GPT-5 na HealthBench.