Najcenniejszym zasobem, jaki masz jako inżynier, jest twój własny czas. Różne modele osiągają szczyty w różnych zadaniach, a wszystkie LLM mogą czasami być zawodowe, więc naturalnym sposobem na zaoszczędzenie czasu podczas kodowania jest uruchomienie tego samego zadania na wielu modelach jednocześnie, a następnie porównanie wyników i zdecydowanie, z którego chcesz korzystać. Jednym z zabawnych efektów ubocznych tego jest to, że otrzymujemy być może najbardziej naturalną ocenę kodowania w rzeczywistym świecie! Wszyscy wiedzą, jak łatwo jest osiągnąć maksymalne wyniki na stałym zestawie zadań; ta ocena jest prawdziwym testem, które modele najlepiej sprawdzają się dla programistów w ich codziennej pracy.