Estamos atualizando a forma como medimos horizontes de tempo de modelos em tarefas de software (TH 1.0→1.1). A metodologia atualizada incorpora mais tarefas do HCAST, ampliando nosso total de 170 para 228. Isso produz estimativas mais apertadas, especialmente em horizontes mais longos.