Kami mengoreksi kesalahan dalam pemodelan kami yang menggelembungkan cakrawala waktu 50% baru-baru ini sebesar 10-20% (dan mengurangi cakrawala 80%). Kami secara tidak tepat menghukum kecuraman dalam kecocokan kurva panjang→keberhasilan tugas. Ini paling memengaruhi model tertua dan terbaru, yang kecocokannya tidak terlalu dibatasi data.