Zeptali jsme se @mikeknoop (spoluzakladatele, @arcprize) na neustálé učení a vývoj benchmarků uvažování AI: "ARC V1 byl představen již v roce 2019. Byl navržen tak, aby zpochybnil hluboké učení jako paradigma, ještě předtím, než se jazykové modely skutečně rozjely." "V2 zpochybňuje nové paradigma systémů uvažování AI. I když hádanky vypadají podobně jako V1, V2 obecně vyžaduje delší řetězce uvažování, což je činí těžšími." "Nyní, s V3, definujeme to, čemu říkáme benchmark interaktivního uvažování; vyhodnotit a zpochybnit novou generaci hraničních systémů agentů AI."
8,39K