Der Grund, warum jedes Modell schlecht im Multimodal ist, liegt darin, dass buchstäblich niemand außer @vikhyatk es überhaupt versucht. Es gibt wahrscheinlich noch viele einfache Gewinne auf dem CUA-Weg zu finden.
Tzafon
Tzafon27. Feb. 2026
Wir haben dem Modell farbige Quadrate für ein paar Stunden gezeigt. Es hat gelernt, einen Computer besser zu nutzen als Modelle, die auf Tausenden von echten Screenshots trainiert wurden.
@ainativefirm @vikhyatk vor dem Prometheus hat @sherjilozair auch hervorragende CUA-Arbeit geleistet, die nicht annähernd genug Aufmerksamkeit erhielt.
@ainativefirm @vikhyatk sowohl Anthropic als auch Perplexity haben korrekt erkannt, dass die nächste Welle der KI-Power, die über das Programmieren hinausgeht, die Finanzen betrifft.
143