🚨GROK 4 ÜBERTREFFEN DEN ARC-AGI-BENCHMARK MIT 60,6% Der Denktest, der die meisten KI-Systeme ins Stocken bringt, hat gerade seinen Meister gefunden. Grok 4 erreichte 60,6% beim ARC-AGI, während OpenAIs Beste bei 41,0% und alle anderen im einstelligen Bereich liegen. Kosten pro Aufgabe? Nur 18 $. Claude benötigt 107 $ für schlechtere Ergebnisse. Dieser Benchmark testet abstraktes Denken - die Art von Denken, die Menschen verwenden, um Rätsel zu lösen, die sie noch nie zuvor gesehen haben. Grok hat gerade bewiesen, dass es anders denkt. Quelle: @xai @elonmusk
Mario Nawfal
Mario Nawfal10. Juli, 12:46
🚨XAI bringt das "EVE" Sprachmodell mit britischem Akzent heraus, das flüstert und singt Lernen Sie Eve kennen: xAIs Antwort darauf, KI-Gespräche tatsächlich angenehm zu gestalten. Kommt mit einem vornehmen britischen Akzent, denn anscheinend waren amerikanische KI-Stimmen nicht raffiniert genug. Kann Geheimnisse flüstern, Melodien singen und Gespräche führen, die nicht wie der Kundenservice eines Roboters klingen. Quelle: @xai @elonmusk
62,61K