We werken samen met @cerebras om de snelst mogelijke inferentie te bouwen. Binnenkort beschikbaar op Amazon Bedrock, leveren we inferentieprestaties die een orde van grootte sneller zijn dan wat vandaag de dag beschikbaar is door AWS Trainium3 te verbinden voor rekenintensieve prefill met Cerebras CS-3 om de decodering aan te drijven. Leer meer over het partnerschap.