Nous nous associons à @cerebras pour construire l'inférence la plus rapide possible. Bientôt disponible sur Amazon Bedrock, nous offrons des performances d'inférence d'un ordre de grandeur plus rapides que ce qui est disponible aujourd'hui en connectant AWS Trainium3 pour le pré-remplissage intensif en calcul avec Cerebras CS-3 pour alimenter le décodage. En savoir plus sur le partenariat.