Las GPU son poco fiables a gran escala. En @modal hemos escalado a más de 20,000 GPU concurrentes en AWS, GCP, Azure y OCI, con más de 1M de instancias lanzadas. Las GPU en la nube pública fallan de muchas maneras, y hemos visto la mayoría de ellas. Aquí está cómo manejamos la fiabilidad de las GPU 👇