Las GPUs son poco fiables a gran escala. En @modal hemos escalado a 20.000+ GPUs concurrentes en AWS, GCP, Azure y OCI, con 1M+ instancias lanzadas. Las GPUs de nube pública fallan de muchas maneras, y hemos visto la mayoría de ellas. Así es como gestionamos la fiabilidad 👇 de la GPU