Le GPU non sono affidabili su larga scala. Presso @modal abbiamo scalato fino a oltre 20.000 GPU concorrenti su AWS, GCP, Azure e OCI, con oltre 1 milione di istanze lanciate. Le GPU nel cloud pubblico falliscono in molti modi, e noi ne abbiamo visti la maggior parte. Ecco come gestiamo l'affidabilità delle GPU 👇