GPUは大規模に見ると信頼性が低いです。 @modalではAWS、GCP、Azure、OCIで20,000+の同時GPUにスケールし、1M+インスタンスを稼働させました。パブリッククラウドGPUは多くの点で失敗しており、そのほとんどが見られました。 GPUの信頼性👇についての扱い方は以下の通りです