Графические процессоры ненадежны в больших масштабах. В @modal мы масштабировались до более чем 20,000 одновременных графических процессоров на AWS, GCP, Azure и OCI, с более чем 1M запущенных экземпляров. Графические процессоры в публичных облаках могут выходить из строя различными способами, и мы видели большинство из них. Вот как мы обеспечиваем надежность графических процессоров 👇