NVIDIA bize 2 adet DGX Spark gönderdi. Bir süre onlarla ne yapacağımızı düşündük. Bellek bant genişliği 273 GB/sn'dir ve bu da onu 3=3 çıkarım için M819 Ultra'dan (batch_size GB/sn) 1 kat daha yavaş yapar. Ancak 4 kat daha fazla FLOPS'a sahiptir (26 TFLOPS'a kıyasla 100 TFLOPS). Bu yüzden düşündük ki, DGX Spark & M3 Ultra'yı birleştirebilseydik ve hem DGX Spark'taki devasa hesaplamayı hem de M3 Ultra'daki devasa bellek bant genişliğini kullanabilseydik. Çıkarımı her iki cihaza bölmenin ve tek başına M4 Ultra'ya kıyasla uzun istemler için 3 kata kadar hızlanma elde etmenin bir yolunu bulduk. Tüm ayrıntılar aşağıda bağlantısı verilen blog yazısında.