Endlich habe ich das große Ding in die Hände bekommen. Qwen3.5-122B-A10B — 122 Milliarden Parameter. Zu groß für jede einzelne Verbraucher-GPU. Also habe ich 4 von jeder gemietet... und dann eine professionelle Karte, um zu sehen, ob rohe Gewalt überhaupt eine Rolle spielt. - 1x RTX PRO 6000 (96GB): 101,4 tok/s - 4x 5090 (128GB): 87,0 tok/s - 4x 4090 (96GB): 25,1 tok/s - 4x 3090 (96GB): 20,8 tok/s Eine einzige Karte für 8.500 $ hat vier RTX 5090s geschlagen.