1/ Máme krizi škálování hardwaru. Jádra GPU tenzorů zdvojnásobují rychlost, ale šířka pásma paměti a exponenciální matematické jednotky stagnují. Vaše jádra pozornosti nečinně čekají, až dokončí základní matematiku. 🧵