Finalmente sono arrivato al punto in cui molte delle cose su cui faccio affidamento sono specifiche per b200 + cuda + torch, quindi non riuscirei a ottenere gli stessi risultati sui TPU con Jax. Che svolta inaspettata.