Yaklaşık bir yıl önce HF'ye katıldım ve hızlandırma üzerinde çalıştım@TheZachMueller teoride dağıtık eğitimin nasıl işlediğini biliyordum ama neredeyse hiç deneyimim yoktu. Birkaç H100'ün deneylerimi yapması beni çok heyecanlandırdı. Birkaç ay önce Prime'a katıldım, ilk projelerimden biri Arcee ile Trinity Large Run'un sorunsuz ve hızlı çalıştığından emin olmaktı. Şimdi, yüzlerce GPU'da 800B modelinin sorunsuz çalışmasını sağlamak için çalışıyorum ve araştırma kümemizin büyük bir kısmını sürekli olarak alıyorum. Biraz kendini savunuyorum ama bir şeyler yapabilmek biraz çılgınca mı geliyor?