1/ Yoğun MLP'ler yalan demektir. Eğittiğimiz standart transformatörler zaten besleme katmanlarının içinde seyrek yönlendirme yapıyor—ama şimdiye kadar görememiştik. 🧵