Google entrenó un modelo con millones de mensajes de usuarios. Sin haber visto nunca un solo mensaje. Se llama Aprendizaje Federado. Google, Apple, Meta y todas las grandes empresas tecnológicas lo utilizan. Déjame explicarte cómo funciona: Imagina que quieres construir un teclado que prediga lo que los usuarios escribirán a continuación. ¿Los mejores datos de entrenamiento? Mensajes reales de millones de teléfonos. Pero no puedes recopilarlos. Son privados, sensibles, y los usuarios se rebelarían. El aprendizaje federado cambia las reglas del juego. En lugar de llevar los datos al modelo, llevas el modelo a los datos. Así es como funciona: "Envía el modelo." Tu teléfono descarga una pequeña red neuronal. Vive localmente en tu dispositivo. → Este es el modelo global W "Entrena donde viven los datos." Mientras escribes, tu teléfono aprende silenciosamente tus patrones. "omw" → "llegaré en 10". Calcula cómo debería mejorar el modelo. → Estos son los gradientes locales ΔW "Envía de vuelta solo los aprendizajes." Tu teléfono envía actualizaciones de peso al servidor. No tus mensajes. No tu historial de escritura. Solo matemáticas. → Este es el paso de agregación de actualizaciones "Promedia entre miles de dispositivos" El servidor combina actualizaciones de miles de teléfonos. Los patrones comunes se refuerzan. Las peculiaridades individuales se cancelan. → Este es FedAvg: W_nuevo = W + (1/n) × Σ(ΔWₖ) Cuatro pasos. Ningún dato en bruto sale de tu dispositivo. Solo una coordinación elegante (consulta la visualización a continuación). La mejor parte: Esto desbloquea datos que antes eran imposibles de usar. Los hospitales colaboran en la detección de cáncer sin compartir escaneos de pacientes. Los bancos construyen modelos de fraude sin exponer transacciones. Los hogares inteligentes aprenden preferencias sin que momentos privados lleguen a la nube. La privacidad y la utilidad no son compensaciones. Respetar los límites de los datos es lo que hace posible el modelo. Así que antes de centralizarlo todo, considera: los mejores datos de entrenamiento podrían ya existir, atrapados en dispositivos a los que nunca accederás directamente. En el siguiente tweet he compartido un video explicativo realmente bueno sobre esto.
Explicación del aprendizaje federado por IBM:
1,7K