O Google treinou um modelo com mensagens de milhões de usuários. Sem nunca ver uma única mensagem. Chama-se Aprendizado Federado. Google, Apple, Meta e todas as grandes empresas de tecnologia usam isso. Deixe-me explicar como funciona: Imagine que você queira construir um teclado que preveja o que os usuários digitam em seguida. Os melhores dados de treinamento? Mensagens reais de milhões de celulares. Mas você não pode cobrar. É privado, sensível, e os usuários se revoltariam. O aprendizado federado inverte o roteiro. Em vez de trazer dados para o modelo, você traz o modelo para os dados. Veja como: "Mande o modelo para fora." Seu celular baixa uma pequena rede neural. Ele fica localmente no seu dispositivo. → Este é o modelo global W "Treine onde os dados vivem." Enquanto você digita, seu celular aprende silenciosamente seus padrões. "omw" → "estar lá em 10". Ele calcula como o modelo deve melhorar. → Estes são gradientes locais ΔW "Envie apenas os aprendizados." Seu celular envia atualizações de peso para o servidor. Não suas mensagens. Não seu histórico de digitação. Só matemática. → Esta é a etapa de agregação de atualizações "Média em milhares de dispositivos" O servidor combina atualizações de milhares de celulares. Padrões comuns reforçam. Individualidades se anulam. → Este é FedAvg: W_new = W + (1/n) × Σ(ΔWk) Quatro passos. Nenhum dado bruto sai do seu dispositivo. Apenas uma coordenação elegante (veja o visual abaixo). A melhor parte: Isso desbloqueia dados que antes eram impossíveis de usar. Hospitais colaboram na detecção do câncer sem compartilhar exames de pacientes. Bancos constroem modelos de fraude sem expor transações. Casas inteligentes aprendem preferências sem momentos privados que passem pela nuvem. Privacidade e utilidade não são trocas. Respeitar os limites dos dados é o que torna o modelo possível. Então, antes de centralizar tudo, considere: os melhores dados de treinamento podem já existir, presos em dispositivos que você nunca terá acesso diretamente. No próximo tweet, compartilhei um vídeo explicativo muito bom sobre isso.
Explicação de aprendizagem federada pela IBM:
1,7K