Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O Google treinou um modelo com milhões de mensagens de usuários.
Sem nunca ter visto uma única mensagem.
Chama-se Aprendizagem Federada. O Google, a Apple, a Meta e todas as grandes empresas de tecnologia a utilizam.
Deixe-me explicar como funciona:
Imagine que você quer construir um teclado que prevê o que os usuários vão digitar a seguir.
Os melhores dados de treinamento? Mensagens reais de milhões de telefones. Mas você não pode coletá-las. São privadas, sensíveis, e os usuários se revoltariam.
A aprendizagem federada inverte o script. Em vez de trazer os dados para o modelo, você traz o modelo para os dados.
Aqui está como:
"Envie o modelo para fora."
Seu telefone baixa uma pequena rede neural. Ela vive localmente no seu dispositivo.
→ Este é o modelo global W
"Treine onde os dados estão."
Enquanto você digita, seu telefone aprende silenciosamente seus padrões. "omw" → "estou a caminho em 10". Ele calcula como o modelo deve melhorar.
→ Estes são os gradientes locais ΔW
"Envie de volta apenas os aprendizados."
Seu telefone envia atualizações de peso para o servidor. Não suas mensagens. Não seu histórico de digitação. Apenas matemática.
→ Este é o passo de agregação de atualizações
"Média entre milhares de dispositivos"
O servidor combina atualizações de milhares de telefones. Padrões comuns se reforçam. Peculiaridades individuais se cancelam.
→ Esta é a FedAvg: W_novo = W + (1/n) × Σ(ΔWₖ)
Quatro passos. Nenhum dado bruto sai do seu dispositivo. Apenas coordenação elegante (consulte o visual abaixo).
A melhor parte:
Isto desbloqueia dados que antes eram impossíveis de usar.
Hospitais colaboram na detecção de câncer sem compartilhar exames de pacientes. Bancos constroem modelos de fraude sem expor transações. Casas inteligentes aprendem preferências sem momentos privados atingindo a nuvem.
Privacidade e utilidade não são trocas. Respeitar os limites dos dados é o que torna o modelo possível.
Então, antes de centralizar tudo, considere: os melhores dados de treinamento podem já existir, presos em dispositivos que você nunca acessará diretamente.
No próximo tweet, compartilhei um vídeo explicativo realmente bom sobre isso.

Explicação sobre aprendizado federado pela IBM:

1,7K
Top
Classificação
Favoritos
