Meta ha appena lanciato SAM 3D, ma più interessante è che hanno praticamente risolto il collo di bottiglia dei dati 3D che ha bloccato il settore per anni. Creare manualmente o scansionare la verità di base 3D per il disordinato mondo reale è praticamente impossibile su larga scala. Ma e se facessi semplicemente classificare le uscite dei modelli da parte degli esseri umani? Invia i casi limite a veri artisti 3D per modellare, e poi reinseriscili. Improvvisamente puoi annotare come un milione di immagini. È fondamentalmente RLHF per la ricostruzione 3D. I dati sintetici sono il pre-addestramento, la classificazione del mondo reale è l'allineamento. Hanno preso l'intero manuale e funziona davvero. Due modelli - uno per oggetti/scenari, uno per esseri umani. Lo stanno già spedendo in FB Marketplace così puoi vedere se quella lampada o sedia sta bene nella tua stanza prima di acquistare. Inoltre stanno rilasciando tutto - modelli, codice, il loro rig del corpo umano sotto licenza commerciale. E hanno costruito un set di valutazione di immagini reali disordinate per aiutare a colmare il divario sim-to-real. La cosa più interessante è però il motore dei dati. Il 3D è stato bloccato dalla verità di base per sempre. Se la verifica scala più facilmente della creazione, improvvisamente tutto il gioco cambia.