Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Bilawal Sidhu
O Google acaba de descobrir uma poderosa capacidade emergente no Veo 3 - anotar visualmente as suas instruções no quadro inicial, e o Veo faz isso por si!
Em vez de iterar sem fim na prompt perfeita, definindo relações espaciais complexas em palavras, pode simplesmente desenhar como faria para um artista humano.
Esta capacidade está a pedir uma experiência de utilizador adequada, mas por agora, apenas faça rabiscos na sua aplicação de escolha e use "frames to video" no Google Flow.
152,07K
Em breve, o seu iPhone estará a usar o FaceID para garantir que é realmente você a usar o seu dispositivo enquanto navega, interage e publica.
A Apple está singularmente posicionada para fazer tudo isso no dispositivo de uma maneira que preserva a privacidade.
As funcionalidades "atentas" já são um passo nessa direção — o seu iPhone tira uma foto infravermelha de baixa resolução a cada poucos segundos para verificar o seu olhar e ver se você está a prestar atenção à tela.
O próximo passo seria permitir que um aplicativo soubesse que é realmente você, ou simplesmente que é um ser humano real a usar o dispositivo, e não um bot.

Balaji23/07, 03:37
Um tipo importante de rede social será aquele onde nenhum bot é permitido.
8,34K
Combinar o controlo explícito do software 3D com a criatividade dos modelos de IA generativa é um fluxo de trabalho promissor, mas subestimado.
Construa as suas cenas 3D de forma procedural, descrevendo-as em linguagem natural, e depois leve-as até ao fim com os seus modelos de imagem e vídeo de escolha.
Ferramentas como a intangible são construídas em torno de tal fluxo de trabalho, para que não precise de colar aplicações juntas. Muito fixe!
35,94K
O SceneScript trata a reconstrução 3D como um problema de linguagem em vez de um problema de geometria.
O modelo assiste a um vídeo de uma sala e aprende a escrever um script para isso. Ele gera automaticamente comandos de texto como make_wall(...) ou make_bbox(...) que definem a cena.
O novo artigo "Scene Language" de Stanford vai um passo além, adicionando embeddings CLIP para capturar também a aparência visual.
O fato de que os modelos de linguagem já entendem relações espaciais suficientemente bem para escrever gráficos de cena é bastante impressionante.
100,44K
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável