Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Bilawal Sidhu
Google acaba de descubrir una poderosa capacidad emergente en Veo 3: anote visualmente sus instrucciones en el cuadro de inicio, ¡y Veo lo hace por usted!
En lugar de iterar sin cesar en el mensaje perfecto, definiendo relaciones espaciales complejas en palabras, puedes dibujarlo como lo harías con un artista humano.
Esta capacidad está pidiendo a gritos una experiencia de usuario adecuada, pero por ahora solo garabatea en la aplicación de tu elección y usa "fotogramas a video" en Google Flow.
152.08K
Muy pronto, su iPhone usará FaceID para asegurarse de que realmente sea usted quien use su dispositivo mientras se desplaza, interactúa y publica.
Apple está en una posición única para hacer todo esto en el dispositivo de una manera que preserve la privacidad.
Las funciones de "atención consciente" ya son un paso en esta dirección: su iPhone toma una foto infrarroja de baja resolución cada pocos segundos para verificar su mirada y ver si está prestando atención a la pantalla.
El siguiente paso sería hacerle saber a una aplicación que en realidad eres tú, o simplemente que es un humano real el que usa el dispositivo, y no un bot.

Balaji23 jul, 03:37
Un tipo importante de red social será aquella en la que no se permitan bots de ningún tipo.
8.35K
Combinar el control explícito del software 3D con la creatividad de los modelos de IA generativa es un flujo de trabajo prometedor pero infravalorado.
Construya sus escenas 3D de forma procedimental describiéndolas en lenguaje natural, y luego llévelas hasta el final con los modelos de imagen y vídeo que elija.
Herramientas como intangible se basan en un flujo de trabajo de este tipo, por lo que no es necesario unir las aplicaciones con cinta adhesiva. ¡Genial!
35.95K
SceneScript trata la reconstrucción 3D como un problema de lenguaje en lugar de uno de geometría.
La modelo ve un video de una habitación y simplemente aprende a escribir un guión para ella. Escupe automáticamente comandos de texto como make_wall(...) o make_bbox(...) que definen la escena.
El nuevo documento "Scene Language" de Stanford va un paso más allá, añadiendo incrustaciones de CLIP para capturar también la apariencia visual.
El hecho de que los modelos de lenguaje ya entiendan las relaciones espaciales lo suficientemente bien como para escribir gráficos de escena es bastante descabellado.
100.45K
Populares
Ranking
Favoritas
Onchain en tendencia
Tendencia en X
Principales fondos recientes
Más destacadas