Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Bilawal Sidhu
¡Google acaba de descubrir una poderosa capacidad emergente en Veo 3: anotar visualmente tus instrucciones en el fotograma de inicio, y Veo simplemente lo hace por ti!
En lugar de iterar sin fin en el aviso perfecto, definiendo relaciones espaciales complejas con palabras, puedes simplemente dibujarlo como lo harías para un artista humano.
Esta capacidad está pidiendo a gritos una experiencia de usuario adecuada, pero por ahora, simplemente dibuja en tu aplicación de elección y utiliza "fotogramas a video" en Google Flow.
152,07K
Pronto tu iPhone estará utilizando FaceID para asegurarse de que realmente eres tú quien está usando tu dispositivo mientras navegas, interactúas y publicas.
Apple está en una posición única para hacer todo esto en el dispositivo de manera que se preserve la privacidad.
Las funciones "atentas" ya son un paso en esta dirección: tu iPhone toma una foto infrarroja de baja resolución cada pocos segundos para verificar tu mirada y ver si estás prestando atención a la pantalla.
El siguiente paso sería permitir que una aplicación sepa que realmente eres tú, o simplemente que es un ser humano real quien está usando el dispositivo, y no un bot.

Balaji23 jul, 03:37
Un tipo importante de red social será aquel donde no se permitan bots en absoluto.
8,34K
Combinar el control explícito del software 3D con la creatividad de los modelos de IA generativa es un flujo de trabajo prometedor pero subestimado.
Construye tus escenas 3D de manera procedural describiéndolas en lenguaje natural, luego llévalas hasta el final con tus modelos de imagen y video elegidos.
Herramientas como intangible están construidas en torno a este flujo de trabajo, así que no necesitas juntar aplicaciones con cinta adhesiva. ¡Bastante genial!
35,94K
SceneScript trata la reconstrucción 3D como un problema de lenguaje en lugar de uno de geometría.
El modelo observa un video de una habitación y simplemente aprende a escribir un guion para ello. Genera de forma autoregresiva comandos de texto como make_wall(...) o make_bbox(...) que definen la escena.
El nuevo artículo de Stanford "Scene Language" va un paso más allá al añadir embeddings de CLIP para capturar también la apariencia visual.
El hecho de que los modelos de lenguaje ya entiendan las relaciones espaciales lo suficientemente bien como para escribir gráficos de escena es bastante sorprendente.
100,45K
Parte superior
Clasificación
Favoritos
En tendencia on-chain
En tendencia en X
Principales fondos recientes
Más destacado