Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Bilawal Sidhu
Google heeft net een krachtige opkomende functie ontdekt in Veo 3 - visueel annoteren van je instructies op het startframe, en Veo doet het gewoon voor je!
In plaats van eindeloos te itereren op de perfecte prompt, complexe ruimtelijke relaties in woorden te definiëren, kun je het gewoon tekenen zoals je dat voor een menselijke kunstenaar zou doen.
Deze functie vraagt om een goede UX, maar voor nu kun je gewoon in je favoriete app krabbelen en "frames naar video" gebruiken in Google Flow.
152,06K
Binnenkort zal je iPhone FaceID gebruiken om ervoor te zorgen dat jij het daadwerkelijk bent die je apparaat gebruikt terwijl je aan het scrollen, interactie hebt en berichten plaatst.
Apple is uniek gepositioneerd om dit allemaal op het apparaat zelf te doen op een privacy-beschermende manier.
"Aandacht-bewuste" functies zijn al een stap in deze richting — je iPhone maakt elke paar seconden een lage resolutie infraroodfoto om je oogbeweging te controleren en te zien of je aandacht aan het scherm besteedt.
De volgende stap zou zijn om een app te laten weten dat jij het daadwerkelijk bent, of simpelweg dat het een echte mens is die het apparaat gebruikt, en geen bot.

Balaji23 jul, 03:37
Een belangrijk soort sociaal netwerk zal er een zijn waar helemaal geen bots zijn toegestaan.
8,34K
Het combineren van de expliciete controle van 3D-software met de creativiteit van generatieve AI-modellen is een veelbelovende maar ondergewaardeerde workflow.
Bouw je 3D-scènes procedureel door ze in natuurlijke taal te beschrijven, en breng ze vervolgens helemaal tot leven met de door jou gekozen beeld- en videomodellen.
Tools zoals intangible zijn gebouwd rond zo'n workflow, zodat je geen apps aan elkaar hoeft te plakken. Best cool!
35,94K
SceneScript beschouwt 3D-reconstructie als een taalprobleem in plaats van een geometrisch probleem.
Het model kijkt naar een video van een kamer en leert gewoon een script ervoor te schrijven. Het genereert autoregressief tekstcommando's zoals make_wall(...) of make_bbox(...) die de scène definiëren.
Het nieuwe "Scene Language"-artikel van Stanford gaat een stap verder door CLIP-embeddings toe te voegen om ook de visuele uitstraling vast te leggen.
Het feit dat taalmodellen al goed genoeg zijn om ruimtelijke relaties te begrijpen om scènegrafieken op te stellen, is behoorlijk bijzonder.
100,44K
Boven
Positie
Favorieten
Populair op onchain
Populair op X
Recente topfinanciering
Belangrijkste