Populaire onderwerpen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vandaag zijn we samen met @oliver_wang2, hoofdwetenschapper bij @GoogleDeepMind en tech-lead voor Gemini 2.5 Flash Image—beter bekend onder de codenaam “Nano Banana.” We duiken in de ontwikkeling en mogelijkheden van dit nieuw vrijgegeven grensverleggende visie-taalmodel, te beginnen met de bredere verschuiving van gespecialiseerde afbeeldingsgeneratoren naar algemene multimodale agenten die zowel visuele als tekstuele gegevens kunnen gebruiken voor een verscheidenheid aan taken. Oliver legt uit hoe Nano Banana afbeeldingen kan genereren en iteratief kan bewerken terwijl het consistentie behoudt, en hoe de integratie met de wereldkennis van Gemini creatieve en praktische gebruiksgevallen uitbreidt. We bespreken de spanning tussen esthetiek en nauwkeurigheid, de relatieve volwassenheid van afbeeldingsmodellen in vergelijking met tekstgebaseerde LLM's, en schaling als een drijfveer voor vooruitgang. Oliver deelt ook verrassende opkomende gedragingen, de uitdagingen van het evalueren van visie-taalmodellen, en de risico's van trainen op AI-gegenereerde gegevens. Ten slotte kijken we vooruit naar interactieve wereldmodellen en VLM's die op een dag misschien "denken" en "redeneren" in afbeeldingen.
Voor de volledige lijst van bronnen voor deze aflevering, bezoek de show-notities pagina:
📖 HOOFDSTUKKEN
===============================
00:00 - Introductie
4:39 - Nano banana
5:35 - Nano banana vs Imagen en de traject van afbeeldingsgeneratiemodellen
7:01 - Integratie van Nano banana in Gemini
9:52 - Nano banana— een algemeen model
13:42 - Modelconsistentie en bewerkingsmogelijkheden
15:41 - Gegevenskwaliteit en modelarchitectuur
18:13 - Gebruikscases
24:10 - One-shot modellen vs. node-gebaseerde interfaces
28:33 - Fine-tuning
30:32 - Spannende trends in afbeeldingsgeneratie en VLM's
32:40 - De uitdagingen van modelkwaliteit overwinnen
34:36 - Uitdagingen bij modelevaluatie
36:32 - Voor- en nadelen van Nano banana
38:58 - Prompt herschrijven
40:36 - Papers
41:52 - Toegankelijkheid van het onderzoek
46:45 - Verifieerbare domeinen
49:49 - Spanning tussen nauwkeurigheid en esthetiek
52:50 - Smalle gegevensverdeling in afbeeldingsgeneratie
55:15 - AI-gegenereerde afbeeldingen voor trainingsgegevens
57:56 - Modelgrootte versus gegevenscuratie
58:55 - Volwassenheid van tekst versus afbeeldingsdomeinen
Boven
Positie
Favorieten
