Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

480EB0
Dnes se k nám připojuje @rdn_nikita, spoluzakladatel a generální ředitel společnosti @FlexionRobotics, abychom probrali rozdíl mezi současnými schopnostmi robotů a tím, co je potřeba k nasazení plně autonomních robotů v reálném světě. Nikita vysvětluje, jak posilované učení a simulace urychlily rychlý pokrok v robotické lokomoci—a proč je lokomoce stále daleko od "vyřešení". Zabýváme se mezerou sim2real a tím, jak přidání vizuálních vstupů přináší šum a výrazně komplikuje přenos simulace do reality. Zkoumáme také debatu mezi end-to-end modely a modulárními přístupy a proč je oddělení pohybu, plánování a sémantiky dnes stále pragmatickým přístupem. Nikita také představuje koncept "real-to-sim", který využívá reálná data k zpřesnění parametrů simulace pro trénink vyšší věrnosti, diskutuje, jak se kombinují data posilovaného učení, imitace a teleoperace k trénování robustních politik jak pro čtyřnohé, tak humanoidní roboty, a představuje hierarchický přístup Flexionu, který využívá předtrénované modely Vision-Language Models (VLM) pro koordinaci úkolů na vysoké úrovni s modely Vision-Language-Action (VLA) a nízkoúrovňovými modely Celotělové trackery. Nakonec Nikita sdílí zákulisní ukázky humanoidních robotů, svůj pohled na posilované učení v simulaci oproti reálnému světu, nuance ladění odměn a nabízí praktické rady pro výzkumníky a praktiky, kteří chtějí dnes začít s robotikou.
🗒️ Pro kompletní seznam zdrojů k této epizodě navštivte stránku s poznámkami k pořadu:
📖 KAPITOLY
===============================
00:00 - Úvod
04:07 - Je robotická lokomoce vyřešena?
06:04 - Mezera mezi simulátorem a realitou
08:58 - Přidání sémantiky do politik
09:42 - Modulární vs end-to-end architektury
10:29 - Model plánovače
12:21 - Přizpůsobení RL technik ze čtyřnožců na humanoidy
15:39 - Ukázky Behind Robot
18:09 - Humanoidní roboti v domácím prostředí
22:03 - Tréninkové přiblížení
23:56 - VLA modely
27:59 - Uzavírání mezery mezi simulátorem a realitou
32:55 - Orchestrace úloh pomocí VLM
36:38 - Použití nástrojů
38:10 - Hierarchie modelu
43:37 - Simulátor versus simulační prostředí
44:57 - Kombinace imitačního učení a posilovaného učení
46:42 - RL v reálném světě versus RL v simulaci
52:58 - Ladění odměn a hodnotové funkce v robotice
56:38 - Předpovědi
1:00:10 - Humanoidi, kvadropedové a kolové platformy
1:02:45 - Rady, doporučené robotické sady a komunitní PLA
23
Dnes se k nám připojil @oliver_wang2, hlavní vědecký pracovník společnosti @GoogleDeepMind a technický vedoucí projektu Gemini 2.5 Flash Image – známějšího pod kódovým názvem "Nano Banana". Ponoříme se do vývoje a schopností tohoto nově vydaného modelu jazyka hraničního vidění, počínaje širším posunem od specializovaných generátorů obrazu k univerzálním multimodálním agentům, kteří mohou využívat vizuální i textová data pro různé úkoly. Oliver vysvětluje, jak může Nano Banana generovat a iterativně upravovat obrázky při zachování konzistence a jak jeho integrace se znalostmi světa Gemini rozšiřuje kreativní a praktické případy použití. Diskutujeme napětí mezi estetikou a přesností, relativní vyspělost obrazových modelů ve srovnání s textovými LLM a škálování jako hnací sílu pokroku. Oliver také sdílí překvapivé vznikající chování, výzvy spojené s vyhodnocováním modelů jazyka vidění a rizika trénování na datech generovaných umělou inteligencí. Nakonec se podíváme dopředu na interaktivní modely světa a VLM, které mohou jednoho dne "myslet" a "uvažovat" v obrazech.
Úplný seznam zdrojů informací pro tuto epizodu najdete na stránce s poznámkami k pořadu:
📖 KAPITOLY
===============================
00:00 - Úvod
4:39 - Nano banán
5:35 – Nano banán vs Imagen a trajektorie modelů generování obrázků
7:01 - Integrace Nano banánu v Gemini
9:52 – Nano banán – model pro všeobecné použití
13:42 – Konzistence modelu a možnosti úprav
15:41 – Kvalita dat a architektura modelu
18:13 – Případy použití
24:10 – Jednorázové modely vs. rozhraní založená na uzlech
28:33 – Jemné doladění
30:32 - Vzrušující trendy v generování obrazů a VLM
32:40 – Překonání výzev spojených s kvalitou modelu
34:36 – Výzvy vyhodnocení modelu
36:32 – Nano banány klady a zápory
38:58 – Rychlé přepisování
40:36 – Příspěvky
41:52 – Přístupnost výzkumu
46:45 – Ověřitelné domény
49:49 – Napětí mezi přesností a estetikou
52:50 – Úzká distribuce dat při generování obrázků
55:15 – Obrázky generované umělou inteligencí pro trénovací data
57:56 – Měřítko modelu versus kurátorství dat
58:55 – Zralost textových a obrázkových domén
23
Top
Hodnocení
Oblíbené