Veřejný prodej PUMP je u konce, původně jsem byl v Bybitu také velké množství, pouze 1/2 na řetězci, a nakonec byl úspěšný pouze řetěz, naštěstí nebylo žádné zajištění předem... V poslední době se v komunitě AI hodně diskutuje o VLA (Vision-Language-Action) Konkrétně jsem šel prozkoumat, zda v řetězci existuje někdo, kdo dělá projekty související s VLA, a viděl jsem tento CodecFlow@Codecopenflow projekt a trochu jsem si koupil. == Co dělá CodecFlow == Stručný úvod do VLA, modelové architektury, která umožňuje umělé inteligenci nejen "mluvit", ale "dělat". Tradiční LLM (jako GPT) rozumí pouze jazyku a dává návrhy, ale neumí dělat hands-on, klikat na obrazovky nebo chytat objekty. Model VLA znamená, že integruje tři funkce: 1. Zrak: Pochopte obrázky, snímky obrazovky, vstupy fotoaparátu nebo data ze senzorů 2. Jazyk: Pochopte pokyny lidského přirozeného jazyka 3. Akce: Generování spustitelných příkazů, jako je kliknutí myší, vstup z klávesnice a ovládání robotické ruky CodecFlow provádí VLA v řetězci a všechny procesy lze také nahrát do řetězce, který lze auditovat, ověřovat a vypořádat. Jednoduše řečeno, je to infrastruktura "AI bota". == Proč věnuji zvláštní pozornost této položce? == Zjistil jsem, že jejich vývojáři jsou hlavními přispěvateli do LeRobot, nejžhavějšího open source projektu v oblasti VLA! LeRobot je špičkovou základnou pro vytváření modelů VLA ve světě open source, včetně odlehčených VLA, které lze spustit na noteboocích, jako je SmolVLA. To znamená, že tento tým opravdu rozumí architektuře VlA a robotovi. Vidím, že také pokračují v budování a cena měny také neustále roste, jsem velmi optimistický ohledně stopy VLA a z celkového trendu jsou VLA a roboti skutečně budoucností na trhu. • Giganti Web2 (Google, Meta, Tesla) se nyní plně věnují školení VLA a botů; • Projekty Web3 jsou vzácné, pokud jde o aplikace VLA, které mohou provádět úkoly • VLA má příležitost hrát obrovskou roli ve scénářích, jako je DePIN, Web Automation a provádění agentů AI v řetězci. CA:69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump Vždy DYOR。
CodecFlow
CodecFlow26. 6. 2025
Co je to $CODEC operátor? Je to místo, kde modely Vision-Language-Action konečně umožňují umělou inteligenci pro skutečnou práci. Operátor je autonomní softwarový agent poháněný modely VLA, který plní úkoly prostřednictvím nepřetržitého cyklu vnímání-zdůvodnění-jednání. LLM mohou myslet a mluvit brilantně, ale nemohou na nic ukazovat, klikat nebo chytit. Jsou to čistě logické motory s nulovým zakotvením ve fyzickém světě. VLA kombinují vizuální vnímání, porozumění jazyku a strukturovaný výstup akcí v jediném průchodu vpřed. Zatímco LLM popisuje, co by se mělo stát, model VLA to ve skutečnosti uskutečňuje vysíláním souřadnic, řídicích signálů a spustitelných příkazů. Pracovní postup operátora je: - Vnímání: zachycuje snímky obrazovky, záběry z kamery nebo data ze senzorů. - Uvažování: zpracovává pozorování spolu s instrukcemi v přirozeném jazyce pomocí modelu VLA. - Akce: provádí rozhodnutí prostřednictvím interakcí s uživatelským rozhraním nebo hardwarového ovládání – to vše v jedné nepřetržité smyčce. Příklady: LLM vs. operátor využívající model VLA Plánování schůzky LLM: Poskytuje podrobné vysvětlení správy kalendáře a popisuje kroky k naplánování schůzky. Operátor s VLA modelem: - Zachytí plochu uživatele. - Identifikuje kalendářovou aplikaci (např. Outlook, Kalendář Google). - Přejde na čtvrtek, vytvoří schůzku ve 14:00 a přidá účastníky. - Automaticky se přizpůsobuje změnám uživatelského rozhraní. Robotika: Třídění objektů LLM: Generuje přesné psané pokyny pro třídění objektů, jako je identifikace a organizace červených komponent. Operátor s VLA modelem: - Sleduje pracovní prostor v reálném čase. - Identifikuje červené komponenty mezi smíšenými objekty. - Plánuje bezkolizní trajektorie pro robotickou paži. - Provádí operace pick-and-place a dynamicky se přizpůsobuje novým pozicím a orientacím. Modely VLA konečně překlenují propast mezi umělou inteligencí, která dokáže uvažovat o světě, a umělou inteligencí, která jej může skutečně změnit. Jsou tím, co transformuje automatizaci z křehkého dodržování pravidel na adaptivní řešení problémů – inteligentní pracovníky. "Tradiční skripty se při změně prostředí rozbijí, ale operátoři se pomocí vizuálního porozumění přizpůsobí v reálném čase a zpracují výjimky místo toho, aby na nich spadli."
10,7K