PUMP la vendita pubblica è finita, inizialmente avevo investito molto su Bybit, lasciando solo 1/2 sulla catena, alla fine solo quello sulla catena ha avuto successo, per fortuna non ho coperto in anticipo... A proposito, recentemente nella comunità AI molte persone stanno discutendo di VLA (Vision‑Language‑Action) Ho fatto una ricerca sui progetti sulla catena per vedere se qualcuno stava lavorando su VLA, e ho visto questo progetto CodecFlow @Codecopenflow, ho comprato un po'. == Cosa fa il progetto CodecFlow == Una breve introduzione a VLA, VLA è un'architettura di modello che consente all'AI non solo di "parlare", ma anche di "fare". I tradizionali LLM (come GPT) possono solo comprendere il linguaggio e fornire suggerimenti, ma non possono eseguire azioni, non possono cliccare sullo schermo, non possono afferrare oggetti. Il modello VLA significa integrare tre grandi capacità: 1. Visione: comprendere immagini, screenshot, input della fotocamera o dati dei sensori 2. Linguaggio: comprendere i comandi in linguaggio naturale degli esseri umani 3. Azione: generare comandi eseguibili, come clic del mouse, input da tastiera, controllo di bracci meccanici CodecFlow sta lavorando su VLA sulla catena, tutti i processi operativi possono essere registrati sulla catena, auditabili, verificabili e liquidabili. In breve, è l'infrastruttura di base per un "robot AI". == Perché ho prestato particolare attenzione a questo progetto? == Ho scoperto che i loro sviluppatori sono i principali contributori del progetto open source LeRobot, il più popolare nel campo VLA! LeRobot è la base di alto livello per costruire modelli VLA nel mondo open source, inclusi SmolVLA e altri modelli leggeri che possono funzionare su laptop. Questo significa che questo team comprende davvero l'architettura VLA e i robot. Ho visto che continuano a costruire, il prezzo della moneta è anche stabilmente in aumento, io stesso sono molto ottimista sul settore VLA, e guardando la tendenza generale, VLA e i robot sono sicuramente il futuro nel mercato. • I giganti del Web2 (Google, Meta, Tesla) si sono attualmente impegnati a fondo nella formazione di VLA e robot; • Ci sono pochi progetti Web3 che possono eseguire applicazioni VLA, e sono molto rari • VLA ha l'opportunità di esprimere un enorme valore in scenari come DePIN, automazione web, esecuzione di agenti AI sulla catena. CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump Fai sempre le tue ricerche.
CodecFlow
CodecFlow26 giu 2025
Che cos'è un Operatore $CODEC? È il punto in cui i modelli Vision-Language-Action rendono finalmente l'IA utile per il lavoro reale. Un Operatore è un agente software autonomo alimentato da modelli VLA che esegue compiti attraverso un ciclo continuo di percezione-razionalizzazione-azione. I LLM possono pensare e parlare brillantemente, ma non possono puntare, cliccare o afferrare nulla. Sono motori di ragionamento puri senza alcun ancoraggio nel mondo fisico. I VLA combinano percezione visiva, comprensione del linguaggio e output di azione strutturata in un'unica passata in avanti. Mentre un LLM descrive cosa dovrebbe accadere, un modello VLA lo fa realmente accadere emettendo coordinate, segnali di controllo e comandi eseguibili. Il flusso di lavoro dell'Operatore è: - Percezione: cattura screenshot, feed della fotocamera o dati dei sensori. - Ragionamento: elabora osservazioni insieme a istruzioni in linguaggio naturale utilizzando il modello VLA. - Azione: esegue decisioni attraverso interazioni UI o controllo hardware—tutto in un unico ciclo continuo. Esempi: LLM vs. Operatore Alimentato da Modello VLA Pianificazione di un incontro LLM: Fornisce una spiegazione dettagliata della gestione del calendario, delineando i passaggi per pianificare un incontro. Operatore con Modello VLA: - Cattura il desktop dell'utente. - Identifica l'applicazione del calendario (ad es., Outlook, Google Calendar). - Naviga a giovedì, crea un incontro alle 14:00 e aggiunge i partecipanti. - Si adatta automaticamente ai cambiamenti dell'interfaccia utente. Robotica: Ordinamento degli oggetti LLM: Genera istruzioni scritte precise per ordinare oggetti, come identificare e organizzare componenti rossi. Operatore con Modello VLA: - Osserva lo spazio di lavoro in tempo reale. - Identifica i componenti rossi tra oggetti misti. - Pianifica traiettorie senza collisioni per un braccio robotico. - Esegue operazioni di presa e posizionamento, adattandosi dinamicamente a nuove posizioni e orientamenti. I modelli VLA colmano finalmente il divario tra l'IA che può ragionare sul mondo e l'IA che può realmente cambiarlo. Sono ciò che trasforma l'automazione da un fragile seguire regole a una risoluzione di problemi adattiva—lavoratori intelligenti. "Gli script tradizionali si rompono quando l'ambiente cambia, ma gli Operatori usano la comprensione visiva per adattarsi in tempo reale, gestendo le eccezioni invece di andare in crash."
10,72K