PUMP-salget er over, opprinnelig var jeg også et stort beløp i Bybit, bare 1/2 på kjeden, og til slutt var det bare kjeden som var vellykket, heldigvis var det ingen sikring på forhånd... Den siste tiden har det vært mye diskusjon i AI-miljøet om VLA (Vision-Language-Action) Spesielt gikk jeg for å undersøke om det var noen som drev med VLA-relaterte prosjekter i kjeden, og jeg så dette CodecFlow@Codecopenflow prosjektet og kjøpte litt. == Hva gjør CodecFlow == En kort introduksjon til VLA, en modellarkitektur som lar AI ikke bare "snakke", men "gjøre". Tradisjonelle LLM-er (som GPT) kan bare forstå språk og gi forslag, men den kan ikke gjøre praktisk, klikke på skjermer eller ta tak i objekter. VLA-modellen betyr at den integrerer tre funksjoner: 1. Visjon: Forstå bilder, skjermbilder, kamerainnganger eller sensordata 2. Språk: Forstå menneskelige naturlige språkinstruksjoner 3. Handling: Generer kjørbare kommandoer, for eksempel museklikk, tastaturinngang og kontroll av robotarmen CodecFlow gjør VLA på kjeden, og alle prosessene kan også lastes opp til kjeden, som kan revideres, verifiseres og avgjøres. Enkelt sagt er det infrastrukturen til en "AI-bot". == Hvorfor er jeg spesielt oppmerksom på dette elementet? == Jeg fant ut at utviklerne deres er kjernebidragsytere til LeRobot, det hotteste åpen kildekode-prosjektet i VLA-området! LeRobot er den beste basen for å bygge VLA-modeller i åpen kildekode-verdenen, inkludert lette VLA-er som kan kjøres på bærbare datamaskiner som SmolVLA. Det betyr at dette teamet virkelig forstår VlA-arkitektur og robot. Jeg ser at de også fortsetter å bygge, og prisen på valutaen stiger også jevnt og trutt, jeg er veldig optimistisk med tanke på VLA-sporet, og fra den generelle trenden er VLA og roboter faktisk fremtiden i markedet. • Web2-giganter (Google, Meta, Tesla) er nå fullt forpliktet til VLA og bottrening; • Web3-prosjekter er knappe når det gjelder VLA-applikasjoner som kan utføre oppgaver • VLA har muligheten til å spille en stor rolle i scenarier som DePIN, Web Automation og utførelse av AI-agenter på kjeden. CA:69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump Alltid DYOR。
CodecFlow
CodecFlow26. juni 2025
Hva er en $CODEC operatør? Det er her Vision-Language-Action-modeller endelig gjør AI nyttig for ekte arbeid. En operatør er en autonom programvareagent drevet av VLA-modeller som utfører oppgaver gjennom en kontinuerlig oppfatte-fornuft-handling-syklus. LLM-er kan tenke og snakke briljant, men de kan ikke peke, klikke eller ta tak i noe. De er rene resonneringsmotorer med null forankring i den fysiske verden. VLA-er kombinerer visuell persepsjon, språkforståelse og strukturert handlingsutgang i en enkelt foroverpassering. Mens en LLM beskriver hva som skal skje, får en VLA-modell det faktisk til å skje ved å sende ut koordinater, kontrollsignaler og kjørbare kommandoer. Arbeidsflyten for operatører er: - Oppfatning: tar skjermbilder, kamerafeeder eller sensordata. - Resonnement: behandler observasjoner sammen med instruksjoner på naturlig språk ved hjelp av VLA-modellen. - Handling: utfører beslutninger gjennom grensesnittinteraksjoner eller maskinvarekontroll – alt i én kontinuerlig sløyfe. Eksempler: LLM vs. operatør drevet av VLA-modell Planlegge et møte LLM: Gir en detaljert forklaring av kalenderadministrasjon, og skisserer trinn for å planlegge et møte. Operatør med VLA-modell: - Fanger opp brukerens skrivebord. - Identifiserer kalenderapplikasjonen (f.eks. - Navigerer til torsdag, oppretter et møte kl. 14 og legger til deltakere. - Tilpasser seg automatisk til endringer i brukergrensesnittet. Robotikk: Sortering av objekter LLM: Genererer presise skriftlige instruksjoner for sortering av objekter, for eksempel å identifisere og organisere røde komponenter. Operatør med VLA-modell: - Observerer arbeidsområdet i sanntid. - Identifiserer røde komponenter blant blandede objekter. - Planlegger kollisjonsfrie baner for en robotarm. - Utfører plukk-og-plasser-operasjoner, og justerer seg dynamisk til nye posisjoner og orienteringer. VLA-modeller bygger endelig bro over gapet mellom AI som kan resonnere om verden og AI som faktisk kan endre den. Det er de som forvandler automatisering fra skjør regelfølging til adaptiv problemløsning – intelligente arbeidere. "Tradisjonelle skript brytes når miljøet endres, men operatører bruker visuell forståelse for å tilpasse seg i sanntid, og håndtere unntak i stedet for å krasje på dem."
10,7K