Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Penjualan publik PUMP telah berakhir, awalnya saya juga dalam jumlah besar di Bybit, hanya 1/2 di rantai, dan pada akhirnya, hanya rantai yang berhasil, untungnya tidak ada lindung nilai sebelumnya ...
Baru-baru ini, ada banyak diskusi di komunitas AI tentang VLA (Vision-Language-Action)
Secara khusus, saya pergi untuk meneliti apakah ada orang yang melakukan proyek terkait VLA di rantai, dan saya melihat proyek CodecFlow@Codecopenflow ini dan membeli sedikit.
== Apa yang dilakukan CodecFlow ==
Pengantar singkat tentang VLA, arsitektur model yang memungkinkan AI tidak hanya "berbicara", tetapi juga "melakukan".
LLM tradisional (seperti GPT) hanya dapat memahami bahasa dan memberikan saran, tetapi tidak dapat melakukan hands-on, mengklik layar, atau mengambil objek.
Model VLA berarti mengintegrasikan tiga kemampuan:
1. Penglihatan: Pahami gambar, tangkapan layar, input kamera, atau data sensor
2. Bahasa: Pahami instruksi bahasa alami manusia
3. Tindakan: Hasilkan perintah yang dapat dieksekusi, seperti klik mouse, input keyboard, dan kontrol lengan robot
CodecFlow melakukan VLA pada rantai, dan semua proses juga dapat diunggah ke rantai, yang dapat diaudit, diverifikasi, dan diselesaikan.
Secara sederhana, ini adalah infrastruktur "bot AI".
== Mengapa saya memberikan perhatian khusus pada item ini? ==
Saya menemukan bahwa pengembang mereka adalah kontributor inti untuk LeRobot, proyek open source terpanas di ruang VLA!
LeRobot adalah basis teratas untuk membangun model VLA di dunia open source, termasuk VLA ringan yang dapat berjalan di laptop seperti SmolVLA.
Artinya, tim ini benar-benar memahami arsitektur dan Robot VlA.
Saya melihat bahwa mereka juga terus membangun, dan harga mata uang juga terus naik, saya sangat optimis tentang trek VLA, dan dari tren keseluruhan, VLA dan robot memang masa depan di pasar.
• Raksasa Web2 (Google, Meta, Tesla) sekarang berkomitmen penuh untuk pelatihan VLA & bot;
• Proyek Web3 langka dalam hal aplikasi VLA yang dapat melakukan tugas
• VLA memiliki peluang untuk memainkan peran besar dalam skenario seperti DePIN, Otomatisasi Web, dan eksekusi agen AI on-chain.
CA: 69LjZUUzxj3Cb3Fxeo1X4QpYEQTboApkhXTysPpbpump
Selalu DYOR。

26 Jun 2025
Apa itu Operator $CODEC?
Di sinilah model Vision-Language-Action akhirnya membuat AI berguna untuk pekerjaan nyata.
Operator adalah agen perangkat lunak otonom yang didukung oleh model VLA yang melakukan tugas melalui siklus persepsi-alasan-tindakan yang berkelanjutan.
LLM dapat berpikir dan berbicara dengan cemerlang, tetapi mereka tidak dapat menunjuk, mengklik, atau mengambil apa pun. Mereka adalah mesin penalaran murni tanpa landasan di dunia fisik.
VLA menggabungkan persepsi visual, pemahaman bahasa, dan output tindakan terstruktur dalam satu lintasan maju. Sementara LLM menjelaskan apa yang harus terjadi, model VLA benar-benar mewujudkannya dengan memancarkan koordinat, sinyal kontrol, dan perintah yang dapat dieksekusi.
Alur kerja Operator adalah:
- Persepsi: menangkap tangkapan layar, umpan kamera, atau data sensor.
- Penalaran: memproses pengamatan bersama instruksi bahasa alami menggunakan model VLA.
- Tindakan: mengeksekusi keputusan melalui interaksi UI atau kontrol perangkat keras—semuanya dalam satu perulangan berkelanjutan.
Contoh: LLM vs. Operator Didukung oleh Model VLA
Menjadwalkan Rapat
LLM: Memberikan penjelasan terperinci tentang manajemen kalender, menguraikan langkah-langkah untuk menjadwalkan rapat.
Operator dengan Model VLA:
- Menangkap desktop pengguna.
- Mengidentifikasi aplikasi kalender (misalnya, Outlook, Google Kalender).
- Menavigasi ke hari Kamis, membuat rapat pada pukul 2 siang, dan menambahkan peserta.
- Beradaptasi secara otomatis dengan perubahan antarmuka pengguna.
Robotika: Menyortir Objek
LLM: Menghasilkan instruksi tertulis yang tepat untuk menyortir objek, seperti mengidentifikasi dan mengatur komponen merah.
Operator dengan Model VLA:
- Mengamati ruang kerja secara real time.
- Mengidentifikasi komponen merah di antara objek campuran.
- Merencanakan lintasan bebas tabrakan untuk lengan robot.
- Menjalankan operasi pick-and-place, secara dinamis menyesuaikan dengan posisi dan orientasi baru.
Model VLA akhirnya menjembatani kesenjangan antara AI yang dapat bernalar tentang dunia dan AI yang benar-benar dapat mengubahnya. Mereka yang mengubah otomatisasi dari mengikuti aturan yang rapuh menjadi pemecahan masalah adaptif—pekerja cerdas.
"Skrip tradisional rusak saat lingkungan berubah, tetapi Operator menggunakan pemahaman visual untuk beradaptasi secara real time, menangani pengecualian alih-alih mogok padanya."

10,73K
Teratas
Peringkat
Favorit