熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
作員代理的虛擬環境:$CODEC
我圍繞 AI 爆炸式增長的核心論點始終集中在營運商代理的崛起上。
但要使這些代理成功,它們需要深入的系統訪問許可權,從而有效地授予它們對您的個人計算機和敏感數據的控制權,這帶來了嚴重的安全問題。
我們已經看到了 OpenAI 和其他科技巨頭等公司如何處理用戶數據。雖然大多數人並不關心,但從運營商代理中受益最大的人,前 1% 的人絕對關心。
就個人而言,我讓像OpenAI這樣的公司完全訪問我的機器的可能性為零,即使這意味著生產力提高了10×。
那麼為什麼選擇Codec?
編解碼器的架構以為 AI 代理啟動隔離的按需「雲桌面」 為中心。其核心是基於 Kubernetes 的編排服務(代號為 Captain),可在 Kubernetes Pod 中預置羽量級虛擬機 (VM)。
每個代理都有自己的作系統級隔離環境(完整的 Linux作系統實例),它可以在其中運行應用程式、瀏覽器或任何代碼,這些代碼完全獨立於其他代理和主機。Kubernetes 處理這些代理 Pod 的調度、自動擴展和自我修復,確保可靠性以及根據負載需求啟動/關閉許多代理實例的能力
可信執行環境 (TEE) 用於保護這些 VM,這意味著代理的計算機可以通過加密方式隔離,其記憶體和執行可以受到主機作系統或雲供應商的保護。這對於敏感任務至關重要:例如,在 Enclave 中運行的 VM 可以安全地保存 API 金鑰或加密錢包密鑰。
當 AI 代理(基於 LLM 的“大腦”)需要執行作時,它會向 Captain 服務發送 API 請求,然後 Captain 服務會啟動或管理代理的 VM Pod。工作流:代理請求一台機器,Captain(通過 Kubernetes)分配一個 Pod 並附加一個持久卷(用於 VM 的磁碟)。然後,代理可以連接到其 VM(通過安全通道或流介面)以發出命令。Captain 為代理公開端點,以執行 shell 命令、上傳/下載檔、檢索日誌,甚至對 VM 進行快照以供以後恢復。
此設計為代理提供了一個完整的作系統,但具有受控的、經過審核的訪問。因為它是基於 Kubernetes 構建的,所以 Codec 可以水平自動擴展,如果 100 個代理需要環境,它可以在集群中調度 100 個 Pod,並通過重新啟動 Pod 來處理故障。
代理的 VM 可以配備各種 MCP 伺服器(如 AI 的“USB 埠”)。例如,編解碼器的 Conductor 模組是一個容器,它運行 Chrome 瀏覽器以及用於瀏覽器控制的 Microsoft Playwright MCP 伺服器。這允許 AI 代理通過標準 MCP 調用打開網頁、單擊連結、填寫表單和抓取內容,就像它是控制瀏覽器的人類一樣。
其他 MCP 整合可能包括檔案系統/終端 MCP(讓代理安全地運行 CLI 命令)或特定於應用程式的 MCP(用於雲 API、資料庫等)。從本質上講,編解碼器提供了基礎設施“包裝器”(VM、安全區、網路),以便可以在實際軟體和網路上安全地執行高級代理計劃。
使用案例
錢包自動化:
編解碼器可以將錢包或密鑰嵌入受 TEE 保護的 VM 中,允許 AI 代理與區塊鏈網路交互(在 DeFi 上進行交易、管理加密資產),而無需暴露密鑰。
這種架構使鏈上金融代理能夠安全地執行真實交易,這在典型的代理設置中是非常危險的。該平台的標語明確將對 「錢包」 的支持列為一項關鍵功能。
例如,代理可以為其飛地內的乙太坊錢包運行 CLI,簽署交易併發送交易,並保證如果代理行為不端,它將被限制在其 VM 中,並且密鑰永遠不會離開 TEE。
瀏覽器和 Web 自動化:
CodecFlow 代理可以控制其 VM 中的完整 Web 瀏覽器。Conductor 示例演示了代理啟動 Chrome 並將其螢幕即時流式傳輸到 Twitch。通過 Playwright MCP,代理可以像人類用戶一樣瀏覽網站、按兩下按鈕和抓取數據。這非常適合登錄後進行 Web 抓取、自動 Web 事務或測試 Web 應用程式等任務。
傳統框架通常依賴於 API 調用或簡單的無頭瀏覽器腳本;相比之下,CodecFlow 可以運行具有可見 UI 的真實瀏覽器,從而更容易在 AI 控制下處理複雜的 Web 應用程式(例如,具有繁重的 JavaScript 或 CAPTCHA 挑戰)。
實際 GUI 自動化(舊系統):
由於每個代理都有一個實際的桌面作系統,因此它可以自動執行舊版 GUI 應用程式或遠端桌面會話,其功能本質上類似於機器人流程自動化 (RPA),但由 AI 驅動。例如,代理可以在其 Windows VM 中打開 Excel 電子表格,或者與沒有 API 的舊終端應用程式交互。
編解碼器的網站明確提到了啟用「遺留自動化」。。這打開了使用 AI 來作無法通過現代 API 訪問的軟體,如果沒有封閉的環境,這項任務將非常 hack 或不安全。包含的 noVNC 集成表明可以通過 VNC 觀察或控制代理,這對於監控驅動 GUI 的 AI 非常有用。
類比 SaaS 工作流:
公司通常具有涉及多個 SaaS 應用程式或遺留系統的複雜流程。例如,員工可能會從 Salesforce 獲取數據,將其與來自內部 ERP 的數據相結合,然後通過電子郵件將摘要發送給客戶。編解碼器可以使 AI 代理通過瀏覽器或其 VM 中的用戶端軟體實際登錄這些應用程式來執行整個序列,就像人類一樣。這與 RPA 類似,但由可以做出決策和處理可變性的 LLM 提供支援。
重要的是,這些應用程式的憑據可以安全地提供給 VM(甚至包含在 TEE 中),因此代理可以在不“看到”純文本憑據或向外部公開它們的情況下使用它們。這可以加速日常後台任務的自動化,同時讓IT部門滿意,每個代理都以最低許可權和完全可審計性運行(因為 VM 中的每個作都可以記錄或記錄)。
路線圖
- 在月底推出公開演示
- 與其他類似平臺的功能比較(沒有 web3 競爭對手)
- TAO 集成
- 大型遊戲合作夥伴
在原創性方面,Codec 建立在現有技術的基礎上,但以一種新穎的方式將它們集成在一起以供 AI 代理使用。隔離執行環境的想法並不新鮮(容器、VM 和 TEE 是雲計算中的標準),但將它們應用於具有無縫 API 層 (MCP) 的自主 AI 代理是非常新穎的。
該平臺盡可能利用開放標準和工具:它使用 Microsoft 的 Playwright 等 MCP 伺服器進行瀏覽器控制,而不是重新發明該輪子,並計劃支援 AWS 的 Firecracker 微型虛擬機以實現更快的虛擬化。它還分叉了現有的解決方案,例如用於流式桌面的 noVNC。證明該專案建立在經過驗證的技術(Kubernetes、安全區硬體、開源庫)的基礎上,將其原始開發重點放在粘合邏輯和編排上(“秘訣”是它們如何協同工作)。
開源元件和即將推出的雲服務的結合(通過提到 $CODEC 令牌實用程式和公共產品訪問來暗示)意味著 Codec 將很快以多種形式訪問(作為服務和自託管)。
團隊
Moyai:15+ 年開發經驗,目前在 Elixir Games 領導 AI 開發。
lil'km:5+ 年 AI 開發人員,目前與 HuggingFace 合作開發 LeRobot 專案。
HuggingFace 是一家大型機器人公司,Moyai 在 elixir games(由 Square enix 和 solanafdn 支援)擔任 AI 主管。
我親自給整個團隊打過視頻電話,真的很喜歡他們帶來的能量。我把他們放在我的雷達上的朋友也在 Token2049 遇到了他們,並且只有好話要說。
最後的思考
還有很多內容要介紹,我會把這些留到將來的更新和我的Telegram頻道中發佈。
我一直認為雲基礎設施是運營商代理的未來。我一直很尊重 Nuit 正在構建的東西,但 Codec 是第一個向我展示我一直在尋找的全棧信念的專案。
該團隊顯然是頂級工程師。他們公開表示行銷不是他們的強項,這可能就是為什麼這被低估的原因。我將與他們密切合作,説明制定真正反映他們正在構建的深度的 GTM 戰略。
憑藉 4 百萬美元的市值和這種水準的基礎設施,它感覺被大大低估了。如果他們能夠提供可用的產品,我認為這很容易標誌著下一個 AI 基礎設施週期的開始。
與往常一樣,風險是存在的,雖然我在過去幾周里秘密審查了團隊,但沒有一個專案是完全無懈可擊的。
目標價?高很多。

21.27K
熱門
排行
收藏