每隔一段時間就會產生一個獨特的專案,它會運行自己的比賽。 AI 在很大程度上就是 chatgpt 風格的終端和創意圖像/視頻生成。 幾個月來,我們一直聽說我們正處於每個人都因 AI 而失業的風口浪尖。 是的,它使每個人的生產力提高了 10 倍,但我們還沒有完全取代工作力。為什麼? 當今佔主導地位的 AI 助手,從瀏覽器中的聊天機器人到實驗性的 「代理」 框架,在對話方面很強大,但在執行方面卻在結構上受到限制。 它們通常依靠瀏覽器或簡單的腳本環境來執行任務。雖然這適用於獲取資訊或基本的 Web 自動化,但這些代理在複雜的多步驟流程中苦苦掙扎,並且當事情偏離其受限路徑時通常會中斷。 當前的 AI 代理失敗是因為缺乏持久記憶體和容錯能力,當遇到意外錯誤時,它們無法恢復或適應,經常無限期地停頓或迴圈。 大多數企業在基於瀏覽器的有限環境中運行,無法訪問所有企業軟體,使日常工作超出他們的能力範圍。 這就是為什麼我們還沒有看到 AI 取代客戶支援和管理等平凡的公司角色。不是因為 AI 模型本身缺乏功能,而是因為它們周圍的框架對於關鍵工作流來說不夠可靠。 那麼需要什麼呢? 重新構想的系統架構。一個在單個框架中解決容錯、記憶體、訪問、隔離和效率問題。 他們不應該在第一個意外輸入時停滯不前,而應該捕獲錯誤、調整並重試不同的方法,就像人類出錯時所做的那樣。 要將 AI 擴展到實際工作流中,它需要持久記憶體和任務跟蹤才能長時間可靠運行。 他們還需要完整的生態系統訪問許可權,而不是瀏覽器工具,才能使用與人類相同的軟體,包括桌面應用程式。 如果沒有安全隔離,代理就無法在專用環境中安全運行,由於潛在的跨系統干擾,大規模部署存在風險。 如果他們希望運行時保持一致和高效,他們還需要智慧資源管理,將計算機視為一個正在運行的身體。 對於那些將點連接起來的人來說,@Codecopenflow最近的 Fabric 版本將所有這些整合在一起,為 AI 代理提供了可靠、完全專用的作系統 (OS),這些作系統將高級模型的認知能力與它們所需的基礎設施相結合,從而像可靠的數位工作者一樣運行。 Fabric 本身可以是一個完全獨立的許可軟體。它將代理從瀏覽器綁定的腳本轉變為具有完全作系統級別訪問許可權的自主作員。 就像 DEX 聚合器將最有效的價格路由給您一樣,Fabric 是為 Codec 的深層架構服務的路由層。 您可以列出您的 CPU、GPU、記憶體需求和任何區域首選項。這意味著從 Render/IO 網路中找到最具成本效益的伺服器,如 AWS/google cloud 或 GPU 資源。 編解碼器提供乾淨的 SDK 和 API,用於完全控制這些 AI 運算子。公司可以將 Codec 代理整合到其現有的軟體管道中(例如,啟動代理來處理使用者請求,然後將其關閉),而無需重新創建其基礎設施。 在客戶支援方面,座席可以管理整個工作流程、查詢解決、CRM 更新、退款,將人工成本降低多達 90%,同時提高一致性和正常運行時間。 對於業務運營,Codec 可以自動執行重複的管理流程,例如發票處理、HR 更新和保險索賠,尤其是在金融和醫療保健等高容量行業。 通過專注於每個 AI 作員的完全隔離的多應用環境,AI 不會受到以前框架無法解決的可靠性和整合等關鍵問題的限制。 從本質上講,將雲計算基礎設施轉變為 AI 工作者的靈活裝配線。每個「工人」都獲得了正確的工具(應用程式、作系統、數據訪問)和安全帶(隔離 + 故障處理)來完成其工作。 AI 模型(GPT-5 等)的每一次改進都只會增加 Codec 平台的價值,因為更好的“大腦”現在可以插入這個強大的“身體”來完成更複雜的工作。 編解碼器與模型無關(適用於任何 AI 模型),因此它可以從一般的 AI 進步中受益,而不會與單個供應商的命運挂鉤。 我們正處於一個類似於雲計算早期的拐點。正如為雲提供平臺(虛擬化、AWS 的基礎設施等)的公司成為企業 IT 不可或缺的一部分一樣,為 AI 代理提供運行平臺的公司將佔領一個巨大的市場。 OpenAI 已經發佈了一個名為 Codex 的完全代理雲編碼終端。Codex 將是您可以在計算機上運行的 Codex 的迷你本地版本,但更重要的是,Codex 的主要模型將位於雲中,擁有自己的電腦。 OpenAI 的聯合創始人認為,未來最成功的公司將是這兩種類型的架構融合在一起。聽起來很熟悉。 下一步是什麼? 與其告訴你下一步是什麼,也許我最好指出我們還沒有看到的東西: - 沒有確認的代幣效用 - 無激勵 - 無核心路線圖 - 無演示 - 無市場 - 最少的合作夥伴關係 考慮到有多少正在籌備中,以及新網站、更新的文檔、更深入的流動性池、社區活動/營銷和機器人技術。Codec 還沒有透露很多卡片。 當然,目前市場上可能會有更多基於瀏覽器的現成產品,儘管它們需要多長時間才能過時? 這是對 AI 方向和將取代人類工作力的主要架構的投資。 編解碼器編碼。
Trissy
Trissy2025年5月13日
作員代理的虛擬環境:$CODEC 我圍繞 AI 爆炸式增長的核心論點始終集中在營運商代理的崛起上。 但要使這些代理成功,它們需要深入的系統訪問許可權,從而有效地授予它們對您的個人計算機和敏感數據的控制權,這帶來了嚴重的安全問題。 我們已經看到了 OpenAI 和其他科技巨頭等公司如何處理用戶數據。雖然大多數人並不關心,但從運營商代理中受益最大的人,前 1% 的人絕對關心。 就個人而言,我讓像OpenAI這樣的公司完全訪問我的機器的可能性為零,即使這意味著生產力提高了10×。 那麼為什麼選擇Codec? 編解碼器的架構以為 AI 代理啟動隔離的按需「雲桌面」 為中心。其核心是基於 Kubernetes 的編排服務(代號為 Captain),可在 Kubernetes Pod 中預置羽量級虛擬機 (VM)。 每個代理都有自己的作系統級隔離環境(完整的 Linux作系統實例),它可以在其中運行應用程式、瀏覽器或任何代碼,這些代碼完全獨立於其他代理和主機。Kubernetes 處理這些代理 Pod 的調度、自動擴展和自我修復,確保可靠性以及根據負載需求啟動/關閉許多代理實例的能力 可信執行環境 (TEE) 用於保護這些 VM,這意味著代理的計算機可以通過加密方式隔離,其記憶體和執行可以受到主機作系統或雲供應商的保護。這對於敏感任務至關重要:例如,在 Enclave 中運行的 VM 可以安全地保存 API 金鑰或加密錢包密鑰。 當 AI 代理(基於 LLM 的“大腦”)需要執行作時,它會向 Captain 服務發送 API 請求,然後 Captain 服務會啟動或管理代理的 VM Pod。工作流:代理請求一台機器,Captain(通過 Kubernetes)分配一個 Pod 並附加一個持久卷(用於 VM 的磁碟)。然後,代理可以連接到其 VM(通過安全通道或流介面)以發出命令。Captain 為代理公開端點,以執行 shell 命令、上傳/下載檔、檢索日誌,甚至對 VM 進行快照以供以後恢復。 此設計為代理提供了一個完整的作系統,但具有受控的、經過審核的訪問。因為它是基於 Kubernetes 構建的,所以 Codec 可以水平自動擴展,如果 100 個代理需要環境,它可以在集群中調度 100 個 Pod,並通過重新啟動 Pod 來處理故障。 代理的 VM 可以配備各種 MCP 伺服器(如 AI 的“USB 埠”)。例如,編解碼器的 Conductor 模組是一個容器,它運行 Chrome 瀏覽器以及用於瀏覽器控制的 Microsoft Playwright MCP 伺服器。這允許 AI 代理通過標準 MCP 調用打開網頁、單擊連結、填寫表單和抓取內容,就像它是控制瀏覽器的人類一樣。 其他 MCP 整合可能包括檔案系統/終端 MCP(讓代理安全地運行 CLI 命令)或特定於應用程式的 MCP(用於雲 API、資料庫等)。從本質上講,編解碼器提供了基礎設施“包裝器”(VM、安全區、網路),以便可以在實際軟體和網路上安全地執行高級代理計劃。 使用案例 錢包自動化: 編解碼器可以將錢包或密鑰嵌入受 TEE 保護的 VM 中,允許 AI 代理與區塊鏈網路交互(在 DeFi 上進行交易、管理加密資產),而無需暴露密鑰。 這種架構使鏈上金融代理能夠安全地執行真實交易,這在典型的代理設置中是非常危險的。該平台的標語明確將對 「錢包」 的支持列為一項關鍵功能。 例如,代理可以為其飛地內的乙太坊錢包運行 CLI,簽署交易併發送交易,並保證如果代理行為不端,它將被限制在其 VM 中,並且密鑰永遠不會離開 TEE。 瀏覽器和 Web 自動化: CodecFlow 代理可以控制其 VM 中的完整 Web 瀏覽器。Conductor 示例演示了代理啟動 Chrome 並將其螢幕即時流式傳輸到 Twitch。通過 Playwright MCP,代理可以像人類用戶一樣瀏覽網站、按兩下按鈕和抓取數據。這非常適合登錄後進行 Web 抓取、自動 Web 事務或測試 Web 應用程式等任務。 傳統框架通常依賴於 API 調用或簡單的無頭瀏覽器腳本;相比之下,CodecFlow 可以運行具有可見 UI 的真實瀏覽器,從而更容易在 AI 控制下處理複雜的 Web 應用程式(例如,具有繁重的 JavaScript 或 CAPTCHA 挑戰)。 實際 GUI 自動化(舊系統): 由於每個代理都有一個實際的桌面作系統,因此它可以自動執行舊版 GUI 應用程式或遠端桌面會話,其功能本質上類似於機器人流程自動化 (RPA),但由 AI 驅動。例如,代理可以在其 Windows VM 中打開 Excel 電子表格,或者與沒有 API 的舊終端應用程式交互。 編解碼器的網站明確提到了啟用「遺留自動化」。。這打開了使用 AI 來作無法通過現代 API 訪問的軟體,如果沒有封閉的環境,這項任務將非常 hack 或不安全。包含的 noVNC 集成表明可以通過 VNC 觀察或控制代理,這對於監控驅動 GUI 的 AI 非常有用。 類比 SaaS 工作流: 公司通常具有涉及多個 SaaS 應用程式或遺留系統的複雜流程。例如,員工可能會從 Salesforce 獲取數據,將其與來自內部 ERP 的數據相結合,然後通過電子郵件將摘要發送給客戶。編解碼器可以使 AI 代理通過瀏覽器或其 VM 中的用戶端軟體實際登錄這些應用程式來執行整個序列,就像人類一樣。這與 RPA 類似,但由可以做出決策和處理可變性的 LLM 提供支援。 重要的是,這些應用程式的憑據可以安全地提供給 VM(甚至包含在 TEE 中),因此代理可以在不“看到”純文本憑據或向外部公開它們的情況下使用它們。這可以加速日常後台任務的自動化,同時讓IT部門滿意,每個代理都以最低許可權和完全可審計性運行(因為 VM 中的每個作都可以記錄或記錄)。 路線圖 - 在月底推出公開演示 - 與其他類似平臺的功能比較(沒有 web3 競爭對手) - TAO 集成 - 大型遊戲合作夥伴 在原創性方面,Codec 建立在現有技術的基礎上,但以一種新穎的方式將它們集成在一起以供 AI 代理使用。隔離執行環境的想法並不新鮮(容器、VM 和 TEE 是雲計算中的標準),但將它們應用於具有無縫 API 層 (MCP) 的自主 AI 代理是非常新穎的。 該平臺盡可能利用開放標準和工具:它使用 Microsoft 的 Playwright 等 MCP 伺服器進行瀏覽器控制,而不是重新發明該輪子,並計劃支援 AWS 的 Firecracker 微型虛擬機以實現更快的虛擬化。它還分叉了現有的解決方案,例如用於流式桌面的 noVNC。證明該專案建立在經過驗證的技術(Kubernetes、安全區硬體、開源庫)的基礎上,將其原始開發重點放在粘合邏輯和編排上(“秘訣”是它們如何協同工作)。 開源元件和即將推出的雲服務的結合(通過提到 $CODEC 令牌實用程式和公共產品訪問來暗示)意味著 Codec 將很快以多種形式訪問(作為服務和自託管)。 團隊 Moyai:15+ 年開發經驗,目前在 Elixir Games 領導 AI 開發。 lil'km:5+ 年 AI 開發人員,目前與 HuggingFace 合作開發 LeRobot 專案。 HuggingFace 是一家大型機器人公司,Moyai 在 elixir games(由 Square enix 和 solanafdn 支援)擔任 AI 主管。 我親自給整個團隊打過視頻電話,真的很喜歡他們帶來的能量。我把他們放在我的雷達上的朋友也在 Token2049 遇到了他們,並且只有好話要說。 最後的思考 還有很多內容要介紹,我會把這些留到將來的更新和我的Telegram頻道中發佈。 我一直認為雲基礎設施是運營商代理的未來。我一直很尊重 Nuit 正在構建的東西,但 Codec 是第一個向我展示我一直在尋找的全棧信念的專案。 該團隊顯然是頂級工程師。他們公開表示行銷不是他們的強項,這可能就是為什麼這被低估的原因。我將與他們密切合作,説明制定真正反映他們正在構建的深度的 GTM 戰略。 憑藉 4 百萬美元的市值和這種水準的基礎設施,它感覺被大大低估了。如果他們能夠提供可用的產品,我認為這很容易標誌著下一個 AI 基礎設施週期的開始。 與往常一樣,風險是存在的,雖然我在過去幾周里秘密審查了團隊,但沒有一個專案是完全無懈可擊的。 目標價?高很多。
11.86K