一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX

熱門話題

Bonk 生態迷因幣展現強韌勢頭

有消息稱 Pump.fun 計劃 40 億估值發幣，引發市場猜測

Solana 新代幣發射平臺 Boop.Fun 風頭正勁

BOOP+2.59%

Boopa-1.21%

PORK-2.32%

swyx

以意向性、強度和完整性實現雄心壯志 - @smol_ai - @dxtipshq - @sveltesociety - @aidotengineer - @coding_career - @latentspacepod

swyx12 小時前

恭喜 Bee 被亞馬遜選中；類似於 Blink、Ring、Eero，當然還有新的 Claude + Nova + Alexa，我認為 @panos_panay 正在為亞馬遜的 AI 硬體策略打造一個相當穩固的第二幕。當 @dharmesh 出現在他的 @latentspacepod 上，帶著一個 Bee 時，我就知道 Bee 在贏。

12.27K

swyx7月22日 13:38

llm 分析（以及監管和 PMing）之所以困難* 是因為相關的 DIMENSIONS 隨著每一代前沿模型不斷變化；僅僅將 x 或 y 軸設置為對數刻度並追蹤縮放法則是不夠的，你必須實際思考模型在 2025 年、2024 年、2023 年等年份的結構性差異。 eg everyone 專注於 elo 兩年，elo 被利用並失去可信度。 everyone 專注於每個代幣的價格三年，推理模型在每個任務的輸出代幣上有 10-40 倍的變化，每個代幣的價格失去意義。隨便收集數據，但如果你只是收集純淨的時間序列，你可能會失去更大局面的視野。 *(以及為什麼像“ai 工程師不是一個職業，因為所有軟體工程師都是 ai 工程師”這樣的說法是自我安慰，並且在最微不足道的意義上永遠不會正確)

Scott Huston7月22日 08:30

是否有一個公開的電子表格，列出來自不同公司的所有主要 LLM 模型，顯示它們的定價、基準分數、競技場 Elo 分數等？

9.71K

swyx7月21日 07:55

試圖找到這條推文，內容是：人類目前的三大偉大任務是： - 建造上帝 - 探索星星 - 戰勝死亡有誰知道這是誰說的嗎？@xai @grok 正在讓我失望

23.28K

swyx7月21日 05:25

哇，感謝 @tferriss 在五個要點星期五中介紹了摩洛克的超預言！

60.83K

swyx7月20日 18:04

我會堅持認為 o1-preview 是比 o1 或 o3 更好的摘要工具，而世界即將失去一個從未被妥善投入生產的偉大模型的使用權。

16.51K

swyx 已轉發

AI Engineer7月20日 05:31

🆕 發佈我們的整個 RL + 推理課程！特色： • @willccbb，Prime Intellect • @GregKamradt，Arc Prize • @natolambert，AI2/Interconnects • @corbtt，OpenPipe • @achowdhery，Reflection • @ryanmart3n，Bespoke • @ChrSzegedy，Morph 特別提供 3 小時的工作坊： @danielhanchen 來自 Unsloth！從這裡開始：祝你週末愉快！感謝 @OpenPipeAI 的支持和主辦這個課程！

106.66K

swyx 已轉發

dex7月19日 23:02

如果正如 @sgrove 所提議的，規範是未來的代碼，那麼除錯是什麼？ 1) 規範編譯是編碼代理將規範轉換為代碼的過程 2) 越來越多的“編譯”將是無人值守的，少看代理逐行工作，更多的是規範進，代碼出 3) 類型錯誤 -> 真理錯誤：大多數除錯將是在 markdown 中挖掘研究和實施計劃，以找到使編碼代理在實施時無法成功的那一行錯誤上下文。測試套件將檢查真理和邏輯一致性等內容。 4) 有一種新的高階“附加步驟除錯器”的風味，即觀察代理逐步實施計劃，以確定規範中的邏輯錯誤。當你在逐行執行程序時發現錯誤時，你會更改代碼，重新啟動過程，並重複直到它正常工作。當你在逐步執行實施時發現規範中的錯誤時，你會向上游回去，修正規範，然後重新啟動 *實施*。

10.22K

swyx 已轉發

ARC Prize7月19日 04:48

聽 @GregKamradt 與 @swyx 和 @FanaHOVA 在 @latentspacepod 上談論 ARC-AGI-3 * 為什麼要進行互動基準測試？ * 定義智慧 * ARC-AGI-3 遊戲的遊玩過程

10.16K

swyx7月19日 03:23

我們每天都會從 @aidotengineer 的會議中釋出一首曲目。昨天的 RecSys 曲目反響熱烈，但最受歡迎的曲目是我們對 MCP 狀態的報導，由 @Calclavia 主持。我個人最喜歡的幻燈片是這一張，讓我意識到 @AnthropicAI 對 MCP 的實踐比我最初從我們與 @dsp_ 和 @jspahrsummers 的播客中想像的要深入得多。看看這些演講，並給你最喜歡的演講者打個招呼！ *大多數已經可以通過 "完整播放列表" 以 "未列出" 的形式搜索到。

21.68K

swyx7月18日 01:50

"三件事：一個具有增強搜索瀏覽器的深度研究模型；一個革命性的計算機操作員；以及一個沙盒終端來執行數學和代碼。一個瀏覽器，一台計算機，一個終端……你明白了嗎？這不是三個獨立的設備。這是一個設備，我們稱之為 Agent。"

396