热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲

Taelin
种类 / 弯曲 / HVM / INets / λ微积分
不,你们都错了,GPT-5 是一次飞跃
我在这里100%加倍下注
我不想太快发帖然后后悔,但它刚刚解决了一堆非常非常难的调试提示,这些提示之前是AI无法解决的,然后设计了一个华丽的像素化Gameboy游戏,细节和质量显然超出了我见过的任何东西。
这个模型绝对不差。
我觉得你们都对benchmaxxers感到创伤,并且过度补偿一个实际上很好的模型。我也认为你们低估了gpt-oss的优势(但我最后的帖子确实是匆忙的)
不过我仍然不知道它是否适合严肃的编程(o3不适合),但似乎是这样?一个像Opus一样可靠但比o3更聪明的编码模型,将完全改变我的工作流程。Opus不需要思考就能出色,因此,这可能对它有利。
就我所用的而言,我只真正使用了3个模型:
- Opus 4.1 用于编码
- Gemini 2.5 很少用于编码,当Opus失败时
- o3 用于除编码以外的所有事情
6.51K
不,你们都错了,GPT-5 是一次飞跃
我在这里100%加倍下注
我不想太快发帖然后后悔,但它刚刚解决了一堆非常非常难的调试提示,这些提示之前是AI无法解决的,然后设计了一个华丽的像素化Gameboy游戏,细节和质量显然超出了我见过的任何东西。
这个模型绝对不差。
我觉得你们都对benchmaxxers感到创伤,并且过度补偿一个实际上真的很好的模型。我还认为你们低估了gpt-oss的优势(不过是的,我上一个帖子确实是匆忙的)
不过我仍然不知道它是否适合严肃的编程(4o,o3 绝对不行),但似乎可以?一个像Opus一样可靠但比o3更聪明的编码模型,将完全改变我的工作流程。不过,Opus不需要思考就能出色,所以这可能对它有利。
就我所用的而言,我只真正使用了3个模型:
- Opus 4.1 用于编码
- Gemini 2.5 很少用于编码,当Opus失败时
- o3 用于除编码以外的所有事情
411
"防止死亡是高度不道德的"

João Pedro de Magalhães8月6日 06:41
"停止衰老是极不道德的" - 一位评审在我提交的资助申请上评论。
该资助申请专注于细胞复兴,并未提及治愈衰老,但这表明我们仍然有很长的路要走,甚至要说服同行科学家,治愈衰老是可取的。
16.05K
防止死亡是非常不道德的

João Pedro de Magalhães8月6日 06:41
"停止衰老是极不道德的" - 一位评审在我提交的资助申请上评论。
该资助申请专注于细胞复兴,并未提及治愈衰老,但这表明我们仍然有很长的路要走,甚至要说服同行科学家,治愈衰老是可取的。
217
所以 gpt-oss 120B 不能生成正确的德语,却能解决连 Opus 都未能识别的复杂 Haskell 错误?
这是怎么发生的?
我对此感到非常困惑。

Björn Plüster8月6日 04:45
gpt-oss 120B 显然无法生成语法正确的德语文本。🧵
221
热门
排行
收藏
链上热点
X 热门榜
近期融资
最受认可