Claude 2:为我重写了一些电子邮件,清理了文档中的语法。1.5/10 有帮助。 3 Opus:是我觉得可以智能对话的第一个模型,帮助我进行了一些小的编码/脚本工作。3/10 有帮助。 3.5 Sonnet:开始尝试端到端的编码项目,偶尔给出一些生活建议。4/10 有帮助。 新的 3.5 Sonnet:大多数时候在编码方面比我更出色,提供了很多生活建议/咨询,是我信任的第一个健康/健身推荐模型,更多地使用图像/多模态,我在大多数工作任务中首先求助于它。5.5/10 有帮助。通过外部集成(MCP 等),可能是 6.5/10 有帮助。 这一进展在短短一年内发生,真是令人难以置信。这个评分中的 10/10 有帮助基本上意味着一个极其智慧和知识渊博的生活助手,了解你和你所做的事情的所有背景。我们很快就会达到这个目标。