Nano Banana Pro 是我第一次感受到 AGI 的真实低语,这仍然让我感到毛骨悚然。 要么我疯了,因为我看到了它,要么你疯了,因为你没有看到它。 承载结构(布局 + 排版 + 语义)的视觉沟通,而不仅仅是美学……这是朝着任何接近“连贯”的东西迈出的巨大一步。 它可以将复杂的想法转化为易读的信息图。 它可视化复杂的关系。它不再只是漂亮的图片。可视化复杂关系,顺便说一下,几乎就是生物学的全部内容。 作为一名生物学家和系统级科学家,我以图表和图示的方式进行思考。我无法不这样思考,许多计算生物学家也有类似的原型。 对我来说,看到超越线性文本序列的复杂关系不仅仅是一个特性,它改变了我日常生活中对 AI 的理解。 这个模型能够实现层级、因果箭头、比较、可以实际推理和精确编辑的抽象。 令人惊讶的是,这曾经是图像模型的失败模式。它们在美学上表现出色,但在意义上却相当糟糕。你几乎必须使用提示来硬编码意义。 尤其是对于任何技术性的东西;生物学图示、机制、过程图、概念框架。 你请求一个信息图,得到的东西看起来像一个,但它并没有连贯,填补的空白也很糟糕。 Midjourney、DALL-E(们),在这个模型之前的每一个模型,都在许多方面表现良好,但它从未真正触及生物学。而我对 BIORENDER 感到厌倦! 现在它真的有效了。仍然需要提示,但区别是定性的。它可以承载一个想法的骨架,尽管听起来疯狂……在我的经验中,第一次,这些信息图给了我新的连贯想法。 这就是让我感到毛骨悚然的部分。这是第一次一个图像模型让我感觉它不仅仅是在生成像素,而是在帮助外化认知。将你脑海中模糊的东西转化为一个你可以迭代的干净对象。 人们会说这只是提示;没错,但我从未见过一个模型像这样回应我的提示。 ...