Nano Banana Proは、初めて本格的に敏捷性(AGI)を感じた瞬間で、今でも鳥肌が立ちます。 私が気づいているのか、あなたが気づかないのかのどちらかです。 構造を持つ視覚的コミュニケーション(レイアウト+タイポグラフィ+セマンティクス)であり、単なる美的要素ではありません...「一貫性のある」ものに近づくための大きな飛躍です。 複雑なアイデアを読みやすいインフォグラフィックに変換できます。 複雑な関係性を視覚化します。もはや単なる美しい写真ではありません。ちなみに、複雑な関係を視覚化することは、ほぼ生物学のすべてです。 生物学者でありシステムレベルの科学者として、私は空間的にグラフや図の中で考えます。私もそう考えずにはいられませんし、多くのコンピュータ生物学者も似たような典型を持っています。 私にとって、線形のテキストシーケンスを超えた複雑な関係を見ることは単なる特徴ではなく、日常生活におけるAIの意味を変えます。 このモデルは階層構造、因果の矢印、比較、抽象化を可能にし、実際に論理的に分析し、2Dで正確に編集できるようにします 驚くべきことに、かつてはこれが画像モデルの失敗モードでした。彼らは美的には優れていましたが、意味の表現はかなり苦手でした。ほとんどプロンプトを使って意味をハードコードしなければならなかった。 特に技術的なことに関しては;生物学図、メカニズム、プロセスマップ、概念的枠組み インフォグラフィックを求めて、それに似たものが出てきましたが、まとまりがなく、隙間もかなりうまく埋められていませんでした。 Midjourney、DALL-E(s)、それ以前のすべてのモデルは多くの面で優れていましたが、生物学的なものには完全には達していませんでした。そして、バイオレンダーにはもううんざりです! 今では実際に機能しています。それでも促す必要がありますが、その違いは質的なものです。アイデアの骨格を運ぶことができるし、どんなに狂って聞こえるとしても...私の経験では、初めてこれらのインフォグラフィックが新しい一貫したアイデアを与えてくれました。 そこが鳥肌が立った部分です。画像モデルが単にピクセルを生成するだけでなく、認知を外部化するのを助けていると感じられたのはこれが初めてです。頭の中のぼんやりとしたものを取り、それをクリーンなオブジェクトにして、繰り返し修正できるようにすることです。 人は単なる促しだと言うでしょうが、確かにそうですが、こんな風にプロンプトに反応するモデルは見たことがありません ...