Nano Banana Pro a été la première fois où j'ai ressenti un véritable murmure d'AGI et cela me donne encore des frissons. Soit je suis fou de le voir, soit vous êtes fou de ne pas le voir. La communication visuelle qui porte une structure (mise en page + typographie + sémantique), et pas seulement une esthétique… est un énorme pas vers quelque chose de même proche de "cohérent". Elle peut prendre des idées complexes et les transformer en infographies lisibles. Elle visualise des relations complexes. Ce n'est plus juste une belle image. Visualiser des relations complexes est, d'ailleurs, à peu près (?) toute la biologie. En tant que biologiste et scientifique au niveau des systèmes, je pense spatialement, en graphiques et en diagrammes. Je ne peux pas ne pas penser de cette manière, et beaucoup de biologistes computationnels ont un archétype similaire. Pour moi, voir des relations complexes qui vont au-delà des séquences de texte linéaires n'est pas juste une fonctionnalité, cela change la signification de l'IA dans ma vie quotidienne. Ce modèle permet des hiérarchies, des flèches causales, des comparaisons, des abstractions avec lesquelles vous pouvez réellement raisonner et éditer précisément en 2D. Ce qui est fou, c'est que cela a été le mode d'échec des modèles d'image. Ils étaient excellents en esthétique et plutôt terribles en signification. Vous deviez presque coder la signification en dur en utilisant un prompt. Surtout pour tout ce qui est technique ; diagrammes biologiques, mécanismes, cartes de processus, cadres conceptuels. Vous demandez une infographie et obtenez quelque chose qui ressemblait à une, mais qui ne tenait pas ensemble, et les lacunes étaient comblées assez mal. Midjourney, DALL-E(s), chaque modèle avant celui-ci, a été bon pour beaucoup de choses mais n'a jamais vraiment atteint la biologie. Et J'EN AI MARRE DE BIORENDER ! Maintenant, cela fonctionne réellement. Cela nécessite encore des prompts, mais la différence est qualitative. Cela peut porter les fondements d'une idée, et aussi fou que cela puisse paraître… de mon expérience, pour la première fois, CES INFOGRAPHIES M'ONT DONNÉ DE NOUVELLES IDÉES COHÉRENTES. C'est la partie qui m'a donné des frissons. C'est la première fois qu'un modèle d'image semblait ne pas simplement générer des pixels, mais aider à externaliser la cognition. Prendre quelque chose de flou dans votre tête et le transformer en un objet clair sur lequel vous pouvez itérer. Les gens diront que ce n'est que du prompting ; c'est vrai, mais je n'ai jamais vu un modèle répondre à mon prompt comme ça. ...