Demis Hassabis sobre los próximos 12 meses: - Convergencia multimodal completa: Modelos como Gemini integrarán y generarán sin problemas texto, imágenes, audio y video, con una polinización cruzada que potencia el razonamiento + la creatividad. - Avance en inteligencia visual: Modelos de imagen como Nano Banana Pro producirán infografías altamente precisas y mostrarán una comprensión visual casi humana. - Fusión de lenguaje + video: Modelos de video integrados con LLMs desbloquean un análisis más rico, narración de historias y razonamiento visual paso a paso. - Los modelos del mundo se vuelven convencionales como Genie 3 - Los agentes se vuelven confiables