德米斯·哈薩比斯談未來12個月: - 完全的多模態融合:像Gemini這樣的模型將無縫地接收和輸出文本、圖像、音頻和視頻,並通過交叉傳播來提升推理和創造力。 - 突破性的視覺智能:像Nano Banana Pro這樣的圖像模型將生成高度準確的信息圖,並顯示接近人類的視覺理解能力。 - 語言與視頻融合:與大型語言模型(LLMs)集成的視頻模型解鎖更豐富的分析、故事講述和逐步的視覺推理。 - 世界模型像Genie 3一樣進入主流 - 代理變得可靠