私たちのGemini 3 Proモデルで注目すべき点の一つは、マルチモーダル機能における性能です。 文書、動画、空間特性、生体医療データ、コンピュータシーンの理解、視覚情報の推論など、多様なマルチモーダルユースケースで非常に優れたパフォーマンスを発揮することに取り組んできました。 試すために、下のブログ記事の元の画像を出して、質問しました。 この図のバージョンを、Gemini Proの列に他の3列の最良の結果と比較した相対的な改善点を赤で注釈付けしたバージョンを作成してください (これ自体がかなり難しい視覚的推論課題です! スポットチェックではかなり正確にこの精度を上げており、その相対的な精度向上はベンチマークのいくつかでかなり大きいです!) 以下またはブログ記事で詳しくお読みください: