我們的 Gemini 3 Pro 型號的一個方面是它在多模態能力方面的表現。我們致力於使其在各種多模態用例中表現出色,例如理解文件、視頻、空間特徵、生物醫學數據和計算機螢幕,並能夠推理視覺信息。 為了測試它,我給了下面博客文章中的原始圖像,並問它: 請製作這個圖形的版本,將 Gemini Pro 列標註為相對於其他三列最佳結果的改進,並用紅色標示。 (這本身就是一個相當困難的視覺推理任務!在一些隨機檢查中,它在準確性上表現得相當不錯,而這些相對準確性改進在某些基準中相當大!) 請在下面或在博客文章中閱讀更多內容: