我们Gemini 3 Pro模型的一个方面是它在多模态能力上的表现。我们致力于使其在各种多模态用例中表现出色,例如理解文档、视频、空间特征、生物医学数据和计算机屏幕,并能够推理视觉信息。 为了测试它,我给了下面博客文章中的原始图像,并问它: 请制作一个版本的图形,其中Gemini Pro列用红色标注相对于其他三列最佳结果的相对改进。 (这本身就是一个相当困难的视觉推理任务!在一些抽查中,它在准确性方面表现得相当不错,而这些相对准确性改进在一些基准测试中相当大!) 请在下面或在博客文章中阅读更多内容: