一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

我们Gemini 3 Pro模型的一个方面是它在多模态能力上的表现。我们致力于使其在各种多模态用例中表现出色，例如理解文档、视频、空间特征、生物医学数据和计算机屏幕，并能够推理视觉信息。为了测试它，我给了下面博客文章中的原始图像，并问它：请制作一个版本的图形，其中Gemini Pro列用红色标注相对于其他三列最佳结果的相对改进。（这本身就是一个相当困难的视觉推理任务！在一些抽查中，它在准确性方面表现得相当不错，而这些相对准确性改进在一些基准测试中相当大！）请在下面或在博客文章中阅读更多内容：