编程能力方面,尽管在SWE-Bench上未取得SOTA成绩,但仍稳居第一梯队。其在Live Code Bench的Elo得分突破2400分,并在工具调用与终端操作基准测试中排名第一。
更令人震撼的是其视觉理解能力:对屏幕截图的理解准确率高达72.7%,达到现有最先进水平的两倍。这意味着AI Agent将不再是“视觉障碍者”,有望彻底重塑AI操作计算机的交互模式。
此外,谷歌还同期发布了自家的Agentic编程平台——Google Antigravity,再添一枚“技术砝码”。
根据Model Card披露,Gemini 3 Pro在推理、多模态、Agent工具使用等关键基准测试中实现了全面领先。
在硬件层面,Gemini 3 Pro基于谷歌自研的张量处理单元(TPU)训练。相比CPU,TPU在处理大语言模型所需的大规模计算时速度更快,其配备的大容量高带宽内存也使其能够高效运行超大模型与批量数据。
--
FROM 117.36.116.*