谷歌Gemini 2.5 Flash突破性发布:成本大幅降低,性能依旧强劲

   发布时间:2025-04-18 16:05 作者:顾雨柔

近期,科技巨头谷歌推出了一款名为Gemini 2.5 Flash的混合推理模型,该模型凭借独特的“思考预算”调节功能,在保持卓越性能的同时,实现了成本的大幅缩减。

据悉,在闭源思考模式下,Gemini 2.5 Flash的处理成本仅为每百万tokens 0.6美元,与全功能思考模式下的3.5美元相比,成本降低了惊人的600%。值得注意的是,即便是以基础模式运行,该模型的表现也超越了其前代产品Gemini 2.0 Flash。

在性能评估方面,Gemini 2.5 Flash在大模型排行榜上取得了显著成绩,以1392分的ELO评分紧随GPT-4.5-preview之后,位列第二,与Grok-3的表现不相上下。这一成绩充分展示了该模型在AI领域的强劲实力。

在具体任务测试中,Gemini 2.5 Flash同样表现出色。在GPQA知识问答中,通过分配24K的思考预算,模型性能提升了6%。而在LiveCodeBench代码基准测试中,当思考预算为16K时,模型达到了最佳表现。这些测试结果进一步验证了该模型在复杂任务处理方面的能力。

对比测试结果显示,Gemini 2.5 Flash在多模态推理和数学任务上的表现明显优于Claude 3.7 Sonnet,其综合性能与OpenAI最新的o4-mini模型相当。在模拟人类综合能力的“人类最后一次考试”基准测试中,该模型以12.1%的高分位列第二,再次证明了其强大的综合能力。

Gemini 2.5 Flash的创新之处在于其“思考预算”机制,这一机制使得用户可以根据实际需求调整模型的思考深度和成本,从而在性能与成本之间实现了完美的平衡。这一创新为AI应用开发提供了更加灵活和经济的选择,有助于推动AI技术的普及和发展。

 
 
更多>同类内容
全站最新
热门内容
本栏最新