谷歌Gemini 2.0 AI模型横空出世，性能翻倍引领多模态技术革新-科技-沃资讯

谷歌Gemini 2.0 AI模型横空出世，性能翻倍引领多模态技术革新

发布时间：2024-12-12 20:30 来源：ITBEAR 作者：顾雨柔

谷歌近期震撼发布其最新一代人工智能模型——Gemini 2.0，这款AI模型以其卓越的性能和多模态处理能力，迅速成为业界关注的焦点。与前代产品相比，Gemini 2.0不仅在性能上实现了飞跃，更在多个关键基准测试中展现出了令人瞩目的表现，其性能几乎达到了Gemini 1.5 Pro的两倍，且响应速度更快，延迟更低。

在功能方面，Gemini 2.0同样带来了诸多创新。它不仅支持图像、视频和音频等多种形式的输入，还能够实现与文本相结合的原生文生图以及可定制化的文本转语音（TTS）多语言音频输出。这一多模态处理能力，使得Gemini 2.0在应用场景上更加广泛，能够满足更多元化的需求。

Gemini 2.0还引入了原生调用工具的功能，包括Google搜索、代码执行以及用户自定义的第三方函数等。这些功能的加入，为开发者提供了极大的便利，使得他们能够更加高效地利用Gemini 2.0进行开发和创新。

为了探索通用人工智能（AGI）的未来潜力，谷歌还在积极推进一系列原型项目。其中，Project Astra得到了更新，同时推出了全新的Project Mariner以及AI代码智能体Jules。这些项目旨在通过实践来验证和拓展AGI的功能和应用范围。

目前，开发人员已经可以在AI Studio和Vertex AI平台上试用Gemini 2.0 Flash的实验版本。不过需要注意的是，部分功能如文本转语音和原生图像生成等，目前仍仅对早期访问合作伙伴开放。但谷歌方面表示，预计在今年1月，这些功能将向更广泛的用户开放。

为了推动AI技术在更多领域的应用和发展，谷歌还发布了全新的多模态实时API。这款API具备实时处理音频和视频输入的能力，并能够支持多个组合工具的使用。它的推出，将为开发者打造动态和交互式应用提供更加有力的支持。

更多>同类内容