谷歌发布新一代大模子Gemini 2.0，备战智能体时间

发布日期：2024-12-12 22:43 点击次数：72

（原标题：谷歌发布新一代大模子Gemini 2.0，备战智能体时间）

12月12日，谷歌推出大模子Gemini 2.0 ，谷歌CEO桑达尔·皮查伊（Sundar Pichai）称，这是谷歌为新智能体时间构建的下一代模子，亦然谷歌迄今截至最强的大模子。

Gemini 2.0 Flash是谷歌这次发布的Gemini 2.0系列模子中的第一个模子。比较上一代模子Gemini 1.5 Flash，Gemini 2.0 Flash除了复旧图片、视频和音频等多模态输入，还复旧多模态输出，举例其不错径直生成图像与文本搀杂的内容，以及原生生成可控的多谈话文本转语音（TTS）音频。Gemini 2.0 Flash还不错原生调用谷歌搜索、代码施行以考中三方用户界说的函数等用具。

皮查伊默示，若是说Gemini 1.0的作用是整合和连合信息，那么Gemini 2.0概况作念到让信息愈加灵验。

基于Gemini 2.0模子，谷歌概况构建新的AI智能体，从而离构建通用助手的愿景更进一步。智能体（Agent）是指概况感知环境并弃取当作以杀青特定假想的代理体，也被视为大模子落地的“临了一公里”。

往时一年里，谷歌捏续开采了更多智能体模子。在发布Gemini 2.0的同期，谷歌也先容了多个智能体。举例，Project Astra是通过多模态连合践诺全国的智能体，它不错在多种谈话和搀杂谈话之间进行对话，概况连合不同口音和荒僻单词，并以接近东说念主类对话的蔓延来连合谈话。Project Astra最多不错记着长达10分钟的会话内容，况兼不错回忆起往时与它进行的多轮对话，以便为用户提供更好的个性化办事。Project Astra还能使用谷歌搜索、谷歌舆图等用具。 Project Astra被哄骗于谷歌的AI助手Gemini app以及智能眼镜等其他配置及家具中。

除此除外，谷歌还开采了不错匡助用户完成复杂任务的智能体、面向开采者的智能体，以及面向游戏和其他规模的智能体。

在Gemini 2.0发布本日，新加坡科研局资深科研工程师黄佳就体验了该模子，并将其与OpenAI最新发布的o1模子进行对比。他的测试面目是提供一系列参考文档，给出复杂逻辑，让大模子进行自主编程，并提供瞩目案牍讲明注解。

黄佳默示，在一般情况下，ChatGPT o1的逻辑推理还是更强。具体而言，两个模子王人体现出了很强的分析推明智力，但ChatGPT o1不错收受的文档输入长度较长，Gemini 2.0会截断部分太长的参考文档；此外，ChatGPT o1给出的代码，质料较高，症结（bug）较少，ChatGPT o1的代码讲明注解更瞩目，更接近黄佳念念要的写稿作风，Gemini 2.0的讲明注解案牍较为浮浅。

黄佳嗅觉到，固然现在大模子仍弗成能仅靠浅易的提醒词，就自骨干活，知足需求，还需要在东说念主的入手之下，在精确的业务场景中，经过假想、编程、整合等历程，才概况成为智能体，然而大模子智力在杰出，东说念主们对大模子智力畛域的意志也越来越昭着，这带来了智能体发展的加快，周围共事也在更多地用智能体作念内容神气。

上一篇：华润置地2024年1-11月公约销售金额2291亿元同比减少19.9%
下一篇：习近平会见俄罗斯合并俄罗斯党主席梅德韦杰夫

让建站和SEO变得简单

谷歌发布新一代大模子Gemini 2.0，备战智能体时间

热点资讯

相关资讯