发布日期:2024-12-12 22:43 点击次数:67
(原标题:谷歌发布新一代大模子Gemini 2.0,备战智能体时间)
12月12日,谷歌推出大模子Gemini 2.0 ,谷歌CEO桑达尔·皮查伊(Sundar Pichai)称,这是谷歌为新智能体时间构建的下一代模子,亦然谷歌迄今截至最强的大模子。
Gemini 2.0 Flash是谷歌这次发布的Gemini 2.0系列模子中的第一个模子。比较上一代模子Gemini 1.5 Flash,Gemini 2.0 Flash除了复旧图片、视频和音频等多模态输入,还复旧多模态输出,举例其不错径直生成图像与文本搀杂的内容,以及原生生成可控的多谈话文本转语音(TTS)音频。Gemini 2.0 Flash还不错原生调用谷歌搜索、代码施行以考中三方用户界说的函数等用具。
皮查伊默示,若是说Gemini 1.0的作用是整合和连合信息,那么Gemini 2.0概况作念到让信息愈加灵验。
基于Gemini 2.0模子,谷歌概况构建新的AI智能体,从而离构建通用助手的愿景更进一步。智能体(Agent)是指概况感知环境并弃取当作以杀青特定假想的代理体,也被视为大模子落地的“临了一公里”。
往时一年里,谷歌捏续开采了更多智能体模子。在发布Gemini 2.0的同期,谷歌也先容了多个智能体。举例,Project Astra是通过多模态连合践诺全国的智能体,它不错在多种谈话和搀杂谈话之间进行对话,概况连合不同口音和荒僻单词,并以接近东说念主类对话的蔓延来连合谈话。Project Astra最多不错记着长达10分钟的会话内容,况兼不错回忆起往时与它进行的多轮对话,以便为用户提供更好的个性化办事。Project Astra还能使用谷歌搜索、谷歌舆图等用具。 Project Astra被哄骗于谷歌的AI助手Gemini app以及智能眼镜等其他配置及家具中。
除此除外,谷歌还开采了不错匡助用户完成复杂任务的智能体、面向开采者的智能体,以及面向游戏和其他规模的智能体。
在Gemini 2.0发布本日,新加坡科研局资深科研工程师黄佳就体验了该模子,并将其与OpenAI最新发布的o1模子进行对比。他的测试面目是提供一系列参考文档,给出复杂逻辑,让大模子进行自主编程,并提供瞩目案牍讲明注解。
黄佳默示,在一般情况下,ChatGPT o1的逻辑推理还是更强。具体而言,两个模子王人体现出了很强的分析推明智力,但ChatGPT o1不错收受的文档输入长度较长,Gemini 2.0会截断部分太长的参考文档;此外,ChatGPT o1给出的代码,质料较高,症结(bug)较少,ChatGPT o1的代码讲明注解更瞩目,更接近黄佳念念要的写稿作风,Gemini 2.0的讲明注解案牍较为浮浅。
黄佳嗅觉到,固然现在大模子仍弗成能仅靠浅易的提醒词,就自骨干活,知足需求,还需要在东说念主的入手之下,在精确的业务场景中,经过假想、编程、整合等历程,才概况成为智能体,然而大模子智力在杰出,东说念主们对大模子智力畛域的意志也越来越昭着,这带来了智能体发展的加快,周围共事也在更多地用智能体作念内容神气。