谷歌全面反击PaLM 2模型挑战GPT-4产品通通AI化

根据基准测试,PaLM 2的部分结果超越了GPT-4。

PaLM 2 是在具有100 语言的语料库上进行训练的,因此它更擅长多语言任务,能够理解、生成和翻译比以往模型更细致多样化的文本。PaLM 2 通过了“精通”(mastery)级别的高级语言能力考试。

比起PaLM,在最新专业语言熟练度考试中的表现,PaLM 2的日语水平达到了A级,而PaLM达到了F级。PaLM 2的法语水平达到了C1级。在相关论文中,谷歌工程师声称PaLM 2的语言能力已经“足以教授这门语言”,原因是其训练数据中的非英语文本更为普遍。

编程方面,PaLM 2现在支持20种编程语言,如Python、JavaScript等常用语言,以及Prolog、Fortran和Verilog等。

此外,基于PaLM 2,谷歌还推出了两个专业领域大模型。一个是谷歌健康团队打造的Med-PaLM 2,它能回答各种医学问题,据介绍是首个在美国医疗执照考试中达到专家水平的大语言模型。

自动生成遛狗业务的收费表。

谷歌搜索蓝牙音箱。

但是要是想要访问这一功能,必须选择Search Generative Experience(SGE)这一新功能。并非所有搜索都会有AI生成的答案。只有当谷歌的算法认为它比标准答案更有用时,AI内容才会出现,而像健康、财务等敏感主题完全不会有AI生成。

发布会上,谷歌还宣布了一个重磅消息:聊天机器人Bard未来也能像ChatGPT一样,接入网络,实时搜索网页。

这次,Bard有诸多升级并很快就会支持各种第三方扩展,例如AI可以自动根据你输入的文本生成图像。

谷歌在发布会上展示了一个案例。假如用户问Bard,美国的新奥尔良有哪些必看的景点,那么Bard就能图文并茂地解答这个问题,就像用户在谷歌搜图中问同样的问题一样。

另一个功能是图像提示系统,由Google Lens提供,它能够识别图片中的物体。比如说,上传一张狗的照片,然后给一个prompt“为这两只狗写一个有趣的标题”。Google Lens就可以识别狗的品种,然后Bard就能写下与狗特征相关的内容

用Bard为照片写一个有趣的标题。

通过语言描述让Bard生成代码。

谷歌决定取消Bard的等候名单,其将在180个国家或地区提供服务。

发布文本生成音乐模型MusicLM

谷歌当天还发布了一种新的实验性AI工具MusicLM,可以将文本描述转化为音乐。 MusicLM可在网络、Android或iOS上的AI Test Kitchen应用程序中使用,允许用户输入诸如“晚宴上的深情爵士乐”或“创造催眠的工业技术声音”的提示,让该工具创建多个版本的歌曲。

用户可以在完善MusicLM生成的作品时指定“电子”或“古典”等风格,以及他们想要的“氛围、情绪或情感”。

谷歌1月在一篇学术论文中预览MusicLM时,表示“没有立即计划”发布它。论文的合著者指出,像MusicLM这样的系统会带来许多伦理挑战,包括将训练数据中受版权保护的材料整合到生成的歌曲中。

但在接下来的几个月里,谷歌表示它一直在与音乐人士合作并举办研讨会,以“了解这项技术如何为创作过程赋能”。结果之一是,AI Test Kitchen中的MusicLM版本不会生成具有特定艺术家或人声的音乐。

无论如何,围绕生成音乐的更广泛挑战不太可能轻易解决。而“深度造假”音乐仍然站在模糊的法律基础上。

在移动终端发力

相比微软,谷歌的一点优势是拥有包括智能手机、平板电脑及其操作系统在内的终端出口,这是它可以发力并必须抓住的部分。

I/O 大会上,谷歌展示了下一代移动操作系统Android14的新能力。其中,Magic Compose将于今年夏天在谷歌的默认短信应用 Message中推出测试版,它是一种基于AI生成模型的工具,让你在回短信的时候根据聊天内容获得大量提示。它会学习你的说话方式,你也可以让自己的回复内容看起来有不同的语气,或者用莎士比亚的风格来写。

谷歌还使用生成式 AI 来帮你制作独一无二的手机壁纸,和 AI 画图一样使用语言提示完成。

在大会上,谷歌还发布了AI笔记本Project Tailwind,目标受众定位为学生。该功能在大学校园内进行了广泛的测试。

谷歌发布了AI笔记本Project Tailwind。

它就像一个真正的笔记本一样,可以在里面记笔记,而这些内容就是AI学习的对象。

用户可以从谷歌云端硬盘中挑选文件,创建一个兼具个性化和私人属性的AI模型。

在示例演示中,Tailwind收集了一大堆学习笔记,然后生成了包括主题词在内的很多内容,比如用户可以为特定主题创建术语表。

Tailwind操作演示。

Tailwind不仅仅能为学生服务,对任何从不同来源获取信息的人都有帮助。

隐藏在Tailwind背后的理念是,为什么不能为每个用户定制不同的AI语言模型呢?用户目前可以注册Project Tailwind进行测试。

三大基础模型上线谷歌云、安卓开发小助手等

在宣布了AI方面的一系列更新后,谷歌也为自己的云端机器学习平台Vertex AI推出了三款大模型:Codey(text-to-code,帮助程序员写代码)、Imagen(text-to-image,生成高质量图像)、Chirp(speech-to-text,方便沟通)。

LLM模型需要大量的计算能力来训练和运行。认识到这一点,谷歌云在谷歌I/O大会上宣布了一款新的A3超级计算机虚拟机。

谷歌在一份声明中写道:“A3 GPU VM专为当今的机器学习工作负载提供最高性能的训练而设计,配备了现代CPU、改进的主机内存、下一代英伟达GPU和主要网络升级。”

具体来说,该公司正在为这些机器配备英伟达的H100 GPU,并将其与专门的数据中心相结合,以获得具有高吞吐量和低延迟的巨大计算能力。

谷歌将以多种方式提供A3:客户可以自己运行它,或者如果他们愿意,可以将其作为托管服务运行,谷歌会为他们处理大部分繁重的工作。目前,客户只能通过注册预览等候名单来使用。

除此之外,谷歌I/O大会上也推出了专为Android开发的AI编码机器人Studio Bot。它不仅可以生成代码、修复BUG,甚至能够回答关于安卓应用开发的相关问题。同时支持Kotlin和Java编程语言,并将直接嵌入到Android Studio开发工具的工具栏中。

谷歌还宣布推出搜索实验室,这是一种让消费者在搜索中测试“大胆的新想法和我们正在探索的想法”的新方式。

搜索实验室限时提供三个主要功能。第一个称为搜索生成体验(SGE),将生成式AI直接引入谷歌搜索。 “新的搜索体验可以帮助您快速找到并理解信息。”谷歌表示, “在搜索时,您可以通过AI驱动的概述、探索更多内容的指示以及以自然跟进的方式来了解主题的要点。”第二个功能是,搜索提示还提供代码提示,使用大型语言模型提供片段和“更快更智能地编写代码的指针”。最后,“添加到表格”可以将搜索结果直接插入到电子表格中。例如,如果计划使用表格文档安排度假,可以直接从谷歌搜索轻松添加链接。