Opera采用Google Gemini技术来为其浏览器AI助手和图像生成器提供动力

CN
Decrypt
關注
7 個月前

Opera,作为第五大受欢迎的桌面浏览器背后的公司,将允许其内置的人工智能助手Aria的用户轻松生成使用Google最新的图像生成模型Imagen 2

该浏览器项目宣布,周二达成协议,将为Aria提供Google Gemini的文本聊天机器人功能。

Opera合作伙伴关系负责人Per Wetterdal在一份官方声明中表示:“我们很高兴宣布将此合作扩展到生成式人工智能领域,以进一步增强我们的浏览器人工智能服务套件。”他提到了过去20年的合作。

该功能立即在Opera Developer中提供,这是Opera的预发布版本,公众可以预览和测试即将推出的功能。开发者版本通常会先迁移到Opera Beta(以前称为Opera Next),最终成为下一个主要的稳定版本。


来自Opera Developer、Opera GX和Opera浏览器的生成。

此外,此更新使Opera的人工智能能够以对话方式回答,这要归功于Google的文本转音频模型。

虽然在Opera移动浏览器上可以访问Aria的旧版本,但基于Gemini的更新尚未在智能手机上推出。Opera未对Decrypt的置评请求做出回应。

Opera的人工智能助手Aria首次在2023年5月推出,曾依赖于OpenAI的ChatGPT,但后来集成了Google的PaLM 2模型的优化版本。由于Google已将其人工智能开发转向Gemini,该模型现已过时。Opera的Aria会处理用户的命令,并决定针对哪项任务使用Gemini或Imagen 2。

通过集成Google的Gemini模型,Opera现在能够为用户提供与通过GPT-4获得的高质量回复相媲美的回复。目前,GPT-4o和Gemini 1.5 Pro在Chatbot Arena排行榜上排名第一和第二,该排名基于用户的盲目评分。

“我们相信人工智能的未来将是开放的,因此我们正在提供对谷歌基础设施、人工智能产品、平台和基础模型的最佳访问权限,以赋予组织使用生成式人工智能制定其发展方向的能力,”谷歌云北欧地区总经理Eva Fors表示。“我们很高兴通过为其浏览器空间内的人工智能创新提供动力,提升我们与Opera长期合作的合作关系。”

Opera仍然保留了与OpenAI的ChatGPT(现由GPT-4和Dall-e 3提供支持)的现有集成。用户只需点击Aria按钮下方显示的不同图标即可。

Opera已经利用其所有旗舰浏览器,包括Opera GX游戏浏览器,利用浏览器人工智能的潜力已经一年多了。该公司最近还在冰岛开设了一个由NVIDIA DGX技术提供动力的绿色能源AI数据集群,以快速扩展其人工智能项目。

人工智能浏览器之战

人工智能的集成显著影响了主导浏览器市场的竞争。虽然谷歌的Chrome仍然是无可争议的领导者,但其缺乏默认的内置人工智能集成为其他竞争者创新和获得市场份额留下了空间。

特别是微软大力 s 押注人工智能,通过大量人工智能功能彻底改造了曾经备受诟病的Edge浏览器。曾经是嘲笑的对象,用户开玩笑说它最好的用途是下载Chrome,Edge在过去几个月里出现了显著复苏。

通过转向基于Chromium的引擎并嵌入人工智能功能,微软的浏览器已经攀升至第二位,超过了苹果的Safari,根据Statcounter数据,这一转折点与微软于2023年9月26日宣布其统一的Copilot体验相关。

Opera和谷歌云的这一商业举措意义重大,因为它在人工智能浏览器市场上提供了一个基于谷歌的替代选择。随着微软Edge由于其人工智能集成而崛起,Opera与谷歌之间的合作为用户提供了一个稳固的选择,可以利用谷歌的先进模型,而不是OpenAI的模型。

选择的乐趣

如果在Web浏览器内使用人工智能工具的便利性吸引人,现在您有三个稳固的选择:使用来自谷歌的Aria的Opera,使用来自微软的Copilot的Edge,以及使用Mistral和Anthropic提供动力的Leo的Brave。

著名的加密浏览器Brave可能会吸引注重隐私的用户。Brave已经将其自己的人工智能助手Leo直接集成到其浏览器中,它可以回答问题,提供摘要,生成新内容等。但它目前还不能生成图像。

Leo由Mixtral 8x7B、Claude Instant和Llama 2 13B等大型语言模型提供支持。与其他人工智能助手不同,Brave将这些模型托管在自己的服务器上,确保用户输入和与Leo的对话不会被保留或用于模型训练。

在Opera和Edge之间,Copilot在基于文本的回复方面可能具有优势,但谷歌的Imagen 2功能在逼真度和连贯性方面击败了Dall-E 3。在Decrypt进行的测试中,Aria也被证明更加多才多艺和有创造力,能够理解更短的提示。

例如,Aria对于简单的要求,比如一只狗吃汉堡的解释是逼真的。Copilot要求更详细的提示,只有在我们要求创建一只戴着墨镜吃汉堡的狗后,才创建了一个不太逼真的图像,具有3D渲染的美学。


Aria、Copilot和扩展提示后的Copilot生成的图像

如果您在Edge中使用Copilot,值得尝试一下Opera中的Aria——无论是Aria还是Copilot的图像生成能力,都值得尝试一些超出Brave中Leo提供的私密范围之外的东西。

Ryan Ozawa编辑。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接