谷歌为了挑战OpenAI在人工智能市场的主导地位,于周三发布了其旗舰AI模型Gemini的首个重大更新,其中包括可定制的“Gems”。Gemini还将直接整合公司的AI图像生成器Imagen 3。然而,它仍不会生成人物图像,这是因为早期发布的版本产生了问题图像,迫使谷歌将该工具下线。类似于OpenAI的ChatGPT的GPT功能,Gems允许用户基于Gemini模型创建一组定制的模块化AI助手,可用于从编码到职业建议等各种项目。据谷歌称,Gems适用于Gemini高级、商业和企业用户。对于可能没有确切措辞来构建他们的Gems的创作者,Gemini还具有AI驱动的重写功能,以微调设置。Gems的输出可以通过社交媒体上的链接共享,并且还可以共享到Google Docs和Gmail以添加到电子邮件草稿中。关于分享,谷歌代表告诉Decrypt:“目前,您创建的Gems仅供个人使用。您可以通过创建公共链接来分享与Gems的对话,但与Gems的共享对话不能由您与链接分享的其他人继续进行。”这比OpenAI的GPT提供的功能更为有限,后者可以更全面地与其他人分享定制。其Imagen 3图像生成器的整合还扩展了Gemini的内置功能,并且这家科技巨头重申了其谨慎的推出方式。谷歌代表表示:“我们进行了广泛的内部和外部红队测试,并与独立专家合作,以确保持续改进。我们有一项禁止使用政策,并禁止违反我们政策的回应。”谷歌在本月初推出了Imagen 3,此前在五月宣布。它面临着来自OpenAI的Dall-E、Midjourney和Elon Musk的Grok chatbot内置的Flux等工具的激烈竞争。
Decrypt使用AI创建的图像
“Imagen 3为图像质量设定了新标准,仅凭几个词就能生成图像,”谷歌表示。“您甚至可以要求Gemini以各种风格创建图像,比如逼真的风景、质感的油画,或者奇幻的粘土动画场景。”
虽然Gemini能够创建动物和物体的图片,但它仍然无法创建人类的图片。
“如果要求Gemini创建人物图像,聊天机器人会回复说‘人物图像生成即将推出Gemini Advanced版’。”
“通过Imagen 3,我们在生成人物图像时取得了重大进展,提供了更好的用户体验,”谷歌表示。“我们不支持生成逼真可识别的个人形象,未成年人的描绘,以及过于血腥、暴力或性暗示的场景。”
“当然,与任何生成式AI工具一样,Gemini创建的并非每张图像都完美无缺,但我们将继续倾听早期用户的反馈意见,不断改进,”谷歌补充道。“我们将逐步推出这一功能,希望能很快将其推广到更多用户和语言。”
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。