Ideogram发布新的AI图像模型,以与Flux和MidJourney竞争

CN
Decrypt
关注
2个月前

Ideogram AI于周三发布了Ideogram 2.0。其文本到图像模型的下一代旨在挑战生成式人工智能领域中已建立的主要参与者的主导地位。

该发布距离备受期待的Flux.1作为X上Grok的主要图像生成器的实施仅有几天时间。这一举措巩固了Flux.1在后稳定扩散XL(SDXL)时代的强大和多才多艺的地位。其他争夺主导地位的开放模型包括Auraflow、KwaiKolors、Hunyuan、Lumina和Kandinsky 3。

公司在其官方公告中表示:“Ideogram 2.0在许多质量指标上明显优于其他文本到图像模型,包括图像文本对齐、整体主观偏好和文本渲染准确性。”

除了新模型,Ideogram还推出了一系列新功能,以使他们的整个套件更具竞争力。这些功能包括iOS应用程序和面向开发人员的API。

由前Google员工创立的Ideogram长期以来一直以将文本生成能力纳入其图像模型的开创性工作而闻名。它是第一个这样做的模型,与Stability AI的一个鲜为人知的实验Deep Floyd IF并列。

随着Ideogram 2.0的发布,该公司提高了其模型输出的整体质量,使其更快、更有能力和更多才多艺,这要归功于五种不同预设的新选项:真实主义、绘画、3D、动漫和通用实现。

更新还引入了调色板,以使用户对美学和构图有更多控制。

Ideogram称,“真实主义”风格在Ideogram 2.0中使用户能够创建看起来像真实照片的图像。“纹理得到显著增强,人类皮肤和头发看起来栩栩如生。” 另一方面,“设计”预设侧重于准确和艺术性的文本生成。“这使您能够为贺卡、按需打印、海报、插图以及市场营销和社交媒体内容创建高级图形设计,带有长篇、风格化的文本。” 公告中写道。

除了这两种风格外,“3D”预设侧重于生成模仿计算机渲染的图像,“动漫”预设则是对MidJourney的虹式风格在日本漫画灵感创作方面的强大竞争对手,“通用”预设是一种一刀切的多才多艺设置,可以根据提示调整输出。

社交媒体用户的初始反应总体上非常积极,许多人分享了他们使用Ideogram生成的作品,展示了该模型在逼真度和渲染名人方面的显著能力。我们的初步测试结果令人满意,特别是在使用“真实主义”预设时,乍一看似乎与Flux.1的表现相当。

然而,对于想要免费测试的高级用户来说,这可能不是最佳选择。Ideogram 2.0的免费版本每日限制为20张图像(四张图像的五批次),付费计划从每月8美元起,还有一个每月20美元的无限慢速生成计划。然而,它仍然与MidJourney竞争,后者要求其最低档每月收费10美元,无限慢速生成每月收费30美元。

Ideogram的产品定位为MidJourney的更具可访问性的替代品,因为该模型的自然语言处理能力可以实现更直观、更流畅的提示体验,类似于ChatGPT与Dall-E 3提供的体验,与MidJourney依赖传统的“SDXL”提示风格并具有特定关键词和命令的方式形成对比。

如果金钱不是问题,用户可能希望在输出质量上评估功能,因为这两种模型都非常有竞争力。MidJourney提供了一个非常强大的个性化功能,让用户可以创建自己的风格。它还有一个相当强大的图像编辑器,可以让用户以相当高的控制水平调整生成的图像。

相比之下,Ideogram 2.0为用户提供了许多对生成的控制,而无需依赖提示工程或额外工具,如风格转移、LoRAs或IPAdapter。调色板选项和预设可能是获得个性化结果的好方法,特别是对于新用户来说。

Ryan Ozawa编辑。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接