Freepik 如何从一个图库平台转变为一个生成式 AI 强国

CN
Decrypt
关注
7小时前

十五年前,Freepik 只是另一个股票图片提供商,帮助设计师为他们的项目找到合适的视觉素材。今天,它已经变成了一个完全不同的存在——一个吸引每月超过6000万访客的生成式AI中心。

这种转变并非偶然。这是因为公司愿意重新思考其目标,并超越静态图像,迈向更大的愿景:一个完全由AI驱动的创意生态系统。

在他的客厅里,Freepik首席执行官 Joaquín Cuenca Abela 与Decrypt谈论了AI行业的现状,以及他的公司如何利用生成式AI为数字艺术家带来的机遇。

“当生成式AI出现时,我们看到可以扩展我们的使命,”他对Decrypt说。“我们不再仅限于帮助设计师使用预制内容。相反,我们可以根据他们的需求进行调整,为每个人创造独特的东西。”

这一转变取得了成功。Freepik现在是一个一站式的AI驱动图像和视频生成、放大、动画等服务的商店。Cuenca Abela简单地说:“我们只想让创作者拥有更多的控制权。”


图片:Freepik

从空白页面到AI引擎

Freepik的起点是一个简单的前提:消除盯着空白页面的挫败感。在AI出现之前,该平台提供了数百万张库存图片和模板,供创作者作为起点使用。

“创作过程最慢、最痛苦的部分就是从零开始,”Cuenca Abela说。“我们通过提供数百万张图片,帮助设计师消除了这一障碍,让他们可以开始创作。”

现在,借助生成式AI,Freepik不仅提供内容库——该公司按需创建内容。“摄影师并不是传统的Freepik用户,”Cuenca Abela说。“他们已经有了自己的图片。但现在,借助我们的放大器Magnific,他们可以以前所未有的方式增强这些图片。”

这一转变使其受众超越了平面设计师。摄影师使用它来增强、调整和放大图像。电影制作人尝试使用AI生成的视觉效果,建筑师和室内设计师以曾经耗时且昂贵的方式构建概念,而普通人则用它生成美丽的二次元角色——因为,当然,我们谈论的是AI。

不仅仅是另一个图像生成器

在拥挤的AI领域,Freepik专注于工作流程集成。大多数AI工具专注于一项功能,无论是图像生成、视频创作还是放大。Freepik将它们连接在一起,充当一个集成不同开源和闭源生成式AI工具的中心。

在其他服务中,该公司的AI套件包括:

  • 使用Mystic、Flux、Ideogram和Google Imagen等模型进行图像生成

  • 自定义LoRA训练以实现一致的角色和风格生成

  • 使用七种不同模型(包括Google的V2、Hunyuan、Luma、Kling、Hailuo和Minimax)进行视频生成

  • 用于修补、扩展、滤镜和无缝图像扩展的编辑工具

  • 音频生成,包括音乐、配音和音效

  • 向量资产的SVG转换能力。

其中一个最大的成功故事是 Magnific,Freepik的AI驱动放大器。它因能够在不扭曲图像的情况下增强细节而走红——这是连顶级AI模型也难以做到的。

然后,Mystic则是锦上添花,提供了能够与Ideogram或MirJourney等最先进模型竞争的结果。Mystic实际上是一个工作流程,使用Flux作为核心模型,并在后台进行了大量调整。

尽管如此,许多专家和爱好者 尝试过 模仿 Freepik 的秘密武器——依赖于开源模型——但结果 褒贬不一。Freepik 有一种方法可以持续提供高质量的结果,并且拥有最佳的用户界面,这正是客户所支付的。

“人们有时低估了好产品和优秀产品之间的差异,”Cuenca Abela 说。“最后的 10% 需要 90% 的努力。这就是为什么许多人尝试复制 Magnific,但始终无法做到。”

版权争议

随着 AI 生成内容的出现,随之而来的是 争议。许多艺术家认为,AI 开发者在 未经许可的情况下使用受版权保护的作品 来训练他们的模型是不公平的。Cuenca Abela 并没有否认他们的担忧,但他说他对这个问题的看法有所不同。

“如果你要求每个创作者都获得许可才能训练 AI 模型,那么这些模型根本无法存在,”他说。“这就像在推出 Google 之前要求获得索引每个网页的许可。”

他承认这种紧张关系。

“这在短期内损害了艺术家——使用了艺术家创作的东西。对于 [受影响的] 艺术家来说,这是一种深刻的不公正,”他对 Decrypt 说,承认这种进步迫使他们作为商业进行演变。“类似的事情也发生在我们身上。当 (AI) 出现时,我们的业务突然带来的价值减少了。我们不得不适应。”

尽管如此,他认为 AI 生成的图像 并不是直接复制。“传统艺术家通常抱怨的是他们的图像在未经许可的情况下被使用,这完全是事实,”他承认。“但反驳的观点是,这些模型生成的图像并不是复制品。如果一个人制作了这些图像,就不会有版权侵权的主张。”

争论的核心基本上是创造性控制与技术进步之间的权衡。Cuenca Abela 认为,社会最终会偏向于 AI 的好处——就像在类似的争论围绕 摄影 杀死绘画、数字艺术 杀死传统艺术,或 互联网搜索引擎 杀死百科全书时一样。

“作为一个社会,我们需要平衡各方并做出决定。如果训练模型需要创作者的许可,文本和图像的生成模型将无法存在。”他说。“[如果那样的话,] 社会将失去文本模型所提供的所有进步。它们可以帮助我们找到疫苗、药物;它们所能带来的科学进步是巨大的。所有这些进步都将丧失。”

Cuenca 还将 AI 视为自我表达的工具。他不区分 AI 艺术家和艺术家。

“没有区别。这是一个工具。AI 是表达你想要的东西的手段,而艺术是你内心深处的表达,是发生在你身上的事情、你的生活经历——好吧,你可以用 AI、用绘画、用照片来做到这一点……这将取决于艺术家,”他对 Decrypt 说。

“对我来说,这完全是艺术,而且是合法的。我对此没有伦理问题。”

开放模型与封闭系统

曾经有共识认为,封闭源代码是终端用户的首选选项,因为模型和技术通常更易于使用,并提供比开放选项更好的体验。然而,多年来情况发生了剧烈变化。

Stable Diffusion 革新了 AI 艺术,Llama 是将本地文本生成带给大众的关键,而最近,DeepSeek R1 重新点燃了关于封闭源 AI 公司 对其模型收费过高 的辩论。

然而,一些用户仍然更喜欢封闭源选项。Cuenca Abela 对 AI 行业的未来有强烈的看法,特别是在开放源和专有模型之间的斗争中。

“在代码方面,最先进的开源与专有模型处于同一水平,”他说。“最大的区别在于训练时间和数据集的策划,较长的后训练阶段,稍微更好的标记等等。但在技术水平上,我看不到太大的差距。”

虽然像 MidJourney 和 Ideogram 这样的专有模型获得了更多的精细化,Cuenca 看到开源替代品迅速缩小了差距。他以 Flux 为例:“它可能在最好的封闭模型后面小一步,但不是两步。而且因为它是开放的,社区会对其进行微调和构建,有时会超越封闭版本。”


Flux 的众多微调之一。图片来源:Civitai

对于 Freepik 来说,多样性和灵活性是优先考虑的。“懂得如何使用 Freepik 的人会获得比 MidJourney 更好的质量,”Cuenca Abela 说。“如果你需要照片级真实感,我们有 Google Imagen。如果你需要艺术文本生成,使用 Ideogram。如果你需要角色一致性,训练一个 LoRA。没有单一模型可以解决所有问题。”

换句话说,AI 中没有全能的工具。而根据需求选择开放和封闭源模型的多样性对于获得完美艺术作品所需的细致程度至关重要——那种真正与用户心中所想相似的作品。

Freepik 的 AI 视频赌注

最近,Freepik 加倍投入于 AI 驱动的视频工具。该公司 集成了 Google 的 Veo 2,显著提高了视频生成质量。

“在 Veo 2 之前,你需要生成 10 或 20 个视频才能得到一个有效的,”Cuenca Abela 指出。“现在,使用 Veo 2,你每隔一次就能得到一个好结果。”

但他表示,对视频艺术家来说,真正的游戏规则改变者将是即将推出的 AI 视频编辑器。用户将很快能够在 Freepik 内部完全组装完整视频,而不仅仅是生成短片。

“今天你只能制作视频剪辑——只能生成 2 秒、3 秒、8 秒的小剪辑。我们正在开发一种可以让人们在页面上编辑它们、添加音频并进行整个组合的工具,这样你就能得到你的剪辑,”Cuenca Abela 对 Decrypt 说。

“目标是让 Freepik 成为创意中心,你不需要离开平台就能完成一个项目,”他说。

AI 的未来:机遇还是担忧?

我们是否接近人工通用智能(AGI)?机器会取代我们吗?Cuenca Abela 认为 AI 的快速发展既令人兴奋又令人不安。

“[AGI] 现在感觉很接近——比几年前任何人预期的都要近,”他承认。“我们从人们将 AI 视为玩具,转变为能够思考的机器。”

关于什么构成 AGI 并没有真正 的共识,但可以广泛地将其视为一种人工智能,能够理解、学习并在基本上任何领域以人类水平或更高的水平应用知识,能够适应新问题。我们目前处于“狭义 AI”的状态,模型在某些方面表现出色,但在其他方面表现不佳。

他认为,这一转变引发了重大的生存问题。“机器可以被暂停、重启或复制。人类则不能。这些差异很重要,”他说。“这意味着我们将始终在技术旁边拥有独特的位置。”

虽然一些人担心 AI 会取代人类的创造力,Cuenca Abela 对其潜力仍持乐观态度。“我认为这将导致一种非常深刻和强烈的加速,感觉有点压倒性。我们不知道未来能实现什么。”

更为务实的是,他认为不久的将来可能会带来更多工具,帮助机器准确理解用户的需求,提供更高的准确性和更高质量的结果。而 Freepik 的新理念似乎指向这个方向,成为一个艺术家可以找到他们所需的一切,以将 AI 生成的作品转变为他们自己想象的艺术作品的中心。

“这就是我们的使命:帮助人们创造出色的设计,以表达他们想法的力量,”Cuenca Abela 说。“对我们来说,AI 只是一个工具——但人们如何与 AI 互动才是重要的。”

编辑:Andrew Hayward

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接