Mistral AI,这家由前谷歌和Meta员工创立的法国人工智能公司,刚刚对其免费的多模态AI平台进行了全面改造——它几乎可以与OpenAI或Anthropic的付费产品相媲美,有时甚至超越它们。
这家位于巴黎的初创公司的AI工具套件现在具备网页搜索和图像生成能力,并配备了一种新的视觉模型,在关键基准测试中超越了更大的竞争对手。
该公司推出了一项更新,以分析文档,更新了大型语言模型,以及专注于编码任务的Codestral LLM。
但最令人兴奋的是它使用Flux Pro生成图像,这意味着它是目前可用的图像生成能力最强的多模态聊天机器人。新的Canvas界面使得直接内容编辑成为可能,将Mistral的聊天机器人UI命名为Le Chat,定位为企业级工作空间工具。
“Mistral表示:‘我们并不追求不惜一切代价实现AGI;我们的使命是将前沿AI放在您的手中,’”在一份声明中,该公司与竞争对手更广泛的人工通用智能雄心保持距离,这些雄心在专家中引发了担忧。
该公司在12月的融资轮中估值为20亿美元。
Pixtral Large,一个拥有1240亿参数的视觉模型,在MathVista上以69.4%的准确率和在DocVQA上以93.3%的准确率超越了GPT-4和谷歌的Gemini 1.5 Pro。它可以在128,000个标记的上下文窗口内处理多达30张高分辨率图像。
与此同时,Flux Pro在质量和推理速度方面超越了所有其他图像生成器,正如Decrypt之前报道的那样。
ChatGPT使用的DALL-E相比之下显得原始。因此,Flux与Le Chat的整合是一个受欢迎的举措。
这些功能作为“免费测试版”推出,使用户可以免费访问最新的生成AI工具。Mistral并未说明何时打算开始对其工具收费。
ChatGPT与Mistral的LeChat:它们的比较
我们对Mistral和ChatGPT的聊天机器人的免费版本进行了测试。两者之间有很多相似之处——主要体现在写作风格上——但差异足以让两者之间产生一些区别。
ChatGPT的GPT-4o仍然是语言模型的皇冠明珠,在复杂推理、创意写作和技术分析方面展现出无与伦比的细腻。
它理解上下文和维持连贯的长篇对话的能力定义了行业标准。在广泛的测试中,GPT-4o在从文学分析到高级编码挑战等任务中展现了卓越的能力。
Le Chat的Mistral Large 2.5虽然令人印象深刻,但在复杂推理任务中处于GPT-4o之下。然而,它在实际应用中表现出色,提供快速的响应和强大的日常任务执行能力。虽然该模型具备多语言能力,但其创造力往往不如GPT-4o。
网页搜索集成
Le Chat提供了一个免费的网页搜索功能——用户可以通过直接引用链接访问当前信息,类似于使用传统搜索引擎,但通过AI驱动的综合。集成感觉自然且不突兀,使得事实核查和研究工作流程显著高效。免费访问此功能代表了一个重要的价值主张。
ChatGPT的SearchGPT虽然在方法上更为复杂,但处于付费墙后。它在网页集成方面采取了独特的角度,通常提供更多的上下文分析(甚至有时会幻觉出一些响应)。Chrome插件与OpenAI的语言模型能力深度集成,尽管许多用户可能会发现Le Chat的直接方法在日常使用中更为实用。
图像生成能力
Le Chat集成Flux Pro在图像生成领域是一个重大优势。该系统生成非常详细的视觉效果,严格遵循提示,特别是在艺术风格、准确的人体解剖和复杂场景构图方面表现出色。最近的基准测试将Flux Pro置于图像生成技术的前沿,在纹理细节和空间一致性等领域表现明显更好。
ChatGPT的DALL-E 3虽然在发布时开创了先河,但现在在新模型面前显得有些过时。尽管能够生成可用的图像,但它在处理复杂提示、详细纹理和一致风格维护方面常常遇到困难——而这些正是Flux Pro展现出明显优势的领域。尤其在专业级图像生成任务中,这一差距尤为明显。
自定义AI代理
Le Chat对AI代理的民主化方法代表了可及性的重要转变。用户可以免费创建、定制和部署专门的代理,执行从数据分析到创意写作等任务。
另一方面,ChatGPT维持着一个双层系统。虽然免费用户可以访问预制的GPT,但创建自定义GPT的能力仍然是一个高级功能。
这些GPT的质量非常出色,通过自然语言提示进行配置的能力也是一个优点;但创建工具的限制和定价墙限制了个性化工作流程优化的潜力。
视觉分析能力
在我们第一次快速测试中,这似乎是平局。GPT-4V和Pixtral Large在实际应用中表现出惊人的相似能力。
两者在图表解释、图像理解、数学符号和空间意识方面都表现出色。
裁决
虽然基准数字显示LLM、视觉模型和图像生成模型之间存在轻微差异,但在日常使用案例中的实际差异并不显著。
这两个系统在从创意写作到技术图表的处理上都表现出令人印象深刻的准确性,使得在它们之间的选择更多地取决于生态系统的偏好,而非能力的差异。
在这些平台之间的选择越来越依赖于具体的使用案例。
ChatGPT在以下方面仍然优越:
- 学术写作
- 复杂的技术文档
- 细腻的创意写作
- 高级编码挑战
Le Chat在以下方面提供更好的价值:
- 视觉内容创作
- 网络研究
- 文档分析
- 日常生产力任务
- 工作流程自动化
财务影响是成败的关键:Le Chat提供约80-90%的ChatGPT Plus功能,且无需付费,这使其对预算有限的个人用户和小型企业来说越来越具吸引力。
总体而言,Mistral目前提供了更好的价值主张,他们的模型可能足以让用户取消订阅——至少在测试版期间保持不变。
编辑:Josh Quittner 和 Sebastian Sinclair
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。