芯片制造商英伟达周一宣布,其Spectrum-X网络技术帮助扩展了初创公司xAI的Colossus超级计算机,现在被公认为世界上最大的AI训练集群。
位于田纳西州孟菲斯的Colossus是xAI第三代Grok大型语言模型的训练基地,这些模型旨在为X Premium订阅者提供聊天机器人功能。
Colossus在仅122天内完成,安装后19天便开始训练其第一个模型。科技亿万富翁埃隆·马斯克的初创公司xAI计划将系统的容量翻倍至200,000个GPU,英伟达在周一的声明中表示。
Colossus的核心是一个巨大的互联GPU系统,每个GPU专门处理大型数据集。当训练Grok模型时,它们需要分析大量的文本、图像和数据,以改善其响应。
被马斯克称为世界上最强大的AI训练集群,Colossus通过统一的远程直接内存访问网络连接了100,000个NVIDIA Hopper GPU。英伟达的Hopper GPU通过将工作负载分散到多个GPU上并并行处理复杂任务。
这种架构允许数据直接在节点之间移动,绕过操作系统,确保低延迟以及为广泛的AI训练任务提供最佳吞吐量。
虽然传统以太网网络常常遭受拥堵和数据包丢失,限制吞吐量至60%,但Spectrum-X在没有延迟降级的情况下实现了95%的吞吐量。
Spectrum-X允许大量GPU之间更顺畅地通信,因为传统网络在处理过多数据时可能会变得缓慢。
该技术使Grok的训练速度更快、准确性更高,这对于构建能够有效响应人类互动的AI模型至关重要。
周一的公告对英伟达的股票影响不大,股价略有下跌。截至周一,股价为141美元,公司市值为3.45万亿美元。
编辑:塞巴斯蒂安·辛克莱
免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。