Perspective AI
Perspective AI|2025年02月18日 08:47
DeepSeek推出了NSA,代表原生稀疏注意力。这是一种让人工智能系统更快工作的新方法,尤其是在同时处理大量信息时。 NSA使用了一些聪明的技巧来加快速度:它有一种特殊的方法来挑选最重要的信息位(动态分层稀疏策略),压缩部分数据以节省空间(粗粒度令牌压缩),然后放大真正重要的细节(细粒度令牌选择)。 这一切都有助于使人工智能在当今的计算机上快速运行,而不会失去任何智能。在处理大任务、理解长文本和遵循说明方面,它与旧方法一样好,甚至更好。 有趣的是,DeepSeek选择在另一个大型人工智能模型xAI的Grok 3发布的时候宣布NSA。 这个时机可能是让更多人关注国家安全局的明智之举,因为Grok3的推出会让每个人都在谈论人工智能。 这就像在已经有大型音乐活动发生时发布一首新歌,让更多的人听到它。 注意:这只是关于公告的时间安排,并不表明哪个更好。
+5
曾提及
分享至:

脉络

热门快讯

APP下载

X

Telegram

Facebook

Reddit

复制链接

热门阅读