Sam Gao
Sam Gao|2025年01月29日 12:36
我对DeepSeek的看法(2/N):人才战略 早些时候,我遇到了专注于AIGC的DeepSeek研究人员,包括DeepSeek Janus系列(2024年11月至2025年1月)和DreamCraft3D ICLR2024等项目的贡献者,还有一位帮助优化我论文的专家(@xingchaoliu),他也是整流流的作者,这被视为Stable Diffusion 3.0/3.5@StabilityAI和Flux@bfl_ml的基础。 令我惊讶的是,DeepSeek的大多数研究人员都是年轻人——目前的博士生或三年内的毕业生——来自北京的学术精英,有3-5篇顶级出版物。 当被问及为什么梁文峰(DeepSeek首席执行官)优先考虑年轻人时,DeepSeek的一位同事分享了梁的理念: 围绕DeepSeek的谜团引发了人们的好奇心:它的秘密武器是什么?外国媒体认为,这是“年轻天才”——能够与财力雄厚的美国科技巨头竞争的人才。 在人工智能行业,雇佣经验丰富的退伍军人是常态。大多数中国人工智能初创公司更喜欢有经验的研究人员或拥有海外博士学位的研究人员。然而,DeepSeek通过优先考虑工作经验最少的年轻人才来打破这一趋势。 一位与DeepSeek合作的猎头透露: “他们避开高级工程师——3-5年的经验已经是上限。拥有8年以上经验的候选人会被直接拒绝。” 在2023年5月接受36Kr采访时,首席执行官梁文峰证实: “我们的大多数开发人员要么是应届毕业生,要么是人工智能的新手。核心技术职位主要由应届毕业生或只有1-2年经验的人担任。” DeepSeek如何评估没有传统证书的候选人? 答案在于潜力。 梁文峰曾经说过: “对于长期努力来说,经验不如基础技能、创造力和激情重要。虽然世界前50名人工智能人才可能还没有在中国,但我们致力于培养自己的人才。” 这反映了OpenAI的早期战略。2015年,Sam Altman招募了雄心勃勃的年轻研究人员,如Andrej Karpathy(斯坦福大学博士)、John Schulman(伯克利分校)和Wojciech Zaremba(纽约大学)。这些“年轻的狼”带来了GPT(亚历克·拉德福德)、DALL-E(阿迪蒂亚·拉梅什)和GPT-4o的多模式负责人Prafulla Dhariwal等突破。 从左到右: Ilya Sutskever(前首席科学家)、Greg Brockman(前总裁)、Andrej Karpathy(前技术主管)、Durk Kingma(前研究员)、John Schulman(前强化学习团队负责人)和Wojciech Zaremba(现任技术主管)。 这种“狼崽策略”已经为OpenAI带来了回报,产生了“GPT之父”Alec Radford(毕业于三级私立大学)、“DALL·E之父”Aditya Ramesh(纽约大学本科生)和GPT-4多式联运领先者、三届奥运会金牌得主Prafulla Dhariwal等关键人物。由于这些年轻的特立独行者不断突破界限,OpenAI——最初在DeepMind之外相对不为人知——已经开辟了一条生存和发展成为强国的道路,即使其最初的拯救世界计划并不完全清楚。 梁文峰认识到萨姆·奥特曼的成功战略,决定走类似的道路。与等待了七年才看到ChatGPT的OpenAI不同,梁的努力在两年多的时间里就得到了回报,这证明了“中国速度”
分享至:

熱門快訊

APP下載

X

Telegram

Facebook

Reddit

複製鏈接

熱門閱讀