DeepSeek 算力卡脖子,高校 AI 研究遇瓶颈?

CN
5小时前
华为联合15校给出最强解法。

文章来源:新智元

图片来源:由无界AI生成

全美TOP 5高校的机器学习博士,实验室却连一块能够提供大量算力的GPU都没有?

2024年中旬,一位网友在reddit上发的帖子,立刻引发了社区大讨论——

年底,Nature的一篇报道更是揭露了学术界在GPU获取上面临的严峻挑战——研究者竟然需要排队申请学校GPU集群的使用时间。

同样,在我国高校的实验室内,GPU严重匮乏的问题也很普遍。甚至还曾曝出过大学要求学生自备算力上课这样十分离谱的新闻。

可见,「算力」这个瓶颈,甚至让AI本身都变成了一件门槛极高的课程。

AI人才紧缺,且算力不足

与此同时,大模型、具身智能等前沿技术的迅猛发展,则正在全球范围内引发人才短缺。

根据牛津大学教授的计算,在美国,要求具备AI技能的工作岗位的比例增加了5倍。

放眼全球,技术人工智能(Tech-AI)的工作岗位增长了9倍,广义人工智能(Broad-AI)的工作岗位增长了11.3倍。

在这一时期内,亚洲的增长尤为显著。

虽然世界各地的大学都在试图帮助学生掌握关键的AI性能,但正如前文所说,算力如今已经成为了一种「奢侈品」。

为了弥合这一差距,企业与高校的合作便成了一个重要手段。

鲲鹏昇腾科教创新孵化中心,开启高校科研布局

好在,为了在我国高校培养起同样的创新体系,华为已经开始布局了!

现在,华为已经和北大、清华、上交、浙大、中科大这5所顶尖高校,共同签订了「鲲鹏昇腾科教创新卓越中心」的合作。

此外,华为也同步推进和复旦大学、哈尔滨工业大学、华中科技大学、西安交通大学、南京大学、北京航空航天大学、北京理工大学、电子科技大学、东南大学、北京邮电大学等10所高校,开展了「鲲鹏昇腾科教创新孵化中心」的合作。

卓越中心和孵化中心的成立,是产教融合的典范:

  • 通过引入昇腾生态,弥补了高校的算力短缺,极大促进了更多科研成果的迸发;

  • 通过改革课程体系,以科研课题、产业课题、竞赛课题驱动,来培养计算产业的顶尖人才;

  • 通过攻坚体系架构、计算加速能力、算法能力、系统能力,力争孕育世界级的创新成果;

  • 通过打造诸多「AI+X」交叉学科,引领智能化的生态发展。

为AI科研构建完全自主的国产算力

如今,AI for Science的意义,已经不言自明。

根据谷歌DeepMind的最新调查,每三位博士后研究员中就有一位使用大语言模型来协助完成文献综述、编程和文章撰写等工作。

而今年的诺贝尔物理学奖和化学奖,更是都颁发给了AI领域的研究人员。

可以看到,在AI赋能科研的过程中,GPU凭借着在这些对高性能计算有需求的领域里出色的性能,以及针对 LLM 训练和推理的强大能力,成为了弥足珍贵的「黄金」,遭到了微软、xAI、OpenAI等各大公司的疯抢。

然而,美国针对GPU的封锁,让我国在AI和科研领域的进展举步维艰。

为了跨越这道鸿沟,我们必须构建起自主完整的生态体系并将其发展壮大。

在算力层面,华为昇腾系列AI处理器承担起了重塑我国竞争力的重任。

而在算力之上,我们还需要有一个自研的计算框架去适配,以便充分发挥出NPU/AI处理器的优势。

众所周知,专为英伟达GPU而设计的CUDA架构,在AI和数据科学领域较为常见。

在国内真正与之抗衡的,实现替代的就只有CANN了。

作为华为针对AI场景推出的异构计算架构,CANN对上支持PyTorch、TensorFlow以及昇思MindSpore等业界主流AI框架,对下使能昇腾AI处理器,是提升昇腾AI处理器计算效率的关键平台。。

正因如此,CANN天生就在技术上拥有诸多优势。其中最为关键的,是对AI计算更深入的软硬结合优化以及更加开放的软件栈:

  • 首先,它可以支持多种AI框架,包括自家的昇思MindSpore,以及第三方的PyTorch、TensorFlow等;

  • 其次,它针对多样化应用场景,提供了多层次编程接口,支持用户快速构建基于昇腾平台的AI应用和业务;

  • 而且,它还提供了模型迁移工具,方便开发者将项目快速迁移到昇腾平台。

目前,CANN已经初步构建起了自己的生态系统。在技术层面,CANN囊括了大量的应用、工具、库,拥有完善的技术生态,给用户提供了一站式的开发体验。同时基于昇腾技术底座的开发者队伍也逐步壮大,为未来的技术应用和创新埋下了沃土。

在异构计算架构CANN之上,我们还需要AI模型搭建的深度学习框架。

几乎所有的AI开发者,都需要用深度学习框架,而且几乎所有DL算法和应用,也都要通过深度学习框架去实现。

如今市面上已有熟知的谷歌TensorFlow,以及Meta的PyTorch等主流框架,并且形成了巨大的生态。

迈入大模型训练的时代,深度学习框架更需要在面对数千台计算机规模时,进行有效训练。

2020年3月正式开源的全场景深度学习框架——华为昇思MindSpore,弥补了国内在这一领域的空缺,实现了真正的自主可控。

MindSpore具备云边端全场景部署、原生支持大模型训练、支持AI+科学计算等关键特性,构建了全场景协同且全流程极简的原生开发环境,加速了国内科研创新和产业应用。

特别之处在于,作为昇腾AI处理器的「最佳搭档」,MindSpore支持「端、边、云」全场景,可以实现统一架构,一次训练,多处部署。

从大到地球系统模拟、自动驾驶,小到蛋白质结构预测,统统都可以通过昇思MindSpore实现。

深度学习开源框架,只有广泛的开发者生态,才能促进它的完善,释放出更大价值。

研究机构Omdia于2023年发布的《中国人工智能框架市场调研报告》显示,MindSpore已经冲进AI框架使用率的第一梯队,仅次于TensorFlow。

此外,千行百业的推理应用,才是释放AI价值的关键。在GenAI加速发展过程中,不论是高校,还是企业对加速推理速度高需求亟待解决。

例如高性能优化编译器TensorRT,就是提升大模型推理性能的得力工具。借助量化和稀疏性,它能够降低模型的复杂性,进而高效地优化深度学习模型的推理速度。但问题在于,它仅支持英伟达的GPU。

如上同理,我们既有了计算架构、深度学习框架,也就会有与之相配套的推理引擎——华为昇腾MindIE。

MindIE是一款全场景AI推理加速引擎,集成了业界最先进的推理加速技术,并继承了开源PyTorch的特性。

其设计兼顾了灵活性和实用性,可无缝对接多种主流AI框架,同时支持不同类型的昇腾AI处理器,为用户提供多层次编程接口。

通过全栈联合优化、分层开放AI能力的方式,MindIE能够释放昇腾硬件的极致算力,为用户提供高效、快速的深度学习推理解决方案,解决模型推理和应用开发中技术难度大、开发步骤多的问题,提升模型吞吐性能,缩短应用上线时间,使能百模千态,满足多元化的AI业务需求。

可以看到,CANN、MindSpore、MindIE等自主创新技术,不仅填补了国产算力短板,更在模型训练、框架易用性、推理性能等方面实现跨越式突破,甚至直接对标国外的先进技术栈。

构建世界级的孵化中心

除了技术上具备优势以外,可以说,在未来几十年内,使用昇腾算力也更加符合国情需要。

只有国产自研算力,才能摆脱风云变幻的外部环境影响,保证科研底座的稳定性。

现在,平台搭好了,怎样让高校的老师和学生们学会使用呢?

从去年9月6号开始,华为已陆续在北大、上交、浙大、中科大四大高校举办了第一期昇腾AI专场特训营。在几百名报名参与的学生中,硕博生占比90%,课程涵盖了昇腾领域CANN、MindSpore、MindIE、MindSpeed、HPC、鲲鹏开发工具等多方面的课程。

在特训营中,学生们不仅能详细了解核心技术,还有动手实践的机会。这样的安排非常符合学生对于新知识的吸收特点,由浅入深,循序渐进。

比如在上交场,第一天的课程会以迁移为主题,让学生了解昇腾AI基础软硬件解决方案、Pytorch模型昇腾原生开发案例实践、MindIE推理解决方案特性及迁移案例等内容。

第二天的课程则会以优化为主题,包括昇腾异构计算架构CANN、Ascend C算子开发、大模型长序列推理优化实操等。

迁移和优化课程的设置,可谓计之深远。

要知道,现在许多高校的实操课程,基本都是基于CUDA/X86设置的,但在制裁的影响之下,算力不足这一问题愈发显著。此时,如果掌握了迁移的方法,就可以将项目放到昇腾的平台上,让学术持续运转下去。

掌握了基本知识后,学生们就可以在实践案例部分中亲自动手了。华为的专家会手把手指导学生们,让他们在大模型量化、推理、Codelabs代码实现展开等过程中,学习昇腾技术栈,体验大模型推理全流程。

经过实操后,学生们会通过亲身体验对于昇腾生态有更多的了解,为之后技术领域的工作打下坚实的基础。

上交的第一期特训营,学生们正在动手实操

除了课程之外,华为还将面向高校开发者举办算子挑战赛,挖掘算子开发精英。

比赛鼓励开发者基于昇腾算力资源、CANN的基础能力进行深度创新与实践,加速AI与行业融合,促进开发者能力提升。

此外,孵化中心对于学术成果也十分重视。

基于鲲鹏或昇腾计算关键技术与工具进行学术研究的学生,还可以申报研究生奖学金。在此期间,如果论文发表在了国际顶会和国内顶刊上,也会有相应的奖励。

同时,华为还联合了鲲鹏&昇腾生态伙伴,发起了优才计划。

该计划让在校生从理论走向实践,走进企业的真实工作场景,同时帮助优秀学生提前与企业对接。

现在,优才计划已经在15个城市联合了200多家企业,提供了2000多个技术岗位,让一万多名高校学生应聘到了岗位。

总的来说,通过这些教学实践和激励计划,可以大大增加学生的参与热情。不仅能他们提升学术经验、做出科研成果,也会让经历和背景更加亮眼,从而获得就业市场上的加分,更容易获得国内外顶尖公司的青睐。

那么,在掌握了最新的技术及其运用之后,如何在AI日新月异的今天,培育出真正具有突破性的科研成果呢?

自从Sora掀起了2024年文生视频的AI热浪,文生视频大模型就在不断涌现。北大和兔展的开源文生视频项目Open-Sora Plan,就曾在业内引起震动。

其实早在Sora面世时,团队就已经在筹备开源版Sora了,然而算力和数据的要求达不到,项目一度搁置。好在,北大与华为联手成立鲲鹏昇腾科教创新卓越中心,让团队迅速得到算力支持。

原本团队使用的是英伟达A100,迁移昇腾生态后,他们有了种种惊喜的发现——

CANN的支持,能实现高效能的并行计算,显著加快大规模数据集处理速度;Ascend C接口类库,简化了AI应用的开发流程;算子加速库进一步优化了算法运行性能。

更重要的是,开放的昇腾生态,能快速实现大模型和应用的适配。

因此,团队成员虽然是从0开始接触昇腾生态,却能在很短的时间内迅速上手。

接下来的训练中,团队不断发现惊喜:比如使用torch_npu进行开发时,整体代码都可以无缝在昇腾NPU上训练和推理。

需要进行模型切分时,昇腾MindSpeed分布式加速套件提供了丰富的大模型分布式算法及并行策略。

另外,在大规模训练中,使用MindSpeed和昇腾硬件的稳定性远高于其他计算平台,可以连续一周不中断。

因此,短短一个月后,Open-Sora Plan就正式推出,获得了业内的极大认可。

Open-Sora Plan生成的这段《黑神话:悟空》画面堪比电影大片,惊艳了无数网友

另外,面向昇腾算力,东南大学还开发了一个多模式交通大模型MT-GPT。

以前交通大模型的落地十分困难,原因包括不同政府部门收集数据导致的数据孤岛问题、数据格式和标准不统一、交通数据的异质多源等等。

为了解决这些问题,团队专门构思了一个名为MT-GPT(Multimodal Transportation GenerativePre-trained Transformer)的多模式交通大模型概念框架,为多模式交通系统任务中的多方位、多颗粒度的决策问题提供数据驱动。

然而大模型的开发训练中,无疑对算力底座的要求极高。

为此,团队选择借助昇腾AI的能力,来加速交通大模型的开发、训练、调优和部署。

在开发阶段,Transformer大模型开发套件,通过多源异构知识语料与多模态特征编码,协同提升了多模态生成式问题的理解精度。

在训练阶段,昇腾MindSpeed分布式训练加速套件,为交通大模型提供了多维度、多模式、多模态的加速算法。

在调优阶段,昇腾MindStudio全流程工具链,结合了微调交通专有领域知识进行训练微调。

在部署阶段,昇腾MindIE推理引擎能够助力交通大模型的一站式推理,还能支持跨城市的迁移分析、开发、调试和调优。

总结来看可以发现,北大Open-Sora是复现Sora的迁移项目,同时作为开源项目,它也能更好地赋能全球开发者做更多场景的应用。

而东南大学的多模式交通大模型MT-GPT则体现出了昇腾算力在成果转化上的实际能力,直接赋能了城市的交通行业。

由此,就充分形成了产学研的闭环。

这些丰硕的成果也更加证明了这一点:卓越中心/孵化中心不仅可以为高校提供学术研究、科学创新的沃土,还能够培养一大批AI顶尖人才,进而孵化出引领世界的科研成果。

比如,就在北大团队研发Open-Sora Plan的过程中,袁粒老师会每天组织同学们和华为昇腾团队一起就代码和算法的开发进行头脑风暴。

在摸着石头过河的过程中,北大团队的众多学生亲自参与了一场高质量的科研实践,展现出了极高的科研创造力。

这支平均年龄23岁的的团队,也成为了推动国产AI视频应用的中坚力量。

在这个过程中,掌握了鲲鹏昇腾生态的青年学习队伍,也在不断壮大。

因此,高校基于国产算力、平台做研究,不仅获得顶尖智力的加持,也在这个过程中扩展了华为技术生态和应用。

我国应该打造怎样的创新体系?

可以看到,校企合作这种新范式,华为已正式起航。

自2019年建立起计算产品线后,华为很快就在2020年和教育部签了智能基座的合作项目,在全国头部的72所高校中,开展教学合作。

当时,鲲鹏/昇腾的一些技术知识,就已经融入了一些大学本科的必修课里。

不过,在高校的投入,是一个中长期的培育过程。只有让学生和老师优先去了解相关技术,未来若干年后才可能发挥出更大价值。

因此,华为计划每年投入10亿元,来发展鲲鹏、昇腾的原生生态与人才。这一战略的实施,将为高校人才和开发者提供更丰富的资源和更广阔的发展空间,也已经启动了10万片鲲鹏开发板和昇腾推理开发板赠送计划,以鼓励他们在教学实验、竞赛实践和科技创新中积极探索和应用鲲鹏、昇腾技术。

根据此计划,师生可以近距离地接触和试用开发板。无论是老师的教学,还是科研实验,高校师生都能在上面常识想要做的创新,激发出新的灵感。

香橙派与华为昇腾携手推出的OrangePi AIpro开发板,满足大多数AI算法原型验证、推理应用开发的需求,可广泛适用于AI边缘计算、深度视觉学习、无人机、云计算等领域,表现出了强大的实力和广泛的适用性

另一方面,我国目前的特殊处境——来自外界的技术封锁,也意味着留给我们的时间不多了。我们必须要有一套独立可控的技术栈。

原生开发,在未来已经势在必行。唯有Made in China,才最符合中国未来的大国情趋势。

随着国产化成为大势所趋,诸如鲲鹏/昇腾这类的国产技术栈,也将遍及到各个IT基础设施之上。

卓越中心和孵化中心的启航,也让业内越来越有信心。

可以预见,在几年的孵化之后,掌握国产技术底座的科研人才,将源源不断地将鲲鹏/昇腾技术路线发扬光大,孵化出足够引领世界的科研成果。

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下载

X

Telegram

Facebook

Reddit

复制链接