英伟达升级低成本Jetson AI计算机——以半价获得更强大的性能

CN
Decrypt
關注
4 個月前

对AI开发者和爱好者来说,好消息来了:Nvidia刚刚大幅降低了构建AI驱动的机器人、无人机、智能摄像头和其他需要“大脑”的小工具的成本。该公司的新款Jetson Orin Nano Super于周二发布,现已上市,提供比其前身更强大的处理能力,而价格仅为249美元,只有一半。

这款掌中宝大小的计算机提供了70%的性能提升,AI任务的处理能力达到每秒67万亿次操作。这是早期型号的显著提升,尤其是在驱动聊天机器人、计算机视觉和机器人应用等方面。

“Nvidia首席执行官黄仁勋在他厨房的官方视频发布中表示:“这是全新的Jetson Nano Super。几乎达到每秒70万亿次操作,功耗25瓦,价格249美元。” “它可以运行HGX所能做的一切,甚至可以运行大型语言模型(LLMs)。”

内存带宽也得到了重大升级,提升至每秒102千兆字节,比上一代Jetson快50%。这一改进意味着该设备可以处理更复杂的AI模型,并同时处理来自多达四个摄像头的数据。

该设备配备了Nvidia的Ampere架构GPU和6核ARM处理器,允许同时运行多个AI应用程序。这使得开发者能够处理更多样化的能力,例如构建能够进行环境映射、物体识别和语音命令的小型机器人模型,且功耗较低。

现有的Jetson Orin Nano用户也不会被冷落。Nvidia正在发布软件更新,以提高其旧版AI处理器的效率。

Nvidia的新款Jetson Orin Nano Super背后的数字讲述了一个有趣的故事。仅有1,024个CUDA核心,与RTX 2060的1,920个核心、RTX 3060的3,584个核心或RTX 4060的3,072个核心相比,看起来相对谦逊。但原始核心数量并不能说明全部情况。

虽然像RTX系列这样的游戏GPU消耗115到170瓦的电力,但Jetson的功耗仅为7到25瓦。这大约是RTX 4060(其中最有效率的)功耗的七分之一。

内存带宽的数字也呈现出类似的情况。Jetson的102 GB/s在RTX显卡的300+ GB/s面前可能显得不够出色,但它专门针对边缘的AI工作负载进行了优化,在那里高效的数据处理比原始吞吐量更为重要。

也就是说,真正的魔力发生在AI性能上。该设备为AI任务提供67 TOPS(每秒万亿次操作)的处理能力——这个数字很难与RTX显卡的TFLOPS直接比较,因为它们测量的是不同类型的操作。

但在实际应用中,Jetson可以处理本地AI聊天机器人、处理多个摄像头数据流和控制机器人等任务——所有这些都可以同时进行,功耗预算几乎只能驱动游戏GPU的冷却风扇,基本上与RTX 2060在成本和功耗上不相上下。

它的8GB共享内存可能看起来较少,但这意味着在运行本地AI模型(如FluxStable Diffusion)时,它比普通的RTX 2060更具能力,这些模型可能会在这些GPU上抛出“内存不足”的错误,或者将部分工作卸载到普通RAM上,从而减少推理时间——基本上是AI的思考过程。

Jetson Orin Nano Super还支持各种小型和大型语言模型,包括参数高达80亿的模型,如Llama 3.1模型。使用这些模型的量化版本时,它可以以每秒大约18-20个的速度生成令牌。虽然速度有点慢,但对于一些本地应用来说仍然足够好。尽管如此,这比上一代Jetson AI硬件模型有了改进。

Nvidia升级低成本Jetson AI计算机——以一半的价格获得更多的性能_aicoin_图1

考虑到其价格和特性,Jetson Orin Nano Super主要设计用于原型开发和小规模应用。对于需要大量计算资源的高级用户、企业或应用程序来说,该设备的能力可能会相较于价格更高、功耗更大的高端系统显得有限。

编辑:Andrew Hayward

免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。

分享至:
APP下載

X

Telegram

Facebook

Reddit

複製鏈接