我聊聊今天看完 #Grok3 发布会的一些思考,可以用几个字形容:喜忧参半,正掉入一个确认偏误之中(如图4)。
虽然我不是专业级AI投资选手,但应该也算业余级AI投资中的佼佼者。我讲讲为何有这种感觉,结合今天下午体验了一下午的感受。
首先可以肯定的是,这次 #Grok3 的跑分,的确吊打很多目前已知主流模型,尤其在数学,科学,编程等基准测试的评分,可以用遥遥领先来形容,具备推理能力的Grok3 Reasoning Beta更是无敌的存在,正如马斯克说的,目前地表最强大的AI模型,一点毛病没有。但我依旧表示有些失望。
为何这么说呢,从实际的情况来看。尤其是LMSYS的评测数据📊,我们可以看到,Grok3 1400分,GPT4o 1380分,Deepseek R1 1360分。其实之间差距不算太大,1%-3%左右。但从一下午玩测的体感差异来看,利用Big-Bench和CLUE做了测试,包括一些经典的汉诺塔问题,多模态识别,python写排序算法,实测效果,跟GPT4o和Deepseek 不相上下,但在python方面,速度和准确性,还略低于Deepseek。
重点来了,获得这个效果,#Grok3 代价可谓不菲,20万张GPU(据说是H100),训练时常累计2亿个GPU小时。我只能说,代价太大了,能源大大滴浪费,GPT4o只用了10分之一的代价完成了1380分,Deepseek(H800老一代GPU)只用了100分之一的代价完成了1360分。只能说钞能力真好,地主家真有钱。搞了一个大炮,打了一个蚊子的感觉。
为什么我说现在 #AI 很多走入了一个‘确认偏误’之中,认为只要增加圆的半径,就能增加面积。信仰‘规模效应’。假如 #AI 的发展,后期大家都在堆跑分,堆规模,那是对人类环境的一次大屠杀和不负责任。任何规模到一定度的时候,边际效应便是递减的。
所以说目前AI的发展面临着一个关键的‘确认偏误’:过于依赖规模效应,忽略了效率和智能核心的真正提升。随着大模型如GPT-3、GPT-4以及即将发布的Grok-3的崛起,行业普遍认为,随着参数量的增加,模型的性能必然随之增强。然而,事实是,随着模型规模的不断扩大,边际效应出现递减,性能的提升并不像预期那样成正比增长。例如,GPT-3有1750亿个参数,而GPT-4的参数量达到1.8万亿个,增长了十倍以上,但其性能提升远远没有达到十倍。这种趋势揭示了单纯增加规模和算力并不能持续地带来质的突破。
此外,数据规模的扩张也没有带来预期的性能提升。互联网几十年的数据被消耗殆尽,但AI的性能并没有随之实现几十倍或上百倍的提升。反观人类大脑,早期生物学家做过一项研究,十分迷惑。就是没有办法解释为什么人类比其他的动物要更聪明。因为人类的大脑的重量是比不过大象。而神经元的数量呢,也比不过蓝鲸。所以其实在算力这个层面上人脑根本就没有什么特别大的优势。至于说数据层面,那就更拉垮了,大部分鸟类啊,它接触的视觉数据信息,都吊打人类。但人类的核心优势是:算法。前段时间李飞飞团队用五十美金来复现deepseek的论文,也证明了一个AI模型它是否强大的核心是:思考和推理的能力上,而不是说这个模型的规模上。
所以说人类在算力和数据量上无法与大规模AI模型相比,但其智能的核心却在于算法和思维方式的高效运作。人类大脑并不依赖庞大的数据量,而是通过高度优化的算法和推理能力,灵活应对复杂的任务。人类的大脑功率仅为20-30瓦,而像GPT-4这样的模型需要消耗巨大的电力和算力,目前维持Chatgpt每天消耗超过五十万度电,相当于2万个美国家庭的用电量。而今天发布的Grok3,大概率要在Chatgpt基础上再乘以10,这将造成极高的能源成本和环境问题。
这也是DeepSeek等创新型AI模型逐渐获得关注的原因。DeepSeek的核心优势在于其MOE混合专家模式(Mixture of Experts, MOE),这类似于人类大脑的学习方法,通过强化学习的机制,使得AI能够在较低的计算成本下实现智能提升。MOE模式通过智能体的奖惩机制来调整模型权重,从而引导AI更高效地进行推理和决策,而不是单纯地通过记忆和规则学习。这种方式能够避免大模型在训练中常见的资源浪费,提升模型的学习效率。
相比之下,大型AI模型的庞大规模和复杂度虽然能在短期内提升表现,但随着规模的扩大,其性能的提升会逐渐趋于平缓,甚至出现边际效应递减的现象。以Grok3为例,尽管其显卡数量激增,但模型性能的提升却未必能够满足投入的成本。如果AI的发展依然沿着单纯依赖计算量和数据量的路径走下去,未来可能会面临资源浪费和成本难以控制的问题。
因此,未来的AI发展应当更多关注效率而非规模。通过优化算法、提高智能密度、利用强化学习等方法,AI可以在较低的计算和数据资源消耗下,提升真正的推理和判断能力。这将是AI技术从大规模推理向高效智能进化的关键所在,可能会引领整个行业进入一个新的发展阶段。值得深思🧐




免责声明:本文章仅代表作者个人观点,不代表本平台的立场和观点。本文章仅供信息分享,不构成对任何人的任何投资建议。用户与作者之间的任何争议,与本平台无关。如网页中刊载的文章或图片涉及侵权,请提供相关的权利证明和身份证明发送邮件到support@aicoin.com,本平台相关工作人员将会进行核查。