OpenAI员工公开指责Grok3的基准测试结果具有误导性

PANews|2025年02月23日 03:11

据金十报道，近日，OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司，称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此，xAI的联合创始人伊戈尔・巴布什金（Igor Babushkin）则坚称公司并无不当。xAI的图表显示，Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而，OpenAI的员工很快在X平台上指出，xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。巴布什金在X平台上辩称，OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

+5

曾提及

|

APP下載

Windows

Mac

分享至：

X

Telegram

Facebook

Reddit

複製鏈接

|

分享至：

脈絡

03月23日 18:49【PulseChain指责控制虚假DAI供应的人】

03月17日 06:20【各国政府对DeFi监管态度变化】

03月11日 16:08【欧洲加密货币监管机构审查OKX与Bybit事件】

03月11日 15:55【OKX回应Bybit关于黑客清洗资金的指责】

02月26日 15:51【ByBit和SAFE的指责游戏令人失望】

02月20日 11:59【DOGE数据科学与工程主管辞职以示抗议】

02月17日 13:30【胡乐志烧毁603个ETH并捐赠1950个ETH】

02月11日 20:45【国土安全部部长指责联邦调查局泄露信息】

02月11日 14:38【第三巡回法院指责SEC实施禁令】

02月08日 22:31【Portnoy推广“JAILSTOOL”代币回应指责】

熱門快訊

|

APP下載

Windows

Mac

分享至：

X

Telegram

Facebook

Reddit

複製鏈接

APP下載

Windows

Mac

X

Telegram

Facebook

Reddit

複製鏈接

熱門閱讀