OpenAI员工公开指责xAI最新AI模型Grok3的基准测试结果具有误导性
近日,OpenAI的一名员工公开指责埃隆・马斯克旗下的xAI公司,称其发布的最新AI模型Grok3的基准测试结果具有误导性。对此,xAI的联合创始人伊戈尔・巴布什金(Igor Babushkin)则坚称公司并无不当。
xAI的图表显示,Grok3的两个版本——Grok3 Reasoning Beta和Grok3 mini Reasoning——在AIME 2025上的表现超过了OpenAI当前最强的可用模型o3-mini-high。然而,OpenAI的员工很快在X平台上指出,xAI的图表并未包含o3-mini-high在“cons@64”条件下的AIME 2025得分。
巴布什金在X平台上辩称,OpenAI过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。
0
0
免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。
PoolX:锁仓获得新代币空投
不要错过热门新币,且APR 高达 10%+
立即参与!
你也可能喜欢
英国利率掉期显示,英国央行2025年底前将降息68个基点
金色财经•2025/04/10 06:42
交易员下调对欧洲央行2025年降息的预期,现在预计降息67个基点
金色财经•2025/04/10 06:42
欧洲斯托克50指数期货现涨超7.8%,创2020年3月以来最大单日涨幅
金色财经•2025/04/10 06:09
数据:特朗普家族加密项目WLFI稳定币USD1市值已接近1亿美元
金色财经•2025/04/10 05:54
加密货币价格
更多
Bitcoin
BTC
$81,600.31
+6.62%

Ethereum
ETH
$1,587.07
+8.53%

Tether USDt
USDT
$0.9995
+0.02%

XRP
XRP
$1.99
+10.49%

BNB
BNB
$576.02
+4.03%

USDC
USDC
$1.0000
+0.00%

Solana
SOL
$113.66
+8.56%

Dogecoin
DOGE
$0.1556
+7.08%

TRON
TRX
$0.2415
+5.64%

Cardano
ADA
$0.6191
+9.89%
交易热门币种
新用户可获得价值 6200 USDT 的迎新大礼包
立即交易
立即成为交易者?新用户可获得价值 6200 USDT 的迎新大礼包
立即注册