Empleados de OpenAI acusan públicamente que los resultados de las pruebas de referencia del último modelo de IA de xAI, Grok3, son engañosos
Recientemente, un empleado de OpenAI acusó públicamente a la empresa xAI de Elon Musk de publicar resultados engañosos en pruebas de referencia para su último modelo de IA, Grok3. En respuesta, Igor Babushkin, cofundador de xAI, insistió en que no hubo ninguna irregularidad.
El gráfico de xAI muestra que dos versiones de Grok3 - Grok3 Reasoning Beta y Grok3 mini Reasoning - superaron al modelo actualmente más fuerte disponible de OpenAI, o3-mini-high, en AIME 2025. Sin embargo, un empleado de OpenAI señaló rápidamente en la plataforma X que el gráfico de xAI no incluía la puntuación de o3-mini-high bajo la condición "cons@64" en AIME 2025.
En la plataforma X, Babushkin argumentó que OpenAI también había publicado en el pasado gráficos de referencia engañosos similares. A pesar de que estos gráficos se utilizaban para comparar el rendimiento de sus propios modelos.
Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.
También te puede gustar
Bio Protocol lanza BioAgent, un complemento de código abierto basado en el marco elizaOS
La cadena Genesis de Babylon está programada para lanzarse a las 18:00 el 10 de abril
Dos grandes ballenas han vendido aproximadamente 150,000 SOL en las últimas 24 horas
En tendencia
MásPrecios de las criptos
Más








