Pracownicy OpenAI publicznie oskarżają wyniki testów porównawczych najnowszego modelu AI xAI, Grok3, o wprowadzanie w błąd
Ostatnio pracownik OpenAI publicznie oskarżył firmę xAI Elona Muska o publikowanie wprowadzających w błąd wyników testów porównawczych dla najnowszego modelu AI, Grok3. W odpowiedzi Igor Babushkin, współzałożyciel xAI, zapewnił, że nie doszło do żadnych nieprawidłowości.
Wykres xAI pokazuje, że dwie wersje Grok3 - Grok3 Reasoning Beta i Grok3 mini Reasoning - przewyższyły obecnie najmocniejszy dostępny model OpenAI, o3-mini-high, w AIME 2025. Jednak pracownik OpenAI szybko zauważył na platformie X, że wykres xAI nie uwzględniał wyniku o3-mini-high w warunku "cons@64" w AIME 2025.
Na platformie X Babushkin argumentował, że OpenAI również w przeszłości publikowało podobne wprowadzające w błąd wykresy porównawcze. Pomimo że te wykresy były używane do porównywania wydajności ich własnych modeli.
Zastrzeżenie: Treść tego artykułu odzwierciedla wyłącznie opinię autora i nie reprezentuje platformy w żadnym charakterze. Niniejszy artykuł nie ma służyć jako punkt odniesienia przy podejmowaniu decyzji inwestycyjnych.
Może Ci się również spodobać
Bio Protocol wprowadza BioAgent, wtyczkę open source zbudowaną na frameworku elizaOS
Łańcuch Babylon Genesis ma zostać uruchomiony o 18:00 10 kwietnia
Dwa duże wieloryby sprzedały około 150 000 SOL w ciągu ostatnich 24 godzin
Popularne
WięcejCeny krypto
Więcej








