Lord Kelvin sagte es am besten: „Wenn Sie messen können, worüber Sie sprechen, und es in Zahlen ausdrücken können, wissen Sie etwas darüber; aber wenn Sie es nicht messen können, wenn Sie es nicht in Zahlen ausdrücken können, ist Ihr Wissen von dürftigem und unbefriedigendem Charakter.“ Glückwunsch an @BrendanFoody und @mercor_ai für die Bereitstellung dessen für AI-Modelle
AI hat seinen Doktortitel und ist jetzt auf dem Arbeitsmarkt.
Wir stellen den AI Productivity Index (APEX) vor, einen Maßstab, der misst, wie gut wir die wertvollsten Branchen der Welt automatisiert haben.
Die meisten Benchmarks untersuchen abstrakte Fähigkeiten. APEX bewertet die Modellleistung bei realen Ergebnissen in den Bereichen Recht, Finanzen, Beratung und Medizin.
Die Modelle, die heute am besten in der Lage sind, Arbeit zu leisten, laut APEX:
🥇 GPT 5
🥈 Grok 4
🥉 Gemini 2.5 Flash
Weitere Erkenntnisse:
- GPT 5 zeigt die stärkste Leistung in allen 4 Bereichen
- Einige günstigere Modelle übertreffen teurere Modelle desselben Anbieters (z. B. Gemini 2.5 Flash vs. Gemini 2.5 Pro)
- Das beste Open-Source-Modell, Qwen (7.), liegt insgesamt nur 2 % hinter Grok 4.
8.633
36
Der Inhalt dieser Seite wird von Drittparteien bereitgestellt. Sofern nicht anders angegeben, ist OKX nicht der Autor der zitierten Artikel und erhebt keinen Anspruch auf das Urheberrecht an den Materialien. Die Inhalte dienen ausschließlich zu Informationszwecken und spiegeln nicht die Ansichten von OKX wider. Sie stellen keine Form der Empfehlung dar und sind weder als Anlageberatung noch als Aufforderung zum Kauf oder Verkauf digitaler Assets zu verstehen. Soweit generative KI zur Bereitstellung von Zusammenfassungen oder anderen Informationen eingesetzt wird, kann der dadurch erzeugte Inhalt ungenau oder widersprüchlich sein. Mehr Infos findest du im verlinkten Artikel. OKX haftet nicht für Inhalte, die auf Drittpartei-Websites gehostet werden. Digitale Assets, einschließlich Stablecoins und NFT, bergen ein hohes Risiko und können stark schwanken. Du solltest sorgfältig überlegen, ob der Handel mit oder das Halten von digitalen Assets angesichts deiner finanziellen Situation für dich geeignet ist.