Lord Kelvin sa det best: «Når du kan måle det du snakker om, og uttrykke det i tall, vet du noe om det; men når du ikke kan måle det, når du ikke kan uttrykke det i tall, er din kunnskap av et magert og utilfredsstillende slag.» Gratulerer til @BrendanFoody og @mercor_ai med å levere dette for AI-modeller
AI har sin doktorgrad og nå er den på arbeidsmarkedet.
Vi introduserer AI Productivity Index (APEX), en målestokk som måler hvor godt vi har automatisert de mest verdifulle bransjene i verden.
De fleste benchmarks studerer abstrakte evner. APEX evaluerer modellytelse på reelle leveranser på tvers av juss, finans, rådgivning og medisin.
Modellene som er mest i stand til å utføre arbeid i dag, ifølge APEX:
🥇 GPT 5
🥈 Grok 4
🥉 Gemini 2.5 blits
Andre funn:
- GPT 5 viser den sterkeste ytelsen på tvers av alle 4 domener
- Noen billigere modeller overgår dyrere modeller fra samme leverandør (f.eks.
- Den beste åpen kildekode-modellen, Qwen (7.), presterer bare 2 % bak Grok 4 totalt sett
8,63k
36
Innholdet på denne siden er levert av tredjeparter. Med mindre annet er oppgitt, er ikke OKX forfatteren av de siterte artikkelen(e) og krever ingen opphavsrett til materialet. Innholdet er kun gitt for informasjonsformål og representerer ikke synspunktene til OKX. Det er ikke ment å være en anbefaling av noe slag og bør ikke betraktes som investeringsråd eller en oppfordring om å kjøpe eller selge digitale aktiva. I den grad generativ AI brukes til å gi sammendrag eller annen informasjon, kan slikt AI-generert innhold være unøyaktig eller inkonsekvent. Vennligst les den koblede artikkelen for mer detaljer og informasjon. OKX er ikke ansvarlig for innhold som er vert på tredjeparts nettsteder. Beholdning av digitale aktiva, inkludert stablecoins og NFT-er, innebærer en høy grad av risiko og kan svinge mye. Du bør nøye vurdere om handel eller innehav av digitale aktiva passer for deg i lys av din økonomiske tilstand.