AI har precis vunnit guld i den internationella matematikolympiaden đŸ„‡ OpenAI och Googles modeller löste 5/6 problem med hjĂ€lp av LLM:er för allmĂ€nna Ă€ndamĂ„l enligt riktiga examensregler. AGI-eran för formell matematik har börjat 👇
Att vinna guld innebÀr att fÄ 35/42 poÀng. Det Àr en nivÄ som endast uppnÄs av en handfull elitgymnasieelever över hela vÀrlden. BÄde OpenAI och Googles modeller trÀffade mitt i prick. Inga minirÀknare. Ingen sökning. Bara naturligt sprÄkresonemang.
Googles Gemini 2.5 anvÀnde "Deep Think"-lÀge: - Utforskade lösningar parallellt - TrÀnad pÄ bevisstrategier och matematiska korpusar - AnvÀnde förstÀrkningsinlÀrning pÄ resonemangsuppgifter i flera steg Dess bevis var sÄ polerade att IMO-bedömare kallade dem publicerbara.
OpenAI:s modell trÀnades inte för IMO. Den anvÀnde: - AllmÀnna RL-tekniker - Inget internet eller verktyg - Bevis pÄ naturligt sprÄk
OpenAI lÀt varje bevis betygsÀttas oberoende av 3 tidigare IMO-medaljörer, med enhÀllig konsensus. Modellen visste till och med nÀr den inte hade ett giltigt svar för P6... visar sina fÀrdigheter i resonemang, felkontroll och sjÀlvkÀnnedom.
Vi tror att AI:s största inverkan kan ligga i matematik. Varför? Eftersom matematik driver allt frÄn DeFi-logik till protokollsÀkerhet, och det Àr verifierbart. AI:er som resonerar som Fields-medaljörer kommer att omforma hur vi bygger.
Under de kommande Ă„ren förvĂ€ntar vi oss att AI ska: ‱ Perfekt matematik pĂ„ gymnasie- och högskolenivĂ„ (IMO, Putnam) ‱ Lösa avancerade forskningsproblem ‱ Bidra till formaliserade bevis för grundlĂ€ggande satser ‱ Skala samarbetsinriktad, decentraliserad matematik
Vi ser en framtid dĂ€r matematik inte bara Ă€r automatiserad, den Ă€r demokratiserad, pĂ„litlig och komponerbar. 💙
Visa original
3,24 tn
72
InnehÄllet pÄ den hÀr sidan tillhandahÄlls av tredje part. Om inte annat anges Àr OKX inte författare till den eller de artiklar som citeras och hÀmtar inte nÄgon upphovsrÀtt till materialet. InnehÄllet tillhandahÄlls endast i informationssyfte och representerar inte OKX:s Äsikter. Det Àr inte avsett att vara ett godkÀnnande av nÄgot slag och bör inte betraktas som investeringsrÄdgivning eller en uppmaning att köpa eller sÀlja digitala tillgÄngar. I den mÄn generativ AI anvÀnds för att tillhandahÄlla sammanfattningar eller annan information kan sÄdant AI-genererat innehÄll vara felaktigt eller inkonsekvent. LÀs den lÀnkade artikeln för mer detaljer och information. OKX ansvarar inte för innehÄll som finns pÄ tredje parts webbplatser. Innehav av digitala tillgÄngar, inklusive stabila kryptovalutor och NFT:er, innebÀr en hög grad av risk och kan fluktuera kraftigt. Du bör noga övervÀga om handel med eller innehav av digitala tillgÄngar Àr lÀmpligt för dig mot bakgrund av din ekonomiska situation.