人工智慧剛在國際數學奧林匹亞獲得金牌 🥇
OpenAI 和 Google 的模型在真實考試規則下,使用通用 LLM 解決了 5/6 的問題。
正式數學的 AGI 時代已經開始 👇

贏得金牌意味著得分35/42。這是全球只有少數精英高中生能達到的水平。
OpenAI和Google的模型都達到了這一標準。
不使用計算器。不進行搜索。僅僅是自然語言推理。
Google 的 Gemini 2.5 使用了 "Deep Think" 模式:
- 平行探索解決方案
- 在證明策略和數學語料庫上進行訓練
- 在多步推理任務上使用強化學習
它的證明如此精緻,以至於 IMO 評分者稱其為可發表的。
OpenAI 的模型並不是為 IMO 訓練的。
它使用了:
- 一般的強化學習技術
- 沒有互聯網或工具
- 自然語言證明
OpenAI 讓 3 位前 IMO 獲獎者獨立評分每個證明,並達成一致共識。
該模型甚至知道在 P6 上沒有有效答案... 展示了它在推理、錯誤檢查和自我意識方面的技能。
我們相信,人工智慧最大的影響可能在於數學。
為什麼?因為數學驅動著從去中心化金融邏輯到協議安全的一切,並且是可驗證的。
像菲爾茲獎得主那樣推理的人工智慧將重塑我們的建設方式。
在未來幾年,我們預期 AI 將會:
• 完美高中和大學水平的數學(IMO,普特南)
• 解決高級研究問題
• 有助於基礎定理的正式證明
• 擴展協作的去中心化數學
我們看到一個未來,數學不僅僅是自動化的,而是民主化、無信任和可組合的。💙
3,209
72
本頁面內容由第三方提供。除非另有說明,OKX 不是所引用文章的作者,也不對此類材料主張任何版權。該內容僅供參考,並不代表 OKX 觀點,不作為任何形式的認可,也不應被視為投資建議或購買或出售數字資產的招攬。在使用生成式人工智能提供摘要或其他信息的情況下,此類人工智能生成的內容可能不準確或不一致。請閱讀鏈接文章,瞭解更多詳情和信息。OKX 不對第三方網站上的內容負責。包含穩定幣、NFTs 等在內的數字資產涉及較高程度的風險,其價值可能會產生較大波動。請根據自身財務狀況,仔細考慮交易或持有數字資產是否適合您。