人工智慧剛在國際數學奧林匹亞獲得金牌 🥇 OpenAI 和 Google 的模型在真實考試規則下,使用通用 LLM 解決了 5/6 的問題。 正式數學的 AGI 時代已經開始 👇
贏得金牌意味著得分35/42。這是全球只有少數精英高中生能達到的水平。 OpenAI和Google的模型都達到了這一標準。 不使用計算器。不進行搜索。僅僅是自然語言推理。
Google 的 Gemini 2.5 使用了 "Deep Think" 模式: - 平行探索解決方案 - 在證明策略和數學語料庫上進行訓練 - 在多步推理任務上使用強化學習 它的證明如此精緻,以至於 IMO 評分者稱其為可發表的。
OpenAI 的模型並不是為 IMO 訓練的。 它使用了: - 一般的強化學習技術 - 沒有互聯網或工具 - 自然語言證明
OpenAI 讓 3 位前 IMO 獲獎者獨立評分每個證明,並達成一致共識。 該模型甚至知道在 P6 上沒有有效答案... 展示了它在推理、錯誤檢查和自我意識方面的技能。
我們相信,人工智慧最大的影響可能在於數學。 為什麼?因為數學驅動著從去中心化金融邏輯到協議安全的一切,並且是可驗證的。 像菲爾茲獎得主那樣推理的人工智慧將重塑我們的建設方式。
在未來幾年,我們預期 AI 將會: • 完美高中和大學水平的數學(IMO,普特南) • 解決高級研究問題 • 有助於基礎定理的正式證明 • 擴展協作的去中心化數學
我們看到一個未來,數學不僅僅是自動化的,而是民主化、無信任和可組合的。💙
查看原文
3,209
72
本頁面內容由第三方提供。除非另有說明,OKX 不是所引用文章的作者,也不對此類材料主張任何版權。該內容僅供參考,並不代表 OKX 觀點,不作為任何形式的認可,也不應被視為投資建議或購買或出售數字資產的招攬。在使用生成式人工智能提供摘要或其他信息的情況下,此類人工智能生成的內容可能不準確或不一致。請閱讀鏈接文章,瞭解更多詳情和信息。OKX 不對第三方網站上的內容負責。包含穩定幣、NFTs 等在內的數字資產涉及較高程度的風險,其價值可能會產生較大波動。請根據自身財務狀況,仔細考慮交易或持有數字資產是否適合您。