Искусственный интеллект только что завоевал золото на Международной олимпиаде по математике 🥇 Модели OpenAI и Google решили 5 из 6 задач, используя универсальные LLM в условиях реального экзамена. Эра AGI для формальной математики началась 👇
Завоевание золота означает получение 35/42. Это уровень, достигнутый лишь небольшой группой элитных старшеклассников по всему миру. Модели как OpenAI, так и Google достигли этой отметки. Без калькуляторов. Без поиска. Только естественное языковое рассуждение.
Gemini 2.5 от Google использовал режим "Глубокого мышления": - Исследовал решения параллельно - Обучался на стратегиях доказательства и математических корпусах - Использовал обучение с подкреплением для задач многопроцессного рассуждения Его доказательства были настолько отточены, что оценщики IMO назвали их публикуемыми.
Модель OpenAI не была обучена для IMO. Она использовала: - Общие методы RL - Без интернета или инструментов - Доказательства на естественном языке
OpenAI поручила каждому доказательству независимую оценку 3 бывшими медалистами IMO, с единогласным согласием. Модель даже знала, когда у нее не было действительного ответа на P6... демонстрируя свои навыки в рассуждении, проверке ошибок и самосознании.
Мы считаем, что наибольшее влияние ИИ может заключаться в математике. Почему? Потому что математика управляет всем, от логики DeFi до безопасности протоколов, и её можно проверить. ИИ, которые рассуждают как лауреаты медали Филдса, изменят то, как мы строим.
В ближайшие годы мы ожидаем, что ИИ будет: • Совершенствовать математику на уровне средней школы и колледжа (IMO, Putnam) • Решать сложные исследовательские задачи • Способствовать формализации доказательств основных теорем • Масштабировать совместную, децентрализованную математику
Мы видим будущее, где математика не просто автоматизирована, а демократизирована, без доверия и составная. 💙
Показать оригинал
3,21 тыс.
72
Содержание этой страницы предоставляется третьими сторонами. OKX не является автором цитируемых статей и не имеет на них авторских прав, если не указано иное. Материалы предоставляются исключительно в информационных целях и не отражают мнения OKX. Материалы не являются инвестиционным советом и призывом к покупке или продаже цифровых активов. Раздел использует ИИ для создания обзоров и кратких содержаний предоставленных материалов. Обратите внимание, что информация, сгенерированная ИИ, может быть неточной и непоследовательной. Для получения полной информации изучите соответствующую оригинальную статью. OKX не несет ответственности за материалы, содержащиеся на сторонних сайтах. Цифровые активы, в том числе стейблкоины и NFT, подвержены высокому риску, а их стоимость может сильно колебаться. Перед торговлей и покупкой цифровых активов оцените ваше финансовое состояние и принимайте только взвешенные решения.