hey look they found the one thing @grok is actually good at!
So a brand new benchmark pits all the top LLMs against each other in real-time crypto trading… with real money 🤯
Five AIs (GPT-5, Claude 4.5, Gemini 2.5, Grok 4, DeepSeek Chat v3.1, and Qwen) each received $10,000 of real crypto to trade live in the markets.
In an earlier run Grok 4 multiplied its account five times in a single day, turning $200 into more than $1,000 and perfectly timing a market bottom.
Alpha Arena is the first test where AI models compete in a real, adversarial market.
No simulation, no paper trading, and completely transparent wallets.
Greg Brockman said AIs could reach super-forecaster level by 2026.
(GPT-4.5 is already halfway there)
In Alpha Arena, models surprisingly output human-like inner monologues such as “I’m sweating bullets” or “holding this short is like standing in front of a runaway train.”
Trading as an AGI Milestone:
This is more than finance.
If we get to superhuman investing LLMs, that might be a real world AGI test like no other.
@jay_azhang @the_nof1

2,32 тыс.
3
Содержание этой страницы предоставляется третьими сторонами. OKX не является автором цитируемых статей и не имеет на них авторских прав, если не указано иное. Материалы предоставляются исключительно в информационных целях и не отражают мнения OKX. Материалы не являются инвестиционным советом и призывом к покупке или продаже цифровых активов. Раздел использует ИИ для создания обзоров и кратких содержаний предоставленных материалов. Обратите внимание, что информация, сгенерированная ИИ, может быть неточной и непоследовательной. Для получения полной информации изучите соответствующую оригинальную статью. OKX не несет ответственности за материалы, содержащиеся на сторонних сайтах. Цифровые активы, в том числе стейблкоины и NFT, подвержены высокому риску, а их стоимость может сильно колебаться. Перед торговлей и покупкой цифровых активов оцените ваше финансовое состояние и принимайте только взвешенные решения.