🦆🚀QuACK🦆🚀: новая библиотека ядра mem-bound для SOL без единой строки CUDA C++, полностью на Python благодаря CuTe-DSL. На H100 с 3TB/s она работает на 33%-50% быстрее, чем высоко оптимизированные библиотеки, такие как torch.compile от PyTorch и Liger. 🤯
С @tedzadouri и @tri_dao
Показать оригинал
66,32 тыс.
303
Содержание этой страницы предоставляется третьими сторонами. OKX не является автором цитируемых статей и не имеет на них авторских прав, если не указано иное. Материалы предоставляются исключительно в информационных целях и не отражают мнения OKX. Материалы не являются инвестиционным советом и призывом к покупке или продаже цифровых активов. Раздел использует ИИ для создания обзоров и кратких содержаний предоставленных материалов. Обратите внимание, что информация, сгенерированная ИИ, может быть неточной и непоследовательной. Для получения полной информации изучите соответствующую оригинальную статью. OKX не несет ответственности за материалы, содержащиеся на сторонних сайтах. Цифровые активы, в том числе стейблкоины и NFT, подвержены высокому риску, а их стоимость может сильно колебаться. Перед торговлей и покупкой цифровых активов оцените ваше финансовое состояние и принимайте только взвешенные решения.