🦆🚀QuACK🦆🚀: nueva biblioteca del kernel SOL mem-bound sin una sola línea de CUDA C++ todo directamente en Python gracias a CuTe-DSL. En H100 con 3 TB/s, funciona entre un 33% y un 50% más rápido que las bibliotecas altamente optimizadas como torch.compile y Liger de PyTorch. 🤯
Con @tedzadouri y @tri_dao
Mostrar original
66.32 k
303
El contenido al que estás accediendo se ofrece por terceros. A menos que se indique lo contrario, OKX no es autor de la información y no reclama ningún derecho de autor sobre los materiales. El contenido solo se proporciona con fines informativos y no representa las opiniones de OKX. No pretende ser un respaldo de ningún tipo y no debe ser considerado como un consejo de inversión o una solicitud para comprar o vender activos digitales. En la medida en que la IA generativa se utiliza para proporcionar resúmenes u otra información, dicho contenido generado por IA puede ser inexacto o incoherente. Lee el artículo enlazado para más detalles e información. OKX no es responsable del contenido alojado en sitios de terceros. Los holdings de activos digitales, incluidos stablecoins y NFT, suponen un alto nivel de riesgo y pueden fluctuar mucho. Debes considerar cuidadosamente si el trading o holding de activos digitales es adecuado para ti según tu situación financiera.