J'ai acheté un sac, j'ai acheté une main ca At68FucjEFY777jQgjXn7KZtPvG7RRwTFX2EiR2cBAGS #ERRLOOM
Mise à jour sur Errloom, ma bibliothèque / boîte à outils d'apprentissage par renforcement. Cela progresse plutôt bien et nous commencerons bientôt à entraîner certains concepts de super-intelligence. Ci-dessous, vous pouvez voir l'écran d'accueil d'Errloom. Une seule commande prend un script d'entraînement en entrée et le déploie sur le cloud de votre choix : elle affiche une liste d'offres dans une liste TUI interactive à choisir, se connecte via SSH, configure tout l'environnement, clone errloom, exécute le serveur vllm et lance errloom pour l'entraînement—l'errloom local agit comme un gestionnaire et un tableau de bord, ouvre WanDB dans votre navigateur lorsque l'entraînement commence, télécharge les journaux et les points de contrôle par intermittence, et affiche la trace du processus distant. Pas de jupyter inutile ou d'autres étapes superflues. Écrivez l'environnement de demande de vos rêves, lancez une commande et laissez l'ordinateur pour le déjeuner. Le message d'aide démontre comment j'ai mis en place le flux de travail de développement progressif. Comme je fonctionne avec un budget et des ressources nuls, je dois faire en sorte que chaque centime compte. Oubliez la location de cloud compute juste pour développer cette bibliothèque. Nous avons besoin de le faire passer par la plupart du circuit du programme sur une configuration domestique robuste. Pour y parvenir, j'ai conçu un certain nombre de commandes et de drapeaux de fonctionnalités pour des tests progressifs, construisant l'ensemble du pipeline brique par brique jusqu'à ce que vous ayez une certitude et une conscience à 100 % que GRPO et le backprop vont recevoir exactement les fenêtres de contexte et les masques de jetons que vous souhaitez.
Afficher l’original
10,66 k
1
Le contenu de cette page est fourni par des tiers. Sauf indication contraire, OKX n’est pas l’auteur du ou des articles cités et ne revendique aucun droit d’auteur sur le contenu. Le contenu est fourni à titre d’information uniquement et ne représente pas les opinions d’OKX. Il ne s’agit pas d’une approbation de quelque nature que ce soit et ne doit pas être considéré comme un conseil en investissement ou une sollicitation d’achat ou de vente d’actifs numériques. Dans la mesure où l’IA générative est utilisée pour fournir des résumés ou d’autres informations, ce contenu généré par IA peut être inexact ou incohérent. Veuillez lire l’article associé pour obtenir davantage de détails et d’informations. OKX n’est pas responsable du contenu hébergé sur des sites tiers. La détention d’actifs numériques, y compris les stablecoins et les NFT, implique un niveau de risque élevé et leur valeur peut considérablement fluctuer. Examinez soigneusement votre situation financière pour déterminer si le trading ou la détention d’actifs numériques vous convient.