Am cumpărat o geantă, am cumpărat o mână de ajutor
ca
At68FucjEFY777jQgjXn7KZtPvG7RRwTFX2EiR2cBAGS
#ERRLOOM

Actualizare de stare pe Errloom, biblioteca / setul meu de instrumente de învățare prin întărire. Se desfășoară destul de bine și vom începe în curând să antrenăm niște concepte de super-inteligență. În imaginea de mai jos este ecranul de pornire al lui Errloom.
O singură comandă preia un script de antrenament de intrare și se implementează în cloud comput la alegere: afișează o listă de oferte într-o listă interactivă TUI de ales, se conectează prin SSH, configurează întregul mediu, clonează errloom, rulează serverul vllm și lansează errloom pentru a se antrena - errloom local acționează ca manager și tablou de bord, deschide WanDB în browser când începe instruirea, Descarcă jurnalele și punctele de control intermitent și afișează urmărirea procesului de la distanță. Fără jupyter inutil sau alți pași de prisos. Scrie mediul de îndemn al visurilor tale, trage o comandă și părăsește computerul pentru prânz.
Mesajul de ajutor demonstrează cum am configurat fluxul de lucru de dezvoltare progresivă. Din moment ce operez cu buget și resurse zero, trebuie să fac ca fiecare bănuț să conteze. Uitați de închirierea cloude compute doar pentru a dezvolta această bibliotecă. Avem nevoie de el pentru a parcurge cea mai mare parte a circuitului de programe pe o configurație de acasă robustă.
Pentru a realiza acest lucru, am conceput o serie de comenzi și steaguri de caracteristici pentru testarea progresivă, construind întreaga conductă cărămidă cu cărămidă până când aveți o certitudine completă de 100% și conștientizarea faptului că GRPO și backprop vor primi exact ferestrele de context și măștile de token pe care le doriți.

10,66 K
1
Conținutul de pe această pagină este furnizat de terți. Dacă nu se menționează altfel, OKX nu este autorul articolului citat și nu revendică niciun drept intelectual pentru materiale. Conținutul este furnizat doar pentru informare și nu reprezintă opinia OKX. Nu este furnizat pentru a fi o susținere de nicio natură și nu trebuie să fie considerat un sfat de investiție sau o solicitare de a cumpăra sau vinde active digitale. În măsura în care AI-ul de generare este utilizat pentru a furniza rezumate sau alte informații, astfel de conținut generat de AI poate să fie inexact sau neconsecvent. Citiți articolul asociat pentru mai multe detalii și informații. OKX nu răspunde pentru conținutul găzduit pe pagini terțe. Deținerile de active digitale, inclusiv criptomonedele stabile și NFT-urile, prezintă un grad ridicat de risc și pot fluctua semnificativ. Trebuie să analizați cu atenție dacă tranzacționarea sau deținerea de active digitale este adecvată pentru dumneavoastră prin prisma situației dumneavoastră financiare.