Ho comprato una borsa, ho comprato una mano
ca
At68FucjEFY777jQgjXn7KZtPvG7RRwTFX2EiR2cBAGS
#ERRLOOM

Aggiornamento sullo stato di Errloom, la mia libreria / toolkit di apprendimento per rinforzo. Sta procedendo piuttosto bene e presto inizieremo ad addestrare alcuni concetti di super-intelligenza. Nella foto qui sotto è mostrata la schermata principale di Errloom.
Un singolo comando prende uno script di addestramento in input e lo distribuisce sul cloud computing di tua scelta: visualizza un elenco di offerte in una lista TUI interattiva da scegliere, si connette tramite SSH, imposta l'intero ambiente, clona errloom, avvia il server vllm e lancia errloom per addestrare—errloom locale funge da manager e dashboard, apre WanDB nel tuo browser quando inizia l'addestramento, scarica i log e i checkpoint di tanto in tanto e visualizza la traccia del processo remoto. Niente jupyter non necessari o altri passaggi superflui. Scrivi l'ambiente di prompting dei tuoi sogni, lancia un comando e lascia il computer per il pranzo.
Il messaggio di aiuto dimostra come ho impostato il flusso di lavoro di sviluppo progressivo. Poiché opero con zero budget e risorse, devo far contare ogni centesimo. Dimentica di affittare cloud computing solo per sviluppare questa libreria. Abbiamo bisogno di farlo attraverso la maggior parte del circuito del programma su un robusto setup domestico.
Per raggiungere questo obiettivo, ho ideato una serie di comandi e flag di funzionalità per test progressivi, costruendo l'intera pipeline mattone dopo mattone fino a quando non hai la certezza e consapevolezza al 100% che GRPO e backprop riceveranno esattamente le finestre di contesto e le maschere di token che desideri.

10.636
1
Il contenuto di questa pagina è fornito da terze parti. Salvo diversa indicazione, OKX non è l'autore degli articoli citati e non rivendica alcun copyright sui materiali. Il contenuto è fornito solo a scopo informativo e non rappresenta le opinioni di OKX. Non intende essere un'approvazione di alcun tipo e non deve essere considerato un consiglio di investimento o una sollecitazione all'acquisto o alla vendita di asset digitali. Nella misura in cui l'IA generativa viene utilizzata per fornire riepiloghi o altre informazioni, tale contenuto generato dall'IA potrebbe essere impreciso o incoerente. Leggi l'articolo collegato per ulteriori dettagli e informazioni. OKX non è responsabile per i contenuti ospitati su siti di terze parti. Gli holding di asset digitali, tra cui stablecoin e NFT, comportano un elevato grado di rischio e possono fluttuare notevolmente. Dovresti valutare attentamente se effettuare il trading o detenere asset digitali è adatto a te alla luce della tua situazione finanziaria.