Eine Tasche gekauft, eine Hand gekauft ca At68FucjEFY777jQgjXn7KZtPvG7RRwTFX2EiR2cBAGS #ERRLOOM
Statusupdate zu Errloom, meiner Bibliothek / Toolkit für verstärkendes Lernen. Es entwickelt sich ganz gut und wir werden bald mit dem Training einiger Konzepte der Superintelligenz beginnen. Unten abgebildet ist der Startbildschirm von Errloom. Ein einziger Befehl nimmt ein Eingabetraining-Skript und deployt es auf die Cloud-Computing-Plattform Ihrer Wahl: zeigt eine Liste von Angeboten in einer interaktiven TUI-Liste zur Auswahl an, verbindet sich über SSH, richtet die gesamte Umgebung ein, klont Errloom, startet den vllm-Server und startet Errloom zum Trainieren – das lokale Errloom fungiert als Manager & Dashboard, öffnet WanDB in Ihrem Browser, wenn das Training beginnt, lädt Logs und Checkpoints intermittierend herunter und zeigt die Remote-Prozessverfolgung an. Keine unnötigen Jupyter- oder anderen überflüssigen Schritte. Schreiben Sie die Eingabeumgebung Ihrer Träume, feuern Sie einen Befehl ab und lassen Sie den Computer für das Mittagessen stehen. Die Hilfsnachricht zeigt, wie ich den progressiven Entwicklungsworkflow eingerichtet habe. Da ich mit null Budget und Ressourcen arbeite, muss ich jeden Cent zählen. Vergessen Sie das Mieten von Cloud-Computing nur zur Entwicklung dieser Bibliothek. Wir müssen es schaffen, den Großteil des Programmkreislaufs auf einer leistungsstarken Heimkonfiguration durchzugehen. Um dies zu erreichen, habe ich eine Reihe von Befehlen und Feature-Flags für progressive Tests entwickelt, um die gesamte Pipeline Stein für Stein aufzubauen, bis Sie 100%ige Sicherheit und Bewusstsein haben, dass GRPO und Backprop genau die Kontextfenster und Token-Masken erhalten, die Sie möchten.
Original anzeigen
10.649
1
Der Inhalt dieser Seite wird von Drittparteien bereitgestellt. Sofern nicht anders angegeben, ist OKX nicht der Autor der zitierten Artikel und erhebt keinen Anspruch auf das Urheberrecht an den Materialien. Die Inhalte dienen ausschließlich zu Informationszwecken und spiegeln nicht die Ansichten von OKX wider. Sie stellen keine Form der Empfehlung dar und sind weder als Anlageberatung noch als Aufforderung zum Kauf oder Verkauf digitaler Assets zu verstehen. Soweit generative KI zur Bereitstellung von Zusammenfassungen oder anderen Informationen eingesetzt wird, kann der dadurch erzeugte Inhalt ungenau oder widersprüchlich sein. Mehr Infos findest du im verlinkten Artikel. OKX haftet nicht für Inhalte, die auf Drittpartei-Websites gehostet werden. Digitale Assets, einschließlich Stablecoins und NFT, bergen ein hohes Risiko und können stark schwanken. Du solltest sorgfältig überlegen, ob der Handel mit oder das Halten von digitalen Assets angesichts deiner finanziellen Situation für dich geeignet ist.