Compré una bolsa, compré una mano ca At68FucjEFY777jQgjXn7KZtPvG7RRwTFX2EiR2cBAGS #ERRLOOM
Actualización sobre Errloom, mi biblioteca / kit de herramientas de aprendizaje por refuerzo. Está avanzando bastante bien y pronto comenzaremos a entrenar algunos conceptos de superinteligencia. En la imagen de abajo se muestra la pantalla de inicio de Errloom. Un solo comando toma un script de entrenamiento de entrada y lo despliega en la computación en la nube de tu elección: muestra una lista de ofertas en una lista TUI interactiva para elegir, se conecta a través de SSH, configura todo el entorno, clona errloom, ejecuta el servidor vllm y lanza errloom para entrenar—el errloom local actúa como gestor y panel de control, abre WanDB en tu navegador cuando comienza el entrenamiento, descarga registros y puntos de control de forma intermitente y muestra el rastro del proceso remoto. Sin jupyter innecesarios ni otros pasos superfluos. Escribe el entorno de solicitud de tus sueños, ejecuta un comando y deja el ordenador para almorzar. El mensaje de ayuda demuestra cómo he configurado el flujo de trabajo de desarrollo progresivo. Dado que estoy operando con un presupuesto y recursos cero, necesito hacer que cada céntimo cuente. Olvida alquilar computación en la nube solo para desarrollar esta biblioteca. Necesitamos que funcione a través de la mayor parte del circuito del programa en una potente configuración doméstica. Para lograr esto, he ideado una serie de comandos y banderas de características para pruebas progresivas, construyendo toda la tubería ladrillo a ladrillo hasta que tengas una certeza y conciencia del 100% de que GRPO y el retroceso recibirán exactamente las ventanas de contexto y las máscaras de tokens que deseas.
Mostrar original
10,66 mil
1
El contenido de esta página lo proporcionan terceros. A menos que se indique lo contrario, OKX no es el autor de los artículos citados y no reclama ningún derecho de autor sobre los materiales. El contenido se proporciona únicamente con fines informativos y no representa las opiniones de OKX. No pretende ser un respaldo de ningún tipo y no debe ser considerado como un consejo de inversión o una solicitud para comprar o vender activos digitales. En la medida en que la IA generativa se utiliza para proporcionar resúmenes u otra información, dicho contenido generado por IA puede ser inexacto o incoherente. Lee el artículo vinculado para obtener más detalles e información. OKX no es responsable del contenido alojado en sitios de terceros. El holding de activos digitales, incluyendo stablecoins y NFT, implican un alto grado de riesgo y pueden fluctuar en gran medida. Debes considerar cuidadosamente si el trading o holding de activos digitales es adecuado para ti a la luz de tu situación financiera.