Comprei uma bolsa, comprei uma mão
ca
At68FucjEFY777jQgjXn7KZtPvG7RRwTFX2EiR2cBAGS
#ERRLOOM

Atualização de status sobre o Errloom, minha biblioteca / kit de ferramentas de aprendizado por reforço. Está a progredir bastante bem e em breve começaremos a treinar alguns conceitos de superinteligência. Abaixo está a tela inicial do Errloom.
Um único comando recebe um script de treinamento de entrada e implanta na computação em nuvem de sua escolha: exibe uma lista de ofertas em uma lista TUI interativa para escolher, conecta via SSH, configura todo o ambiente, clona o errloom, executa o servidor vllm e lança o errloom para treinar—o errloom local atua como gerenciador e painel, abre o WanDB no seu navegador quando o treinamento começa, baixa logs e checkpoints intermitentemente e exibe o rastreamento do processo remoto. Sem jupyter desnecessário ou outros passos supérfluos. Escreva o ambiente de prompting dos seus sonhos, execute um comando e deixe o computador para o almoço.
A mensagem de ajuda demonstra como configurei o fluxo de trabalho de desenvolvimento progressivo. Como estou operando com orçamento e recursos zero, preciso fazer cada centavo contar. Esqueça alugar computação em nuvem apenas para desenvolver esta biblioteca. Precisamos que ela percorra a maior parte do circuito do programa em uma configuração robusta em casa.
Para alcançar isso, elaborei uma série de comandos e flags de recursos para testes progressivos, construindo todo o pipeline tijolo por tijolo até que você tenha 100% de certeza e consciência de que o GRPO e o backprop vão receber exatamente as janelas de contexto e as máscaras de tokens que você deseja.

10,65 mil
1
O conteúdo apresentado nesta página é fornecido por terceiros. Salvo indicação em contrário, a OKX não é o autor dos artigos citados e não reivindica quaisquer direitos de autor nos materiais. O conteúdo é fornecido apenas para fins informativos e não representa a opinião da OKX. Não se destina a ser um endosso de qualquer tipo e não deve ser considerado conselho de investimento ou uma solicitação para comprar ou vender ativos digitais. Na medida em que a IA generativa é utilizada para fornecer resumos ou outras informações, esse mesmo conteúdo gerado por IA pode ser impreciso ou inconsistente. Leia o artigo associado para obter mais detalhes e informações. A OKX não é responsável pelo conteúdo apresentado nos sites de terceiros. As detenções de ativos digitais, incluindo criptomoedas estáveis e NFTs, envolvem um nível de risco elevado e podem sofrer grandes flutuações. Deve considerar cuidadosamente se o trading ou a detenção de ativos digitais é adequado para si à luz da sua condição financeira.