Redwood AI a été ajusté pour permettre à NEO de dribbler de manière autonome un ballon de football en utilisant le contrôleur RL.
1X annonce son dernier contrôleur d'apprentissage par renforcement (RL), qui débloque la mobilité intégrale de NEO pour les environnements domestiques, permettant à Redwood AI (le modèle d'IA interne de 1X) d'interagir avec le monde physique de manière plus naturelle et plus large. Le contrôleur unifié prend en charge la marche dans toutes les directions, s'asseoir, se tenir debout, s'agenouiller, s'allonger, se lever et monter des escaliers en utilisant la vision stéréo RGB - ce qui est essentiel pour naviguer dans de véritables maisons. Le contrôleur fournit une "interface d'action" à travers laquelle la téléopération ou Redwood AI peut interagir de manière sûre et riche en contacts avec le monde physique. Les contrôleurs de marche traditionnels s'appuient souvent sur des "récompenses de modelage" faites à la main pour produire des foulées semblables à celles des humains, ce qui est chronophage et ne s'adapte pas bien aux tâches ou aux directions de mouvement. Pour y remédier, l'équipe a utilisé des données de capture de mouvement pour guider le processus d'apprentissage. Le système RL est entraîné à suivre des trajectoires de référence cinématiques dérivées du mouvement humain naturel tout en maintenant l'équilibre et le rythme en temps réel. Pour améliorer l'utilité générale, le contrôleur va au-delà de la simple répétition de trajectoire en introduisant un design en deux parties : ⦿ Un planificateur cinématique de haut niveau génère des objectifs de mouvement fluides et semblables à ceux des humains à partir de simples commandes d'entrée (par exemple, direction du joystick). ⦿ Un contrôleur RL de bas niveau suit ces trajectoires avec une stabilité dynamique. Cette structure permet des transitions fluides entre les comportements et résout le défi de contrôler un mouvement de haute dimension à partir d'une entrée utilisateur grossière.
Afficher l’original
524
61,88 k
Le contenu de cette page est fourni par des tiers. Sauf indication contraire, OKX n’est pas l’auteur du ou des articles cités et ne revendique aucun droit d’auteur sur le contenu. Le contenu est fourni à titre d’information uniquement et ne représente pas les opinions d’OKX. Il ne s’agit pas d’une approbation de quelque nature que ce soit et ne doit pas être considéré comme un conseil en investissement ou une sollicitation d’achat ou de vente d’actifs numériques. Dans la mesure où l’IA générative est utilisée pour fournir des résumés ou d’autres informations, ce contenu généré par IA peut être inexact ou incohérent. Veuillez lire l’article associé pour obtenir davantage de détails et d’informations. OKX n’est pas responsable du contenu hébergé sur des sites tiers. La détention d’actifs numériques, y compris les stablecoins et les NFT, implique un niveau de risque élevé et leur valeur peut considérablement fluctuer. Examinez soigneusement votre situation financière pour déterminer si le trading ou la détention d’actifs numériques vous convient.