Cadre d’IA guidé par l’humain promet un apprentissage plus rapide des robots dans des environnements nouveaux
Le cadre d'IA guidé par l'humain promet un apprentissage plus rapide des robots dans de nouveaux environnements.
Dans l’ère future des maisons intelligentes, se procurer un robot pour simplifier les tâches ménagères ne sera pas une rareté. Néanmoins, la frustration peut s’installer lorsque ces aides automatisées échouent à accomplir des tâches simples. C’est là qu’intervient Andi Peng, une chercheuse du département de génie électrique et d’informatique du MIT, qui, avec son équipe, trace une voie pour améliorer la courbe d’apprentissage des robots.
Peng et son équipe interdisciplinaire de chercheurs ont développé un cadre interactif homme-robot. L’élément phare de ce système est sa capacité à générer des récits contrefactuels qui identifient les changements nécessaires pour que le robot accomplisse une tâche avec succès.
Pour illustrer, lorsque le robot a du mal à reconnaître une tasse peinte de manière singulière, le système propose des situations alternatives dans lesquelles le robot aurait réussi, peut-être si la tasse était d’une couleur plus répandue. Ces explications contrefactuelles, associées aux retours humains, simplifient le processus de génération de nouvelles données pour le réglage fin du robot.
Peng explique : “Le réglage fin est le processus d’optimisation d’un modèle d’apprentissage automatique existant qui est déjà compétent dans une tâche, afin de lui permettre d’accomplir une deuxième tâche analogue.”
- Découvrez DifFace un nouveau modèle de diffusion d’apprentissage en profondeur pour la restauration aveugle du visage.
- Top Bibliothèques de Traitement d’Images en Python
- Cet article sur l’IA propose une méthode de reconnaissance faciale préservant la vie privée en utilisant la confidentialité différentielle dans le domaine de la fréquence.
Un bond en termes d’efficacité et de performance
Lorsqu’il a été mis à l’épreuve, le système a montré des résultats impressionnants. Les robots formés selon cette méthode ont fait preuve d’une capacité d’apprentissage rapide, tout en réduisant l’investissement en temps de leurs enseignants humains. Si elle est mise en œuvre avec succès à plus grande échelle, cette approche innovante pourrait aider les robots à s’adapter rapidement à de nouveaux environnements, réduisant ainsi le besoin pour les utilisateurs de posséder des connaissances techniques avancées. Cette technologie pourrait être la clé pour débloquer des robots polyvalents capables d’assister efficacement les personnes âgées ou handicapées.
Peng affirme : “L’objectif final est de permettre à un robot d’apprendre et de fonctionner à un niveau abstrait similaire à celui d’un être humain.”
Révolutionner la formation des robots
Le principal obstacle à l’apprentissage robotique est le “changement de distribution”, terme utilisé pour expliquer une situation où un robot rencontre des objets ou des espaces auxquels il n’a pas été exposé pendant sa période d’apprentissage. Pour résoudre ce problème, les chercheurs ont mis en œuvre une méthode appelée “apprentissage par imitation”. Mais elle avait ses limites.
“Imaginez devoir démontrer avec 30 000 tasses pour qu’un robot puisse en prendre une. Au lieu de cela, je préfère démontrer avec une seule tasse et apprendre au robot à comprendre qu’il peut prendre une tasse de n’importe quelle couleur”, explique Peng.
En réponse à cela, le système de l’équipe identifie les attributs de l’objet qui sont essentiels pour la tâche (comme la forme d’une tasse) et ceux qui ne le sont pas (comme la couleur de la tasse). Armé de cette information, il génère des données synthétiques, modifiant les éléments visuels “non essentiels”, optimisant ainsi le processus d’apprentissage du robot.
Relier le raisonnement humain à la logique robotique
Pour évaluer l’efficacité de ce cadre, les chercheurs ont réalisé un test impliquant des utilisateurs humains. On a demandé aux participants si les explications contrefactuelles du système amélioraient leur compréhension de la performance du robot.
Peng déclare : “Nous avons constaté que les humains sont intrinsèquement doués pour cette forme de raisonnement contrefactuel. C’est cet élément contrefactuel qui nous permet de traduire le raisonnement humain en logique robotique de manière transparente.”
Au cours de multiples simulations, le robot a constamment appris plus rapidement avec leur approche, surpassant les autres techniques et nécessitant moins de démonstrations de la part des utilisateurs.
À l’avenir, l’équipe prévoit de mettre en œuvre ce cadre sur des robots réels et de travailler sur la réduction du temps de génération de données grâce à des modèles d’apprentissage automatique génératifs. Cette approche révolutionnaire a le potentiel de transformer la trajectoire d’apprentissage des robots, ouvrant la voie à un avenir où les robots coexisteront harmonieusement dans notre vie quotidienne.
We will continue to update IPGirl; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Top Bases de données pour l’Intelligence Artificielle, l’IoT, l’Apprentissage Profond, l’Apprentissage Automatique, la Science des Données et Autres Applications Logicielles
- Les systèmes de vision par ordinateur peuvent-ils déduire votre activité musculaire à partir de vidéos ? Découvrez Muscles in Action (MIA) un nouvel ensemble de données pour apprendre à intégrer l’activité musculaire dans les représentations du mouvement humain.
- Dernières recherches en IA de Chine Introduit ‘OMMO’ Un ensemble de données et un benchmark multimodal en extérieur à grande échelle pour la synthèse de vues nouvelles et la reconstruction implicite de scènes.
- API de modération ChatGPT Contrôle d’entrée/sortie
- Salesforce AI a développé un nouvel algorithme d’édition appelé EDICT qui effectue la génération de diffusion texte-image avec un processus inversible donné n’importe quel modèle de diffusion existant.
- Les chercheurs de l’UCLA proposent PhyCV une bibliothèque Python de vision par ordinateur inspirée de la physique.
- Découvrez Baichuan-13B le modèle de langage open source chinois destiné à concurrencer OpenAI.