Cadre d’IA guidé par l’humain promet un apprentissage plus rapide des robots dans des environnements nouveaux

Le cadre d'IA guidé par l'humain promet un apprentissage plus rapide des robots dans de nouveaux environnements.

Dans l’ère future des maisons intelligentes, se procurer un robot pour simplifier les tâches ménagères ne sera pas une rareté. Néanmoins, la frustration peut s’installer lorsque ces aides automatisées échouent à accomplir des tâches simples. C’est là qu’intervient Andi Peng, une chercheuse du département de génie électrique et d’informatique du MIT, qui, avec son équipe, trace une voie pour améliorer la courbe d’apprentissage des robots.

Peng et son équipe interdisciplinaire de chercheurs ont développé un cadre interactif homme-robot. L’élément phare de ce système est sa capacité à générer des récits contrefactuels qui identifient les changements nécessaires pour que le robot accomplisse une tâche avec succès.

Pour illustrer, lorsque le robot a du mal à reconnaître une tasse peinte de manière singulière, le système propose des situations alternatives dans lesquelles le robot aurait réussi, peut-être si la tasse était d’une couleur plus répandue. Ces explications contrefactuelles, associées aux retours humains, simplifient le processus de génération de nouvelles données pour le réglage fin du robot.

Peng explique : “Le réglage fin est le processus d’optimisation d’un modèle d’apprentissage automatique existant qui est déjà compétent dans une tâche, afin de lui permettre d’accomplir une deuxième tâche analogue.”

Un bond en termes d’efficacité et de performance

Lorsqu’il a été mis à l’épreuve, le système a montré des résultats impressionnants. Les robots formés selon cette méthode ont fait preuve d’une capacité d’apprentissage rapide, tout en réduisant l’investissement en temps de leurs enseignants humains. Si elle est mise en œuvre avec succès à plus grande échelle, cette approche innovante pourrait aider les robots à s’adapter rapidement à de nouveaux environnements, réduisant ainsi le besoin pour les utilisateurs de posséder des connaissances techniques avancées. Cette technologie pourrait être la clé pour débloquer des robots polyvalents capables d’assister efficacement les personnes âgées ou handicapées.

Peng affirme : “L’objectif final est de permettre à un robot d’apprendre et de fonctionner à un niveau abstrait similaire à celui d’un être humain.”

Révolutionner la formation des robots

Le principal obstacle à l’apprentissage robotique est le “changement de distribution”, terme utilisé pour expliquer une situation où un robot rencontre des objets ou des espaces auxquels il n’a pas été exposé pendant sa période d’apprentissage. Pour résoudre ce problème, les chercheurs ont mis en œuvre une méthode appelée “apprentissage par imitation”. Mais elle avait ses limites.

“Imaginez devoir démontrer avec 30 000 tasses pour qu’un robot puisse en prendre une. Au lieu de cela, je préfère démontrer avec une seule tasse et apprendre au robot à comprendre qu’il peut prendre une tasse de n’importe quelle couleur”, explique Peng.

En réponse à cela, le système de l’équipe identifie les attributs de l’objet qui sont essentiels pour la tâche (comme la forme d’une tasse) et ceux qui ne le sont pas (comme la couleur de la tasse). Armé de cette information, il génère des données synthétiques, modifiant les éléments visuels “non essentiels”, optimisant ainsi le processus d’apprentissage du robot.

Relier le raisonnement humain à la logique robotique

Pour évaluer l’efficacité de ce cadre, les chercheurs ont réalisé un test impliquant des utilisateurs humains. On a demandé aux participants si les explications contrefactuelles du système amélioraient leur compréhension de la performance du robot.

Peng déclare : “Nous avons constaté que les humains sont intrinsèquement doués pour cette forme de raisonnement contrefactuel. C’est cet élément contrefactuel qui nous permet de traduire le raisonnement humain en logique robotique de manière transparente.”

Au cours de multiples simulations, le robot a constamment appris plus rapidement avec leur approche, surpassant les autres techniques et nécessitant moins de démonstrations de la part des utilisateurs.

À l’avenir, l’équipe prévoit de mettre en œuvre ce cadre sur des robots réels et de travailler sur la réduction du temps de génération de données grâce à des modèles d’apprentissage automatique génératifs. Cette approche révolutionnaire a le potentiel de transformer la trajectoire d’apprentissage des robots, ouvrant la voie à un avenir où les robots coexisteront harmonieusement dans notre vie quotidienne.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Robotics

Was this article helpful?

93 out of 132 found this helpful

Une nouvelle recherche en IA de KAIST présente FLASK un cadre d’évaluation à grain fin pour les modèles de langage basé sur des ensembles de compétences

Cadre d’IA guidé par l’humain promet un apprentissage plus rapide des robots dans des environnements nouveaux

Le cadre d'IA guidé par l'humain promet un apprentissage plus rapide des robots dans de nouveaux environnements.

Un bond en termes d’efficacité et de performance

Révolutionner la formation des robots

Relier le raisonnement humain à la logique robotique

Was this article helpful?

Découvrez DifFace un nouveau modèle de diffusion d’apprentissage en profondeur pour la restauration aveugle du visage.

Une nouvelle recherche en IA de KAIST présente FLASK un cadre d’évaluation à grain fin pour les modèles de langage basé sur des ensembles de compétences

AI

Donner aux robots la capacité d'effectuer des tâches complexes Meta AI développe un modèle d'affordance visuelle en utilisant des vidéos en ligne du comportement humain.

Les chercheurs de Microsoft proposent BioViL-T un nouveau cadre auto-supervisé qui introduit des performances prédictives améliorées et une efficacité des données accrue dans les applications biomédicales.

ChatGPT se promène du côté robotique la dernière merveille mécanique de Boston Dynamics répond désormais.

Un défi d'IA que seuls les humains peuvent résoudre

L'instance Amazon EC2 DL2q pour une inférence d'IA à haute performance et économique est maintenant disponible

Déployez un point d'extrémité d'inférence ML sans serveur de grands modèles de langage en utilisant FastAPI, AWS Lambda et AWS CDK.