Cet article sur l’IA présente Lemur et Lemur Chat pour harmoniser le langage naturel et le code des agents linguistiques.

Cet article sur l'IA présente Lemur et Lemur Chat pour synchroniser le langage naturel et le code des agents linguistiques.

Dans un sens large, les agents intelligents sont des résolveurs de problèmes autonomes dotés de capacités de perception, de jugement et d’action basées sur les données recueillies dans leur environnement. Les applications récentes de cette idée ont montré des promesses dans le développement d’agents linguistiques capables d’utiliser le langage naturel pour effectuer une large gamme de tâches complexes dans divers contextes. Cela est particulièrement vrai lorsque ces agents sont construits à l’aide de grands modèles de langage (LLM). Les agents de ce type peuvent imiter la pensée et le langage humains car ils s’appuient sur l’expertise humaine sous forme de LLM. Cela permet aux gens d’être flexibles dans leur utilisation d’outils, de s’adapter à de nouvelles situations, de raisonner linguistiquement et de développer des systèmes multi-agents au fur et à mesure.

Les LLM doivent comprendre l’interaction humaine, le raisonnement et la planification et garantir une mise en contexte nécessaire pour construire correctement la base des agents linguistiques. Les capacités en langage naturel des LLM leur permettent de mimiquer étroitement la conversation humaine, la réflexion et la planification. Cependant, l’exécution basée sur l’environnement est généralement réalisée par le biais de code polyvalent ou d’API spécifiques au domaine, tels que ceux utilisés pour gérer les navigateurs Web, communiquer avec les interfaces en ligne de commande des systèmes d’exploitation et contrôler des bras robotiques.

Pour combler cette lacune, une nouvelle étude menée par l’Université de Hong Kong, le laboratoire XLang, Salesforce Research, Sea AI Lab, l’Université de Washington et le MIT CSAIL présente Lemur et Lemur-Chat, deux modèles à la pointe de la technologie, disponibles publiquement, qui ont été pré-entraînés et affinés pour atteindre une harmonie entre le texte et le code. Grâce à des étapes de pré-formation soigneusement élaborées et d’affinage de l’instruction, les chercheurs ont amélioré le modèle original Llama-2-70B. Pour garantir des capacités améliorées en matière de codage tout en conservant des performances en matière de langage naturel, ils ont construit un corpus axé sur le code basé sur The Stack, comprenant 90 milliards de jetons avec un ratio texte/code de 10:1. Ce prototype est connu sous le nom de Lemur. Pour créer le modèle de suivi des instructions, Lemur-Chat, ils l’ont d’abord pré-entraîné en utilisant environ 100 000 instances de texte et de code. Lemur et Lemur-Chat sont prouvés être les modèles open source les plus polyvalents après avoir fait l’objet d’examens approfondis sur 8 références textuelles et de codage.

De plus, cet effort vise à établir des normes d’agent pour évaluer les compétences de base des agents linguistiques dans différents contextes. L’équipe se concentre particulièrement sur leur maîtrise des outils et leur capacité à s’enraciner à la fois dans les retours environnementaux et sociaux. Ils étudient également les difficultés inhérentes aux situations partiellement visibles du monde réel, où l’agent doit agir sur la base d’informations incomplètes et effectuer des actions supplémentaires pour combler les lacunes. Les expériences montrent que Lemur-Chat obtient de meilleurs résultats dans 12 des 13 références d’agent par rapport à d’autres modèles open source. Cela illustre comment Lemur-Chat peut surpasser les modèles open source existants pour les agents linguistiques en comblant l’écart de performance entre les alternatives open source et commerciales en combinant les talents naturels et codés.

Les résultats de ces tests démontrent l’importance de combiner compétences linguistiques et informatiques dans les paramètres basés sur les agents. Les modèles tels que Llama-2-70B-Chat, qui excellent dans le traitement du langage naturel mais ont du mal avec le codage, peuvent utiliser efficacement des outils de base pour aider à la réflexion car l’espace d’action est limité et l’effort de recourir à de tels outils est faible. En revanche, l’espace d’action est généralement énorme lorsqu’il est confronté à des scénarios sophistiqués de prise de décision tels que la navigation web et domestique, et les modèles dotés de compétences élevées en codage ont un avantage lors de la construction de séquences d’actions exécutables complexes. En somme, la performance supérieure de Lemur peut être attribuée à son traitement du langage naturel et à sa supériorité en matière de programmation. Cette étude jette les bases de la création d’agents linguistiques sophistiqués capables de bien fonctionner dans une large gamme de contextes en mettant en lumière l’optimisation de la synergie entre les langages naturels et de programmation.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

LastMile AI lance AiConfig un framework de développement d'applications IA open-source, piloté par la configuration et compatible avec le contrôle de source.

Dans le paysage en constante évolution du développement d’applications d’IA, AI Config de LastMile Ai se ...

AI

Que faire après un BSc ? Découvrez les 10 meilleures options de carrière

Introduction La science est souvent une source infinie de possibilités, offrant de vastes opportunités d’études...

AI

Les chercheurs d'Apple présentent une approche révolutionnaire de l'intelligence artificielle pour la reconstruction dense en 3D à partir d'images RVB à poses dynamiques

Avec les connaissances antérieures acquises, la reconstruction en mode RVB seule avec une caméra monoculaire a réalis...

AI

Arthur dévoile Bench un outil d'IA pour trouver les meilleurs modèles de langage pour le travail

Dans les rues de NYC, une start-up d’IA émergente nommée Arthur fait sensation dans le monde de l’apprent...

AI

Un programme d'opportunité pour l'intelligence artificielle

Aujourd'hui, nous partageons un programme d'opportunités en matière d'IA pour fournir des recommandations politiques ...