Cet article sur l’IA présente Lemur et Lemur Chat pour harmoniser le langage naturel et le code des agents linguistiques.
Cet article sur l'IA présente Lemur et Lemur Chat pour synchroniser le langage naturel et le code des agents linguistiques.
Dans un sens large, les agents intelligents sont des résolveurs de problèmes autonomes dotés de capacités de perception, de jugement et d’action basées sur les données recueillies dans leur environnement. Les applications récentes de cette idée ont montré des promesses dans le développement d’agents linguistiques capables d’utiliser le langage naturel pour effectuer une large gamme de tâches complexes dans divers contextes. Cela est particulièrement vrai lorsque ces agents sont construits à l’aide de grands modèles de langage (LLM). Les agents de ce type peuvent imiter la pensée et le langage humains car ils s’appuient sur l’expertise humaine sous forme de LLM. Cela permet aux gens d’être flexibles dans leur utilisation d’outils, de s’adapter à de nouvelles situations, de raisonner linguistiquement et de développer des systèmes multi-agents au fur et à mesure.
Les LLM doivent comprendre l’interaction humaine, le raisonnement et la planification et garantir une mise en contexte nécessaire pour construire correctement la base des agents linguistiques. Les capacités en langage naturel des LLM leur permettent de mimiquer étroitement la conversation humaine, la réflexion et la planification. Cependant, l’exécution basée sur l’environnement est généralement réalisée par le biais de code polyvalent ou d’API spécifiques au domaine, tels que ceux utilisés pour gérer les navigateurs Web, communiquer avec les interfaces en ligne de commande des systèmes d’exploitation et contrôler des bras robotiques.
Pour combler cette lacune, une nouvelle étude menée par l’Université de Hong Kong, le laboratoire XLang, Salesforce Research, Sea AI Lab, l’Université de Washington et le MIT CSAIL présente Lemur et Lemur-Chat, deux modèles à la pointe de la technologie, disponibles publiquement, qui ont été pré-entraînés et affinés pour atteindre une harmonie entre le texte et le code. Grâce à des étapes de pré-formation soigneusement élaborées et d’affinage de l’instruction, les chercheurs ont amélioré le modèle original Llama-2-70B. Pour garantir des capacités améliorées en matière de codage tout en conservant des performances en matière de langage naturel, ils ont construit un corpus axé sur le code basé sur The Stack, comprenant 90 milliards de jetons avec un ratio texte/code de 10:1. Ce prototype est connu sous le nom de Lemur. Pour créer le modèle de suivi des instructions, Lemur-Chat, ils l’ont d’abord pré-entraîné en utilisant environ 100 000 instances de texte et de code. Lemur et Lemur-Chat sont prouvés être les modèles open source les plus polyvalents après avoir fait l’objet d’examens approfondis sur 8 références textuelles et de codage.
- De zéro à héros comment AutoGen façonne le domaine de la beauté et de la mode
- Comment Veriff a réduit le temps de déploiement de 80% en utilisant les points de terminaison multi-modèles d’Amazon SageMaker
- New York City présente son plan d’action sur l’IA
De plus, cet effort vise à établir des normes d’agent pour évaluer les compétences de base des agents linguistiques dans différents contextes. L’équipe se concentre particulièrement sur leur maîtrise des outils et leur capacité à s’enraciner à la fois dans les retours environnementaux et sociaux. Ils étudient également les difficultés inhérentes aux situations partiellement visibles du monde réel, où l’agent doit agir sur la base d’informations incomplètes et effectuer des actions supplémentaires pour combler les lacunes. Les expériences montrent que Lemur-Chat obtient de meilleurs résultats dans 12 des 13 références d’agent par rapport à d’autres modèles open source. Cela illustre comment Lemur-Chat peut surpasser les modèles open source existants pour les agents linguistiques en comblant l’écart de performance entre les alternatives open source et commerciales en combinant les talents naturels et codés.
Les résultats de ces tests démontrent l’importance de combiner compétences linguistiques et informatiques dans les paramètres basés sur les agents. Les modèles tels que Llama-2-70B-Chat, qui excellent dans le traitement du langage naturel mais ont du mal avec le codage, peuvent utiliser efficacement des outils de base pour aider à la réflexion car l’espace d’action est limité et l’effort de recourir à de tels outils est faible. En revanche, l’espace d’action est généralement énorme lorsqu’il est confronté à des scénarios sophistiqués de prise de décision tels que la navigation web et domestique, et les modèles dotés de compétences élevées en codage ont un avantage lors de la construction de séquences d’actions exécutables complexes. En somme, la performance supérieure de Lemur peut être attribuée à son traitement du langage naturel et à sa supériorité en matière de programmation. Cette étude jette les bases de la création d’agents linguistiques sophistiqués capables de bien fonctionner dans une large gamme de contextes en mettant en lumière l’optimisation de la synergie entre les langages naturels et de programmation.
We will continue to update IPGirl; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Des chercheurs de CMU et de Google DeepMind présentent AlignProp une approche d’intelligence artificielle basée sur la rétropopagation directe pour affiner les modèles de diffusion texte-image pour une fonction de récompense souhaitée.
- Créez votre application d’intelligence artificielle Full-stack avec ReactPy
- L’imagerie médicale échoue sur les peaux noires. Les chercheurs l’ont résolu.
- Le projet Green Light de Google permet de recaler les feux de circulation pour réduire de 30% les arrêts.
- Les entreprises Internet signalent la plus grande opération de déni de service de tous les temps
- Exploration des technologies de travail à distance tendances et innovations
- Brillance du diamant au MIT les répéteurs quantiques révolutionnent les réseaux