Ce modèle d’IA chinois peut-il surpasser ChatGPT et Claude2? Découvrez le modèle Baichuan2-192k dévoilé par cette startup chinoise ‘Baichuan Intelligent’ avec le modèle de contexte le plus long.
Peut-il le dépasser? Découvrez Baichuan2-192k, le modèle d'IA chinois dévoilé par la startup 'Baichuan Intelligent', rivalisant avec ChatGPT et Claude2 en offrant le contexte le plus long.
Dans la course à la suprématie de l’IA, une start-up chinoise d’IA, Baichuan Intelligent, a dévoilé son dernier modèle linguistique volumineux, le Baichuan2-192K, établissant de nouveaux paramètres en matière de traitement de longs textes. Ce développement souligne la volonté de la Chine de se positionner en tant que chef de file sur la scène mondiale de l’IA.
La demande de modèles d’IA capables de traiter de longs textes, tels que des romans, des documents juridiques et des rapports financiers, est en hausse. Les modèles traditionnels ont souvent du mal avec les textes étendus, et il est nécessaire de disposer de solutions plus puissantes et plus efficaces dans divers secteurs.
Actuellement, le paysage de l’IA est dominé par des géants occidentaux comme OpenAI et Meta, qui n’ont cessé d’innover et de lancer des modèles sophistiqués. La nouvelle sortie de Baichuan Intelligent, le Baichuan2-192K, remet en question ces acteurs établis.
- Cette recherche en IA présente Atom une technique de quantification à faible nombre de bits pour un service efficace et précis des grands modèles de langage (LLM).
- Samsung présente ‘Gauss’ un nouveau modèle d’intelligence artificielle linguistique pour défier la suprématie de ChatGPT.
- Cette recherche en IA présente des méthodes révolutionnaires pour adapter les modèles linguistiques à la conception de puces.
Baichuan Intelligent, fondée par Wang Xiaochuan, fondateur de Sogou, a introduit le Baichuan2-192K, un modèle linguistique volumineux révolutionnaire. Ce modèle dispose d’une remarquable “fenêtre de contexte”, qui lui permet de traiter environ 350 000 caractères chinois en une seule fois. Par comparaison, il dépasse de 14 fois le GPT-4-32k d’OpenAI et de 4,4 fois le Claude 2 d’Anthropic soutenu par Amazon, ce qui en fait un outil puissant pour traiter de longs textes.
L’innovation clé du Baichuan2-192K réside dans sa capacité à traiter de manière transparente de longs textes. Il excelle dans la digestion et la synthèse de romans, offrant des réponses de qualité et comprenant les longs textes, comme le montrent les résultats des tests de LongEval, un projet lancé par l’Université de Californie à Berkeley et d’autres institutions américaines. La longueur exceptionnelle du contexte du modèle est obtenue grâce à des innovations techniques dans le codage positionnel dynamique et les cadres d’entraînement distribué, sans sacrifier les performances. Les capacités exceptionnelles du Baichuan2-192K en font un outil essentiel pour les entreprises des secteurs juridique, des médias et de la finance. Sa capacité à traiter et à générer des longs textes est cruciale dans ces domaines. Cependant, il est important de noter que la capacité à traiter plus d’informations ne rend pas nécessairement un modèle d’IA meilleur que ses pairs, comme le souligne une recherche conjointe de l’Université Stanford et de l’UC Berkeley.
La montée rapide de Baichuan Intelligent dans le secteur de l’IA, y compris son récent adhésion au club des licornes seulement six mois après sa création, démontre l’engagement de la Chine à repousser les limites de la technologie de l’IA. Alors que les entreprises américaines détiennent actuellement la tête en matière de matériel et de logiciels d’IA, la stratégie agressive et les innovations technologiques de Baichuan montrent l’évolution du paysage de l’IA. La présentation du Baichuan2-192K est la preuve que la course à la suprématie de l’IA est loin d’être terminée, la Chine étant déterminée à défier la domination des géants occidentaux dans ce domaine. Le Baichuan2-192K est un modèle révolutionnaire qui repousse les limites de la technologie de l’IA, en particulier dans le traitement de longs textes. Sa longueur exceptionnelle de contexte et ses réponses de qualité en font un outil précieux pour divers secteurs.
We will continue to update IPGirl; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Surveillance de la qualité des données pour vos pipelines de Big Data rendue facile
- Éviter le surajustement des données dans les modèles d’apprentissage automatique
- Comment styliser des graphiques avec Matplotlib
- Le courageux pas de Binny Bansal, milliardaire, dans les services d’IA un changement de donneur de jeu
- VoAGI News, 8 novembre 5 étapes simples pour maîtriser Python, SQL, Scikit-learn, PyTorch et Google Cloud • SQL pour la visualisation des données
- Amazon vs. Alibaba La bataille des géants de l’IA conversationnelle
- Les chercheurs de l’Université d’Oxford introduisent DynPoint un algorithme d’intelligence artificielle conçu pour faciliter la synthèse rapide de nouvelles perspectives pour les vidéos monoculaires non contraintes.