Présentation de PaLM 2

Introduction to PaLM 2.

Lorsque l’on regarde en arrière les plus grandes avancées en intelligence artificielle de la dernière décennie, Google a été à l’avant-garde de tant d’entre elles. Notre travail révolutionnaire sur les modèles de base est devenu la base de l’industrie et des produits alimentés par l’IA que des milliards de personnes utilisent quotidiennement. Alors que nous continuons à faire progresser ces technologies de manière responsable, il y a un grand potentiel pour des utilisations transformationnelles dans des domaines aussi étendus que la santé et la créativité humaine.

Au cours de la dernière décennie de développement de l’IA, nous avons appris que tant de choses sont possibles lorsque l’on met à l’échelle les réseaux neuronaux – en fait, nous avons déjà vu émerger des capacités surprenantes et délicieuses à partir de modèles de plus grande taille. Mais nous avons appris grâce à notre recherche que ce n’est pas aussi simple que “plus grand, c’est mieux”, et que la créativité de la recherche est la clé pour construire de grands modèles. Les progrès plus récents dans la façon dont nous concevons et entraînons les modèles nous ont appris comment débloquer la multimodalité, l’importance d’avoir un retour d’information humain dans la boucle, et comment construire des modèles plus efficacement que jamais. Ce sont des blocs de construction puissants alors que nous continuons à faire progresser l’état de l’art en matière d’IA tout en construisant des modèles qui peuvent apporter de réels avantages aux gens dans leur vie quotidienne.

Présentation de PaLM 2

S’appuyant sur ce travail, nous présentons aujourd’hui PaLM 2, notre modèle de langage de nouvelle génération. PaLM 2 est un modèle de langage de pointe avec des capacités améliorées en matière de multilinguisme, de raisonnement et de codage.

  • Multilinguisme: PaLM 2 est plus intensément formé sur du texte multilingue, couvrant plus de 100 langues. Cela a considérablement amélioré sa capacité à comprendre, générer et traduire un texte nuancé – y compris des idiomes, des poèmes et des énigmes – dans une grande variété de langues, un problème difficile à résoudre. PaLM 2 réussit également des examens de compétence linguistique avancés au niveau “mastery”.
  • Raisonnement: Le jeu de données à large portée de PaLM 2 comprend des articles scientifiques et des pages Web contenant des expressions mathématiques. En conséquence, il démontre des capacités améliorées en matière de logique, de raisonnement de bon sens et de mathématiques.
  • Codage: PaLM 2 a été pré-entraîné sur une grande quantité de jeux de données de code source disponibles publiquement. Cela signifie qu’il excelle dans les langages de programmation populaires comme Python et JavaScript, mais peut également générer du code spécialisé dans des langages comme Prolog, Fortran et Verilog.

Une famille de modèles polyvalente

Même si PaLM 2 est plus capable, il est également plus rapide et plus efficace que les modèles précédents – et il est disponible en différentes tailles, ce qui le rend facile à déployer pour une large gamme de cas d’utilisation. Nous rendrons PaLM 2 disponible en quatre tailles, de la plus petite à la plus grande : Gecko, Otter, Bison et Unicorn. Gecko est si léger qu’il peut fonctionner sur des appareils mobiles et est suffisamment rapide pour des applications interactives de grande qualité sur l’appareil, même hors ligne. Cette polyvalence signifie que PaLM 2 peut être adapté pour prendre en charge des classes entières de produits de plus de façons, pour aider plus de gens.

Alimenter plus de 25 produits et fonctionnalités Google

Au cours de l’événement I/O d’aujourd’hui, nous avons annoncé plus de 25 nouveaux produits et fonctionnalités alimentés par PaLM 2. Cela signifie que PaLM 2 apporte les dernières capacités d’IA avancées directement dans nos produits et aux gens – y compris les consommateurs, les développeurs et les entreprises de toutes tailles dans le monde entier. Voici quelques exemples :

  • Les capacités multilingues améliorées de PaLM 2 nous permettent d’étendre Bard à de nouvelles langues, à partir d’aujourd’hui. De plus, il alimente notre mise à jour de codage récemment annoncée.
  • Les fonctionnalités de Workspace pour vous aider à écrire dans Gmail et Google Docs, et vous aider à organiser dans Google Sheets, exploitent toutes les capacités de PaLM 2 à une vitesse qui aide les gens à mieux travailler et plus rapidement.
  • Med-PaLM 2, formé par nos équipes de recherche en santé avec des connaissances médicales, peut répondre à des questions et résumer des insights à partir d’une variété de textes médicaux denses. Il atteint des résultats de pointe en matière de compétence médicale, et a été le premier grand modèle de langage à performer au niveau “expert” sur des questions de type examen de licence médicale américaine. Nous ajoutons maintenant des capacités multimodales pour synthétiser des informations telles que des radiographies et des mammographies pour améliorer un jour les résultats pour les patients. Med-PaLM 2 sera ouvert à un petit groupe de clients Cloud pour obtenir des commentaires plus tard cet été afin d’identifier des cas d’utilisation sûrs et utiles.

Format vidéo non pris en charge

  • Sec-PaLM est une version spécialisée de PaLM 2 formée sur des cas d’utilisation en matière de sécurité, et un bond en avant potentiel pour l’analyse de la cybersécurité. Disponible via Google Cloud, il utilise l’IA pour aider à analyser et expliquer le comportement de scripts potentiellement malveillants, et à détecter plus facilement quels scripts représentent réellement des menaces pour les personnes et les organisations en un temps sans précédent.
  • Depuis mars, nous avons présenté l’API PaLM à un petit groupe de développeurs. À partir d’aujourd’hui, les développeurs peuvent s’inscrire pour utiliser le modèle PaLM 2, ou les clients peuvent utiliser le modèle dans Vertex AI avec des normes de confidentialité, de sécurité et de gouvernance de niveau entreprise. PaLM 2 alimente également Duet AI pour Google Cloud, un collaborateur IA génératif conçu pour aider les utilisateurs à apprendre, construire et opérer plus rapidement que jamais auparavant.

Faire avancer l’avenir de l’IA

PaLM 2 nous montre l’impact de modèles hautement performants de différentes tailles et vitesses – et que les modèles d’IA polyvalents apportent de réels avantages à tout le monde. Cependant, tout comme nous nous engageons à mettre à disposition les outils d’IA les plus utiles et responsables aujourd’hui, nous travaillons également à créer les meilleurs modèles de base pour Google.

Nos équipes de recherche Brain et DeepMind ont réalisé de nombreux moments décisifs en matière d’IA au cours de la dernière décennie, et nous réunissons ces deux équipes de classe mondiale en une seule unité, pour continuer à accélérer notre progression. Google DeepMind, soutenu par les ressources de calcul de Google, apportera non seulement de nouvelles capacités incroyables aux produits que vous utilisez tous les jours, mais ouvrira également de manière responsable la voie à la prochaine génération de modèles d’IA.

Nous travaillons déjà sur Gemini – notre prochain modèle créé à partir de zéro pour être multimodal, hautement efficace pour les intégrations d’outils et API, et conçu pour permettre des innovations futures, telles que la mémoire et la planification. Gemini est encore en formation, mais il présente déjà des capacités multimodales jamais vues auparavant dans les modèles précédents. Une fois affiné et rigoureusement testé pour la sécurité, Gemini sera disponible dans différentes tailles et capacités, tout comme PaLM 2, pour s’assurer qu’il peut être déployé dans différents produits, applications et appareils pour le bénéfice de tous.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Créature 3D câline prend vie dans une collaboration père-fils cette semaine 'Dans le studio NVIDIA

Note de l’éditeur : Cet article fait partie de notre série hebdomadaire In the NVIDIA Studio, qui met en valeur...

AI

Multiplicateur d'effets visuels Wylie Co. mise tout sur le rendu GPU pour un retour sur investissement de 24x

Les studios d’effets visuels ont depuis longtemps compté sur des fermes de rendu – de vastes quantités de...

AI

Qu'est-ce que la photogrammétrie ?

Grâce aux “vues de rue”, les outils de cartographie modernes peuvent être utilisés pour repérer un restau...

AI

Édition étendue NVIDIA étend Maxine pour le montage vidéo, présente la recherche sur la visioconférence virtuelle 3D

Les professionnels, les équipes, les créateurs et d’autres peuvent exploiter la puissance de l’IA pour cr...

AI

Shutterstock apporte l'IA générative aux arrière-plans de scènes 3D avec NVIDIA Picasso

Imaginez ceci : les créateurs peuvent rapidement créer et personnaliser des arrière-plans de scènes 3D à l’aide...