Anthropic a lancé leur modèle Claude 2 avec des améliorations significatives en codage, mathématiques et raisonnement par rapport aux modèles précédents.

Anthropic a lancé le modèle Claude 2 avec des améliorations significatives.

Anthropic a lancé son nouveau modèle appelé Claude 2, vantant des performances améliorées, des réponses plus longues et une accessibilité via une API et un site web bêta public. Les utilisateurs ont salué les capacités conversationnelles de Claude, ses explications claires, sa réduction de la probabilité de générer des sorties nuisibles et sa mémoire améliorée par rapport aux modèles précédents. Notamment, Claude 2 a présenté de meilleures performances dans les tâches de codage, de mathématiques et de raisonnement. Par exemple, il a obtenu un score de 76,5% à la section à choix multiples de l’examen du barreau, dépassant le score de son prédécesseur de 73,0%. Par rapport aux étudiants universitaires postulant à une école supérieure, Claude 2 s’est classé au-dessus du 90e percentile aux examens de lecture et d’écriture du GRE et a obtenu des résultats similaires à ceux du candidat médian en raisonnement quantitatif.

Les développeurs envisagent Claude comme un collègue virtuel amical et enthousiaste ou un assistant personnel capable de comprendre les instructions en langage naturel pour aider dans diverses tâches. L’API Claude 2 pour les entreprises est disponible au même prix que son prédécesseur, Claude 1.3. De plus, les particuliers aux États-Unis et au Royaume-Uni peuvent déjà utiliser l’expérience de chat bêta.

Des efforts ont été déployés pour améliorer les performances et la sécurité des modèles Claude. Les longueurs d’entrée et de sortie ont été augmentées, permettant aux utilisateurs d’entrer jusqu’à 100K jetons par invitation. Cela permet à Claude de traiter une documentation technique étendue et des livres et de générer des documents plus longs tels que des mémos, des lettres et des histoires comprenant des milliers de jetons.

Le dernier modèle, Claude 2, a considérablement amélioré ses compétences en codage, obtenant un score de 71,2% au test de codage Python Codex HumanEval par rapport au score de 56,0% de Claude 1.3. Dans le jeu de problèmes mathématiques GSM8k, Claude 2 a obtenu un score de 88,0% contre 85,2% pour son prédécesseur. Les plans futurs comprennent le déploiement progressif des améliorations de capacité pour Claude 2.

Des mesures de sécurité ont été une priorité de développement, visant à réduire les sorties nuisibles et offensantes. Une évaluation interne de red-teaming évalue les modèles Claude par rapport à un ensemble représentatif de sollicitations nuisibles, combinant des tests automatisés avec des vérifications manuelles. Claude 2 a montré deux fois plus d’efficacité pour fournir des réponses inoffensives par rapport à Claude 1.3. Bien qu’aucun modèle ne soit complètement immunisé contre les sorties indésirables, des techniques de sécurité et un red-teaming approfondi ont été utilisés pour améliorer la qualité globale des sorties.

Plusieurs entreprises ont déjà adopté l’API Claude, avec des partenaires tels que Jasper et Sourcegraph tirant parti des capacités de Claude 2. Jasper, une plateforme d’IA générative, a souligné la compatibilité de Claude 2 avec des modèles de pointe pour des cas d’utilisation divers, en mettant l’accent sur sa force dans les applications longues et à faible latence. Sourcegraph, une plateforme d’IA de code, intègre la capacité de raisonnement améliorée de Claude 2 dans son assistant de codage, Cody. Cody peut fournir des réponses plus précises aux requêtes des utilisateurs tout en transmettant un contexte de code accru grâce à des fenêtres de contexte pouvant aller jusqu’à 100K. La formation de Claude 2 sur des données récentes dote Cody de connaissances sur les nouveaux frameworks et bibliothèques, permettant aux développeurs de concevoir des logiciels de manière plus efficace.

En fin de compte, la sortie de Claude 2 signifie des avancées en termes de performances, de sécurité et de polyvalence, permettant aux utilisateurs de tirer parti de ses capacités dans divers domaines.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Utiliser l'IA sur votre PC ? Les utilisateurs de GeForce sont en avance sur la courbe

Les jours où l’IA était le domaine de vastes centres de données ou de chercheurs d’élite sont révolus. Po...

AI

Du jeu vidéo à l'IA le rôle pivot de Nvidia dans la révolution de l'IA

Nvidia vaut désormais plus que Facebook, Tesla et Netflix. Selon Reuters, la valeur de l'action a triplé au cours des...

AI

Du jeu vidéo à l'IA Le rôle central de Nvidia dans la révolution de l'IA

Nvidia vaut maintenant plus que Facebook, Tesla et Netflix. Selon Reuters, la valeur de l'action a triplé au cours de...

AI

Xbox PC Game Pass arrive sur GeForce NOW, avec 25 nouveaux jeux

Dans le cadre de la collaboration entre NVIDIA et Microsoft visant à offrir plus de choix aux joueurs, une nouvelle i...

AI

Voici l'offre Les jeux de la vente d'été de Steam en streaming sur GeForce NOW

Le jeudi GFN arrive avec la douce Steam Summer Sale – avec des centaines de jeux PC jouables sur GeForce NOW di...

AI

GeForce NOW devient sauvage, avec 'Party Animals' en tête des 24 nouveaux jeux en septembre

Tout comme ça, l’été se termine en septembre, et certains des jeux les plus attendus de l’année, comme l&...