Permettez à vos utilisateurs professionnels de tirer des enseignements des documents d’entreprise en utilisant Amazon SageMaker Canvas Generative AI

Améliorez les compétences de vos professionnels en tirant des leçons des documents d'entreprise grâce à l'utilisation d'Amazon SageMaker Canvas Generative AI

Les entreprises cherchent à exploiter le potentiel de l’apprentissage automatique (ML) pour résoudre des problèmes complexes et améliorer les résultats. Jusqu’à récemment, la construction et le déploiement de modèles ML nécessitaient des compétences techniques et de codage approfondies, notamment l’ajustement des modèles ML et la maintenance des pipelines opérationnels. Depuis son introduction en 2021, Amazon SageMaker Canvas a permis aux analystes métier de construire, de déployer et d’utiliser une variété de modèles ML – y compris tabulaire, vision par ordinateur et traitement du langage naturel – sans écrire une seule ligne de code. Cela a accéléré la capacité des entreprises à appliquer le ML à des cas d’utilisation tels que la prévision des séries temporelles, la prédiction de la défection des clients, l’analyse des sentiments, la détection des défauts industriels, et bien d’autres.

Comme annoncé le 5 octobre 2023, SageMaker Canvas a étendu son support des modèles aux modèles de base (FMs) – de grands modèles de langage utilisés pour générer et résumer du contenu. Avec la version du 12 octobre 2023, SageMaker Canvas permet aux utilisateurs de poser des questions et d’obtenir des réponses qui sont ancrées dans les données de leur entreprise. Cela garantit que les résultats sont spécifiques au contexte, ouvrant ainsi des cas d’utilisation supplémentaires où le ML sans code peut être appliqué pour résoudre des problèmes métier. Par exemple, les équipes métier peuvent désormais formuler des réponses conformes au vocabulaire et aux principes spécifiques d’une organisation, et peuvent interroger plus rapidement des documents volumineux pour obtenir des réponses spécifiques et ancrées dans le contenu de ces documents. Tout ce contenu est effectué de manière privée et sécurisée, en veillant à ce que toutes les données sensibles soient accessibles avec une gouvernance et des protections adéquates.

Pour commencer, un administrateur cloud configure et peuple les index d’Amazon Kendra avec les données d’entreprise en tant que sources de données pour SageMaker Canvas. Les utilisateurs de Canvas sélectionnent l’index où se trouvent leurs documents, et peuvent idéer, rechercher et explorer en sachant que la sortie sera toujours étayée par leurs sources de vérité. SageMaker Canvas utilise des modèles FMs de pointe provenant d’Amazon Bedrock et d’Amazon SageMaker JumpStart. Des conversations peuvent être lancées avec plusieurs FMs côte à côte, en comparant les sorties et en rendant réellement l’IA générative accessible à tous.

Dans cet article, nous passerons en revue la fonctionnalité récemment publiée, discuterons de l’architecture et présenterons un guide étape par étape pour permettre à SageMaker Canvas d’interroger des documents à partir de votre base de connaissances, comme le montre la capture d’écran suivante.

Aperçu de la solution

Les modèles de base peuvent produire des hallucinations – des réponses génériques, vagues, sans rapport ou factuellement incorrectes. La génération augmentée par la recherche (RAG) est une approche fréquemment utilisée pour réduire les hallucinations. Les architectures RAG sont utilisées pour récupérer des données en dehors d’un FM, qui sont ensuite utilisées pour effectuer un apprentissage en contexte afin de répondre à la requête de l’utilisateur. Cela garantit que le FM peut utiliser des données provenant d’une base de connaissances de confiance et utiliser ces connaissances pour répondre aux questions des utilisateurs, réduisant ainsi le risque d’hallucination.

Avec RAG, les données externes au FM et utilisées pour enrichir les sollicitations de l’utilisateur peuvent provenir de multiples sources de données disparates, telles que des référentiels de documents, des bases de données ou des API. La première étape consiste à convertir vos documents et toutes les requêtes utilisateur en un format compatible pour effectuer une recherche sémantique de pertinence. Pour rendre les formats compatibles, une collection de documents, ou une bibliothèque de connaissances, et les requêtes soumises par l’utilisateur sont converties en représentations numériques à l’aide de modèles d’intégration.

Avec cette version, la fonctionnalité RAG est fournie de manière sans code et transparente. Les entreprises peuvent enrichir l’expérience de chat dans Canvas avec Amazon Kendra en tant que système sous-jacent de gestion des connaissances. Le diagramme suivant illustre l’architecture de la solution.

La connexion de SageMaker Canvas à Amazon Kendra nécessite une configuration unique. Nous décrivons le processus de configuration en détail dans la configuration de Canvas pour interroger des documents. Si vous n’avez pas encore configuré votre domaine SageMaker, consultez Adhérer au domaine Amazon SageMaker.

Dans le cadre de la configuration de domaine, un administrateur cloud peut choisir un ou plusieurs index Kendra que l’analyste commercial peut interroger lorsqu’il interagit avec FM via SageMaker Canvas.

Une fois que les index de Kendra sont hydratés et configurés, les analystes commerciaux les utilisent avec SageMaker Canvas en démarrant un nouveau chat et en sélectionnant le bouton “Interroger des documents”. Canvas se chargera ensuite de la communication sous-jacente entre Amazon Kendra et le FM choisi pour effectuer les opérations suivantes :

  1. Interroger les index de Kendra avec la question provenant de l’utilisateur.
  2. Récupérer les extraits (et les sources) des index de Kendra.
  3. Concevoir la demande avec les extraits et la requête initiale afin que le modèle de base puisse générer une réponse à partir des documents récupérés.
  4. Fournir la réponse générée à l’utilisateur, ainsi que des références aux pages/documents utilisés pour formuler la réponse.

Configuration de Canvas pour interroger des documents

Dans cette section, nous vous guiderons à travers les étapes de configuration de Canvas pour interroger des documents servis via les index Kendra. Vous devez avoir les prérequis suivants :

  • Configuration du domaine SageMaker – Adhérer au domaine Amazon SageMaker
  • Créer un index Kendra (ou plusieurs)
  • Configurer le connecteur Kendra Amazon S3 – suivez le Connecteur Amazon S3 – et téléchargez des fichiers PDF et d’autres documents dans le bucket Amazon S3 associé à l’index Kendra
  • Configurer IAM afin que Canvas dispose des autorisations appropriées, y compris celles requises pour appeler Amazon Bedrock et/ou les points de terminaison SageMaker – suivez la documentation Set-up Canvas Chat

Maintenant, vous pouvez mettre à jour le domaine pour qu’il puisse accéder aux index souhaités. Sur la console SageMaker, pour le domaine donné, sélectionnez Modifier sous l’onglet Paramètres du domaine. Activez la bascule “Activer la recherche de documents avec Amazon Kendra” qui se trouve à l’étape Paramètres de Canvas. Une fois activée, choisissez un ou plusieurs index Kendra que vous voulez utiliser avec Canvas. Une fois activée, choisissez un ou plusieurs index Kendra que vous voulez utiliser avec Canvas.

C’est tout ce qui est nécessaire pour configurer la fonction de recherche de documents de Canvas. Les utilisateurs peuvent maintenant se lancer dans un chat dans Canvas et commencer à utiliser les bases de connaissances qui ont été associées au domaine via les index Kendra. Les mainteneurs de la base de connaissances peuvent continuer à mettre à jour la source de vérité et, avec la capacité de synchronisation de Kendra, les utilisateurs du chat pourront automatiquement utiliser les informations à jour de manière transparente.

Utilisation de la fonctionnalité Query Documents pour les chats

En tant qu’utilisateur de SageMaker Canvas, la fonctionnalité Query Documents peut être accessible depuis un chat. Pour commencer la session de chat, cliquez ou recherchez le bouton “Générer, extraire et résumer le contenu” depuis l’onglet Modèles prêts à l’emploi dans SageMaker Canvas.

Une fois que vous y êtes, vous pouvez activer et désactiver les documents de requête avec le basculement en haut de l’écran. Consultez l’invite d’information pour en savoir plus sur la fonctionnalité.

Lorsque les Documents de requête sont activés, vous pouvez choisir parmi une liste d’indices Kendra activés par l’administrateur cloud.

Vous pouvez sélectionner un index lors de la création d’un nouveau chat. Vous pouvez ensuite poser une question dans l’interface utilisateur avec des connaissances provenant automatiquement de l’index sélectionné. Notez qu’après le début d’une conversation sur un index spécifique, il n’est pas possible de passer à un autre index.

Pour les questions posées, le chat affiche la réponse générée par le FM ainsi que les documents sources qui ont contribué à la génération de la réponse. En cliquant sur l’un des documents sources, Canvas ouvre un aperçu du document, en mettant en évidence l’extrait utilisé par le FM.

Conclusion

L’IA conversationnelle a un potentiel immense pour transformer l’expérience client et employé en fournissant un assistant à l’aspect humain avec des interactions naturelles et intuitives telles que:

  • Réaliser des recherches sur un sujet ou rechercher et parcourir la base de connaissances de l’organisation
  • Résumer des volumes de contenu pour recueillir rapidement des informations
  • Rechercher des entités, des sentiments, des informations personnelles identifiables et d’autres données utiles, et augmenter la valeur commerciale du contenu non structuré
  • Générer des brouillons pour des documents et correspondances commerciales
  • Créer des articles de connaissances à partir de sources internes disparates (incidents, journaux de chat, wikis)

L’intégration innovante des interfaces de chat, de la récupération de connaissances et des FM permet aux entreprises de fournir des réponses précises et pertinentes aux questions des utilisateurs en utilisant leur domaine de connaissance et leurs sources de vérité.

En connectant SageMaker Canvas aux bases de connaissances dans Amazon Kendra, les organisations peuvent conserver leurs données exclusives dans leur propre environnement tout en bénéficiant des capacités de langage naturel de pointe des FM. Avec le lancement de la fonctionnalité Query Documents de SageMaker Canvas, nous facilitons l’utilisation des LLM et de leurs connaissances d’entreprise en tant que sources de vérité pour alimenter une expérience de chat sécurisée. Toutes ces fonctionnalités sont disponibles dans un format sans code, permettant aux entreprises d’éviter de s’occuper des tâches répétitives et non spécialisées.

Pour en savoir plus sur SageMaker Canvas et sur la manière dont il facilite le démarrage avec l’apprentissage automatique pour tous, consultez l’annonce de SageMaker Canvas. Pour en savoir plus sur la manière dont SageMaker Canvas favorise la collaboration entre les data scientists et les analystes métier, consultez le post Créer, Partager & Déployer. Enfin, pour apprendre comment créer votre propre flux de travail de génération augmentée par recherche, consultez le SageMaker JumpStart RAG.

Références

Lewis, P., Perez, E., Piktus, A., Petroni, F., Karpukhin, V., Goyal, N., Küttler, H., Lewis, M., Yih, W., Rocktäschel, T., Riedel, S., Kiela, D. (2020). Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks. Advances in Neural Information Processing Systems, 33, 9459-9474.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

La promesse et le péril de l'IA générative pour la cybersécurité

Explorez les avantages et les inconvénients de l'IA générative sur la sécurité. Indice, étant donné le besoin d'autom...

AI

Ce bulletin AI est tout ce dont vous avez besoin #70

Cette semaine en intelligence artificielle, nous avons été particulièrement intéressés de voir deux nouveaux modèles ...

AI

Tendances de carrière en IA ce qui fait sensation dans le monde de l'intelligence artificielle ?

Êtes-vous à la recherche d'une carrière dans le domaine de l'IA en plein essor ? Découvrez les six principales voies ...

AI

Incrivles façons d'utiliser ChatGPT Vision

Ces nouvelles capacités d'image déverrouillent un tout nouveau monde de possibilités pour utiliser ChatGPT.

Science des données

Green AI Méthodes et Solutions pour Améliorer la Durabilité de l'IA

Si vous avez ouvert cet article, vous avez probablement entendu parler de la controverse actuelle concernant la sécur...

AI

Cet article sur l'IA présente Lemur et Lemur Chat pour harmoniser le langage naturel et le code des agents linguistiques.

Dans un sens large, les agents intelligents sont des résolveurs de problèmes autonomes dotés de capacités de percepti...