Discutez avec les documents de l’entreprise en utilisant Azure OpenAI

Discutez avec les documents de l'entreprise en utilisant Azure OpenAI' -> 'Discutez avec les documents de l'entreprise avec Azure OpenAI

Les modèles de langage de grande taille (LLM) tels que ChatGPT stockent un vaste référentiel de connaissances au sein de leurs milliards de paramètres, car ils sont entraînés sur d’énormes quantités de texte provenant d’Internet. Cependant, leurs connaissances ne sont aussi bonnes que les données textuelles sur lesquelles ils ont été formés. Pour ChatGPT, cela signifie qu’il n’a aucune connaissance de quoi que ce soit après septembre 2021 ou de toute donnée privée stockée derrière des pare-feu, par exemple, des données de société propriétaires.

Jusqu’à présent, la méthode populaire et la plus accessible pour pallier cette limitation de connaissances est une méthode appelée génération augmentée par recherche ou RAG (l’autre méthode est le fine-tuning). Elle fonctionne en stockant des documents basés sur du texte (que le LLM ne connaît pas) dans une base de données externe. Lorsqu’un utilisateur pose une question au LLM, le système récupère les documents pertinents de cette base de données et les fournit au LLM pour qu’il les utilise comme référence pour répondre à la question de l’utilisateur. Cela s’appelle l’apprentissage en contexte ou, plus simplement – l’insertion de requête. Dans la plupart des cas d’utilisation, la méthode RAG est préférable au fine-tuning du LLM, qui est généralement plus complexe, nécessitant du matériel spécialisé (GPU) et des compétences spécifiques (par exemple, l’apprentissage automatique) et est généralement plus coûteux à mettre en œuvre.

Microsoft Azure a publié une solution de démarrage rapide pour ses clients qui utilise la méthode RAG pour augmenter les LLM avec des connaissances sur les documents de l’entreprise. En tant qu’agent conversationnel, il utilise les LLM OpenAI (gpt-3.5/ChatGPT ou gpt-4) hébergés sur l’infrastructure Azure (et non sur celle d’OpenAI) qui sont appelés par l’application via des points d’extrémité de l’API de complétion. L’utilisation de cette application est couverte par la politique rigoureuse de protection des données Azure, de sorte que toute interaction de l’utilisateur et les données partagées lors de son utilisation sont sécurisées et privées. La tarification est basée sur l’utilisation par jeton.

L’exemple d’interaction ci-dessous illustre l’application en utilisant un document d’exemple sur un programme de prêt de calamité de sécurité sociale comme référence. Les LLM sont connus pour “halluciner” ou donner des réponses non véridiques ou inventées. Pour atténuer cela, chaque réponse est renvoyée avec une citation faisant référence au document source sur lequel la réponse était basée. Cela permet à l’utilisateur de vérifier la véracité d’une réponse donnée.

Chaque réponse est accompagnée d'une citation (en jaune). Cliquez pour agrandir.

Options de déploiement

La solution peut être déployée en tant qu’application web ou en tant qu’agent virtuel alimenté par l’intelligence artificielle (PVA) directement depuis l’espace de jeu Azure OpenAI Chat. La source de données doit être configurée, puis déployée en fonction des deux options de déploiement disponibles.

Vous pouvez définir le 'message système' du chatbot avant de déployer l'application.

Application web

L’application web est une interface de chat de base accessible via les navigateurs sur les ordinateurs portables ou les appareils mobiles. L’application web a été publiée en tant que logiciel libre par Microsoft sous une licence MIT, qui autorise une utilisation commerciale. Le référentiel GitHub peut être trouvé ici. Les clients sont libres de personnaliser l’application selon leurs besoins. L’application web peut être déployée “telle quelle” en un clic en tant que service d’application hébergé dans Azure. Cela sera déployé avec le logo Azure et les schémas de couleurs par défaut.

Déploiement d'exemple avec une marque personnalisée.

Agent virtuel alimenté par l’intelligence artificielle

Les agents PVA peuvent être déployés sur les sites Web des entreprises. Il dispose également d’une intégration native et peut être facilement intégré à d’autres produits MS tels que les sites Sharepoint et MS Teams.

Agent PVA intégré dans un site Sharepoint. Source de l'image
PVA bot intégré dans MS Teams. Source de l'image

Chargement des documents de l’entreprise dans la base de connaissances du chatbot

Les types de documents suivants peuvent être chargés dans la base de données du bot : fichiers txt, PDF, Word, PowerPoint et HTML. Il est recommandé d’utiliser des documents riches en texte tels que les politiques de l’entreprise, les contrats, les instructions, etc., pour ce chatbot. Les données tabulaires, telles que celles stockées dans Excel/CSV ou les bases de données relationnelles, ne sont pas recommandées. Les documents téléchargés seront stockés dans un blob de stockage dans l’environnement Azure du client et resteront privés.

Le chatbot interroge les données à partir d’un index dans le service Azure Cognitive Search. Il dispose d’un indexeur intuitif qui peut charger tous les types de documents pris en charge à partir d’un seul emplacement (par exemple, un dossier local ou un blob Azure) et les intégrer à l’index.

Le service de recherche (qui compare la requête/saisie de l’utilisateur avec le document pertinent de l’index qui servira de base à la réponse du chatbot) prend en charge la comparaison lexicale ou par mots clés basée sur l’algorithme de recherche BM25, ainsi que les algorithmes de recherche basés sur les embeddings/vecteurs tels que la similarité cosinus ou le produit scalaire. Il prend également en charge une combinaison de ces deux techniques – une combinaison de recherche en texte intégral et de recherche vectorielle.

Références :

Azure OpenAI sur vos données (aperçu)

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Elon Musk présente 'Grok' l'AI Chatbot impertinent avec une touche de rébellion

Le monde de la technologie est en effervescence. Elon Musk, le génie derrière des entreprises révolutionnaires comme ...

AI

Restez en avance sur la courbe de confiance en IA la trousse à outils responsable en IA en open-source est dévoilée.

Dans le paysage technologique en évolution rapide d’aujourd’hui, l’intelligence artificielle (IA) e...

AI

Elon Musk's xAI entraîné sur le flux de Twitter

Elon Musk, le visionnaire derrière des entreprises telles que Tesla et SpaceX, a de nouveau fixé son attention sur le...

AI

Elon Musk met en garde contre la montée de la superintelligence en Chine

L’entrepreneur renommé Elon Musk a récemment fait les gros titres avec sa déclaration audacieuse lors d’u...

AI

Grok L'IA Chatbot de xAI d'Elon Musk

Plongez dans Grok d'Elon Musk par xAI, un chatbot IA avec une récupération d'informations en temps réel, de l'humour ...

AI

Juliette Powell et Art Kleiner, auteurs de la série d'interviews Le dilemme de l'IA

Le dilemme de l'IA est écrit par Juliette Powell et Art Kleiner. Juliette Powell est auteure, créatrice de télévision...