Les chercheurs d’Amazon proposent KD-Boost un nouvel algorithme de distillation des connaissances conçu pour une correspondance sémantique en temps réel.

Amazon Researchers Introduce KD-Boost A New Knowledge Distillation Algorithm Designed for Real-time Semantic Matching

La recherche sur le Web et la recherche de produits sur les plateformes de commerce électronique sont deux applications principales qui dépendent d’une correspondance sémantique en temps réel précise. Dans les recherches de produits, la difficulté réside dans le rapprochement sémantique entre les requêtes des utilisateurs et les résultats associés. La procédure de correspondance se compose généralement de deux étapes : le Sourcing de produits (PS) et la Reformulation automatique des requêtes. Le sourcing de produits permet de récupérer les résultats correspondants à une requête donnée, souvent appelés produits dans le contexte de la recherche de produits. Ensuite, la reformulation automatique des requêtes convertit les requêtes mal formulées des utilisateurs en requêtes bien formulées et sémantiquement similaires pour élargir la couverture des résultats.

La correspondance sémantique est le processus par lequel les moteurs de recherche reconnaissent et associent des éléments ayant des significations comparables. Avec la correspondance sémantique, les requêtes des utilisateurs ne renvoient pas seulement n’importe quels résultats, mais les plus pertinents compte tenu du contexte. Les modèles basés sur les transformers se sont révélés très efficaces pour encoder les requêtes et les regrouper dans un espace d’incorporation avec des éléments sémantiquement liés tels que les requêtes ou les résultats. Cependant, les problèmes de latence rendent les grands modèles de transformers peu pratiques pour une correspondance en temps réel en raison de leur coût computationnel.

Pour relever ces défis, une équipe de chercheurs d’Amazon a introduit KD-Boost, une nouvelle technique de distillation des connaissances spécifiquement conçue pour résoudre les problèmes de correspondance sémantique en temps réel. KD-Boost utilise des étiquettes de vérité terrain et des étiquettes souples provenant d’un modèle enseignant pour former des modèles étudiants précis à faible latence. Les signaux de requête-produit et de requête-requête par paires, produits par des audits directs, des recherches sur les comportements des utilisateurs et des données basées sur la taxonomie, sont la source des étiquettes souples. Des fonctions de perte personnalisées ont été utilisées pour orienter correctement le processus d’apprentissage.

Les chercheurs ont partagé que l’étude a utilisé diverses sources de signaux de similarité et de dissimilarité pour répondre aux besoins combinés de la reformulation des requêtes et du sourcing de produits. Les étiquettes ordinales de pertinence éditoriale pour les paires requête-produit, les informations comportementales des utilisateurs telles que les clics et les ventes, ainsi que la taxonomie des produits, sont quelques exemples de ces signaux. Des fonctions de perte adaptées ont été utilisées pour s’assurer que le modèle apprend des représentations pouvant capturer avec précision les subtilités de la pertinence et de la similarité.

L’équipe a partagé que des tests ont été réalisés sur des ensembles de données internes et externes de commerce électronique, qui ont démontré une amélioration significative de 2 à 3% de la ROC-AUC (Caractéristique de fonctionnement du récepteur – Surface sous la courbe) par rapport à l’entraînement direct du modèle étudiant. KD-Boost a démontré de meilleures performances que les références en matière de distillation des connaissances et les modèles enseignants.

Des résultats prometteurs ont été observés lors de tests A/B en ligne simulés utilisant KD-Boost pour la reformulation automatique des requêtes. La correspondance requête-requête a augmenté de 6,31%, ce qui suggère une meilleure compréhension sémantique. Il y a également eu une amélioration de 2,19% de la pertinence, montrant des correspondances plus précises et contextualisées, ainsi qu’une augmentation de 2,76% de la couverture des produits, indiquant une plus grande variété de résultats pertinents.

En conclusion, cette étude a abordé les problèmes de latence associés aux recherches approfondies de produits, en mettant l’accent sur l’amélioration à la fois des activités de sourcing de produits et de reformulation automatique des requêtes. Elle a reconnu les limites des modèles actuels basés sur les transformers et a contribué à étudier l’utilisation de la distillation des connaissances comme solution.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Elon Musk met en garde contre la montée de la superintelligence en Chine

L’entrepreneur renommé Elon Musk a récemment fait les gros titres avec sa déclaration audacieuse lors d’u...

AI

Restez en avance sur la courbe de confiance en IA la trousse à outils responsable en IA en open-source est dévoilée.

Dans le paysage technologique en évolution rapide d’aujourd’hui, l’intelligence artificielle (IA) e...

AI

Elon Musk's xAI entraîné sur le flux de Twitter

Elon Musk, le visionnaire derrière des entreprises telles que Tesla et SpaceX, a de nouveau fixé son attention sur le...

AI

Grok L'IA Chatbot de xAI d'Elon Musk

Plongez dans Grok d'Elon Musk par xAI, un chatbot IA avec une récupération d'informations en temps réel, de l'humour ...

AI

Dévoiler l'avenir de l'IA avec GPT-4 et l'IA Explicative (XAI)

Introduction Dans le monde en constante évolution de l’Intelligence Artificielle (IA), GPT-4 est une merveille ...

AI

Elon Musk présente 'Grok' l'AI Chatbot impertinent avec une touche de rébellion

Le monde de la technologie est en effervescence. Elon Musk, le génie derrière des entreprises révolutionnaires comme ...