Comment évaluer les représentations

Evaluation of representations

Des métriques non supervisées aux métriques supervisées

crédit: Image de unsplash.com

Les embeddings, également connus sous le nom de représentations, sont des représentations vectorielles denses d’entités telles que des mots, des documents, des produits, etc. Ils sont conçus pour capturer des significations sémantiques et mettre en évidence les similarités entre les entités. Un bon ensemble de représentations doit non seulement encoder efficacement les caractéristiques essentielles des entités, mais aussi présenter des propriétés telles que la compacité, la signification et la robustesse dans diverses tâches. Dans cet article, nous examinons différentes métriques d’évaluation pour évaluer la qualité des représentations. Commençons.

Un cadre d’évaluation

Tout cadre d’évaluation se compose de trois composants principaux :

  1. Une méthode de référence : elle sert de référence par rapport à laquelle les nouvelles approches ou modèles sont comparés. Elle fournit un point de référence pour évaluer les performances des méthodes proposées.
  2. Un ensemble de métriques d’évaluation : les métriques d’évaluation sont des mesures quantitatives utilisées pour évaluer les performances des modèles. Ces métriques peuvent être supervisées ou non supervisées, et définissent la manière dont la réussite des sorties est évaluée.
  3. Un jeu de données d’évaluation : le jeu de données d’évaluation est une collection de données étiquetées ou non étiquetées utilisées pour évaluer les performances des modèles. Ce jeu de données doit être représentatif des scénarios réels que les modèles sont censés gérer. Il doit couvrir une gamme diversifiée d’exemples pour garantir une évaluation complète.

En fonction de la nécessité ou non d’étiquettes de vérité terrain pour les métriques d’évaluation, nous pouvons les diviser en métriques non supervisées et métriques supervisées. Il est souvent plus avantageux d’utiliser des métriques non supervisées, car elles ne nécessitent pas d’étiquettes, et la collecte d’étiquettes est très coûteuse en pratique.

Ci-dessous, nous examinerons les métriques de pointe. Pour chaque métrique, choisissez une méthode de référence pour comparer vos évaluations. La méthode de référence peut être aussi simple que `générateur d’embedding aléatoire` !

Métriques d’évaluation supervisées

Les métriques supervisées nécessitent un jeu de données d’évaluation étiqueté. Une stratégie courante consiste à choisir un prédicteur tel qu’un classifieur ou un régresseur. Ensuite, entraînez le prédicteur sur un ensemble limité de données étiquetées provenant de…

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Intelligence artificielle pour l'augmentation et la productivité

Le MIT Schwarzman College of Computing accorde des subventions de démarrage à sept projets interdisciplinaires explor...

Recherche en IA

Le premier Grand Défi J-WAFS vise à développer des variantes de culture améliorées et à les transférer du laboratoire aux terres cultivées.

Matt Shoulders dirigera une équipe interdisciplinaire pour améliorer RuBisCO - l'enzyme de la photosynthèse considéré...

Science des données

Le collectif MIT-Pillar AI annonce les premiers bénéficiaires de subventions initiales.

Six équipes menant des recherches en IA, en science des données et en apprentissage automatique reçoivent des finance...

AI

Intervention gouvernementale dans la conception de puces une aubaine ou un fléau pour les ambitions de l'Inde dans le domaine des semi-conducteurs ?

L’Inde se prépare à mettre en valeur son expertise en matière de semi-conducteurs et son innovation en matière ...

Science des données

Novo Nordisk soutiendra les post-doctorants du MIT travaillant à l'intersection de l'IA et des sciences de la vie.

Le programme de bourses postdoctorales en intelligence artificielle MIT-Novo Nordisk soutiendra jusqu'à 10 post-docto...

AI

Soutenir la durabilité, la santé numérique et l'avenir du travail

L'Initiative de Convergence MIT et Accenture pour l'Industrie et la Technologie sélectionne trois nouveaux projets de...