Rencontrez TARDIS un cadre d’IA qui identifie les singularités dans des espaces complexes et capture les structures singulières ainsi que la complexité géométrique locale dans les données d’image.
Meet TARDIS, an AI framework that identifies singularities in complex spaces and captures singular structures as well as local geometric complexity in image data.
Nous sommes submergés par d’énormes volumes de données provenant de tous les domaines différents, y compris les données scientifiques, médicales, sociales et éducatives. L’analyse de ces données est une exigence cruciale. Avec l’augmentation de la quantité de données, il est important d’avoir des approches pour extraire des représentations simples et significatives à partir de données complexes. Les méthodes précédentes fonctionnent sur la même hypothèse selon laquelle les données sont proches d’une variété de petite dimension malgré une grande dimension ambiante et cherchent la variété de plus basse dimension qui caractérise le mieux les données.
Les méthodes d’apprentissage de variétés sont utilisées dans l’apprentissage de représentations, où les données de grande dimension sont transformées en un espace de dimension inférieure tout en préservant les caractéristiques de données cruciales. Bien que l’hypothèse de variété fonctionne pour la plupart des types de données, elle ne fonctionne pas bien dans les données avec des singularités. Les singularités sont des régions où l’hypothèse de variété s’effondre et peuvent contenir des informations importantes. Ces régions violent les propriétés de régularité ou de lissage d’une variété.
Les chercheurs ont proposé un cadre topologique appelé TARDIS (Topological Algorithm for Robust DIscovery of Singularities) pour relever le défi d’identifier et de caractériser les singularités dans les données. Ce cadre d’apprentissage de représentation non supervisée détecte les régions singulières dans les données de nuage de points et a été conçu pour être agnostique par rapport aux propriétés géométriques ou stochastiques des données, ne nécessitant qu’une notion de la dimension intrinsèque des quartiers. Il vise à aborder deux aspects clés – quantifier la dimension intrinsèque locale et évaluer la variété d’un point à travers plusieurs échelles.
- Prédiction du rendement des cultures à l’aide de l’apprentissage automatique et du déploiement Flask
- Comment fonctionne GPT une explication métaphorique de la clé, de la valeur, de la requête dans l’Attention, en utilisant une histoire de potion.
- De la feuille au pixel Comment la télécopie numérique transforme la gestion des données volumineuses.
Les auteurs ont mentionné que la quantification de la dimension intrinsèque locale mesure la dimensionnalité effective du quartier d’un point de données. Le cadre y est parvenu en utilisant des méthodes topologiques, en particulier l’homologie persistante, qui est un outil mathématique utilisé pour étudier la forme et la structure des données à différentes échelles. Il estime la dimension intrinsèque du quartier d’un point en appliquant l’homologie persistante, qui donne des informations sur la complexité géométrique locale. Cette dimension intrinsèque locale mesure le degré selon lequel le point de données est variété et indique s’il est conforme à l’hypothèse de variété de basse dimension ou se comporte différemment.
Le score d’euclidianité, qui évalue la variété d’un point à différentes échelles, quantifie l’écart d’un point par rapport au comportement euclidien, révélant l’existence de singularités ou de structures non-variétés. Le cadre capture les différences de variété d’un point en tenant compte de l’euclidianité à différentes échelles, ce qui permet de repérer les singularités et de comprendre la complexité géométrique locale.
L’équipe a fourni des garanties théoriques sur la qualité d’approximation de ce cadre pour certaines classes d’espaces, y compris les variétés. Ils ont effectué des expériences sur une variété d’ensembles de données, allant des collections d’images de grande dimension à des espaces avec des singularités connues, pour valider leur théorie. Ces résultats ont montré à quel point l’approche identifie et traite bien les parties non-variétés dans les données, mettant en lumière les limites de l’hypothèse de variété et exposant des données importantes cachées dans les régions singulières.
En conclusion, cette approche remet efficacement en question l’hypothèse de variété et est efficace pour détecter les singularités qui sont les points qui violent l’hypothèse de variété.
We will continue to update IPGirl; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- JPL crée une archive PDF pour aider la recherche de logiciels malveillants.
- 5 façons faciles et efficaces d’utiliser Python Logging
- Créer un avantage informationnel avec un accès conversationnel aux données
- Attention aux données non fiables lors de l’évaluation du modèle une étude de cas de sélection de prompt LLM avec Flan-T5.
- Comment identifier les données critiques de votre entreprise.
- Choisir le bon chemin Modèles de rétention contre modèles de levée
- Les 4 meilleurs graphiques en apprentissage automatique.