Les deux nouvelles entreprises de Meta AI pour l’équité en vision par ordinateur introduction de la licence pour DINOv2 et publication de FACET.

Les deux nouvelles entreprises de Meta AI pour l'équité en vision par ordinateur licence DINOv2 et publication de FACET.

Dans le domaine en constante évolution de la vision par ordinateur, une préoccupation pressante est l’impératif d’assurer l’équité. Ce récit met en lumière le vaste potentiel résidant dans la technologie de l’IA, en particulier dans la vision par ordinateur, où elle se présente comme un catalyseur de percées transformantes dans divers secteurs, de la préservation écologique à la facilitation de l’exploration scientifique révolutionnaire. Pourtant, il reste franchement honnête sur les risques inhérents liés à l’essor de cette technologie.

Les chercheurs de Meta AI mettent l’accent sur l’équilibre crucial qui doit être trouvé – un équilibre harmonieux entre le rythme rapide de l’innovation et les pratiques de développement consciencieuses qui émergent comme nécessaires. Ces pratiques ne sont pas seulement un choix, mais un bouclier vital contre les dommages potentiels que cette technologie peut inadvertamment infliger aux communautés historiquement marginalisées.

Les chercheurs de Meta AI ont tracé une feuille de route complète en réponse à ce défi multifacette. Ils commencent par rendre DINOv2, un modèle de vision par ordinateur avancé forgé dans le creuset de l’apprentissage auto-supervisé, accessible à un public plus large sous la licence open source Apache 2.0. DINOv2, abréviation de Data-Efficient Image Neural Network Version 2, représente un bond significatif dans les modèles de vision par ordinateur. Il utilise des techniques d’apprentissage auto-supervisé pour créer des caractéristiques universelles, lui permettant de comprendre et d’interpréter les images de manière très polyvalente.

Les capacités de DINOv2 vont au-delà de la simple classification d’images. Il excelle dans de nombreuses tâches, notamment la segmentation sémantique d’images, où il identifie avec précision les limites des objets et segmente les images en régions significatives, et l’estimation de la profondeur monoculaire, ce qui lui permet de percevoir la profondeur spatiale des objets dans une image. Cette polyvalence fait de DINOv2 une référence pour les applications de vision par ordinateur. Cette expansion de l’accessibilité permet aux développeurs et aux chercheurs de tirer parti des formidables capacités de DINOv2 dans un large éventail d’applications, repoussant encore plus loin les frontières de l’innovation en matière de vision par ordinateur.

L’engagement de Meta envers l’équité dans la vision par ordinateur se concrétise avec l’introduction de FACET (FAirness in Computer Vision Evaluation). FACET est un ensemble de données de référence monumental comprenant pas moins de 32 000 images représentant environ 50 000 individus. Cependant, ce qui distingue FACET, c’est l’annotation minutieuse des annotateurs humains experts. Ces experts ont travaillé avec soin pour annoter l’ensemble de données, le catégorisant selon plusieurs dimensions. Cela comprend des attributs démographiques tels que la présentation du genre perçue, le groupe d’âge et les attributs physiques englobant le teint et la coiffure perçus. Remarquablement, FACET introduit des classes associées aux personnes, couvrant diverses professions telles que “joueur de basket-ball” et “médecin”. L’ensemble de données étend encore son utilité en incluant des étiquettes pour 69 000 masques, renforçant ainsi sa signification à des fins de recherche.

Les premières explorations utilisant FACET ont déjà révélé des disparités dans les performances des modèles de pointe entre différents groupes démographiques. Par exemple, ces modèles rencontrent fréquemment des difficultés à détecter avec précision les personnes à la peau plus foncée ou celles aux cheveux crépus, révélant des biais latents qui nécessitent un examen minutieux.

Lors des évaluations de performance utilisant FACET, les modèles de pointe ont présenté des disparités de performance entre les groupes démographiques. Par exemple, les modèles peuvent avoir du mal à détecter les personnes à la peau plus foncée, ce problème étant exacerbé pour les personnes aux cheveux crépus. Ces disparités soulignent la nécessité d’évaluer et de réduire de manière approfondie les biais dans les modèles de vision par ordinateur.

Bien que conçu principalement pour l’évaluation de la recherche et non destiné à des fins de formation, FACET a le potentiel de devenir la norme prééminente pour évaluer l’équité dans les modèles de vision par ordinateur. Il prépare le terrain pour des examens approfondis et nuancés de l’équité dans l’IA, transcendant les attributs démographiques conventionnels pour incorporer des classes liées aux personnes.

En résumé, l’article de Meta amplifie l’appel pressant concernant les problèmes d’équité dans la vision par ordinateur tout en mettant en lumière les disparités de performance révélées par FACET. La méthodologie de Meta consiste à élargir l’accès à des modèles avancés tels que DINOv2 et à introduire un ensemble de données de référence pionnier. Cette approche multifacette souligne leur engagement indéfectible en faveur de l’innovation tout en respectant des normes éthiques et en atténuant les problèmes d’équité. Elle met en évidence leur dévouement incessant au développement responsable, traçant ainsi la voie vers l’atteinte d’un paysage IA équitable – un paysage où la technologie est exploitée pour le bien de tous.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Une nouvelle recherche IA de Fujitsu améliore la segmentation d'action supervisée faiblement pour l'interaction homme-robot avec l'apprentissage de l'union d'action.

Les récents développements dans le domaine de la reconnaissance des actions humaines ont permis des avancées extraord...

AI

Pourquoi Bankrate a abandonné les articles générés par l'IA

En janvier, Bankrate et son site partenaire, CNET, ont fait sensation en publiant ouvertement des centaines d'article...

AI

Construction d'un petit modèle de langage (SLM) avec l'algorithme de Jaro-Winkler pour améliorer et renforcer les erreurs d'orthographe

Apprenez à utiliser l'algorithme de Jaro-Winkler pour construire un petit modèle de langue (SLM) avec un petit ensemb...

AI

L'évolution du développement logiciel de la méthode en cascade à l'approche agile, au DevOps et au-delà

Plongez dans la transformation du développement logiciel, comprenez Agile et DevOps, et obtenez des perspectives sur ...