Est-ce que l’IA peut vraiment comprendre nos émotions? Cette étude sur l’IA explore la reconnaissance avancée des émotions faciales avec les modèles de transformateurs de vision.

L'IA peut-elle réellement comprendre nos émotions? Cette étude sur l'IA explore la reconnaissance avancée des émotions faciales avec les modèles de transformation de la vision.

FER est essentiel dans l’interaction homme-machine, l’analyse des sentiments, l’informatique affective et la réalité virtuelle. Il aide les machines à comprendre et à répondre aux émotions humaines. Les méthodologies ont évolué de l’extraction manuelle aux modèles basés sur les CNN et les transformateurs. Les applications incluent une meilleure interaction homme-machine et une meilleure réponse émotionnelle chez les robots, ce qui rend FER crucial dans la technologie de l’interface homme-machine.

Les méthodologies de pointe en FER ont subi une transformation significative. Les premières approches reposaient fortement sur des caractéristiques créées manuellement et des algorithmes d’apprentissage automatique tels que les machines à vecteurs de support et les forêts aléatoires. Cependant, l’avènement de l’apprentissage profond, en particulier des réseaux neuronaux convolutifs (CNN), a révolutionné le FER en capturant adroitement des motifs spatiaux complexes dans les expressions faciales. Malgré leur succès, des défis tels que les variations de contraste, le déséquilibre des classes, les variations intra-classes et l’occlusion persistent, y compris les variations de qualité d’image, les conditions d’éclairage et la complexité inhérente des expressions faciales humaines. De plus, les jeux de données déséquilibrés, comme le référentiel FER2013, ont entravé les performances du modèle. Résoudre ces défis est devenu un point d’attention pour les chercheurs visant à améliorer la précision et la résilience du FER.

En réponse à ces défis, un article récent intitulé “Analyse comparative des modèles Vision Transformer pour la reconnaissance des émotions faciales utilisant des ensembles de données équilibrés augmentés” introduit une nouvelle méthode visant à résoudre les limitations des ensembles de données existants tels que FER2013. Le travail vise à évaluer les performances de différents modèles Vision Transformer dans la reconnaissance des émotions faciales. Il se concentre sur l’évaluation de ces modèles à l’aide d’ensembles de données équilibrés et augmentés pour déterminer leur efficacité dans la reconnaissance précise des émotions représentées dans les expressions faciales.

Concrètement, l’approche proposée consiste à créer un nouvel ensemble de données équilibré en utilisant des techniques d’augmentation de données avancées telles que le retournement horizontal, le recadrage et le remplissage, en mettant particulièrement l’accent sur l’élargissement des classes minoritaires et le nettoyage méticuleux des images de mauvaise qualité du référentiel FER2013. Cet ensemble de données nouvellement équilibré, appelé FER2013_balanced, vise à rectifier le problème du déséquilibre des données, en garantissant une répartition équitable entre les différentes classes émotionnelles. En augmentant les données et en éliminant les images de mauvaise qualité, les chercheurs cherchent à améliorer la qualité de l’ensemble de données, améliorant ainsi la formation des modèles FER. L’article approfondit l’importance de la qualité des ensembles de données pour atténuer les prédictions biaisées et renforcer la fiabilité des systèmes FER.

Initialement, l’approche a identifié et exclu les images de mauvaise qualité de l’ensemble de données FER2013. Ces images de mauvaise qualité comprenaient des cas de faible contraste ou d’occlusion, car ces facteurs affectent considérablement les performances des modèles formés sur de tels ensembles de données. Ensuite, pour atténuer les problèmes de déséquilibre des classes. L’augmentation visait à augmenter la représentation des émotions sous-représentées, garantissant une répartition plus équitable entre les différentes classes émotionnelles.

Par la suite, la méthode a équilibré l’ensemble de données en supprimant de nombreuses images des classes sureprésentées, telles que joyeux, neutre, triste et autres. Cette étape visait à obtenir un nombre égal d’images pour chaque catégorie d’émotion dans l’ensemble de données FER2013_balanced. Une distribution équilibrée atténue le risque de biais envers les classes majoritaires, garantissant un référentiel plus fiable pour la recherche FER. L’accent mis sur la résolution de ces problèmes d’ensemble de données était essentiel pour établir une norme fiable pour les études de reconnaissance des émotions faciales.

La méthode a démontré des améliorations notables des performances du modèle Tokens-to-Token ViT après la construction de l’ensemble de données équilibré. Ce modèle a présenté une précision améliorée lorsqu’il a été évalué sur l’ensemble de données FER2013_balanced par rapport à l’ensemble de données FER2013 d’origine. L’analyse a porté sur diverses catégories émotionnelles, illustrant des améliorations significatives de la précision pour la colère, le dégoût, la peur et les expressions neutres. Le modèle Tokens-to-Token ViT a atteint une précision globale de 74,20% sur l’ensemble de données FER2013_balanced contre 61,28% sur l’ensemble de données FER2013, mettant en évidence l’efficacité de la méthodologie proposée dans l’amélioration de la qualité de l’ensemble de données et, par conséquent, l’amélioration des performances du modèle dans les tâches de reconnaissance des émotions faciales.

En conclusion, les auteurs ont proposé une méthode innovante pour améliorer le FER en affinant la qualité de l’ensemble de données. Leur approche consistait à nettoyer méticuleusement les images de mauvaise qualité et à utiliser des techniques d’augmentation de données avancées pour créer un ensemble de données équilibré, FER2013_balanced. Cet ensemble de données équilibré a considérablement amélioré la précision du modèle Tokens-to-Token ViT, démontrant le rôle crucial de la qualité de l’ensemble de données dans l’amélioration des performances des modèles FER. L’étude met l’accent sur l’impact décisif du nettoyage et de l’augmentation méticuleux des ensembles de données sur l’avancement de la précision du FER, ouvrant des perspectives prometteuses pour la recherche en interaction homme-machine et en informatique affective.

L’article Can AI Truly Understand Our Emotions? Cette étude sur l’IA explore la reconnaissance avancée des émotions faciales avec les modèles de vision transformer est apparu en premier sur MarkTechPost.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Une nouvelle recherche en IA de CMU propose une méthode d'attaque simple et efficace qui amène les modèles de langage alignés à générer des comportements inacceptables.

Les grands modèles de langage (LLM) tels que ChatGPT, Bard AI et Llama-2 peuvent générer du contenu indésirable et of...

AI

Des chercheurs de l'UCLA et de CMU présentent Stormer des réseaux neuronaux Transformer évolutifs pour une prévision météorologique de moyenne portée habile et fiable.

Un des principaux problèmes auxquels la science et la société sont confrontées aujourd’hui est la prévision mét...

Recherche en IA

Le système d'injection bactérienne délivre des protéines chez les souris et les cellules humaines.

Avec un développement ultérieur, le système programmable pourrait être utilisé dans une gamme d'applications, y compr...

AI

L'Associated Press dévoile des lignes directrices sur l'IA pour les journalistes

L’avancement rapide de l’intelligence artificielle (IA) a ouvert la voie à son intégration dans divers se...

AI

Un guide complet de Distributed Data Parallel (DDP)

Salut tout le monde ! Je suis François, chercheur scientifique chez Meta. Bienvenue dans ce nouveau tutoriel faisant ...

Informatique

L'Europe avance sur la réglementation de l'IA, remettant en question le pouvoir des géants de la technologie.

Bruxelles a lancé un nouveau défi en matière de concurrence contre Google le même jour où les législateurs européens ...