Les chercheurs de KAIST proposent SyncDiffusion un module plug-and-play qui synchronise plusieurs diffusions à l’aide de la descente de gradient à partir d’une perte de similarité perceptive.

Les chercheurs de KAIST proposent SyncDiffusion, un module plug-and-play pour synchroniser plusieurs diffusions en utilisant la descente de gradient à partir d'une perte de similarité perceptive.

Dans un article de recherche récent, une équipe de chercheurs de KAIST a présenté SYNCDIFFUSION, un module révolutionnaire visant à améliorer la génération d’images panoramiques à l’aide de modèles de diffusion pré-entraînés. Les chercheurs ont identifié un problème significatif dans la création d’images panoramiques, principalement lié à la présence de coutures visibles lors de l’assemblage de plusieurs images de taille fixe. Pour résoudre ce problème, ils ont proposé SYNCDIFFUSION comme solution.

La création d’images panoramiques, celles avec des vues larges et immersives, pose des défis aux modèles de génération d’images, car ils sont généralement entraînés à produire des images de taille fixe. Lors de la tentative de génération de panoramas, l’approche naïve consistant à assembler plusieurs images entraîne souvent l’apparition de coutures visibles et de compositions incohérentes. Ce problème a conduit à la nécessité de méthodes innovantes pour fusionner les images de manière transparente et maintenir une cohérence globale.

Deux méthodes courantes pour générer des images panoramiques sont l’extrapolation d’images séquentielles et la diffusion conjointe. La première consiste à générer un panorama final en étendant une image donnée séquentiellement, en fixant la région de chevauchement à chaque étape. Cependant, cette méthode a souvent du mal à produire des panoramas réalistes et tend à introduire des motifs répétitifs, ce qui donne des résultats moins qu’idéaux.

D’autre part, la diffusion conjointe opère le processus de génération inverse simultanément sur plusieurs vues et moyenne les images intermédiaires bruitées dans les régions de chevauchement. Bien que cette approche génère efficacement des montages sans couture, elle pèche en termes de maintien de la cohérence du contenu et du style entre les vues. Par conséquent, elle combine fréquemment des images avec un contenu et des styles différents dans un seul panorama, ce qui donne des résultats incohérents.

Les chercheurs ont introduit SYNCDIFFUSION comme un module qui synchronise plusieurs diffusions en utilisant une descente de gradient basée sur une perte de similarité perceptuelle. L’innovation clé réside dans l’utilisation des images débruitées prédites à chaque étape de débruitage pour calculer le gradient de la perte perceptuelle. Cette approche offre des orientations significatives pour créer des montages cohérents, en veillant à ce que les images se fondent harmonieusement tout en préservant la cohérence du contenu.

Dans une série d’expériences utilisant SYNCDIFFUSION avec le modèle Stable Diffusion 2.0, les chercheurs ont constaté que leur méthode surpassait significativement les techniques précédentes. L’étude utilisateur réalisée a montré une préférence importante pour SYNCDIFFUSION, avec un taux de préférence de 66,35 %, par opposition à 33,65 % pour la méthode précédente. Cette amélioration marquée démontre les avantages pratiques de SYNCDIFFUSION dans la génération d’images panoramiques cohérentes.

SYNCDIFFUSION est un ajout notable au domaine de la génération d’images. Il s’attaque efficacement au défi de la génération d’images panoramiques sans couture et cohérentes, qui a été un problème persistant dans le domaine. En synchronisant plusieurs diffusions et en appliquant une descente de gradient basée sur une perte de similarité perceptuelle, SYNCDIFFUSION améliore la qualité et la cohérence des panoramas générés. Par conséquent, il offre un outil précieux pour un large éventail d’applications impliquant la création d’images panoramiques, et démontre le potentiel d’utilisation de la descente de gradient pour améliorer les processus de génération d’images.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Plongée dans les Embeddings et les bases de données vectorielles Un guide pratique !

L'IA générative évolue rapidement, transformant de manière profonde le paysage de la technologie et de la gestion des...

Actualités sur l'IA

Un nouvel accélérateur pour les startups axées sur l'IA en Europe et en Israël.

Ce programme de 10 semaines soutient les startups utilisant l'IA au cœur de leur activité grâce à une formation sur m...

AI

Le cousin IA de Michel-Ange Neuralangelo est un modèle IA qui peut réaliser une reconstruction de surface 3D haute fidélité [Code inclus]

Les réseaux neuronaux ont connu une avancée significative ces dernières années et ont trouvé une utilisation dans pre...

Recherche en IA

Les chercheurs de Stanford présentent SequenceMatch Entraînement des LLMs avec une perte d'apprentissage par imitation.

Les modèles autorégressifs sont une classe de modèles statistiques basée sur l’intuition selon laquelle la vale...

AI

Les 10 meilleurs sociétés de génération d'IA dans le monde

Introduction L’intelligence artificielle (IA) est une technologie puissante qui peut transformer la façon dont ...

Actualités sur l'IA

Les Grammy Awards interdisent l'utilisation de l'IA les créateurs humains prennent le devant de la scène.

L’Académie d’enregistrement, responsable du prestigieux Grammy Awards, a décidé d’interdire l’...