Cet article sur l’IA propose MATLABER un nouvel auto-encodeur BRDF latent pour la génération de texte vers 3D consciente des matériaux

This article proposes MATLABER, a new latent BRDF auto-encoder for text-to-3D material-aware generation.

Le développement d’actifs 3D est essentiel pour de nombreuses applications commerciales, notamment les jeux, le cinéma et la RA/RV. Plusieurs étapes laborieuses et chronophages sont nécessaires dans le processus traditionnel de développement d’actifs 3D, qui dépendent toutes de connaissances spécialisées et d’une formation esthétique formelle. Les avancées récentes en termes de qualité et d’efficacité de génération, ainsi que leur potentiel à réduire de manière significative le temps et les compétences nécessaires à la création d’actifs 3D traditionnels, ont suscité une attention croissante pour les pipelines de texte vers 3D qui génèrent automatiquement des actifs 3D à partir de descriptions purement textuelles.

Ces pipelines de texte vers 3D peuvent fournir une géométrie et une apparence attrayantes en optimisant progressivement l’actif 3D cible exprimé en tant que NeRF ou DMTET grâce à la perte SDS. La figure 1 illustre la difficulté pour eux de restaurer des matériaux d’objet haute fidélité, ce qui limite considérablement leur utilisation dans des applications du monde réel telles que le relighting. Bien que des tentatives aient été faites pour modéliser la fonction de distribution bidirectionnelle de la réflectance (BRDF) et la réflectance lambertienne dans leurs conceptions, le réseau neuronal chargé de prédire les matériaux manque de motivation et d’indices nécessaires pour identifier un matériau approprié conforme à la distribution naturelle, notamment dans des conditions d’éclairage fixe où leur matériau indiqué est fréquemment enchevêtré avec les lumières environnantes.

Dans cette étude, des chercheurs du Shanghai AI Laboratory et du S – Lab de l’Université technologique de Nanyang utilisent des données matérielles riches déjà disponibles pour apprendre un pipeline de texte vers 3D unique qui sépare avec succès le matériau de l’éclairage ambiant. Il existe des ensembles de données de matériaux BRDF à grande échelle tels que MERL BRDF, les matériaux Adobe Substance3D et les collections BRDF du monde réel TwoShotBRDF, malgré l’inaccessibilité des ensembles de données couplés de matériaux et de descriptions textuelles. Par conséquent, ils suggèrent Material-Aware Text-to-3D through LAtent BRDF auto EncodeR (MATLABER), qui utilise un nouvel auto-encodeur BRDF latent pour créer des matériaux réalistes et naturels qui correspondent précisément aux indications textuelles.

Pour que MATLABER prédise des codes latents BRDF plutôt que des valeurs BRDF, l’auto-encodeur BRDF latent est entraîné à incorporer des prédictions BRDF du monde réel de TwoShotBRDF dans son espace latent lisse. Cela permet à MATLABER de se concentrer davantage sur la sélection du matériau le plus approprié et de se soucier moins de la validité de la BRDF projetée. Leur méthode garantit le réalisme et la cohérence des matériaux d’objet et permet de découpler de manière optimale la géométrie et l’apparence grâce à l’espace latent lisse de l’auto-encodeur BRDF. Leur méthode peut produire du contenu 3D de haute fidélité, dépassant les pipelines de texte vers 3D de pointe précédents, comme illustré dans la figure 1.

Figure 1: L’objectif de la génération de texte vers 3D est de créer des objets 3D de haute qualité correspondant aux descriptions textuelles fournies. Malgré des visuels impressionnants, des techniques représentatives comme DreamFusion et Fantasia3D continuent de peiner à récupérer des matériaux d’objet de haute fidélité. Plus précisément, Fantasia3D prévoit des matériaux BRDF enchevêtrés avec un éclairage ambiant tandis que DreamFusion ne tient compte que des matériaux diffus. La méthode, basée sur un auto-encodeur BRDF latent, peut produire des matériaux organiques pour des objets 3D, permettant des rendus réalistes dans différentes conditions d’éclairage.

De manière plus cruciale, une estimation précise des matériaux d’objet permet des activités telles que la modification de scène, l’édition de matériaux et le relighting qui étaient auparavant difficiles à réaliser. Plusieurs applications du monde réel notent que ces tâches en aval sont essentielles, ouvrant la voie à un paradigme plus pratique de génération de contenu 3D. De plus, leur algorithme peut inférer des informations tactiles et sonores à partir des matériaux acquis, qui constituent ensemble la trinité du matériau pour les objets virtuels, en utilisant des ensembles de données multimodaux comme ObjectFolder.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Le xAI d'Elon Musk affronte le ChatGPT d'OpenAI

Elon Musk, le milliardaire visionnaire derrière des entreprises telles que les voitures électriques, l’explorat...

AI

Restez en avance sur la courbe de confiance en IA la trousse à outils responsable en IA en open-source est dévoilée.

Dans le paysage technologique en évolution rapide d’aujourd’hui, l’intelligence artificielle (IA) e...

AI

Dévoiler l'avenir de l'IA avec GPT-4 et l'IA Explicative (XAI)

Introduction Dans le monde en constante évolution de l’Intelligence Artificielle (IA), GPT-4 est une merveille ...

AI

Elon Musk met en garde contre la montée de la superintelligence en Chine

L’entrepreneur renommé Elon Musk a récemment fait les gros titres avec sa déclaration audacieuse lors d’u...

AI

Grok L'IA Chatbot de xAI d'Elon Musk

Plongez dans Grok d'Elon Musk par xAI, un chatbot IA avec une récupération d'informations en temps réel, de l'humour ...

AI

Elon Musk's xAI entraîné sur le flux de Twitter

Elon Musk, le visionnaire derrière des entreprises telles que Tesla et SpaceX, a de nouveau fixé son attention sur le...