Reconnaissance du logo dans les images

Est-ce que quelqu’un connaît les travaux académiques récents qui ont été réalisés sur la reconnaissance du logo en images? S’il vous plaît répondre que si vous êtes familier avec ce sujet spécifique (je peux rechercher Google pour “reconnaissance de logo” moi-même, merci beaucoup). Toute personne connaissant bien la vision par ordinateur et ayant travaillé sur la reconnaissance d’objects est invitée à commenter également.

Mise à jour : Veuillez vous référer aux aspects algorithmiques (quelle approche pensez-vous appropriée, documents sur le terrain, si cela doit fonctionner (et a été testé) pour des données réelles, considérations d’efficacité) et non techniques (le langage de programmation utilisé ou que ce soit avec OpenCV …) Le travail sur l’indexation des images et la récupération des images basées sur le contenu peuvent également aider.

Vous pouvez essayer d’utiliser des fonctionnalités locales comme SIFT ici: http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

Cela devrait fonctionner car la forme du logo est généralement constante, les caractéristiques extraites doivent donc correspondre.

Le workflow sera comme ceci:

  1. Détecter les coins (par ex. Détecteur d’angle Harris) – pour le logo Nike, ce sont deux extrémités pointues.

  2. Calculer les descripteurs (comme SIFT – vecteur entier 128D)

  3. Au stade de la formation, souvenez-vous d’eux. à l’étape correspondante, trouvez les voisins les plus proches pour chaque fonction de la firebase database obtenue pendant la formation. Enfin, vous avez un ensemble de correspondances (certaines d’entre elles sont probablement erronées).

  4. Saisie de correspondances erronées avec RANSAC. Ainsi, vous obtiendrez la masortingce qui décrit la transformation d’une image de logo idéale en une image où vous trouverez le logo. Selon les parameters, vous pouvez autoriser différents types de transformations (uniquement la traduction, la traduction et la rotation, la transformation affine).

Le livre de Szeliski comporte un chapitre (4.1) sur les caractéristiques locales. http://research.microsoft.com/en-us/um/people/szeliski/Book/

PS

  1. Je suppose que vous voulez trouver des logos sur les photos, par exemple trouver tous les panneaux d’affichage Pepsi, afin qu’ils puissent être déformés. Si vous avez besoin de trouver un logo de chaîne de télévision à l’écran (pour qu’il ne soit pas pivoté et mis à l’échelle), vous pouvez le faire plus facilement (correspondance de modèle ou autre).

  2. SIFT conventionnel ne prend pas en compte les informations de couleur. Étant donné que les logos ont généralement des couleurs constantes (bien que la couleur exacte dépende de la foudre et de la caméra), vous pouvez envisager les informations de couleur d’une manière ou d’une autre.

Nous avons travaillé sur la détection / reconnaissance de logo dans des images réelles. Nous avons également créé un dataset FlickrLogos-32 et l’ avons rendu public, y compris des données, des scripts de vérité et d’évaluation.

Dans notre travail, nous avons traité la reconnaissance du logo comme un problème de récupération afin de simplifier la reconnaissance multi-classes et de permettre à ces systèmes d’être facilement évolutifs à de nombreuses classes (par exemple, des milliers).

Récemment, nous avons développé une technique de regroupement appelée Bundle min-Hashing qui agrège les configurations spatiales de plusieurs entités locales en ensembles d’entités très distinctifs. La représentation des lots est utilisable à la fois pour la récupération et la reconnaissance. Voir les exemples de cartes thermiques pour les détections de logo:

entrer la description de l'image icientrer la description de l'image ici

Vous trouverez plus de détails sur les opérations internes, les applications potentielles de cette approche, des expériences sur ses performances et, bien entendu, de nombreuses références à des travaux connexes dans les articles [1] [2] .

Travaillez là-dessus: la correspondance et l’extraction de marques de commerce dans les bases de données de sports reçoivent un PDF du document: http://scholar.google.it/scholar?cluster=9926471658203167449&hl=fr&as_sdt=2000

Nous avons utilisé SIFT comme descripteur de marque et d’image, et une correspondance de seuil normalisée pour calculer la distance entre les modèles et les images. Dans nos derniers travaux, nous avons pu réduire considérablement les calculs à l’aide de méta-modèles, en évaluant la pertinence des points SIFT présents dans différentes versions de la même marque.

Je dirais qu’en général, travailler avec des vidéos est plus difficile que de travailler sur des photos en raison de la très mauvaise qualité visuelle des standards de télévision actuellement utilisés.

Marco

J’ai travaillé sur un projet où il fallait faire quelque chose de très similaire. Au début, j’ai essayé d’utiliser les techniques de formation Haar en utilisant ce logiciel

OpenCV

Cela a fonctionné, mais n’était pas une solution optimale pour nos besoins. Nos images sources (où nous recherchions le logo) étaient de taille fixe et ne contenaient que le logo. Pour cette raison, nous avons pu utiliser cvMatchShapes avec une bonne correspondance connue et comparer la valeur renvoyée pour juger une bonne correspondance.