Une bibliothèque C / C ++ de type OpenCV pour le traitement audio?

Y a-t-il autre chose qui ressemble (en esprit) à OpenCV, mais pour le traitement de l’audio et pour en tirer une certaine intelligence? Les capacités peuvent aller de: –

  1. Capture audio multi-plateforme et lecture audio
  2. DSP – Filtres audio
  3. Détection de tonalité
  4. Analyse de la propriété tonale
  5. Synthèse de tonalité (diverses formes d’onde standard)
  6. La reconnaissance compte tenu de certains corpus et modèles de reconnaissance (p. Ex. Déterminer les instruments de musique, les rythmes, la parole humaine, etc.) – pourrait éventuellement utiliser d’autres projets à source ouverte pour la partie reconnaissance réelle (sphinx)
  7. Synthèse vocale / musicale – pourrait être à nouveau en utilisant d’autres projets open source (festival)

C’est bien si la bibliothèque fonctionne sur le format audio brut / la conversion d’encodage sont des problèmes externes gérés par d’autres bibliothèques existantes (de ffmpeg).

Je ne suis pas un expert dans ce domaine, mais j’ai besoin d’utiliser une telle API et je me demande si de telles bibliothèques existent, donc mon choix de termes pour déterminer les capacités n’est probablement pas le meilleur.

Pour la capture et la lecture audio, portaudio me vient à l’esprit.

Pour le traitement audio, STK semble prometteur.

Jetez un oeil à cette question connexe: Quelqu’un peut-il recommander une bibliothèque DSP / voix décente en C ++?

Je recommande ces trois bibliothèques:

  1. très facile à utiliser et convivial pour le traitement du signal général Aquila-dsp

  2. forte lib pour le traitement du signal audio bien que difficile à utiliser et c’est très grand et compliqué pour les débutants: projet CLAM

  3. un autre dont je n’ai aucune expérience en vaut la peine. tspl

Découvrez Essentia http://essentia.upf.edu/ Essentia est une bibliothèque C ++ open-source pour l’parsing audio et les informations musicales basées sur l’audio … Elle contient une vaste collection d’algorithmes réutilisables qui implémentent des fonctionnalités d’entrée / sortie audio standard blocs de traitement de signaux numériques, caractérisation statistique de données et un grand ensemble de descripteurs de musique spectraux, temporels, tonaux et de haut niveau.

Il existe également une twig openFrameworks, même si vous souhaiterez peut-être attendre jusqu’à ce qu’elle soit officiellement 64 bits, C ++ 11 dans quelques mois. https://github.com/GiantSteps/Essentia-Libraries

Je pense que vous pouvez essayer la bibliothèque sonore de Gaudio – http://www.geek-audio.org

La bibliothèque Gaudio prend en charge le décodage audio, l’encodage et le dps.