Qu’est-ce que les données synthétiques ?

Les données synthétiques sont quoi ?

Un guide pratique des différentes espèces de fausses données : Partie 1

Les données synthétiques sont, pour le dire clairement, des fausses données. Autrement dit, des données qui ne proviennent pas réellement de la population qui vous intéresse. (Population est un terme technique en science des données, que j’explique ici.) Ce sont des données que vous prévoyez de traiter comme si elles provenaient du lieu/groupe dont vous souhaitez qu’elles proviennent. (Ce n’est pas le cas.)

Les données synthétiques sont, pour le dire clairement, des fausses données.

Données artificielles, données synthétiques, fausses données et données simulées sont tous des synonymes avec des connotations poétiques légèrement différentes selon les époques. De nos jours, les jeunes branchés préfèrent le mot à la mode données synthétiques, peut-être parce que les investisseurs doivent être convaincus que quelque chose de nouveau a été inventé, plutôt que redécouvert. Et il y a quelque chose de légèrement nouveau en jeu ici, mais (à mon avis) pas assez nouveau pour rendre toutes les vieilles idées sans pertinence.

Plongeons-y !

Tous les droits d'image appartiennent à l'auteur.

(Remarque : les liens de cet article vous conduisent à des explications du même auteur.)

Des possibilités infinies

Si vous avez souffert d’un cours de troisième cycle sur la probabilité avancée et la théorie de la mesure comme moi (mon thérapeute et moi en sommes encore à le travailler plus de dix ans plus tard), vous serez inutilement conscient qu’il existe des nombres réels infinis. Entre autres choses, infini signifie que si vous essayez de les énumérer tous, je peux surgir comme un idiot et vous en trouver un nouveau, par exemple en ajoutant 1 à votre plus grand nombre, en prenant la moyenne de vos deux nombres les plus proches, ou en ajoutant un chiffre à la suite du nombre ayant la plus longue série de chiffres après la virgule.

Cela signifie également que si vous me donnez la liste de tous les nombres jamais enregistrés par les humains tout au long de l’histoire de l’humanité, je peux quand même en créer un tout neuf. Boom ! Le pouvoir.

Où est-ce que je veux en venir avec cela, en plus de fournir de la matière pour votre prochain débat alcoolisé sur l’existence d’une véritable originalité (pouah) ?

Nombres synthétiques

Disons que vous disposez d’un ensemble de données contenant des hauteurs humaines. Entre deux mesures (disons 173 cm et 174 cm, l’intervalle dans lequel vous trouverez ma taille), il y a une infinité…

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Science des données

Deux techniques avancées de SQL qui peuvent considérablement améliorer vos requêtes

SQL est le pain quotidien de tout professionnel des données. Peu importe que vous soyez un analyste de données, un sc...

AI

10 Questions fréquentes auxquelles les analystes de données sont susceptibles de faire face - et comment y répondre

Dans le monde effréné de l'analyse des données, il n'est pas rare de se retrouver à vivre un sentiment de déjà vu en ...

Science des données

Aide-mémoire Bard pour la science des données

Consultez notre dernière fiche de triche pour vous mettre à jour et fournir une référence pratique pour utiliser l'ou...

AI

Rôle des contrats de données dans le pipeline de données

Qu’est-ce que les contrats de données ? Un contrat de données est un accord ou un ensemble de règles définissan...

AI

Décoder la symphonie du son traitement du signal audio pour l'ingénierie musicale

La capacité de traiter et d'analyser des données de différentes sortes pour obtenir des idées pratiques est l'une des...

AI

À l'intérieur du fonctionnement interne de CHATGPT une réponse à chaque question que vous vous posez sur l'IA

Nous savons tous que ChatGPT est un chatbot IA convivial qui répond à nos questions et exécute nos commandes en nous ...