Qu’est-ce que les données synthétiques ?
Les données synthétiques sont quoi ?
Un guide pratique des différentes espèces de fausses données : Partie 1
Les données synthétiques sont, pour le dire clairement, des fausses données. Autrement dit, des données qui ne proviennent pas réellement de la population qui vous intéresse. (Population est un terme technique en science des données, que j’explique ici.) Ce sont des données que vous prévoyez de traiter comme si elles provenaient du lieu/groupe dont vous souhaitez qu’elles proviennent. (Ce n’est pas le cas.)
Les données synthétiques sont, pour le dire clairement, des fausses données.
Données artificielles, données synthétiques, fausses données et données simulées sont tous des synonymes avec des connotations poétiques légèrement différentes selon les époques. De nos jours, les jeunes branchés préfèrent le mot à la mode données synthétiques, peut-être parce que les investisseurs doivent être convaincus que quelque chose de nouveau a été inventé, plutôt que redécouvert. Et il y a quelque chose de légèrement nouveau en jeu ici, mais (à mon avis) pas assez nouveau pour rendre toutes les vieilles idées sans pertinence.
Plongeons-y !
- Former des leaders de la sécurité nationale sur l’intelligence artificielle
- L’ennemi invisible de l’IA Confronter le défi de la ‘Matière Noire’ Numérique
- Transformer d’anciennes cartes en modèles numériques 3D de quartiers perdus
(Remarque : les liens de cet article vous conduisent à des explications du même auteur.)
Des possibilités infinies
Si vous avez souffert d’un cours de troisième cycle sur la probabilité avancée et la théorie de la mesure comme moi (mon thérapeute et moi en sommes encore à le travailler plus de dix ans plus tard), vous serez inutilement conscient qu’il existe des nombres réels infinis. Entre autres choses, infini signifie que si vous essayez de les énumérer tous, je peux surgir comme un idiot et vous en trouver un nouveau, par exemple en ajoutant 1 à votre plus grand nombre, en prenant la moyenne de vos deux nombres les plus proches, ou en ajoutant un chiffre à la suite du nombre ayant la plus longue série de chiffres après la virgule.
Cela signifie également que si vous me donnez la liste de tous les nombres jamais enregistrés par les humains tout au long de l’histoire de l’humanité, je peux quand même en créer un tout neuf. Boom ! Le pouvoir.
Où est-ce que je veux en venir avec cela, en plus de fournir de la matière pour votre prochain débat alcoolisé sur l’existence d’une véritable originalité (pouah) ?
Nombres synthétiques
Disons que vous disposez d’un ensemble de données contenant des hauteurs humaines. Entre deux mesures (disons 173 cm et 174 cm, l’intervalle dans lequel vous trouverez ma taille), il y a une infinité…
We will continue to update IPGirl; if you have any questions or suggestions, please contact us!
Was this article helpful?
93 out of 132 found this helpful
Related articles
- Modèle informatique prédit les rendements des cultures
- Construire des pipelines de déploiement pour l’apprentissage automatique
- Deux techniques avancées de SQL qui peuvent considérablement améliorer vos requêtes
- Comment devenir un scientifique des données sans formation technique conseils et stratégies
- L’Assistant Ultime de Visualisation
- Formation de modèles de langage avec des données synthétiques de qualité de manuel scolaire
- Agrégation de données en Python avec Pandas Analyse des données de lithologie géologique