Apprentissage automatique, illustré apprentissage incrémental

Apprentissage automatique, illustré apprentissage incrémental

Comment les modèles apprennent de nouvelles informations au fil du temps, en maintenant et en développant les connaissances précédentes

Bienvenue dans la série illustrée sur l’apprentissage automatique. Si vous avez lu les autres articles de la série, vous connaissez le principe. Nous prenons un concept d’apprentissage automatique (qui peut sembler ennuyeux) et le rendons intéressant en l’illustrant ! Cet article portera sur un concept appelé Apprentissage incrémental, où les modèles d’apprentissage automatique apprennent de nouvelles informations au fil du temps, en maintenant et en développant les connaissances précédentes. Mais avant d’entrer dans les détails, parlons d’abord de ce à quoi ressemble le processus de construction des modèles aujourd’hui.

Nous suivons généralement un processus appelé apprentissage statique lors de la construction des modèles. Dans ce processus, nous entraînons un modèle en utilisant les dernières données disponibles. Nous ajustons et réglons le modèle lors du processus d’entraînement. Et une fois satisfait de ses performances, nous le déployons. Ce modèle est en production pendant un certain temps. Ensuite, nous remarquons que les performances du modèle se détériorent au fil du temps. C’est à ce moment-là que nous jetons le modèle existant et en construisons un nouveau en utilisant les dernières données disponibles. Et nous répétons ce même processus.

Illustrons cela avec un exemple concret. Prenons ce scénario hypothétique. Nous avons commencé à construire un modèle de fraude à la fin de janvier 2023. Ce modèle détecte si une transaction par carte de crédit est frauduleuse ou non. Nous entraînons notre modèle en utilisant toutes les données de transactions par carte de crédit que nous avions sur la période d’un an précédente (janvier 2022 à décembre 2022) et utilisons les données de transactions de ce mois-ci (janvier 2023) pour le tester.

À la fin du mois suivant, nous remarquons que le modèle ne fonctionne pas très bien avec les nouvelles données. Nous construisons donc un autre modèle, mais cette fois en utilisant les données de la période d’un an précédente (février 2022 à janvier 2023) pour l’entraîner, puis utilisons les données du mois en cours (février 2023) pour le tester. Et toutes les données en dehors de ces périodes d’entraînement et de test sont jetées.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Analyser l'infestation de rongeurs en utilisant les capacités géospatiales d'Amazon SageMaker

Les rongeurs tels que les rats et les souris sont associés à plusieurs risques pour la santé et sont connus pour prop...

AI

Recherche sémantique d'images pour les articles utilisant Amazon Rekognition, les modèles de base d'Amazon SageMaker et le service Amazon OpenSearch

Les éditeurs numériques cherchent continuellement des moyens de rationaliser et d'automatiser leurs flux de travail m...

AI

Visualisez une analyse Amazon Comprehend avec un nuage de mots dans Amazon QuickSight

Rechercher des informations dans un référentiel de documents textuels libres peut s'avérer être comme chercher une ai...

AI

Pratiques exemplaires et modèles de conception pour la construction de flux de travail d'apprentissage automatique avec les pipelines Amazon SageMaker

Dans cet article, nous proposons quelques bonnes pratiques pour maximiser la valeur des pipelines SageMaker et rendre...

AI

Permettez à vos utilisateurs professionnels de tirer des enseignements des documents d'entreprise en utilisant Amazon SageMaker Canvas Generative AI

Les entreprises cherchent à exploiter le potentiel de l'apprentissage automatique (ML) pour résoudre des problèmes co...

AI

Ajustez finement Falcon 7B et d'autres LLMs sur Amazon SageMaker avec le décorateur @remote

Aujourd'hui, les modèles d'IA générative couvrent une variété de tâches, de la résumé de texte, aux questions-réponse...