Comment l’IA affectera-t-elle le rôle des professionnels des données ?

Impact de l'IA sur les professionnels des données

Note de l’éditeur : Alan est un conférencier pour ODSC Europe les 14 et 15 juin. Assurez-vous de consulter sa conférence intitulée “La communication des données à l’ère de l’IA” !

Écrire sur l’impact potentiel de l’IA et des LLM en 2023 est demander des ennuis. Les prédictions vont de l’apocalyptique (lettres ouvertes d’experts renommés avertissant d’une menace existentielle pour l’humanité) au scepticisme (des possibilités intéressantes, mais actuellement trop de défauts).

Même si nous supposons que la réalité se situera quelque part entre les deux extrêmes, certainement dans le terme VoAGI, l’impact de l’IA générative sur les emplois dans de nombreux secteurs sera profond. La plupart des discussions se sont concentrées sur les implications pour les écrivains, les concepteurs, les ingénieurs logiciels, les chercheurs, les avocats et les employés administratifs. Moins a été dit sur les professionnels des données eux-mêmes.

Humains et machines

Les scientifiques des données et les analystes doivent être conscients de l’impact de cette technologie sur leur rôle, leurs processus et leurs relations avec les autres parties prenantes. Tout le monde est conscient de l’avertissement souvent répété sur les réseaux sociaux : l’IA ne prendra pas votre emploi, mais quelqu’un utilisant l’IA le fera.

Il y a clairement des aspects du traitement des données que l’IA va maîtriser. Identifier les caractéristiques et les relations, aider à nettoyer et structurer les données, et trier de gigantesques ensembles de données – ce sont tous des domaines où les machines excellent particulièrement. Et ces capacités sont déjà intégrées dans des produits et des processus axés sur les données.

Mais l’utilisation de l’IA pourrait aller plus loin. En fin de compte, les professionnels des données doivent apporter de la valeur à leur entreprise ou à leur organisation. Cela implique de créer des relations, d’expliquer des concepts et de communiquer clairement avec les autres, en particulier les non-spécialistes des données.

Comme des modèles tels que ChatGPT peuvent au moins agir comme des humains, ce sont les tâches qui semblent mieux adaptées aux professionnels en chair et en os qui pourraient être confiées à l’IA.

Interfaces conversationnelles

L’abstraction est utile car elle cache des niveaux de détail inutiles aux utilisateurs. Les codeurs ne veulent pas travailler en langage machine, donc les langages de programmation fournissent une couche de traduction lisible entre l’humain et la machine.

Les interfaces de chat peuvent être considérées comme une autre étape dans l’échelle de l’abstraction. Par exemple, les utilisateurs professionnels pourront interroger des bases de données en utilisant un langage naturel. ChatGPT est déjà utilisé pour générer des requêtes SQL dans la syntaxe correcte.

Cela soulève l’idée de “l’ingénierie de la requête” en tant que compétence spécifique, voire rôle – mais cela manque légèrement le point. Avec les interfaces conversationnelles, le modèle n’a pas besoin de se fier à une seule requête d’un utilisateur expert. Il peut poser une série de questions pour obtenir les informations dont il a besoin de l’utilisateur. Pensez à un médecin qui pose des questions à un patient avant de revenir avec un diagnostic.

Le modèle pourrait également se souvenir d’informations clés sur un utilisateur spécifique (le type de données le plus utile à son travail, les cycles d’activité saisonniers ou spécifiques aux données qui fournissent un contexte, les préférences de l’utilisateur en termes de lecture de graphiques ou de diagrammes).

En agissant dans ce rôle d’assistant personnel, il n’est pas difficile d’imaginer une directrice marketing arrivant à son bureau un lundi matin et demandant simplement : “Que dois-je savoir aujourd’hui ?”. L’IA peut alors essayer de prédire quelles données sont importantes pour cet utilisateur spécifique, les récupérer et les visualiser.

En plus de la personnalisation pour l’utilisateur, les modèles peuvent également être entraînés sur des ensembles de données de niche ou propriétaires pour les rendre encore plus spécialisés. Bloomberg GPT est un LLM sur mesure, avec 50 millions de paramètres, formé à l’aide d’un vaste ensemble d’informations financières.

Raconter automatiquement des histoires de données

Dans le cadre du processus d’analyse exploratoire des données, il est déjà possible de générer une série de graphiques et de diagrammes avec quelques lignes de code. Mais lorsqu’il s’agit de communiquer des insights de données à d’autres parties prenantes, les choses deviennent plus compliquées.

Les publics des présentations, des rapports ou des tableaux de bord ont des niveaux de littératie des données différents. Ils s’intéressent également à différentes parties des données. Réduire des ensembles de données complexes pour un public spécifique est encore une compétence très humaine. Selon les mots de Seth Godin : “Dans une présentation destinée à des non-scientifiques (ou à des scientifiques ennuyés), le but d’un graphique ou d’un diagramme est de faire passer un point, de manière vivante.”

L’analyse d’ODSC de 25 000 descriptions de postes d’analystes de données a révélé que la communication et la visualisation des données figuraient parmi les dix compétences les plus recherchées pour ces postes. La capacité à articuler les insights des données à différents publics est demandée.

Les Documents Magiques d’Alteryx sont un exemple d’utilisation de l’IA générative pour automatiser au moins une partie de ce processus de narration. En plus de visualiser les données dans le cadre d’une présentation, sa fonctionnalité Auto Insights peut extraire des récits descriptifs pour ajouter du contexte aux chiffres.

Explication des modèles

Les interfaces conversationnelles et les récits de données automatisés reposent tous deux sur la simplification. Fournir aux utilisateurs professionnels des idées spécifiques nécessite intrinsèquement de laisser certaines choses de côté – filtrer le signal du bruit.

Mais comme le savent tous ceux qui travaillent directement avec les données, ce processus de simplification peut faire perdre des nuances et des avertissements importants. Pour comprendre dans quelle mesure nous pouvons faire confiance aux prédictions et aux idées générées par l’IA, nous devons comprendre la qualité des données sous-jacentes. Jusqu’à présent, ChatGPT et des modèles similaires n’ont pas été très bons pour dire “Je ne sais pas”. Au lieu de cela, ils inventent (ou hallucinent) des réponses. Les experts en données humaines auront un rôle encore plus essentiel pour expliquer les limites à la fois des modèles et des données.

Il en va de même pour les biais dans les données d’entraînement. Bien qu’il y ait une prise de conscience générale que les biais des données sont un problème potentiel, les cadres enthousiastes peuvent souvent l’oublier lorsqu’ils voient un avantage concurrentiel qui pourrait bénéficier à l’organisation. Les professionnels des données doivent militer pour un examen minutieux des sources. Quelque part entre la phase expérimentale et improvisée d’un projet d’IA et son déploiement en production, ces ensembles de données doivent être audités.

Le modeste dictionnaire de données deviendra également plus important si vous avez des utilisateurs non experts interrogeant des ensembles de données en utilisant leur propre terminologie. Même un point de données en apparence simple comme “l’effectif actuel de l’entreprise” peut être différent en fonction de la personne qui pose la question et de la manière dont il est calculé. Les services financiers ont tendance à utiliser un nombre “équivalent temps plein”, tandis que les ressources humaines comptent les personnes (littéralement, le nombre d’humains dans l’entreprise).

Et il y aura de plus en plus de pression sur les personnes occupant des postes liés aux données pour expliquer non seulement les résultats qu’un modèle génère, mais aussi comment et pourquoi il les a générés. Il ne s’agit pas simplement d’une question d’éthique (bien que cela doive être intégré aux projets d’IA dès le départ). Les États-Unis, l’Union européenne, le Royaume-Uni et de nombreux autres pays examinent activement le cadre juridique et réglementaire entourant le déploiement des modèles d’IA.

Le futur professionnel des données

Ce sont des moments passionnants pour travailler dans des rôles axés sur les données. Mais alors que nous examinons l’impact de l’IA sur d’autres professions, nous devrions également considérer ce que cela pourrait signifier pour la nôtre. En tant que personnes ayant la compréhension la plus profonde de cette nouvelle technologie, nous devons être à la fois des évangélistes pour les possibilités qu’elle crée et des critiques minutieux des risques qu’elle soulève.

Pour en savoir plus sur l’impact potentiel de la révolution de l’IA sur les rôles des professionnels des données, je serais ravi de vous voir lors de ma présentation à la conférence ODSC Europe.

À propos de l’auteur

Alan Rutter est le fondateur du cabinet de conseil Fire Plus Algebra et est un spécialiste de la communication de sujets complexes par le biais de la visualisation des données, de l’écriture et de la conception. Il a travaillé en tant que journaliste, responsable de produit et formateur pour des marques et des organisations telles que Guardian Masterclasses, WIRED, Riskified, le ministère de l’Intérieur, le Conseil de recherche en biotechnologie et sciences biologiques et l’École de médecine tropicale de Liverpool.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Quantifiez les modèles Llama avec GGML et llama.cpp

Dans cet article, nous quantifions notre modèle Llama 2 pré-ajusté avec GGML et llama.cpp. Ensuite, nous exécutons le...

AI

Les meilleurs algorithmes et bibliothèques de détection d'objets en Intelligence Artificielle (IA)

La science de la vision par ordinateur a récemment connu des changements spectaculaires dans l’identification d...

AI

Les meilleurs cours d'IA gratuits pour sécuriser votre carrière à l'avenir

Voici 8 des meilleurs cours d'IA gratuits auxquels vous pouvez vous inscrire dès aujourd'hui.

AI

Stack Overflow révolutionne le support aux développeurs avec OverflowAI

Stack Overflow est une plateforme renommée pour les développeurs à la recherche de réponses techniques. Elle exploite...

AI

Les modèles d'IA sont puissants, mais sont-ils biologiquement plausibles?

Une nouvelle étude faisant le lien entre les neurosciences et l'apprentissage automatique offre des éclairages sur le...

AI

Plongée profonde dans le mode Copy-on-Write de pandas Partie I

pandas 2.0 a été publié début avril et a apporté de nombreuses améliorations au nouveau mode Copy-on-Write (CoW). Il ...