Directeur des connaissances en apprentissage automatique [Partie 2 Édition SaaS]

'Machine Learning Knowledge Director [Part 2 SaaS Edition]'

Si vous ou votre équipe êtes intéressés par la construction de solutions d’apprentissage automatique plus rapides, visitez hf.co/support dès aujourd’hui !

👋 Bienvenue à la partie 2 de notre série Insights du directeur de l’apprentissage automatique. Consultez la partie 1 ici.

Les directeurs de l’apprentissage automatique occupent une place unique à la table de l’IA, couvrant la perspective de différents rôles et responsabilités. Leur riche connaissance des cadres d’apprentissage automatique, de l’ingénierie, de l’architecture, des applications réelles et de la résolution de problèmes fournit des informations approfondies sur l’état actuel de l’apprentissage automatique. Par exemple, un directeur notera comment l’utilisation de la nouvelle technologie de reconnaissance vocale de transformer a permis de réduire le taux d’erreur de son équipe de 30% et comment une pensée simple peut aider à économiser beaucoup de puissance de calcul.

Vous êtes-vous déjà demandé ce que les directeurs de Salesforce ou de ZoomInfo pensent actuellement de l’état de l’apprentissage automatique ? Quels sont leurs plus grands défis ? Et de quoi sont-ils les plus enthousiastes ? Eh bien, vous êtes sur le point de le découvrir !

Dans cette deuxième partie axée sur les services logiciels en tant que service (SaaS), vous entendrez un auteur de manuels d’apprentissage approfondi pour les soins de santé, qui a également fondé une organisation à but non lucratif pour encadrer les talents de l’apprentissage automatique, un expert en cybersécurité et passionné d’échecs, un entrepreneur dont l’entreprise a été inspirée par le besoin de surveillance de la réputation de la marque de Barbie après un rappel de plomb, et un auteur de brevets et d’articles universitaires d’expérience qui aime voir ses 4 enfants commettre les mêmes erreurs que ses modèles d’apprentissage automatique.

🚀 Rencontrons quelques directeurs de l’apprentissage automatique de premier plan dans le SaaS et écoutons ce qu’ils ont à dire sur l’apprentissage automatique :

Omar Rahman – Directeur de l’apprentissage automatique chez Salesforce

Parcours : Omar dirige une équipe d’ingénieurs en apprentissage automatique et en données qui exploitent l’IA à des fins de sécurité défensive au sein de l’équipe de cybersécurité. Auparavant, Omar a dirigé des équipes de science des données et d’ingénierie de l’apprentissage automatique chez Adobe et SAP, en se concentrant sur l’apport de capacités intelligentes aux applications de marketing cloud et d’approvisionnement. Omar est titulaire d’une maîtrise en génie électrique de l’Université d’État de l’Arizona.

Anecdote amusante : Omar aime jouer aux échecs et consacre son temps libre à guider et à encadrer les étudiants diplômés en IA.

Salesforce : Logiciel de gestion de la relation client numéro 1 dans le monde.

1. Comment l’IA a-t-elle eu un impact positif sur le SaaS ?

L’IA a bénéficié de plusieurs façons aux offres SaaS.

a. Amélioration de l’automatisation au sein des applications : Par exemple, un aiguilleur de tickets de service utilisant le traitement automatique du langage naturel (NLP) pour comprendre le contexte de la demande de service et la diriger vers l’équipe appropriée au sein de l’organisation.

b. Réduction de la complexité du code : Les systèmes basés sur des règles ont tendance à devenir ingérables à mesure que de nouvelles règles sont ajoutées, ce qui augmente les coûts de maintenance. Par exemple, un système de traduction linguistique basé sur l’IA est plus précis et robuste avec beaucoup moins de lignes de code par rapport aux systèmes basés sur des règles précédentes.

c. De meilleurs résultats de prévision entraînent des économies de coûts. Une prévision plus précise permet de réduire les commandes en attente dans la chaîne d’approvisionnement ainsi que les coûts de stockage.

2. Quels sont les plus grands défis de l’IA dans le SaaS ?

a. La mise en production d’applications d’IA nécessite bien plus qu’un simple modèle. Pouvoir exploiter le modèle pour fournir des résultats, détecter et s’adapter aux changements dans les statistiques des données, etc. crée une charge importante lors du déploiement et de la maintenance des systèmes d’IA.

b. Dans la plupart des grandes organisations, les données sont souvent cloisonnées et mal entretenues, ce qui entraîne une perte de temps considérable pour consolider les données, prétraiter, nettoyer les données, etc., nécessitant ainsi une quantité importante de temps et d’efforts pour créer des applications basées sur l’IA.

3. Quelle est une erreur commune que vous voyez les gens faire en essayant d’intégrer l’IA dans le SaaS ?

Ne pas se concentrer suffisamment sur le contexte commercial et le problème à résoudre, mais plutôt essayer d’utiliser les algorithmes les plus récents et les bibliothèques nouvellement diffusées en open source. Beaucoup peut être accompli grâce à des techniques traditionnelles simples d’apprentissage automatique.

4. Ce qui vous enthousiasme le plus au sujet de l’avenir de l’IA ?

Les capacités généralisées de l’intelligence artificielle, si elles sont bien construites et gérées, ont le potentiel de transformer l’humanité de plus de façons qu’on ne peut l’imaginer. J’espère que nous verrons d’importants progrès dans les domaines de la santé et des transports. Nous constatons déjà les avantages de l’IA en radiologie, ce qui permet de réaliser des économies importantes en main-d’œuvre et permet aux humains de se concentrer sur des tâches plus complexes. Les voitures et les camions autonomes transforment déjà le secteur des transports.

Cao (Danica) Xiao – Directrice senior de l’apprentissage machine chez Amplitude

Contexte : Cao (Danica) Xiao est la directrice senior et responsable de la science des données et de l’apprentissage machine chez Amplitude. Son équipe se concentre sur le développement et le déploiement de modèles et de produits d’apprentissage machine en libre-service basés sur des données utilisateur provenant de différentes sources afin de résoudre des défis commerciaux critiques liés à l’analyse et à l’optimisation de la production numérique. De plus, elle est une chercheuse passionnée en apprentissage machine et a publié plus de 95 articles dans des revues scientifiques de premier plan en informatique. Elle est également une leader technologique avec une vaste expérience dans la création de feuilles de route en apprentissage machine, la constitution d’équipes et le mentorat.

Avant de rejoindre Amplitude, Cao (Danica) était responsable mondiale de l’apprentissage machine au sein du Centre d’excellence analytique d’IQVIA. Avant cela, elle était chercheuse à IBM Research et responsable de la recherche au MIT-IBM Watson AI Lab. Elle a obtenu son doctorat en apprentissage machine à l’Université de Washington, à Seattle. Récemment, elle a également co-écrit un manuel sur l’apprentissage profond pour la santé et a fondé une organisation à but non lucratif pour encadrer les talents en apprentissage machine.

Anecdote : Cao aime les chats et est maman de deux chats : une femelle Singapura et un mâle British Shorthair.

Amplitude : Une plateforme d’analyse de produits basée sur le cloud qui aide les clients à construire de meilleurs produits.

1. Comment l’apprentissage machine a-t-il eu un impact positif sur le SaaS ?

L’apprentissage machine joue un rôle déterminant en transformant d’énormes volumes de données générées par des machines ou des utilisateurs en réponses à toutes sortes de questions commerciales, telles que la personnalisation, la prédiction, la recommandation, etc. Il a un impact sur un large éventail de secteurs industriels via le SaaS.

2. Quels sont les plus grands défis de l’apprentissage machine dans le SaaS ?

Le manque de données pour l’entraînement des modèles d’apprentissage machine qui couvrent un éventail plus large de cas d’utilisation dans l’industrie. Bien qu’il s’agisse d’une solution générale pour tous les secteurs industriels, il est encore nécessaire de trouver comment gérer les besoins spécifiques à chaque secteur qui découlent des activités commerciales ou des problèmes de changement de domaine qui affectent la qualité des modèles d’apprentissage machine.

3. Quelle est l’erreur commune que vous constatez chez les personnes qui essaient d’intégrer l’apprentissage machine dans un produit SaaS ?

Ne pas donner aux utilisateurs la flexibilité d’incorporer leurs connaissances commerciales ou d’autres facteurs humains qui sont essentiels à la réussite de l’entreprise. Par exemple, pour une recommandation de produit en libre-service, ce serait bien si les utilisateurs pouvaient contrôler la diversité des produits recommandés.

4. Qu’est-ce qui vous enthousiasme le plus pour l’avenir de l’apprentissage machine ?

L’apprentissage machine a connu un succès considérable. Il évolue également rapidement pour résoudre les limitations actuelles (par exemple, le manque de données, le changement de domaine, l’intégration des connaissances du domaine).

Davantage de technologies d’apprentissage machine seront appliquées pour répondre aux besoins commerciaux ou des clients. Par exemple, l’apprentissage machine interprétable permettra aux utilisateurs de comprendre et de faire confiance aux résultats des modèles d’apprentissage machine ; la prédiction contrefactuelle permettra aux utilisateurs d’estimer les résultats alternatifs s’ils prennent une décision commerciale différente.

Raphael Cohen – Directeur de l’apprentissage machine chez ZoomInfo

Contexte : Raphael est titulaire d’un doctorat dans le domaine de la compréhension des dossiers médicaux et de la génétique, il est l’auteur de 20 articles académiques et détient 8 brevets. Raphael est également un leader en science des données et en recherche avec une expérience en NLP, en parole, en santé, en ventes, en parcours clients et en informatique.

Anecdote : Raphael a 4 enfants et aime les voir apprendre et faire les mêmes erreurs que certains de ses modèles d’apprentissage machine.

ZoomInfo : Une technologie intelligente de vente et de marketing soutenue par la base de données d’entreprises la plus complète au monde.

1. Comment l’apprentissage machine a-t-il eu un impact positif sur le SaaS ?

L’apprentissage machine a facilité la transcription des données de conversation pour aider les personnes à découvrir de nouvelles informations et compréhensions. Les utilisateurs peuvent désormais facilement consulter les sujets abordés, les objectifs résumés, les conclusions, qui a le plus parlé, qui a posé les meilleures questions, quelles sont les prochaines étapes, et bien plus encore. Cela est extrêmement utile pour de nombreuses interactions telles que les e-mails et les visioconférences (qui sont de plus en plus courantes).

Avec Chorus.ai, nous transcrivons les conversations en temps réel pendant qu’elles sont enregistrées. Nous utilisons un algorithme appelé Wave2Vec pour cela. 🤗 Hugging Face a récemment publié sa propre version de Wave2Vec créée pour l’entraînement et dont nous avons tiré beaucoup de valeur. Cette nouvelle génération de la technologie de transformation de la parole par les transformers est incroyablement puissante, elle a réduit notre taux d’erreur de 30%.

Une fois que nous avons transcrit une conversation, nous pouvons examiner le contenu – c’est là que l’analyse du langage naturel (NLP) intervient et nous nous appuyons fortement sur les transformers de Hugging Face pour nous permettre de décrire environ 20 catégories de sujets à l’intérieur des enregistrements et des e-mails; par exemple, parlons-nous de tarification, de signature d’un contrat, des prochaines étapes, tous ces sujets sont envoyés par e-mail ou discutés et il est maintenant facile d’extraire cette information sans avoir à revenir sur toutes vos conversations.

Cela contribue grandement à améliorer les performances des personnes dans leur travail.

2. Quels sont les plus grands défis de l’apprentissage automatique (ML) dans les SaaS ?

Le plus grand défi est de comprendre quand utiliser l’apprentissage automatique (ML).

Quels problèmes pouvons-nous résoudre avec le ML et lesquels ne devrions-nous pas résoudre ? Souvent, nous faisons une percée avec un modèle de ML, mais un modèle heuristique plus léger sur le plan informatique est mieux adapté pour résoudre le problème que nous avons.

C’est là qu’une stratégie d’IA solide entre en jeu. —Comprenez comment vous voulez que votre produit final fonctionne et avec quelle efficacité.

Nous nous posons aussi la question de savoir comment mettre en production les modèles de ML que vous avez construits avec une empreinte environnementale/informatique faible ? Tout le monde lutte avec cela ; comment maintenir les modèles en production de manière efficace sans consommer trop de ressources.

Un excellent exemple de cela a été lorsque nous sommes passés au framework Wav2Vec, ce qui nous a obligé à découper notre audio conversationnel en segments de 15 secondes qui sont ensuite alimentés dans ce modèle énorme. Pendant ce processus, nous avons découvert que nous alimentions le modèle avec de nombreux segments qui étaient du silence pur. C’est courant lorsque quelqu’un ne se présente pas ou qu’une personne attend que quelqu’un d’autre rejoigne une réunion.

En ajoutant simplement un autre modèle très léger pour nous dire quand ne pas envoyer les segments silencieux dans ce grand modèle de ML compliqué, nous sommes en mesure d’économiser beaucoup de puissance de calcul/énergie. C’est un exemple où les ingénieurs peuvent réfléchir à d’autres moyens plus simples d’accélérer et de réduire la production de modèles. Il y a une opportunité pour que plus d’ingénieurs soient plus astucieux et optimisent mieux les modèles sans consommer trop de ressources.

3. Quelle est une erreur courante que vous voyez les gens commettre en essayant d’intégrer le ML dans les SaaS ?

Ma solution est-elle la meilleure solution ? Existe-t-il un meilleur moyen de décomposer cela et de le résoudre de manière plus efficace ?

Quand nous avons commencé à identifier les intervenants, nous avons directement utilisé une méthode de ML et ce n’était pas aussi précis que les données du fournisseur de vidéoconférence.

Depuis, nous avons appris que la meilleure façon de faire cela est de commencer par les métadonnées de l’identité des intervenants fournies par le fournisseur de conférence, puis de les superposer avec un modèle d’incorporation intelligent. Nous avons perdu du temps précieux pendant cette courbe d’apprentissage. Nous n’aurions pas dû utiliser cette grande solution de ML si nous avions pris le temps de comprendre qu’il existe d’autres sources de données dans lesquelles nous devrions investir et qui nous aideront à accélérer de manière plus efficace.

Pensez en dehors des sentiers battus et ne vous contentez pas de prendre quelque chose que quelqu’un a construit et de penser que vous avez une idée pour l’améliorer. Où pouvons-nous être plus malins en comprenant mieux le problème ?

4. Qu’est-ce qui vous enthousiasme le plus à propos de l’avenir du ML ?

Je pense que nous sommes au milieu d’une autre révolution. Pour nous, voir notre taux d’erreur diminuer de 30% grâce à notre modèle Wave2Vec a été incroyable. Nous avons travaillé pendant des années en ne réduisant l’erreur que de 1% à chaque fois, puis en l’espace de 3 mois, nous avons constaté une énorme amélioration et nous savons que ce n’est que le début. Dans le milieu universitaire, des choses plus grandes et plus intelligentes se produisent. Ces modèles pré-entraînés nous permettent de faire des choses que nous n’aurions jamais pu imaginer auparavant. C’est très excitant !

Nous voyons également beaucoup de technologies issues de l’analyse du langage naturel (NLP) entrer dans d’autres domaines comme la parole et la vision et être en mesure de les alimenter.

Une autre chose qui m’enthousiasme beaucoup, c’est la génération de modèles ! Nous avons récemment travaillé avec une entreprise appelée Bria.ai et ils utilisent ces incroyables GAN pour créer des images. Vous prenez une photo standard et vous pouvez la transformer en une autre photo en disant “enlever les lunettes”, “ajouter des lunettes” ou “ajouter des cheveux” et cela se fait parfaitement. L’idée est que nous pouvons utiliser cela pour générer des données. Nous pouvons prendre des images de personnes dans des réunions qui ne sourient pas et nous pouvons les faire sourire afin de constituer un ensemble de données pour la détection des sourires. Cela sera transformateur. Vous pouvez prendre 1 image et en faire 100 images. Cela s’appliquera également à la génération de parole qui pourrait être une application puissante dans le secteur des services.

Des réflexions finales ?

-Il est difficile de mettre en production des modèles. Je crois que les équipes de science des données ont besoin d’une ingénierie intégrée avec elles. Les ingénieurs devraient faire partie de l’équipe d’IA. Ce sera un pivot structurel important à l’avenir.

Martin Ostrovsky Fondateur/Directeur Général et Directeur de l’Apprentissage Automatique chez Repustate Inc.

Contexte : Martin est passionné par l’IA, l’apprentissage automatique et le TALN. Il est responsable de guider la stratégie et le succès de tous les produits de Repustate en dirigeant l’équipe pluridisciplinaire chargée de les développer et de les améliorer. Il définit la stratégie, la feuille de route et la définition des fonctionnalités pour l’API d’Analyse de Texte Mondiale de Repustate, l’Analyse de Sentiment, la Recherche Approfondie et les solutions de Reconnaissance des Entités Nomées. Il possède un diplôme de licence en informatique de l’Université York et a obtenu son Master en Administration des Affaires de la Schulich School of Business.

Anecdote : La première application d’apprentissage automatique que j’ai utilisée était pour les jouets Barbie. Mon professeur à la Schulich Business School a mentionné que Barbie devait surveiller sa réputation de marque en raison d’un rappel des jouets en raison de préoccupations concernant une quantité excessive de plomb. Embaucher des personnes pour passer en revue manuellement chaque publication sur les réseaux sociaux et chaque article en ligne me semblait inefficace et inefficace. J’ai donc proposé de créer un algorithme d’apprentissage automatique qui surveillerait ce que les gens pensent d’eux sur tous les réseaux sociaux et canaux en ligne. L’algorithme a fonctionné parfaitement. Et c’est ainsi que j’ai décidé de nommer ma société, Repustate – l’état de votre réputation. 🤖

Repustate : Un fournisseur leader de services d’analyse de texte pour les entreprises.

1. Quelle est votre application commerciale d’apprentissage automatique préférée ?

Ma application d’apprentissage automatique préférée est la cybersécurité.

La cybersécurité reste la partie la plus critique pour toute entreprise (gouvernementale ou non) en ce qui concerne les données. L’apprentissage automatique permet d’identifier les menaces cybernétiques, de lutter contre la cybercriminalité, y compris le cyberharcèlement, et permet une réponse plus rapide aux violations de sécurité. Les algorithmes d’apprentissage automatique analysent rapidement les vulnérabilités les plus probables et les applications potentielles de logiciels malveillants et d’espionnage en fonction des données utilisateur. Ils peuvent repérer les distorsions dans les modèles d’entrée des points de terminaison et les identifier comme une violation potentielle de données.

2. Quel est votre plus grand défi en matière d’apprentissage automatique ?

Le plus grand défi en matière d’apprentissage automatique est la transcription audio en texte en langue arabe. Il existe plusieurs systèmes capables de déchiffrer l’arabe, mais ils manquent de précision. L’arabe est la langue officielle de 26 pays et compte 247 millions de locuteurs natifs et 29 millions de locuteurs non natifs. C’est une langue complexe avec un vocabulaire riche et de nombreux dialectes.

L’outil d’exploration des sentiments doit pouvoir lire directement les données en arabe si vous souhaitez obtenir des informations précises à partir du texte arabe, car sinon les nuances sont perdues dans les traductions. La traduction du texte en anglais ou dans une autre langue peut complètement changer le sens des mots en arabe, y compris même le mot racine. C’est pourquoi l’algorithme doit être entraîné sur des ensembles de données arabes et utiliser un étiqueteur morphosyntaxique arabe dédié. En raison de ces défis, la plupart des entreprises ne parviennent pas à fournir une traduction précise de l’audio en texte arabe à ce jour.

3. Quelle est l’erreur la plus courante que vous voyez les gens commettre en essayant d’intégrer l’apprentissage automatique ?

L’erreur la plus courante que les entreprises commettent lorsqu’elles essaient d’intégrer l’apprentissage automatique est l’insuffisance des données dans leurs ensembles de données d’entraînement. La plupart des modèles d’apprentissage automatique ne peuvent pas faire la distinction entre les bonnes données et les données insuffisantes. Par conséquent, les ensembles de données d’entraînement sont considérés comme pertinents et utilisés comme précédent pour déterminer les résultats dans la plupart des cas. Ce défi ne se limite pas aux petites entreprises ou aux entreprises de taille VoAGI ; les grandes entreprises ont le même défi.

Peu importe les processus d’apprentissage automatique, les entreprises doivent s’assurer que les ensembles de données d’entraînement sont fiables et exhaustifs pour obtenir les résultats souhaités en intégrant un élément humain aux premières étapes de l’apprentissage automatique.

Cependant, les entreprises peuvent créer la base nécessaire pour des projets d’apprentissage automatique réussis grâce à une revue approfondie de données d’entraînement précises, complètes et constantes.

4. Où voyez-vous l’apprentissage automatique avoir le plus grand impact dans les 5 à 10 prochaines années ?

Dans les 5 à 10 prochaines années, l’apprentissage automatique aura le plus grand impact sur la transformation du secteur de la santé.

Hôpitaux en réseau et soins connectés :

Avec des soins prédictifs, les centres de commandement sont prêts à analyser en temps réel les données cliniques et de localisation pour surveiller l’offre et la demande dans les réseaux de santé. Grâce à l’apprentissage automatique (ML), les professionnels de la santé seront en mesure de repérer plus rapidement et efficacement les patients à haut risque, éliminant ainsi les goulots d’étranglement du système. Vous pouvez vérifier plus rapidement la propagation des maladies contagieuses, prendre de meilleures mesures pour gérer les épidémies, identifier de manière plus précise les patients à risque, en particulier pour les maladies génétiques, et bien plus encore.

Meilleures expériences pour le personnel et les patients :

On s’attend à ce que les réseaux de soins de santé prédictifs réduisent les temps d’attente, améliorent les flux de travail du personnel et assument le fardeau administratif toujours croissant. En apprenant de chaque patient, diagnostic et procédure, l’apprentissage automatique (ML) est censé créer des expériences adaptées au personnel de l’hôpital ainsi qu’au patient. Cela améliore les résultats de santé, réduit les pénuries et l’épuisement des cliniciens tout en permettant au système d’être financièrement durable.


🤗 Nous vous remercions de vous joindre à nous pour cette deuxième édition des aperçus du directeur de l’apprentissage automatique (ML). Restez à l’écoute pour plus d’informations de la part des directeurs de l’apprentissage automatique (ML) dans les domaines de la finance, des soins de santé et du commerce électronique.

Un grand merci à Omar Rahman, Cao (Danica) Xiao, Raphael Cohen et Martin Ostrovsky pour leurs brillantes idées et leur participation à cet article. Nous nous réjouissons de voir chacun de vos succès continus et nous vous soutiendrons à chaque étape. 🎉

Si vous ou votre équipe êtes intéressés à accélérer votre feuille de route ML avec les experts de Hugging Face, veuillez visiter hf.co/support pour en savoir plus.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Ainsi, So Fresh Jouez aux tout derniers jeux dans le cloud dès le premier jour

C’est une fête ce jeudi avec plusieurs nouveaux titres lancés en streaming sur GeForce NOW. Profitez de la magi...

AI

'Remnant II' en tête d'affiche parmi les 14 jeux rejoignant GeForce NOW en juillet

C’est un mois de juillet bien rempli avec 14 nouveaux titres pris en charge dans la bibliothèque GeForce NOW, n...

AI

Un Âge d'Or Age of Empires III rejoint GeForce NOW

Conquérez les terres dans Age of Empires III: Definitive Edition, lauréat de Microsoft. Il mène les 10 nouveaux jeux ...

AI

Un jeudi GFN ultime 41 nouveaux jeux, plus la sortie complète de 'Baldur's Gate 3' et les premiers titres de Bethesda à rejoindre le Cloud en août

L’Ultimate upgrade est terminé — la performance ultime de GeForce NOW est désormais diffusée partout en Amériqu...

AI

Voici l'offre Les jeux de la vente d'été de Steam en streaming sur GeForce NOW

Le jeudi GFN arrive avec la douce Steam Summer Sale – avec des centaines de jeux PC jouables sur GeForce NOW di...

AI

Défi accepté GeForce NOW enflamme le cloud avec un défi ultime et les premiers jeux Bethesda.

Levez-vous et brillez, il est temps de se réveiller – le défi GeForce NOW Ultimate KovaaK’s démarre aujourdR...