Émissions de carbone d’une équipe d’ingénierie ML

Emprunte carbone d'une équipe d'ingénierie en ML

Le coût caché du développement qui compte vraiment

Tout le monde est conscient de la crise climatique due au réchauffement climatique résultant des activités humaines. Pour prévenir ses conséquences catastrophiques [1], le monde doit réduire drastiquement nos émissions de gaz à effet de serre, de nombreux pays fixant un objectif de zéro émission nette d’ici 2050.

L’essor technologique de l’IA ces dernières années a également suscité des inquiétudes quant à son coût environnemental. Si l’on ne regarde que ses contributions directes, celles-ci se feront par l’utilisation d’électricité pour entraîner et alimenter les modèles. Par exemple, l’entraînement de ChatGPT-3 avec ses 175 milliards de paramètres a généré des émissions de gaz à effet de serre équivalentes à 502 tonnes de CO2 [2]. Le petit nouveau Llama2 génère quant à lui 539 tonnes de CO2 équivalent pour l’entraînement de sa famille de quatre modèles [3]. Pour mettre cela en perspective, chaque valeur équivaut aux émissions d’un passager effectuant un vol aller simple de New York à San Francisco 500 fois.

Je travaille au sein d’une équipe d’ingénierie en apprentissage automatique, et cette question me taraude également constamment. Quelle est notre contribution aux émissions de carbone par le biais de la consommation d’électricité ? Existe-t-il des moyens de la réduire ? Et c’est ainsi que commence une première tentative de comptabilisation du carbone de notre part.

Photo de Chris LeBoutillier sur Unsplash

Méthodes

Il n’y a pas de moyen unique et direct de mesurer notre consommation d’électricité et donc notre impact carbone. Cela est dû à la variété des plateformes et des services que nous utilisons. Je ne vais pas entrer dans les détails techniques, mais de manière générale, cela comprend trois méthodes.

  1. Fourni : Les chiffres exacts des émissions de carbone sont déjà calculés pour nous. Cela a été fourni par notre fournisseur de services cloud (CSP).
  2. Outils : Nous avons utilisé plusieurs logiciels tels que Powermetics, Nvidia-SMI et Turbostat pour mesurer la puissance en watts, ce qui permet de suivre le calcul CPU et GPU de nos ordinateurs portables et de notre serveur sur site.
  3. Auto-calculé : Lorsque ce qui précède n’est pas possible, nous utilisons des méthodes proxy pour calculer. Cela consiste à enregistrer la durée du calcul, à estimer le pourcentage d’utilisation du/des processeurs, ainsi qu’à trouver la puissance thermique de conception (TDP) de chaque type de puce pour calculer la puissance consommée. Le reste des plateformes est calculé de cette manière.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

Simplification des Transformers NLP de pointe en utilisant des mots que vous comprenez - partie 2 - Entrée

Le dragon sort de son œuf, les bébés sortent du ventre, le texte généré par l'IA commence à partir des entrées. Nous ...

Apprentissage automatique

L'IA excelle dans la détection de maladies mentales

Détecter le délire chez les patients gravement malades est une tâche complexe avec des implications significatives po...

AI

Chattez avec des PDF | Donnez du pouvoir à l'interaction textuelle avec Python et OpenAI

Introduction Dans un monde rempli d’informations, les documents PDF sont devenus un élément essentiel pour part...

AI

Comment j'ai appris à aimer l'IA générative autonome par rapport à l'auto-complétion

L'IA générative peut devenir le meilleur ami d'un développeur pour les tests unitaires, mais les outils d'apprentissa...

AI

Préparez-vous pour une révolution sonore dans l'IA 2023 est l'année des ondes sonores génératives

L’année précédente a connu une augmentation significative du travail axé sur la vision par ordinateur (CV) et l...