Data Commons utilise l’IA pour rendre les données publiques mondiales plus accessibles et utiles.

Data Commons utilise l'IA pour rendre les données publiques mondiales plus accessibles et utiles. Condensed Data Commons utilise l'IA pour faciliter l'accès et l'utilisation des données publiques mondiales.

À chaque instant, partout dans le monde, les gouvernements, les organisations et bien d’autres génèrent des données sur des sujets aussi variés que la température, le commerce ou les taux de maladie. Ce sont des données qui pourraient être extrêmement utiles pour comprendre et relever les grands défis sociétaux tels que le changement climatique, la faim ou les épidémies. Heureusement, une grande partie de ces données est disponible publiquement, avec encore plus à venir. Malheureusement, être disponible publiquement ne signifie pas être facile d’accès et d’utilisation. C’est l’écart que Data Commons, une initiative de Google, s’efforce de combler.

Les données sont souvent fragmentées par les frontières des États et des pays, collectées et publiées par différents organismes, institutions de recherche et autres organisations non gouvernementales, et partagées dans différents formats et à des moments différents. Il peut être difficile, chronophage et coûteux de faire fonctionner ensemble ces ensembles de données publiques de manière utile pour les décideurs politiques, les chercheurs, les organisations à but non lucratif, les journalistes, les étudiants et les membres du grand public qui cherchent à mieux comprendre les problèmes sociétaux et à trouver des solutions. La vision à long terme de Data Commons est de faire pour les données disponibles publiquement ce que Google Search fait pour Internet ou Google Maps pour la navigation – les organiser et les rendre accessibles et utiles.

10:25

Notre objectif de rendre les données et les informations qui en découlent plus accessibles à ceux qui cherchent à comprendre et à travailler sur les défis et les opportunités les plus pressants de la société est alimenté par deux innovations, et d’autres sont à venir.

Premièrement, depuis 2017, l’équipe de Data Commons cherche à normaliser et à traiter des milliers d’ensembles de données provenant de sources publiques fiables, allant du Groupe d’experts intergouvernemental sur l’évolution du climat des Nations Unies à l’Institut brésilien de géographie et de statistique en passant par le Département du commerce des États-Unis. Cela a nécessité une innovation pour rendre possible la mise en commun de données dans des formats, des schémas et des méthodes d’accès très variés, et pour créer un graphe de connaissances avec une seule API et un seul schéma, créant ainsi une vue unifiée. Cette vue unifiée permet aux utilisateurs expérimentés en matière de données d’accomplir en quelques heures ce qui prendrait normalement des semaines, voire plus. Bien que la normalisation et l’accessibilité de ces données aient été une avancée majeure, leur utilisation via des API et des outils de visualisation nécessitait encore un investissement important en temps – et souvent des compétences en programmation – pour comprendre et utiliser les données de manière efficace.

Deuxièmement, pour résoudre ce problème et rendre Data Commons encore plus utilisable, Data Commons exploite désormais le pouvoir de l’IA, notamment des modèles linguistiques de grande envergure (LLMs), pour créer une interface de langage naturel qui permet aux utilisateurs de poser des questions telles que : Quels États en Inde ont les niveaux de pauvreté les plus élevés par habitant ? Comment les taux d’alphabétisation se comparent-ils à la pauvreté là-bas ? Comment la mortalité infantile a-t-elle évolué au fil du temps dans ces États ?

Format vidéo non pris en charge

L’IA permet de poser des questions telles que : “Quels pays d’Afrique ont connu la plus forte augmentation de l’accès à l’électricité ?” et “Comment le revenu est-il corrélé avec le diabète dans les comtés des États-Unis ?” ou d’offrir des suggestions telles que “Comparer les émissions de gaz à effet de serre de l’agriculture en Europe par rapport à leur PIB ?”

Les LLM sont utilisés pour comprendre la requête et les résultats proviennent directement de Data Commons, y compris un lien vers la source de données d’origine ; ainsi, la sortie n’est pas générée par le LLM. Cette approche permet à Data Commons d’éviter certaines des limitations actuellement connues des LLM en termes de véracité dans certains cas.

Data Commons ne collecte ni ne possède de données, mais s’appuie plutôt sur des données disponibles publiquement provenant de plus de 200 sources, couvrant des milliers d’ensembles de données, notamment la démographie, l’économie, l’éducation, le logement, la santé publique, le climat, la durabilité et la biomédecine. Il y a des données provenant de 194 pays, dans certains pays jusqu’au niveau de l’État ou du comté. Cependant, les données accessibles jusqu’à présent ne sont pas réparties de manière équitable et ne sont pas complètes – malheureusement, la disponibilité des données reflète bon nombre des mêmes défis d’équité auxquels le monde est confronté sur d’autres questions, de sorte que nous disposons actuellement de plus de données pour les États-Unis, l’Inde et les pays de l’OCDE que pour les pays d’Afrique, d’Amérique du Sud et certaines parties de l’Asie. Un travail supplémentaire et continu est nécessaire pour rendre disponibles des données supplémentaires et à jour. Nous espérons que davantage de données publiques seront publiées pour combler les lacunes et nous cherchons à ajouter de nouvelles catégories de données utiles pour mieux comprendre le monde et permettre à ceux qui travaillent à relever les défis sociétaux pressants d’avoir une vue unifiée de leurs propres données avec toutes les données publiques déjà accessibles via Data Commons.

Marnie Webb, directrice de l’impact communautaire chez TechSoup, un partenaire de longue date de Google, a partagé comment Data Commons peut également être utile aux petites organisations à but non lucratif avec lesquelles son organisation travaille : “Data Commons donne aux organisations de base accès aux données dont elles ont besoin. Cela leur donne les outils pour poser des questions sur les besoins de leur communauté dans le langage qu’ils utiliseraient pour poser une question à un collègue, et obtenir des informations fiables en retour, comme s’ils avaient des scientifiques et ingénieurs de données dans leur équipe. Ce dont nous parlons, c’est de la démocratisation de l’information pour une meilleure prise de décision, afin que les organisations puissent prendre des risques intelligents pour mieux servir leurs communautés. Nous parlons de mettre le pouvoir des données entre les mains de ceux qui connaissent le mieux leurs communautés.”

Par exemple, avec le financement de Google.org, TechSoup aide les organisations à but non lucratif à exploiter le pouvoir de Data Commons pour évaluer et résoudre les défis sociétaux. Par exemple, Cemefi met en évidence les intersections entre la faim et le genre au Mexique et Makaia suit la croissance économique et sociale en Colombie. TechSoup illustre la relation entre la sécurité alimentaire, l’agriculture et le changement climatique en rassemblant des données provenant de sources telles que l’USDA et Feeding America.

Data Commons est un travail en cours. Bien que l’équipe travaille dessus depuis 2017, nous en sommes encore qu’au début – et nous avons besoin que d’autres continuent à se joindre à nous dans ce travail. Pour rendre plus de données accessibles, nous avons besoin de partenaires pour aider à identifier et combler les lacunes des données. Et nous avons besoin d’organisations comme TechSoup, Resources for the Future, Feeding America, et bien d’autres encore pour mettre ces données à profit dans leur travail pour résoudre certains des plus grands défis mondiaux. Il reste encore beaucoup à faire, ensemble.

Apprenez-en davantage sur la façon de rendre les données accessibles via Data Commons.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

La course à la régulation de l'intelligence artificielle

Pourquoi l'Europe a un avantage sur l'Amérique et la Chine.

AI

À l'intérieur du centre brûlant de la pessimisme de l'IA

Anthropic, une start-up axée sur la sécurité de l'IA, tente de rivaliser avec ChatGPT tout en évitant une apocalypse ...

Actualités sur l'IA

Numérisez et découvrez ces codes QR générés par intelligence artificielle.

Dans le domaine de l’artificial intelligence (AI) art, nous avons assisté à des avancées stupéfiantes, allant d...

AI

Cette recherche en IA présente une nouvelle distillation de pose en deux étapes pour l'estimation de la pose du corps entier.

De nombreuses tâches de perception, de compréhension et de création centrées sur l’humain dépendent de l’...

AI

Découvrez DERA Un cadre AI pour améliorer les complétions de grands modèles de langage avec des agents de résolution activés par le dialogue.

Les “grands modèles de langage” d’apprentissage profond ont été développés pour prévoir le contenu ...

Science des données

Les chercheurs développent un nouvel estimateur basé sur l'IA pour la fabrication de médicaments.

Une équipe de recherche collaborative du programme MIT-Takeda a combiné la physique et l'apprentissage automatique po...