AlphaFold révèle la structure de l’univers des protéines

AlphaFold dévoile la structure des protéines.

Découvrez comment résoudre le repliement des protéines sur deepmind.com/AlphaFold et consultez une chronologie de notre percée ici.

Cela fait un an que nous avons publié et rendu open source AlphaFold, notre système d’IA pour prédire la structure 3D d’une protéine à partir de sa séquence d’acides aminés 1D, et créé la base de données de structure des protéines AlphaFold (AlphaFold DB) pour partager gratuitement ces connaissances scientifiques avec le monde. Les protéines sont les éléments constitutifs de la vie, elles sous-tendent chaque processus biologique chez tous les êtres vivants. Et, parce que la forme d’une protéine est étroitement liée à sa fonction, connaître la structure d’une protéine permet une meilleure compréhension de ce qu’elle fait et de son fonctionnement. Nous espérions que cette ressource révolutionnaire contribuerait à accélérer la recherche scientifique et les découvertes à l’échelle mondiale, et que d’autres équipes pourraient s’inspirer des avancées que nous avons réalisées avec AlphaFold pour réaliser d’autres percées. Cet espoir est devenu une réalité bien plus rapidement que nous n’avions osé le rêver. Douze mois seulement après, AlphaFold a été consulté par plus d’un demi-million de chercheurs et a été utilisé pour accélérer les progrès sur d’importants problèmes concrets allant de la pollution plastique à la résistance aux antibiotiques.

Aujourd’hui, je suis incroyablement enthousiaste de partager la prochaine étape de ce parcours. En partenariat avec l’Institut européen de bio-informatique (EMBL-EBI) de l’EMBL, nous publions maintenant des structures prédites pour presque toutes les protéines répertoriées connues de la science, ce qui va étendre la base de données AlphaFold de plus de 200 fois – de près de 1 million de structures à plus de 200 millions de structures – avec le potentiel d’augmenter considérablement notre compréhension de la biologie.

Cette mise à jour comprend des structures prédites pour les plantes, les bactéries, les animaux et d’autres organismes, ouvrant de nombreuses nouvelles opportunités pour les chercheurs d’utiliser AlphaFold pour faire avancer leur travail sur des problèmes importants, tels que la durabilité, l’insécurité alimentaire et les maladies négligées.

Cette mise à jour signifie que la plupart des pages de la principale base de données de protéines UniProt seront accompagnées d’une structure prédite. Les plus de 200 millions de structures seront également disponibles en téléchargement groupé via Google Cloud Public Datasets, rendant AlphaFold encore plus accessible aux scientifiques du monde entier.

“AlphaFold est l’avancée unique et majeure dans les sciences de la vie qui démontre la puissance de l’IA. Déterminer la structure 3D d’une protéine prenait autrefois des mois voire des années, cela prend maintenant quelques secondes. AlphaFold a déjà accéléré et permis d’importantes découvertes, notamment en craquant la structure du complexe de pores nucléaires. Et avec cette nouvelle addition de structures éclairant presque tout l’univers des protéines, nous pouvons nous attendre à ce que davantage de mystères biologiques soient résolus chaque jour.” – Eric Topol, fondateur et directeur de l’Institut de recherche translationnelle Scripps

L’impact d’AlphaFold jusqu’à présent

Douze mois après la première publication d’AlphaFold, il est incroyable de réfléchir à l’incroyable impact qu’AlphaFold a déjà eu et à notre long voyage jusqu’à l’étape d’aujourd’hui.

Pour notre équipe, le succès d’AlphaFold a été particulièrement gratifiant, à la fois parce que c’était le système d’IA le plus complexe que nous ayons jamais construit, nécessitant plusieurs innovations cruciales, et parce qu’il a eu l’impact le plus significatif en aval. En démontrant que l’IA pouvait prédire avec précision la forme d’une protéine avec une précision atomique, à grande échelle et en quelques minutes, AlphaFold a non seulement apporté une solution à un défi majeur vieux de 50 ans, mais il est également devenu le premier grand point de preuve de notre thèse fondatrice : l’intelligence artificielle peut accélérer considérablement les découvertes scientifiques et, par conséquent, faire progresser l’humanité.

Nous avons rendu le code d’AlphaFold open source et publié deux articles détaillés dans Nature [1, 2], qui ont déjà été cités plus de 4000 fois. Nous avons collaboré étroitement avec l’EMBL-EBI, leader mondial dans le domaine de la bio-informatique, pour concevoir un outil qui aiderait au mieux les biologistes à accéder et à utiliser AlphaFold, et nous avons ensemble publié AlphaFold DB, une base de données consultable, ouverte et gratuite pour tous. Avant de sortir AlphaFold, conformément à notre approche prudente de pionnier responsable, nous avons sollicité l’avis de plus de 30 experts en recherche biologique, sécurité, éthique et sûreté pour nous aider à comprendre comment partager les avantages d’AlphaFold avec le monde, de manière à maximiser les bénéfices potentiels et à minimiser les risques potentiels.

À ce jour, plus de 500 000 chercheurs de 190 pays ont consulté AlphaFold DB pour voir plus de 2 millions de structures. Nos structures disponibles gratuitement ont également été intégrées à d’autres ensembles de données publics, tels que Ensembl, UniProt et OpenTargets, où des millions d’utilisateurs y accèdent dans le cadre de leurs flux de travail quotidiens.

Nous sommes stupéfaits par la rapidité avec laquelle AlphaFold est devenu un outil essentiel pour des centaines de milliers de scientifiques dans les laboratoires et les universités du monde entier, les aidant dans leur travail important. En ce qui concerne notre propre travail avec AlphaFold, nous avons donné la priorité aux applications que nous estimions avoir le plus grand impact social positif, en mettant l’accent sur des initiatives qui avaient été historiquement sous-financées ou négligées. Par exemple, nous nous sommes associés à l’initiative Drugs for Neglected Diseases (DNDi) pour les aider à faire avancer leurs recherches, les rapprochant ainsi de la découverte de remèdes salvateurs pour des maladies telles que la leishmaniose et la maladie de Chagas, qui touchent de manière disproportionnée les populations des régions les plus pauvres du monde. Nous avons également soutenu la Journée mondiale des maladies tropicales négligées en créant des prédictions de structure pour les organismes identifiés par l’Organisation mondiale de la santé comme étant prioritaires pour leurs recherches, contribuant ainsi à approfondir l’étude de maladies telles que la lèpre et la schistosomiase, qui dévastent la vie de plus d’un milliard de personnes dans le monde.

C’est tellement inspirant de voir les nombreuses façons dont la communauté scientifique a utilisé AlphaFold, l’utilisant pour tout, de la compréhension des maladies à la protection des abeilles, en passant par le déchiffrement de puzzles biologiques et l’exploration des origines même de la vie.

D’autres exemples impressionnants, choisis par des membres de notre équipe AlphaFold, comprennent :

Un puzzle biologique, choisi par Kathryn Tunyasuvunakool

Dans un récent numéro spécial de Science, plusieurs groupes ont décrit comment AlphaFold les a aidés à reconstituer le complexe du pore nucléaire, l’un des puzzles les plus complexes de la biologie. Cette structure géante est composée de centaines de parties de protéines et contrôle tout ce qui entre et sort du noyau de la cellule. Sa structure délicate a finalement été révélée en utilisant des méthodes expérimentales existantes pour en dévoiler le contour et en utilisant les prédictions d’AlphaFold pour compléter et interpréter les zones floues. Cette combinaison puissante devient maintenant courante dans les laboratoires, débloquant de nouvelles connaissances scientifiques et montrant comment les techniques expérimentales et computationnelles peuvent travailler ensemble.

Déverrouillage du complexe du pore nucléaire : https://unfolded.deepmind.com/stories/unlocking-the-nuclear-pore-complex

Un nouveau monde de bioinformatique, choisi par Richard Evans

Des outils de recherche structurale tels que Foldseek et Dali permettent aux utilisateurs de rechercher rapidement des entrées similaires à une protéine donnée. Cela pourrait être une première étape vers l’exploitation de vastes ensembles de données de séquences pour trouver des protéines pratiquement utiles, telles que celles qui dégradent le plastique, et cela pourrait fournir des indices sur la fonction des protéines. La mise à jour de la base de données pour inclure plus de 200 millions de structures prédictives amplifiera encore cet impact.

Un impact direct sur la santé humaine, choisi par John Jumper

AlphaFold a déjà un impact significatif et direct sur la santé humaine. Lors d’une réunion avec des chercheurs de la Société européenne de génétique humaine, il a été révélé à quel point les structures d’AlphaFold sont importantes pour les biologistes et les cliniciens qui tentent de comprendre les causes des maladies génétiques rares. De plus, AlphaFold accélère la découverte de médicaments en fournissant une meilleure compréhension des nouvelles protéines identifiées comme cibles de médicaments, et en aidant les scientifiques à trouver plus rapidement des médicaments potentiels qui se lient à ces protéines.

“AlphaFold est devenu un outil essentiel pour la recherche biopharmaceutique du jour au lendemain, y compris ici chez ROME Therapeutics, où il nous permet de prédire les structures de protéines dans des parties du génome sombre qui n’ont jamais été résolues auparavant. La vitesse et la précision d’AlphaFold accélèrent le processus de découverte de médicaments, et nous n’en sommes qu’au début de la réalisation de son impact sur l’accélération de la mise au point de nouveaux médicaments pour les patients.” – Rosana Kapeller, présidente et directrice générale de ROME Therapeutics et ancienne directrice scientifique de Nimbus Therapeutics

: https://unfolded.deepmind.com

Histoires de Unfolded Rendre les prédictions d’AlphaFold disponibles aux scientifiques du monde entier Accélérer la lutte contre la pollution plastique : https://unfolded.deepmind.com/stories/making-alphafolds-predictions-available-to-scientists-around-the-world

Ce n’est que le début

AlphaFold a lancé la biologie dans une ère d’abondance structurelle, débloquant l’exploration scientifique à la vitesse du numérique. La base de données AlphaFold sert de “moteur de recherche” pour les structures protéiques, offrant aux chercheurs un accès instantané à des modèles prédictifs des protéines qu’ils étudient, leur permettant de concentrer leurs efforts et d’accélérer les travaux expérimentaux. De la lutte contre les maladies au développement de vaccins, AlphaFold a déjà permis d’énormes avancées face à certains des plus grands défis mondiaux, et ce n’est que le début de l’impact que nous commencerons à voir au cours des prochaines années. Notre espoir est que cette base de données étendue aidera de nombreux autres scientifiques dans leur travail et ouvrira de nouvelles voies d’exploration scientifique, telles que la méta-protéomique.

À DeepMind, nous travaillons ardemment pour exploiter tout ce potentiel en investissant significativement dans de nombreux domaines, notamment en partenariat avec notre nouvelle société sœur Alphabet, Isomorphic Labs, pour réinventer l’intégralité du processus de découverte de médicaments à partir de premiers principes avec une approche axée sur l’IA ; en établissant un laboratoire humide au célèbre Francis Crick Institute pour renforcer le lien entre l’IA et les techniques expérimentales afin de faire avancer la compréhension de la biologie, notamment la conception des protéines et la génomique ; et en élargissant notre équipe d’IA pour la science afin d’accélérer les progrès dans notre recherche fondamentale en biologie et d’appliquer l’IA à d’autres défis scientifiques fascinants et importants, tels que les sciences du climat, la chimie quantique et la fusion.

AlphaFold est un aperçu du futur et de ce qui pourrait être possible avec les méthodes informatiques et d’IA appliquées à la biologie. Au niveau le plus fondamental, la biologie peut être considérée comme un système de traitement de l’information, bien qu’extraordinairement complexe et émergent. Tout comme les mathématiques sont le langage de description parfait pour la physique, nous pensons que l’IA pourrait s’avérer être la technique idéale pour faire face à la complexité dynamique de la biologie. AlphaFold est une première preuve importante de cela et un signe de bien plus à venir. En tant que pionniers dans le domaine émergent de la “biologie numérique”, nous sommes enthousiasmés de voir le potentiel énorme de l’IA commencer à se concrétiser en tant qu’un des outils les plus utiles de l’humanité pour faire progresser la découverte scientifique et la compréhension des mécanismes fondamentaux de la vie.

We will continue to update IPGirl; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

AI

La tarification dynamique avec le bandit manchot multi-bras Apprendre en faisant

Dans le vaste monde des problèmes de prise de décision, un dilemme est particulièrement propre aux stratégies d'Appre...

Recherche en IA

Système de deep-learning explore l'intérieur des matériaux depuis l'extérieur

Une nouvelle méthode pourrait fournir des informations détaillées sur les structures internes, les vides et les fissu...

AI

Au-delà du stylo l'art de l'IA dans la génération de texte manuscrit à partir d'archétypes visuels

Le domaine émergent de la génération de texte manuscrit stylisé (HTG) vise à créer des images de texte manuscrit qui ...

AI

Applications de conversation avec de grands modèles linguistiques comprenant la séquence des entrées utilisateur, des instructions et des réponses

Cet article explique comment les entrées des utilisateurs sont traitées, converties en invitations, envoyées aux LLMs...