Edit

AlphaFold predicts structure of almost every catalogued protein known to science

This article is also available in Italiano, Français, Deutsch and Español.

DeepMind and EMBL's European Bioinformatics Institute (EMBL-EBI) have made AI-powered predictions of the three-dimensional structures of nearly all catalogued proteins known to science freely and openly available to the scientific community, via the AlphaFold Protein Structure Database.

Protein structure on blue background
Credit: Karen Arnott/EMBL-EBI

The two organisations hope the expanded database will continue to increase our understanding of biology, aiding countless more scientists in their work as they look to tackle global challenges.

The database is being expanded by approximately 200 times, from nearly 1 million protein structures to over 200 million, covering almost every organism on Earth that has had its genome sequenced. The expansion of the database includes predicted structures for a wide range of species, including plants, bacteria, animals, and other organisms, opening up new avenues of research across the life sciences that will have an impact on global challenges, including sustainability, food insecurity, and neglected diseases.

Now, almost every protein sequence on the UniProt protein database will come with a predicted structure. This release will also open up new research avenues, such as supporting bioinformatics and computational work by allowing researchers to potentially spot patterns and trends in the database.

“AlphaFold now offers a 3D view of the protein universe,” said Edith Heard, Director General of EMBL. “The popularity and growth of the AlphaFold Database is testament to the success of the collaboration between DeepMind and EMBL. It shows us a glimpse of the power of multidisciplinary science.”

“We’ve been amazed by the rate at which AlphaFold has already become an essential tool for hundreds of thousands of scientists in labs and universities across the world,” said Demis Hassabis, Founder and CEO of DeepMind. “From fighting disease to tackling plastic pollution, AlphaFold has already enabled incredible impact on some of our biggest global challenges. Our hope is that this expanded database will aid countless more scientists in their important work and open up completely new avenues of scientific discovery.” 

An essential tool for scientists

DeepMind and EMBL-EBI launched the AlphaFold database in July 2021, with more than 350,000 protein structure predictions, including the entire human proteome. Subsequent updates saw the addition of UniProtKB/SwissProt and 27 new proteomes, 17 of which represent neglected tropical diseases that continue to devastate the lives of more than 1 billion people globally. 

In just over a year, more than 1,000 scientific papers have cited the database and over 500,000 researchers from over 190 countries have accessed the AlphaFold Database to view over two million structures. 

The team has also seen researchers building on AlphaFold to create and adapt tools such as Foldseek and Dali which allow users to search for entries similar to a given protein. Others have adopted the core machine learning ideas behind AlphaFold, forming the backbone of a slate of new algorithms in this space, or applying them to areas such as RNA structure prediction or in developing new models for designing proteins.

Impact and future of AlphaFold and the database

AlphaFold has also shown impact in areas such as improving our ability to fight plastic pollution, gain insight into Parkinson’s disease, increase the health of honey bees, understand how ice forms, tackle neglected diseases such as Chagas disease and Leishmaniasis, and explore human evolution

“We released AlphaFold in the hopes that other teams could learn from and build on the advances we made, and it has been exciting to see that happen so quickly. Many other AI research organisations have now entered the field and are building on AlphaFold’s advances to create further breakthroughs. This is truly a new era in structural biology, and AI-based methods are going to drive incredible progress,” said John Jumper, Research Scientist and AlphaFold Lead at DeepMind.

“AlphaFold has sent ripples through the molecular biology community. In the past year alone, there have been over a thousand scientific articles on a broad range of research topics which use AlphaFold structures; I have never seen anything like it,” said Sameer Velankar, Team Leader at EMBL-EBI’s Protein Data Bank in Europe. “And this is just the impact of one million predictions; imagine the impact of having over 200 million protein structure predictions openly accessible in the AlphaFold Database.”

DeepMind and EMBL-EBI will continue to refresh the database periodically, with the aim of improving features and functionality in response to user feedback. Access to structures will continue to be fully open, under a CC-BY 4.0 licence, and bulk downloads will be made available via Google Cloud Public Datasets


AlphaFold predice la struttura di quasi tutte le proteine catalogate note alla scienza

Con oltre 200 milioni di predizioni di strutture proteiche aggiunte al database, AlphaFold offre ora agli utenti un accesso aperto all’universo delle proteine in 3D.

DeepMind e l’Istituto Europeo di Bioinformatica dell’EMBL (EMBL-EBI) hanno messo a disposizione della comunità scientifica le predizioni delle strutture tridimensionali di quasi tutte le proteine catalogate conosciute dalla scienza, attraverso l’AlphaFold Protein Structure Database.

Le due organizzazioni sperano che il database ampliato continui ad aumentare la nostra comprensione della biologia, aiutando un numero sempre maggiore di scienziati ad affrontare le principali sfide globali.

Il database è stato ampliato di circa 200 volte, passando da quasi 1 milione di strutture proteiche a oltre 200 milioni, includendo quasi tutti gli organismi terrestri il cui genoma è stato sequenziato. L’espansione del database include predizioni di strutture proteiche di un’ampia gamma di specie, tra cui piante, batteri, animali e altri organismi, e apre nuove linee di ricerca nelle scienze della vita che avranno un impatto sulle sfide globali, tra cui la sostenibilità, l’insicurezza alimentare e le malattie neglette.

Quasi tutte le sequenze proteiche presenti nel database delle proteine UniProt saranno ora corredate da una predizione di struttura. Questo rilascio aprirà anche nuove strade alla ricerca, come il supporto alla bioinformatica e al lavoro computazionale, consentendo ai ricercatori di individuare potenzialmente modelli e tendenze nel database.

“AlphaFold offre ora una visione tridimensionale dell’universo proteico”, ha dichiarato Edith Heard, Direttrice Generale dell’EMBL. “La popolarità e la crescita del database AlphaFold testimoniano il successo della collaborazione tra DeepMind ed EMBL, e il potere della scienza multidisciplinare”.

Uno strumento essenziale per gli scienziati

“Siamo rimasti stupiti dalla velocità con cui AlphaFold è già diventato uno strumento essenziale per centinaia di migliaia di scienziati nei laboratori e nelle Università di tutto il mondo”, ha dichiarato Demis Hassabis, fondatore e CEO di DeepMind. “Dalla lotta contro le malattie a quella contro l’inquinamento da plastica, AlphaFold ha già avuto un impatto incredibile su alcune delle più grandi sfide globali. La nostra speranza è che questo database ampliato aiuti un numero sempre maggiore di scienziati nel loro importante lavoro e apra strade completamente nuove alla ricerca scientifica”.

DeepMind ed EMBL-EBI hanno lanciato il database AlphaFold nel luglio 2021, con oltre 350.000 predizioni di strutture proteiche, compreso l’intero proteoma umano. Gli aggiornamenti successivi hanno visto l’aggiunta di UniProtKB/SwissProt e di 27 nuovi proteomi, 17 dei quali rappresentano malattie tropicali neglette che continuano ad affliggere oltre 1 miliardo di persone a livello globale.

In poco più di un anno, oltre 1.000 articoli scientifici hanno citato il database e più di 500.000 ricercatori di oltre 190 Paesi hanno avuto accesso al Database AlphaFold per visualizzare oltre due milioni di strutture.

Alcuni ricercatori si sono basati su AlphaFold per creare e adattare strumenti come Foldseek e Dali, che consentono agli utenti di confrontare nuove strutture con quelle preesistenti. Altri hanno adottato il principio di apprendimento automatico alla base di AlphaFold, per strutturare una serie di nuovi algoritmi in questo settore, o applicandolo ad aree come la predizione della struttura dell’RNA o allo sviluppo di nuovi modelli per la progettazione delle proteine.

Impatto e futuro di AlphaFold e del database

AlphaFold ha mostrato un impatto anche in settori come il miglioramento della nostra capacità di combattere l’inquinamento da plastica, la comprensione del morbo di Parkinson, il miglioramento della salute delle api da miele, la comprensione della formazione del ghiaccio, la lotta a malattie neglette come la malattia di Chagas e la Leishmaniosi, e l’esplorazione dell’evoluzione umana.

“Abbiamo rilasciato AlphaFold nella speranza che altri team potessero imparare e basarsi sui nostri progressi, ed è stato entusiasmante vedere come ciò sia avvenuto così rapidamente. Molte altre organizzazioni di ricerca sull’intelligenza artificiale sono entrate in questo campo e stanno sfruttando i progressi di AlphaFold per generare ulteriori scoperte. Questa è davvero una nuova era nella biologia strutturale e i metodi basati sull’intelligenza artificiale porteranno a progressi incredibili”, ha dichiarato John Jumper, ricercatore e responsabile di AlphaFold presso DeepMind.

“AlphaFold ha avuto un successo enorme nella comunità della biologia molecolare. Solo nell’ultimo anno sono stati pubblicati oltre mille articoli scientifici su un’ampia gamma di argomenti di ricerca che utilizzano le strutture AlphaFold; non ho mai visto nulla di simile”, ha dichiarato Sameer Velankar, Team Leader della Protein Data Bank dell’EMBL-EBI in Europa. “E questo è solo l’impatto di un milione di predizioni; immaginate l’impatto di oltre 200 milioni di predizioni di strutture proteiche accessibili liberamente dal Database AlphaFold”.

DeepMind ed EMBL-EBI continueranno ad aggiornare periodicamente il database, con l’obiettivo di migliorare le caratteristiche e le funzionalità in risposta al feedback degli utenti. L’accesso alle strutture continuerà a essere completamente aperto, con licenza CC-BY 4.0, e i download di massa saranno resi disponibili tramite Google Cloud Public Datasets.


AlphaFold prédit la structure de presque toutes les protéines cataloguées connues de la science

Avec plus de 200 millions de prédictions de structures de protéines ajoutées à la base de données AlphaFold, celle-ci donne désormais aux utilisateurs un accès libre à tout un univers protéique en 3D

DeepMind et l’Institut européen de bio-informatique de l’EMBL (EMBL-EBI) ont mis à la disposition de la communauté scientifique, en accès libre et sans coût, des prédictions basées sur l’intelligence artificielle (IA) de la structure tridimensionnelle de presque toutes les protéines cataloguées connues de la science, via la base de données AlphaFold Protein Structure Database

Les deux organisations espèrent que l’élargissement de cette base de données va continuer à améliorer notre compréhension de la biologie, en aidant un nombre incalculable de scientifiques dans leur travail pour relever les défis mondiaux.

La base de données a été multipliée par environ 200, passant de près d’un million de prédictions de structures de protéines à plus de 200 millions de prédictions, couvrant ainsi presque tous les organismes sur Terre dont le génome a été séquencé. L’expansion de la base de données comprend la prédiction de structures d’un large éventail d’espèces, y compris les plantes, les bactéries, les animaux et d’autres organismes. Ceci ouvre de nouvelles voies de recherche dans les sciences de la vie, qui auront un impact sur les défis mondiaux tels que le développement durable, l’insécurité alimentaire et les maladies négligées.

Désormais, presque toutes les séquences de protéines de la base de données UniProt seront accompagnées d’une prédiction de structure. Cette version ouvrira également de nouvelles voies de recherche, notamment en soutenant les travaux en bio-informatique, permettant potentiellement aux chercheurs de repérer des modèles et des tendances dans la base de données.

“AlphaFold offre désormais une vue en 3D de l’univers des protéines”, a déclaré Edith Heard, directrice générale de l’EMBL. “La popularité et la croissance de la base de données AlphaFold témoignent du succès de la collaboration entre DeepMind et l’EMBL. Elle nous montre un aperçu de la puissance de la science multidisciplinaire.”

“Nous avons été stupéfaits par la vitesse à laquelle AlphaFold est déjà devenu un outil essentiel pour des centaines de milliers de scientifiques dans les laboratoires et les universités du monde entier”, a déclaré Demis Hassabis, fondateur et PDG de DeepMind. “De la lutte contre les maladies à la lutte contre la pollution plastique, AlphaFold a déjà eu un impact incroyable sur certains de nos plus grands défis mondiaux. Nous espérons que cette base de données élargie aidera d’innombrables autres scientifiques dans leurs travaux et ouvrira la voie à de découvertes scientifiques totalement nouvelles.”

Un outil essentiel pour les scientifiques

DeepMind et EMBL-EBI ont lancé la base de données AlphaFold en juillet 2021, avec plus de 350 000 prédictions de structures de protéines, y compris l’ensemble du protéome humain. Les mises à jour ultérieures ont vu l’ajout d’UniProtKB/SwissProt et de 27 nouveaux protéomes, dont 17 concernent des pathogènes causant des maladies tropicales négligées qui continuent de dévaster la vie de plus d’un milliard de personnes dans le monde. 

En un peu plus d’un an, plus de 1 000 articles scientifiques ont cité la base de données et plus de 500 000 chercheurs de plus de 190 pays ont accédé à la base de données AlphaFold pour visualiser plus de deux millions de structures. 

L’équipe a également vu des chercheurs s’appuyer sur AlphaFold pour créer et adapter des outils tels que Foldseek et Dali, qui permettent aux utilisateurs de rechercher des entrées similaires à une protéine donnée. D’autres ont adopté les idées fondamentales d’apprentissage automatique d’AlphaFold, formant l’épine dorsale d’une série de nouveaux algorithmes dans ce domaine, ou les appliquant à des domaines tels que la prédiction de la structure de l’ARN ou le développement de nouveaux modèles pour la conception de protéines.

Impact et avenir d’AlphaFold et de la base de données

AlphaFold a également eu un impact dans des domaines tels que l’amélioration de notre capacité à lutter contre la pollution plastique, la compréhension de la maladie de Parkinson, l’amélioration de la santé des abeilles, la compréhension de la formation de la glace, la lutte contre les maladies négligées telles que la maladie de Chagas et la Leishmaniose, et l’exploration de l’évolution humaine

“Nous avons mis à disposition AlphaFold dans l’espoir que d’autres équipes pourraient tirer des enseignements de nos avancées et s’en inspirer, et il est passionnant de voir que cela s’est produit si rapidement. De nombreuses autres organisations de recherche en IA sont désormais entrées dans le domaine et s’appuient sur les avancées d’AlphaFold pour créer de nouvelles avancées. Il s’agit véritablement d’une nouvelle ère pour la biologie structurale, et les méthodes basées sur l’IA vont permettre de réaliser des progrès incroyables”, a déclaré John Jumper, chercheur scientifique et responsable d’AlphaFold chez DeepMind.

“AlphaFold a fait des vagues dans la communauté de la biologie moléculaire. Rien que l’année dernière, plus d’un millier d’articles scientifiques sur un large éventail de sujets de recherche ont utilisé les structures d’AlphaFold ; je n’ai jamais rien vu de tel”, a déclaré Sameer Velankar, chef d’équipe du Protein Data Bank en Europe de l’EMBL-EBI.” Et il ne s’agit là que de l’impact d’un million de prédictions ; imaginez l’impact d’avoir plus de 200 millions de prédictions de structures de protéines en accès libre dans la base de données AlphaFold. “

DeepMind et EMBL-EBI continueront à mettre à jour périodiquement la base de données, dans le but d’améliorer les caractéristiques et les fonctionnalités en réponse aux commentaires des utilisateurs. L’accès aux structures continuera d’être totalement en libre accès, sous une licence CC-BY 4.0, et les téléchargements de masse seront disponibles via Google Cloud Public Datasets


AlphaFold stellt Strukturvorhersagen von fast allen der Wissenschaft bekannten Proteinen zur Verfügung

DeepMind und das Europäische Institut für Bioinformatik (EMBL-EBI) haben KI-gestützte Vorhersagen der dreidimensionalen Strukturen fast aller der Wissenschaft bisher bekannten, katalogisierten Proteine über die AlphaFold Protein Structure Database frei und offen für die wissenschaftliche Gemeinschaft zugänglich gemacht.

Die beiden Organisationen hoffen, dass die erweiterte Datenbank unser Verständnis der Biologie weiter verbessern und damit unzähligen Wissenschaftler*innen bei ihrer Arbeit helfen wird, globale Herausforderungen zu bewältigen.

Die Datenbank wurde um etwa das 200-fache auf über 200 Millionen Proteinstrukturen erweitert. Die Strukturvorhersagen decken fast alle Organismen der Erde ab, deren Genom sequenziert wurde. Die Erweiterung der Datenbank umfasst vorhergesagte Strukturen für ein breites Artenspektrum, darunter Pflanzen, Bakterien, Tiere und andere Organismen, und eröffnet neue Wege für die Biowissenschaften mit Auswirkung auf die Forschung zu globalen Herausforderungen wie Nachhaltigkeit, Ernährungssicherheit und vernachlässigte Krankheiten.

Nun wird fast jede Proteinsequenz in der UniProt-Protein-Datenbank mit einer vorhergesagten Struktur in Verbindung stehen. Diese Veröffentlichung wird auch neue Forschungsmöglichkeiten eröffnen, z. B. gibt sie in der Bioinformatik und der computerbasierten Forschung Wissenschaftler*innen die Möglichkeit, Muster und Trends in der Datenbank zu erkennen.

“AlphaFold bietet jetzt eine 3D-Ansicht des Proteinuniversums”, sagte Edith Heard, Generaldirektorin des EMBL. “Die Popularität und das Wachstum der AlphaFold-Datenbank sind ein Zeugnis der erfolgreichen Zusammenarbeit zwischen DeepMind und EMBL. Die Datenbank gibt uns einen Einblick in die Kraft der multidisziplinären Wissenschaft.”

“Wir sind verblüfft über die Geschwindigkeit, mit der AlphaFold bereits zu einem unverzichtbaren Werkzeug für Hunderttausende von Wissenschaftler*innen in Laboren und Universitäten auf der ganzen Welt geworden ist”, sagte Demis Hassabis, Gründer und CEO von DeepMind. “Von der Krankheitsbekämpfung bis hin zum Kampf gegen die Plastikverschmutzung hat AlphaFold bereits einen unglaublichen Einfluss auf einige unserer größten globalen Herausforderungen ermöglicht. Wir hoffen, dass diese erweiterte Datenbank zahllosen weiteren Wissenschaftler*innen bei ihrer wichtigen Arbeit helfen und völlig neue Wege der wissenschaftlichen Entdeckung eröffnen wird.”

Ein unverzichtbares Werkzeug für Wissenschaftler*innen

DeepMind und EMBL-EBI starteten die AlphaFold-Datenbank im Juli 2021 mit mehr als 350.000 Proteinstrukturvorhersagen, darunter dem gesamten menschlichen Proteom. In den darauffolgenden Aktualisierungen wurden UniProtKB/SwissProt und 27 neue Proteome hinzugefügt. 17 von ihnen repräsentieren vernachlässigte Tropenkrankheiten, die nach wie vor verheerende Auswirkungen auf das Leben von mehr als einer Milliarde Menschen auf der Welt haben.

In etwas mehr als einem Jahr wurde die Datenbank in über 1.000 wissenschaftlichen Artikeln zitiert und mehr als 500.000 Forscher aus über 190 Ländern haben auf die AlphaFold-Datenbank zugegriffen, um bisher mehr als zwei Millionen Strukturen einzusehen.

Das AlphaFold Team konnte auch beobachten, wie Forschende die Datenbank nutzten, um Tools wie Foldseek und Dali zu entwickeln und anzupassen, mit denen Nutzer*innen nach Einträgen suchen können, die einem vorgegebenen Protein ähneln. Andere haben die Kernideen des maschinellen Lernens hinter AlphaFold übernommen, die nun das Rückgrat einer Reihe neuer Algorithmen in diesem Bereich bilden oder in Bereichen wie der Vorhersage von RNA-Strukturen oder bei der Entwicklung neuer Modelle für das Design von Proteinen angewendet werden.

Auswirkungen und Zukunft von AlphaFold und der Datenbank

AlphaFold wurde bereits in Bereichen wie der Bekämpfung der Plastikverschmutzung, der Erforschung der Parkinson-Krankheit, der Verbesserung der Gesundheit von Honigbienen, dem Verständnis der Eisbildung, der Bekämpfung vernachlässigter Krankheiten wie der Chagas-Krankheit und der Leishmaniose, sowie der Erforschung der menschlichen Evolution erfolgreich angewendet.

“Wir haben AlphaFold in der Hoffnung veröffentlicht, dass andere Teams von unseren Fortschritten lernen und darauf aufbauen können, und es war aufregend zu sehen, dass dies so schnell geschah. Viele andere KI-Forschungseinrichtungen sind inzwischen in dieses Feld eingestiegen und bauen auf den Fortschritten von AlphaFold auf, um weitere Durchbrüche zu erzielen. Dies ist wirklich eine neue Ära in der Strukturbiologie, und KI-basierte Methoden werden unglaubliche Fortschritte hervorbringen”, sagte John Jumper, Research Scientist und AlphaFold Lead bei DeepMind.

“AlphaFold hat die Molekularbiologie-Community in Aufruhr versetzt. Allein im letzten Jahr gab es über tausend wissenschaftliche Artikel zu einem breiten Spektrum von Forschungsthemen, in denen AlphaFold-Strukturen verwendet wurden; so etwas habe ich noch nie gesehen”, sagte Sameer Velankar, Teamleiter bei der Protein Data Bank des EMBL-EBI in Europa. “Und das ist nur die Auswirkung von einer Million Vorhersagen; stellen Sie sich die Auswirkung von über 200 Millionen Proteinstrukturvorhersagen vor, die nun in der AlphaFold-Datenbank offen zugänglich sind.”

DeepMind und EMBL-EBI werden die Datenbank weiterhin in regelmäßigen Abständen aktualisieren, und mit dem Feedback der Nutzer*innen Eigenschaften und Funktionen verbessern. Der Zugang zu den Strukturen wird unter einer CC-BY 4.0-Lizenz weiterhin vollständig offen sein, und Massen-Downloads werden über Google Cloud Public Datasets zur Verfügung gestellt.


AlphaFold predice la estructura de casi todas las proteínas catalogadas conocidas por la ciencia

DeepMind y el Instituto Europeo de Bioinformática del EMBL (EMBL-EBI por sus siglas en inglés) han puesto a disposición de la comunidad científica, de forma gratuita y abierta, las predicciones basadas en inteligencia artificial de la estructura tridimensional de casi todas las proteínas catalogadas conocidas por la ciencia, a través de la base de datos AlphaFold Protein Structure Database.

Ambas organizaciones esperan que la ampliación de la base de datos siga aumentando nuestra comprensión de la biología, y ayudando a innumerables científicos en su trabajo a la hora de abordar los retos globales.

Esta base de datos se ha multiplicado aproximadamente por 200, pasando de casi un millón de estructuras proteicas a más de 200 millones, abarcando casi todos los organismos de la Tierra cuyo genoma ha sido secuenciado. La ampliación de la base de datos incluye estructuras predichas para una amplia gama de especies, incluyendo plantas, bacterias, animales y otros organismos, abriendo nuevas vías de investigación en las ciencias de la vida y que tendrán un impacto en los desafíos globales, incluyendo la sostenibilidad, la inseguridad alimentaria y las enfermedades olvidadas.

De ahora en adelante, casi todas las secuencias de proteínas de la base de datos de proteínas UniProt aparecerán con una estructura predicha. Este lanzamiento también abrirá nuevas vías de investigación, como el apoyo a la bioinformática y el trabajo computacional, permitiendo a los investigadores detectar potencialmente patrones y tendencias en la base de datos.

“AlphaFold ofrece ahora una visión tridimensional del universo de las proteínas”, declaró Edith Heard, Directora General del EMBL. “La popularidad y el crecimiento de la base de datos AlphaFold es testimonio del éxito de la colaboración entre DeepMind y el EMBL. Nos muestra un atisbo del poder de la ciencia multidisciplinar”.

“Nos ha sorprendido la velocidad en la que AlphaFold se ha convertido ya en una herramienta esencial para cientos de miles de científicos en laboratorios y universidades de todo el mundo”, dijo Demis Hassabis, fundador y Director General de DeepMind. “Desde la lucha contra las enfermedades hasta la lucha contra la contaminación por plásticos, AlphaFold ya ha permitido un impacto increíble en algunos de nuestros mayores desafíos globales. Nuestra esperanza es que esta base de datos ampliada ayude a innumerables científicos más en su importante trabajo y abra vías completamente nuevas de descubrimiento científico.”

Una herramienta esencial para los científicos

DeepMind y EMBL-EBI lanzaron la base de datos AlphaFold en julio de 2021, con más de 350.000 predicciones de estructuras de proteínas, incluyendo todo el proteoma humano. Las actualizaciones posteriores incluyeron UniProtKB/SwissProt y 27 nuevos proteomas, 17 de los cuales representaban enfermedades tropicales desatendidas que continúan devastando las vidas de más de mil millones de personas en todo el mundo.

En poco más de un año, más de 1.000 artículos científicos han citado la base de datos y más de 500.000 investigadores de más de 190 países han accedido a la base de datos AlphaFold para visualizar más de dos millones de estructuras proteicas.

El equipo también ha visto cómo los investigadores se basan en AlphaFold para crear y adaptar herramientas como Foldseek y Dali, que permiten a los usuarios buscar entradas similares a una proteína determinada. Otros grupos han adoptado las ideas centrales de aprendizaje automático de AlphaFold, formando la columna vertebral de una serie de nuevos algoritmos en este ámbito, o aplicándolas a áreas como la predicción de estructuras de ARN o el desarrollo de nuevos modelos para el diseño de proteínas.

Impacto y futuro de AlphaFold y la base de datos

AlphaFold también ha demostrado su repercusión en ámbitos como la mejora de nuestra capacidad para luchar contra la contaminación por plásticos, la comprensión de la enfermedad de Parkinson, el aumento de la salud de las abejas melíferas, la comprensión de cómo se forma el hielo, la lucha contra enfermedades desatendidas como la enfermedad de Chagas y la leishmaniosis, y la exploración de la evolución humana.

“Lanzamos AlphaFold con la esperanza de que otros equipos pudieran aprender y aprovechar los avances que hicimos, y ha sido emocionante ver que esto ha sucedido tan rápidamente. Muchas otras organizaciones de investigación con Inteligencia Artificial (IA) han entrado en este campo y se basan en los avances de AlphaFold para crear los suyos propios. Se trata de una nueva era en la biología estructural, y los métodos basados en la IA van a impulsar un progreso increíble”, comentó John Jumper, científico de investigación y líder de AlphaFold en DeepMind.

“AlphaFold ha tenido un éxito enorme en la comunidad de la biología molecular. Solo en el último año, se han publicado más de mil artículos científicos sobre una amplia gama de temas de investigación que utilizan las estructuras de AlphaFold; nunca he visto nada parecido”, ha declarado Sameer Velankar, jefe de equipo del Banco de Datos de Proteínas de Europa del EMBL-EBI. “Y esto es solo el impacto de un millón de predicciones; imagina el impacto de tener más de 200 millones de predicciones de estructuras proteicas abiertamente accesibles en la base de datos AlphaFold”.

DeepMind y EMBL-EBI seguirán actualizando la base de datos periódicamente, con el objetivo de mejorar las características y su funcionalidad en respuesta a los comentarios de los usuarios. El acceso a las estructuras seguirá siendo totalmente abierto, bajo una licencia CC-BY 4.0, y las descargas masivas estarán disponibles a través de Google Cloud Public Datasets.


Tags: alphafold, bioinformatics, embl-ebi, open data, protein structure

EMBLetc.

Read the latest Issues of our magazine - EMBLetc.

Looking for past print editions of EMBLetc.? Browse our archive, going back 20 years.

EMBLetc. archive

Newsletter archive

Read past editions of our monthly e-newsletter

For press

Contact the Press Office
Edit