O Nobel da Química 2024: inteligência artificial e proteínas
Qual é a importância destes avanços? As proteínas estão envolvidas em todos os processos biológicos. Pode-se, por design computacional, sintetizar proteínas que actuem como medicamentos.
O Prémio Nobel da Química deste ano focou um assunto com o qual trabalhei: a forma das proteínas em três dimensões. Passei alguns anos da minha vida a tentar determinar estruturas de proteínas. Sei, por experiência própria, que demora e, na realidade nem sempre é possível obter essas estruturas de modo experimental em tempo útil.
As proteínas, moléculas essenciais em todos os seres vivos, poderiam ser uma espécie de um esparguete cozido sem uma forma definida, mas não são. Enrolam-se sobre si próprias e adquirem formas complexas no espaço. Isto acontece porque há partes das proteínas que “gostam” de água (hidrofílicas) e outras que não gostam (hidrofóbicas). Elas enrolam-se todas para “esconder” as partes hidrofóbicas e expor ao solvente as partes hidrofílicas.
Uma proteína é, de um modo simplificado, uma sequência de aminoácidos ligados entre si. Por exemplo, a insulina humana, produzida pelo pâncreas, é uma proteína com 51 aminoácidos, alguns repetidos (só há 20 aminoácidos principais). Os primeiros cinco são: metionina, alanina, leucina, triptofano, metionina. A sequência de aminoácidos de uma proteína está codificada no ADN, no gene correspondente.
Sabendo a sua sequência de aminoácidos, deveria ser possível determinar a forma em três dimensões de uma proteína. Assim como o inverso, ou seja, encontrar a sequência de aminoácidos certa para obter uma proteína com uma determinada forma pretendida.
Uma parte do problema foi resolvida em 2003, pelo agora laureado David Baker, que respondeu à seguinte pergunta: qual é a sequência de aminoácidos que dá origem a uma proteína com esta forma? Baker, usando métodos computacionais, criou genes artificiais que deram origem a proteínas com a forma pretendida. Foi um enorme avanço na biologia!
Faltava a resposta à outra parte do problema: dada uma determinada sequência de aminoácidos, qual é a forma tridimensional da proteína? As estruturas teóricas existiam há muito, mas eram pouco precisas. A partir de 2018, com sucessivas versões de um programa de inteligência artificial chamado AlphaFold, da empresa DeepMind ligada à Google, a situação mudou. O AlphaFold usa aprendizagem automática para, a partir da relação entre as sequências e as estruturas de proteínas conhecidas, prever a forma de outras proteínas. Foi por esse triunfo que foram reconhecidos os dois restantes laureados, Demis Hassabis e John Jumper.
O AlphaFold ainda tem limitações e não pode substituir – pelo menos de momento – todas as determinações de estruturas por via experimental. Consegue prever a estrutura de uma cadeia polipeptídica (união sequencial de vários aminoácidos), mas muitas proteínas são formadas por várias dessas cadeias e não apenas por uma. O AlphaFold também não prevê a posição exacta de alguns outros constituintes, tais como metais, iões ou pequenas moléculas (ligandos) necessários para o funcionamento de algumas proteínas. Mas é plausível que várias dessas limitações sejam ultrapassadas em breve. O campo da bioinformática, alavancado pela inteligência artificial, está em franco desenvolvimento.
Qual é a importância destes avanços? As proteínas estão envolvidas em todos os processos biológicos. Pode-se, por design computacional, sintetizar proteínas que actuem como medicamentos. A previsão de estrutura de proteínas também nos pode ajudar a compreender os mecanismos causadores de uma doença. Portanto, estes avanços vão no sentido de aumentar a nossa qualidade de vida.