Este Nobel da Física salienta o poder do pensamento interdisciplinar
O Prémio Nobel da Física de 2024 pode ser visto como um convite da física para que os investigadores em aprendizagem automática e inteligência artificial pensem como os físicos.
John Hopfield e Geoffrey Hinton recebem o Prémio Nobel de Física de 2024 por “descobertas e invenções fundamentais que permitem a aprendizagem automática com redes neuronais artificiais”, baseadas em conceitos e métodos matemáticos originários da física estatística.
Antes de mais, importa referir que a física estatística estuda o comportamento macroscópico de sistemas (físicos) complexos a partir de propriedades e interacções microscópicas simples dos seus componentes. Num exemplo clássico, a física estatística explica a relação entre temperatura, volume e pressão num balão de gás, partindo apenas de uma descrição estatística dos movimentos e interacções das partículas do gás.
Esta capacidade da física estatística para descrever e analisar sistemas complexos constituídos por muitos elementos relativamente simples tem estimulado, há décadas, o uso dos seus métodos no estudo de muitos tipos de sistemas complexos. Estes sistemas, que não são necessariamente físicos, podem ser também computacionais, nomeadamente as redes de neurónios (naturais ou virtuais), que são sistemas complexos constituídos por muitos elementos com interacções simples.
Em 1982, John Hopfield usou modelos de física estatística usados para estudar propriedades magnéticas de materiais (spin glasses) para propor uma classe de redes neuronais (virtuais) que ficou conhecida como “redes de Hopfield”. Esta área de trabalho abriu caminho para novas formas de compreender o processamento de informações no cérebro e em sistemas de aprendizagem automática.
As redes de Hopfield são sistemas de “memória associativa” que permitem recuperar versões ideais a partir observações imperfeitas: por exemplo, a imagem da cara de alguém conhecido, a partir de uma imagem parcial dessa cara, algo que um ser humano faz facilmente. As redes de Hopfield, apesar de simples, foram um passo crucial no desenvolvimento da moderna aprendizagem automática e da inteligência artificial (IA), ao exibir memória associativa, uma capacidade cognitiva fundamental.
Geoffrey Hinton, em 1985, com Terrence Sejnoski (que tinha sido estudante de Hopfield), levou a adopção de modelos da física estatística ainda mais a fundo, propondo as chamadas “máquinas de Boltzmann” (em referência a Ludwig Boltzmann, importantíssimo físico do século XIX, “pai” da física estatística). Estas redes são, na sua versão mais simples, variantes probabilísticas das de Hopfield, o que lhes permite quantificar probabilidades, capacidade fundamental para exprimir a incerteza associada aos resultados produzidos por sistemas de IA.
Este prémio, talvez mais do que premiar os contributos de Hopfield e Hinton, salienta o poder do pensamento interdisciplinar e o profundo impacto que os métodos e o modo de pensar da física podem ter em áreas aparentemente distantes. Pode ser visto como um convite da física para que os investigadores em aprendizagem automática e IA pensem como os físicos.
Num apontamento crítico, pode argumentar-se que os premiados não são os pioneiros originais desta infusão de física na aprendizagem automática – nomeadamente Shun’ichi Amari, seminal investigador japonês desta área, fez contribuições uma década antes de Hopfield que essencialmente coincidem com as redes de Hopfield. Pode também questionar-se por que motivo Sejnoski não recebeu também o prémio com Hinton, dada a co-autoria das máquinas de Boltzman e o seu também enorme impacto na área.
Termino com duas notas pessoais e locais. Em 1991, no início do meu doutoramento, os primeiros artigos que publiquei em co-autoria com o meu orientador, José Leitão, foram sobre o uso de redes de Hopfield em restauração de imagens, à época trabalho pioneiro. Saltando para 2024, o meu colega André Martins publicou já este ano um artigo descrevendo uma nova versão das redes de Hopfield (na conferência mais importante da área), dando evidência acerca da duradoura influência e impacto destes modelos na moderna aprendizagem automática e IA.
Professor catedrático do Instituto Superior Técnico