Por que razão estamos sempre errados em relação ao futuro
Uma confusão comum nestas coisas dos modelos é que os modelos não são a realidade. Os modelos são apenas uma aproximação da realidade.
A 2 de março de 2020 foi confirmado oficialmente o primeiro caso da covid-19 em Portugal. Nesse dia ainda ninguém tinha noção exata do que aí vinha, apesar de a contagem já ter começado noutros países.
À covid-19 seguiu-se uma outra pandemia menos óbvia, aquela em que as informações falsas muitas vezes se transmitem mais rapidamente que as verdadeiras, com impactos que vão do inócuo ao grave. E quase sempre estas informações são baseadas num número impressionante ou numa probabilidade bombástica que parece ser relevante compreender.
Mas será que é importante compreender todos os números, ou será que parte da informação é mais ruído de fundo do que mensagem fundamental? Talvez uma das coisas mais importantes seja separar o trigo do joio. No fundo, perceber quais são os números importantes a reter, e quais os que devemos ignorar. Porque estes números alimentam decisões. E essas serão sempre difíceis de tomar.
Não podemos acreditar nos números como uma verdade absoluta, porque naturalmente estes correspondem a observações, que podem diferir da realidade, que gostaríamos de observar sem erro, mas que infelizmente está, quase sempre, inacessível.
Pensemos em qualquer um dos números que as televisões e os jornais nos reportam a cada dia como se isso nos pudesse dizer o que se segue, seja o número de doentes em cuidados intensivos, o número de novos casos confirmados, o número de doentes recuperados ou o número de óbitos cuja causa foi a covid-19.
Qualquer um destes valores corresponde apenas a uma observação de um valor real, mas que por um conjunto enorme de fatores pode não ser o valor real. Todos estes fatores são como filtros que estão entre nós, o observador e a realidade. Por cada filtro que a realidade passa para ser observada dá-se um processo de distorção. Só se conseguirmos compreender essa distorção, que o processo de observação induziu, é que podemos interpretar os números reportados.
Erros aleatórios e erros sistemáticos
Pensemos, por exemplo, no número registado de óbitos cuja causa foi a covid-19. Por exemplo, a 22 de abril foram 785. Há uma série de fatores que podem levar a que o número real de mortos seja maior que o reportado. Por exemplo, as pessoas que morreram da covid-19 hoje, mas nem sequer foram diagnosticadas como tal. Ou as pessoas que morreram nos dias anteriores, mas só foram registadas hoje. Ou alguém que se enganou a registar um óbito e o atribui à covid-19 quando a causa foi outra.
O que isto nos mostra, para começar, é que os dados, por mais óbvios que possam ser, têm erros. Que podem ser grandes e cujo impacto irá ser propagado em qualquer análise que os use. Esse impacto vai ser de dois tipos possíveis. Por um lado, se os erros forem aleatórios, de uma forma simples, se eles não estiverem relacionados com o fenómeno que estamos a querer modelar, vão de uma forma geral traduzir-se numa redução da precisão dos resultados. Porquê? Porque a variabilidade extra dos erros nos dados propaga-se naturalmente para a variabilidade nas previsões de um modelo estatístico. Por outro lado, se os erros forem sistemáticos iremos obter previsões enviesadas. O erro nos dados propaga-se, mais uma vez, para os resultados do modelo. O pior é que, na vida real, o que temos é uma complicada combinação de erros aleatórios e erros sistemáticos, que vão mudando ao longo do tempo. Isso faz com que os resultados de qualquer modelo tenham de ser interpretados com extremo cuidado. As previsões de um modelo nunca podem ser melhores do que a qualidade dos dados que alimentaram esse mesmo modelo.
Os mortos e a taxa de mortalidade
Mas falamos de mortos, o pior dos números para a população em geral, mas um dos melhores para quem os trabalha, porque este é um número muito simples de perceber. É que um morto não desaparece, numa sociedade moderna são (quase) todos contabilizados. E mesmo assim há erros. E logo a seguir, quando falamos em taxa de mortalidade, fica tudo muito confuso.
Mas estamos acima dos 3%, estamos abaixo dos 2%? Este tipo de número é uma divisão entre dois números, por exemplo o número de mortos e o número de casos confirmados. Se o quisermos baixar, podemos investir em testes de diagnóstico indiscriminadamente em sectores da população de menor prevalência da covid-19. Baixaremos a tal “taxa de mortalidade”, mas não mudamos a realidade! Daí que comparar estes números (o número de mortos e o número de casos confirmados) entre países seja uma tarefa ingrata e perigosa.
Mas há outros números a considerar. Como por exemplo o número diário de novos casos confirmados. Esse número não é o que nós gostaríamos de observar! O que gostaríamos de observar, para depois poder aplicar os modelos que nos permitem prever o futuro, era, para cada dia, o número de novos infetados na população. Mas, claro, entre o número de novos casos na população e o número de novos casos confirmados está uma diferença abissal. Os primeiros são todos aqueles que foram contaminados, mas que não fazemos ideia que o foram, porque são assintomáticos, porque acham que têm uma gripe normal e não vão ao médico ou porque são homens ou mulheres que se habituaram a aguentar a doença sem ir a um hospital. Para não falar do facto de o processo de observação ter um natural desfasamento com a realidade, porque observamos sintomas, mas a infeção aconteceu dias ou semanas antes.
Há mais uma série de filtros que temos de compreender se quisermos modelar a realidade e obter resultados robustos. E, quando fazemos comparações entre países, as coisas são ainda mais complicadas, porque obviamente o número de novos casos depende não só de existirem novos casos, mas também da quantidade de testes realizados. Por isso, o número pode aumentar de um dia para o outro não porque o verdadeiro número de infetados aumentou, mas porque de repente se começaram a testar mais pessoas.
O pico é uma aproximação da realidade
De um ponto de vista conceptual, a abordagem seria simples. Em vez de fazer um modelo que apenas modela os dados observados, poderíamos considerar modelos bastante mais complexos. Um exemplo serão os modelos hierárquicos, em que temos não só uma componente do modelo que explica como os processos, a realidade, evolui ao longo do tempo, mas também como é que o processo de observação dessa realidade decorre. A vantagem desse tipo de modelos hierárquicos é que permite separar as componentes dos erros que são devidas ao processo de observação, e aqueles que são devidos à própria variação natural do fenómeno que pretendemos modelar. Até porque uma confusão comum nestas coisas dos modelos é que os modelos não são a realidade.
Os modelos são apenas uma aproximação – útil, se tivermos arte, engenho e até um pouco de sorte – da realidade. Ou seja, tanto se fala do “pico” da pandemia, mas a verdade é que não há pico nenhum. O pico é uma aproximação, tal como o crescimento exponencial é uma aproximação, tal como todo e qualquer modelo é uma aproximação da realidade. É algo que permite que todos falemos de uma coisa abstrata que não existe. E por não existir, e por nem sempre ser claro a que se refere, muitas vezes temos confusões. Há vários processos a decorrer. Várias contagens que podemos tentar seguir. Por exemplo, haverá um pico no número de casos confirmados, no número de doentes na população, e também no número de mortos, mas estes são três processos distintos. Estão relacionados, logicamente, mas são distintos.
Para qualquer fenómeno aleatório, ninguém sabe o que vai ser o dia seguinte antes de o observar. Há probabilidades associadas a cada futuro, que podem ser mais ou menos difíceis de calcular. Os modelos que estão a ser utilizados para prever a pandemia, e assim tentar definir políticas adequadas, tentam fazê-lo. Tentam, de uma forma rigorosa, prever o futuro com base no passado, à custa de uma série de pressupostos, que são muitas vezes ignorados ou propositadamente esquecidos. Mas não nos podemos esquecer disso mesmo. Toda e qualquer decisão tomada em face da incerteza pode não ser a melhor. Toda e qualquer decisão tomada em face da incerteza tem um risco associado. E os modelos não são melhores do que a qualidade dos dados que os alimentam, que, pela natureza do processo em causa, nem sempre é a melhor.
Qual a percentagem de imunizados?
Neste momento, por exemplo, parece-me que uma das quantidades fundamentais que os decisores políticos precisavam de ter era a percentagem da população imunizada. Ou seja, aquelas pessoas que já tiveram em contacto com o vírus, mas recuperaram. Para isso precisamos de testes serológicos. São esses imunizados confirmados que, se assumirmos que depois de imunizados o nosso sistema imunitário vai, pelo menos durante uns tempos, conseguir resistir a novas infeções, vão permitir que o país retome a vida normal. Quando tivermos um número suficientemente grande, mais de metade da população certamente, atingiremos a tal imunidade de grupo de que por vezes se fala. Até lá, as consequências de começarmos a relaxar as medidas até agora tomadas são uma incógnita. A única maneira que consigo imaginar para obtermos este número é removermos alguns dos filtros que estão entre os poucos testes serológicos realizados até agora e a proporção de imunizados na população em geral. Teríamos de fazer uma amostragem aleatória, coordenada por quem destas coisas entende – como o Instituto Nacional de Estatística –, tal como se faz para estimar qualquer outra quantidade, como por exemplo a taxa de desemprego. Só assim podemos garantir que percebemos os filtros usados, desfazendo assim o seu efeito e permitindo uma visão não enviesada da realidade. E depois definir estratégias em face dessa realidade.
Os políticos deste e de outros países têm de tomar decisões complicadas em face de incerteza. E nesse aspeto não invejo esse trabalho. É que para os cientistas que estão a modelar o problema é tudo muito fácil. Não há grandes decisões em jogo, as vidas das pessoas não lhes estão efetivamente nas mãos. Mesmo que, naturalmente, alguns assim o sintam. O trabalho dos cientistas é obter os dados, criar as ferramentas e explorar os cenários que permitam aos decisores políticos atuar. Mas os políticos têm de agir, e têm de fazê-lo sabendo que, façam o que fizerem, vão ser criticados. Porque as suas decisões vão ser julgadas no futuro, por pessoas que terão então o conhecimento fundamental que, por definição, não existia quando essas mesmas decisões foram tomadas.
Professor auxiliar convidado do Departamento de Biologia Animal e vice-coordenador do Centro de Estatística e Aplicações da Faculdade de Ciências da Universidade de Lisboa
O autor escreve segundo o novo Acordo Ortográfico