O caso Equinix: como falhas em centros de dados afectam a Internet

Há quase um ano, uma quebra no centro de dados da Equinix, no Prior Velho em Lisboa, afectou vários serviços online. Explicamos porquê.

Foto
A Equinix é uma das principais operadoras de centros de dados em Portugal Daniel Rocha
Ouça este artigo
00:00
12:26

Muito mais do que armazéns digitais, os centros de dados são fundamentais para o funcionamento do mundo online. Basta pensar no corte de Internet que Portugal registou no Verão de 2023.

Naquele dia 6 de Junho, às 16h, falhas de acesso à Internet começaram a afectar os clientes da Nos, Meo e Vodafone, interrompendo serviços de bancos, tribunais, jornais e empresas fornecedoras de água e de luz. Em 40 minutos, o site Downdetector, que faz o registo falhas na Internet em tempo real, tinha recebido 2400 alertas relativos às três grandes operadoras nacionais. A causa? Problemas no edifício da Equinix no Prior Velho, às portas de Lisboa mas já no concelho de Loures.

A empresa é uma das grandes operadoras de centros de dados em Portugal, juntamente com a Altice e a ONI Telecom, entre outras, mas um corte temporário de energia no edifício da Equinix em Lisboa, conhecido como LS1, interrompeu o funcionamento do sistema de arrefecimento das instalações. Os sistemas de emergência, que deveriam ligar-se automaticamente, demoraram – e foi o suficiente para causar o sobreaquecimento de vários servidores alojados naquele espaço.

“Foi pouco tempo, mas várias coisas falharam em sequência”, reconhece Carlos Paulino, director-geral da Equinix em Portugal, numa visita do jornal às instalações. O PÚBLICO preparou um conjunto de perguntas e respostas sobre o papel dos centros de dados, a importância dos sistemas de arrefecimento e como evitar problemas.

O que é um centro de dados?

Um centro de dados (data centers, em inglês) é um espaço composto por computadores ligados em rede, sistemas de armazenamento e infra-estruturas informáticas que as empresas e organizações utilizam para reunir, tratar, armazenar e gerir grandes quantidades de dados. Na base, é onde reúnem a informação que precisam para funcionar online. Estes centros também tratam e encaminham informação transcontinental, transportada por cabos submarinos, até chegar aos utilizadores finais.

Voltar ao início.

Como funcionam?

De certa forma, os centros de dados funcionam como o cérebro de uma empresa: por exemplo, no caso de uma loja online, quando um cliente faz uma compra, a informação da transacção (produto comprado, preço, informação do cliente) é enviada através da rede para o centro de dados, onde a informação é tratada, registada e armazenada.

Além de alojar servidores, os centros de dados garantem a segurança e funcionamento correcto destes aparelhos. Por exemplo, ao garantir sistemas de segurança física e digital (câmaras, seguranças e sistemas antivírus), alimentação eléctrica e refrigeração.

Voltar ao início.

Porque é que os centros precisam de refrigeração?

Os centros de dados precisam de sistemas de refrigeração porque os computadores e outros equipamentos electrónicos produzem muito calor ao funcionar. Isto acontece porque estão constantemente a tratar grandes quantidades de dados.

Se esse calor não for dissipado, os equipamentos podem sobreaquecer, o que leva a problemas como falhas nos sistemas e redução da vida útil dos dispositivos. Regra geral, a temperatura ideal situa-se entre os 18 e os 27 graus Celsius (temperaturas mais baixas representam um gasto desnecessário de energia). Regular os níveis de humidade também é importante para evitar danos nos equipamentos.

Os valores de climatização recomendados vêm da Sociedade Americana de Engenheiros de Aquecimento, Refrigeração e Ar Condicionado (ASHRAE, na sigla inglesa).

Foto
Problemas no LS1 causaram quebras nos acessos online em Junho de 2023

Voltar ao início.

Há diferentes tipos de centros?

Os centros de dados podem variar em tamanho, desde uma sala pequena com alguns servidores até conjuntos de edifícios distribuídos geograficamente. Algumas empresas podem ter de recorrer a mais do que um tipo, dependendo das cargas de trabalho e das necessidades do negócio.

Empresariais: servidores utilizados por uma só empresa para fins internos. Muitas vezes, ficam nos edifícios das próprias organizações. É um formato comum para gigantes de tecnologia.

Compartilhados (colocation, em inglês): servidores em espaços alojados por terceiros que são alugados por várias empresas. O centro compartilhado fornece a infra-estrutura (espaço, segurança, energia, serviços de arrefecimento), mas os servidores são dos clientes. Algumas empresas que recorrem a centros compartilhados arrendam salas inteiras. Outras apenas precisam de uma estante num armário com servidores de diferentes organizações.

Na nuvem: centros de dados que alojam infra-estrutura e servidores em diferentes localizações que podem ser usados por vários clientes através de uma ligação à Internet. Quando alguém tem dados “na nuvem”, na realidade, estão nestes servidores. A Microsoft, a Amazon, a IBM e a Google são exemplos de empresas que vendem acesso a serviços e alojamento na nuvem.

Voltar ao início.

Como funcionam os centros “na nuvem”?

O armazenamento “na nuvem” tem diversas vantagens em relação a outros tipos de centros de dados, principalmente devido à sua natureza redundante. Isto significa que a infra-estrutura física está dividida em várias partes do mundo e que cada peça de informação é duplicada em múltiplos centros de dados. Quando um utilizador guarda fotografias no iCloud (Apple) ou no Google Photos (Google), por exemplo, esses ficheiros são replicados em vários centros de dados distribuídos globalmente.

A estratégia garante a segurança dos dados contra falhas físicas e facilita o acesso. A redundância é crucial para aplicações que necessitam de respostas imediatas e tratam grandes volumes de dados, como é o caso dos novos sistemas de inteligência artificial. Por norma, há centros perto dos clientes que usam os serviços, o que minimiza a latência (o tempo de espera no acesso aos dados).

Foto
Problemas nos centros de dados podem causar quebras no acesso a serviços online

Voltar ao início.

Como é que a informação atravessa continentes?

A informação online viaja entre diferentes continentes através de extensos cabos colocados no fundo do mar – os cabos submarinos. Estes cabos funcionam como auto-estradas para a informação digital, só que, em vez de viajar sobre rodas, a informação viaja em feixes de luz que percorrem fibras ópticas no interior dos cabos.

A proximidade dos centros de dados aos pontos onde os cabos submarinos chegam à terra (pontos de amarração) é crucial, pois reduz a latência, ou seja, o tempo de resposta nas comunicações, e aumenta a velocidade de transmissão de dados. O centro de dados da Equinix, por exemplo, tem conectividade directa com todos os cabos submarinos que chegam a Portugal.

Foto
Localização dos pontos de amarração de cabos submarinos em Portugal

Voltar ao início.

O que leva os sistemas a falhar?

Apesar de os centros de dados serem uma parte essencial do mundo digital, estão vulneráveis a várias ameaças que incluem desastres naturais, ciberataques, erros humanos e falhas eléctricas.

Desastres naturais: terramotos, inundações, incêndios e outras catástrofes naturais podem levar a cortes de energia e danificar fisicamente as infra-estruturas. O terramoto de 2011 em Tóquio, no Japão, por exemplo, causou falhas em alguns serviços da NTT Data. Outros exemplos incluem o furacão Sandy, nos EUA, que em 2012 levou a falhas em vários centros de dados em Nova Iorque, e as inundações de 2015 em Leeds, no Reino Unido. Isto é um dos motivos que levam à construção de centros de dados subterrâneos (nestes casos, porém, a expansão e a ventilação tornam-se desafios maiores).

Quebras de energia: interrupções ou instabilidade no fornecimento de energia eléctrica também causam problemas, afectando os servidores de forma directa ou indirecta. Por exemplo, se os servidores não se desligarem, mas o ar condicionado deixar de funcionar, as máquinas podem sobreaquecer. Foi parte do problema do dia 6 de Junho, nas instalações da Equinix no Prior Velho.

Problemas de refrigeração: como os equipamentos electrónicos geram muito calor, a falha dos sistemas de refrigeração pode levar ao superaquecimento e até danificar permanentemente os componentes.

Erros humanos: configurações incorrectas, manutenção inadequada ou erros durante a manipulação dos equipamentos podem causar interrupções significativas.

Ciberataques: atacar o sistema de gestão de energia de um centro de dados pode comprometer o fornecimento correcto de energia aos servidores, resultando em falhas operacionais. Danificar os equipamentos não é sempre o objectivo: em 2018, por exemplo, surgiram suspeitas de que fornecedores chineses da Super Micro, uma empresa que produz equipamentos de informática que são usados em centros de dados, teriam instalado chips nos seus produtos com fins de espionagem. A situação, que foi primeiro reportada numa investigação da Bloomberg, nunca foi comprovada.

Foto
As inundações em Leeds afectaram centros de dados REUTERS/ANDREW YATES

Voltar ao início.

O que aconteceu com a Equinix em 2023?

A explicação oficial da Equinix é que houve uma falha de energia no edifício do Prior Velho e os sistemas de emergência não começaram a funcionar a tempo, levando ao sobreaquecimento dos servidores. Os motivos da quebra de energia e das baterias de emergência nunca foram adiantados publicamente. À semelhança de outros centros de dados, o edifício em Lisboa tem vários sistemas preparados para cortes temporários de energia.

“Em caso de falha de energia, as baterias suportarão imediatamente a carga, seguidas pelos geradores, que alimentarão todos os sistemas cruciais do data center. Este processo é totalmente automatizado e não requer intervenção humana”, lê-se num email enviado pela equipa da Equinix.

Durante a visita do PÚBLICO ao centro da Equinix, a equipa garantiu que os sistemas de redundância são testados regularmente, a cada seis meses. “Nunca podemos garantir o funcionamento constante a 100%. Garantimos 99,9%”, sublinha Carlos Paulino, director-geral da organização em Portugal.

Voltar ao início.

Foto
Não é certo porque é que os sistemas de redundância não arrancaram de imediado
Foto
Carlos Paulino, director geral da Equinix em Portugal

Porque é que tantas pessoas foram afectadas?

A Equinix diz que o LS1 fornece conectividade de rede a mais de 110 clientes empresariais, 45 redes (incluindo operadores de telecomunicações e empresas de serviços de Internet) e quatro pontos de troca de tráfego (local onde os provedores de Internet e as redes de fornecimento de conteúdo se interligam).

Empresas que dependiam exclusivamente do LS1 foram as mais afectadas. Por norma, empresas maiores têm servidores também noutros centros de dados. Ainda assim, o processo de migração de dados não é instantâneo.

Voltar ao início.

O problema poderia ter sido evitado?

Os centros de dados são falíveis: existe sempre a possibilidade de algo correr mal, seja devido a falhas no equipamento, erros humanos, ciberataques ou desastres naturais. No caso da Equinix, pelas 19h, o problema tinha sido dado como resolvido. Empresas que tinham dados noutros servidores conseguiram retomar o funcionamento normal muito mais rapidamente.

“Nunca podemos prometer 100%. Há sempre algo que falha”, reforça Carlos Paulino. “Empresas mais pequenas que apenas tinham servidores no LS1 foram mais afectadas.”

As empresas que recorrem a centros de dados têm de reflectir sobre o custo e o benefício de ter servidores em diferentes locais – é a chamada redundância geográfica.

Isto quer dizer que, quando um centro de dados enfrenta um problema, os servidores noutros locais podem continuar a operar, minimizando o tempo de inactividade ou a perda de dados guardados nos servidores. Grandes empresas como Google, Amazon e Microsoft, por exemplo, têm os seus dados distribuídos em vários centros de dados em todo o mundo.

Voltar ao início.

Quanta energia gastam?

Segundo as mais recentes estimativas da Agência Internacional de Energia (IEA na sigla inglesa), referentes a 2022, o consumo mundial de electricidade dos centros de dados em 2022 ronda os 240-340 TWh, ou seja, cerca de 1-1,3% do consumo de electricidade mundial. Este valor exclui a energia utilizada para a extracção de criptomoedas, que foi estimada em cerca de 110 TWh em 2022 (0,4% da utilização anual de electricidade mundial).

A IEA nota, no entanto, que a utilização combinada de electricidade pela Amazon, Microsoft, Google e Meta mais do que duplicou entre 2017 e 2021, aumentando para cerca de 72 TWh em 2021. A tendência deve continuar a aumentar com o desenvolvimento de novos serviços de IA, que requerem cada vez mais energia.

Para reduzir a pegada ambiental, os centros de dados podem utilizar energias renováveis para fornecer energia e partilhar o calor gerado pelos servidores para aquecer outros edifícios. Manter a temperatura dos servidores perto do limite máximo (27 graus Celsius) também ajuda a diminuir os custos de energia com refrigeração.

Voltar ao início

Actualizado às 16h20 com as referências aos centros de dados a operar em Portugal

Sugerir correcção
Ler 1 comentários