Estratégias de Recuperação de Desastres

Como as empresas, principalmente aquelas que possuem dados críticos e que não podem se dar ao luxo de ficarem horas ou dias indisponíveis, seja por necessidade em manter a reputação da empresa ou por necessidade legal, é necessário a elaboração de uma estratégia em como lidar com situações de desastres.

Na publicação anterior falei sobre o plano de continuidade de operações (Business Continuity Planning) em que informa os tempos máximos toleráveis para indisponibilidade do negócio. Para cumprir com os prazos levantados no BCP é necessário a adoção de uma estratégia. O evento de desastre pode ser desde uma ocorrência tecnológica (ex: indisponibilidade elétrica no Data Center em que a empresa possui um colocation), ou evento de vandalismo/terrorismo (ex: ataque às instalações da organização) ou desastre natural (ex: terremotos, enchentes, furações). Os riscos em que a empresa é suscetível são identificados durante o BIA (Business Impact Analysis). Como lidar nessas situações?

Uma forma de lidar com ocorrências dessa natureza é manter um site (Data Center) remoto que poderá atender as necessidades da organização em caso de desastre. Existem diferentes estratégias de como montar um site backup.

O local alternativo pode ser desde apenas o necessário para acomodar as pessoas necessárias às funções críticas da empresa ou pode ser necessário local alternativo para todo o ambiente produtivo crítico. Recomenda-se que o site de backup possua pelo menos 8 quilômetros de distância do original para cenários de baixo risco, 24 quilômetros para cenários de médio risco e 80 a 300 quilômetros para cenários de alto risco. Essa recomendação existe para evitar que desastres regionais (tornados, terremotos) possam afetar ambos os locais.

Tipos de locais alternativos existentes dependerão dos requisitos do negócio e podem ser um dos seguintes:

  • Hot site: site totalmente funcional com todos os recursos (hardware e software) necessários para manter as funções críticas da empresa. Podem não possuir todos os dados necessários e mais atualizados e pode ser necessário prover algum tipo de restauração e sincronismo com o site principal. É a opção que permite a mais rápida recuperação em caso de desastres, porém é a opção mais cara, pois a organização precisará manter o site durante todo o período de sua operação.
  • Warm site: site que possui infraestrutura mínima (ar-condicionado, por exemplo) para acomodar os computadores e componentes. É basicamente um tipo de hot site porém sem os componentes mais caros. A proposta é permitir reduzir os custos em manter o local para eventualidades. Porém, devido a ausência de componentes importantes, o tempo necessário para operacionalizar o local é alto. É adotado pela maioria das empresas.
  • Cold site: possui toda a infraestrutura para sustentação dos serviços críticos, como sistemas de climatização, cabos e races. Porém não possui os computadores. É a opção mais barata de contingenciamento, porém os exercícios dos testes de contingência e uso do local custam caro. Podem ser necessárias semanas até a ativação do local em caso de necessidade, considerando que não existem computadores no local.
  • Mobile site: dependendo dos requisitos do negócio e a infraestrutura necessária, o site alternativo pode ser literalmente algo móvel. Empresas podem prover grandes caminhões com infraestrutura para prover um Data Center móvel. Obviamente essa abordagem possui limitações mas pode ser uma solução para determinados cenários. Outro cenário, adotado geralmente por grandes corporações e militares, é o uso de prédios e instalações de rápida montagem, que podem ser provisionadas rapidamente para atender a necessidades mais críticas em situações mais adversas.
  • Cloud site: outra abordagem é o uso de diversos diferentes centros de processamento de dados. Esses centros de processamento de dados podem possuir tecnologias que permitam o rápido o sincronismo de forma a rapidamente restaurar as operações em caso de desastres. No entanto esse tipo de abordagem não é possível para toda e qualquer natureza de negócio, já que podem existir regulamentações que limitam onde os dados poderão estar localizados. Exemplo: manter dados financeiros de correntistas brasileiros em outro país, que possui soberania e leis próprias que podem ser conflitantes com as leis nacionais. Esse cenário atualmente é possível para bancos brasileiros de acordo com a Resolução nº 4658/2018 do Banco Central do Brasil.

Essas definições não são orientações fixas. As empresas devem adotar o modelo que for mais adequado as necessidades de recuperação do negócio após um desastre.

De forma a simplificar o processo de manutenção desses locais alternativos, existem empresas que são especializadas em prover os sites de backup. Chamadas de service bureau, ou companhia de contingenciamento, elas são responsáveis em prover o tipo de site necessário e, dependendo do contrato, os equipamentos e demais componentes necessários para a recuperação da organização. Um ponto de atenção relevante é verificar se essa empresa possui gestão sobre sua cadeia de fornecedores.

Acordos de Reciprocidade

Outra forma de lidar com sites alternativos é o estabelecimento de contratos de reciprocidade. A idéia é realizar acordos com outras empresas, geralmente de ramo de atuação semelhante, para que em caso de necessidade seja possível uso do site da outra empresa para hospedagem dos serviços.

Esse tipo de acordo é bastante arriscado, pois cada empresa possui seus normativos e regras, bem como estrutura própria. Fazer com que ambas as empresas operem nas mesmas instalações gera um alto risco para todos. Imagina a gerência de configuração em um cenário como esse? Imagina os riscos de segurança que existirão por permitir com que diversas pessoas não conhecidas tenham acesso ao local.

Os termos do acordo de reciprocidade precisam ser muito claros e objetivos de forma a viabilizar a possibilidade de compartilhamento dos recursos. O recomendado é realizar testes para verificar a viabilidade do acordo.

Sites Redundantes

Sem dúvida uma das formas mais eficientes em realizar a recuperação em caso de desastres é o uso de sites redundantes. Nesse cenário, que pode parecer com um Hot site, o site alternativo possui toda a infraestrutura e os dados necessários para continuidade das operações. O site alternativo é um espelho do site principal, sendo pronto para uso de forma imediata ou com poucas intervenções. Geralmente essa solução é adotado por empresas que possuem MTD (Maximum Tolerable Downtime) muito baixo, sendo necessária rápida recuperação em caso de desastres. Outras empresas adotam essa solução por ser requisito para operação em determinados mercados regulamentados, como no caso do setor financeiro.

Outra diferença entre um Hot site e um site redundante é que o Hot site é provido por um service bureau, e o site redundante é infraestrutura da própria empresa. Sendo assim, qualquer uma das opções anteriores (hot, warm, cold) são soluções contratadas. É possível utilizar dessas estratégias para sites da própria organização.

Por fim…

As propostas apresentadas devem ser utilizadas sempre de acordo com a natureza do negócio e das necessidades identificadas pelo time de BCP. Modelos híbridos são bem-vindos desde que façam sentido para a organização e sua realidade. Sempre deve ser levado em consideração os custos de manutenção da infraestrutura de backup e o impacto em caso de falha do centro de processamento primário.

2 comentários sobre “Estratégias de Recuperação de Desastres

Deixe um comentário

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *