O que é recuperação de desastres? {+Tipos e como funciona}
Uma estratégia sólida de recuperação de desastres (DR) ajuda as empresas a se recuperarem de cenários de emergência, sejam eles de origem natural, acidental ou maliciosa. Ao garantir que a empresa possa retomar rapidamente as operações de TI em tempos de crise, a DR ajuda a evitar perdas de receita, clientes insatisfeitos e danos à marca.
Este artigo é uma introdução à recuperação de desastres e às formas como as empresas conscientes da segurança se preparam para emergências. Explicamos todos os principais conceitos de DR, analisamos diferentes estratégias de restauração e descrevemos tudo o que você precisa cobrir para criar um plano eficaz de recuperação de desastres.
O que é recuperação de desastres?
A recuperação de desastres (DR) é um conjunto de procedimentos, políticas e processos que determinam como uma empresa responde a eventos e incidentes perturbadores. As empresas normalmente estruturam a sua estratégia de DR num documento formal que fornece às equipas instruções detalhadas para responder a desastres.
O objetivo da DR é garantir que uma empresa possa continuar a operar ou retomar rapidamente as operações de TI se houver um incidente natural ou induzido pelo homem. Cenários de desastre comuns são:
- Riscos naturais como tsunamis, terremotos, inundações ou furacões.
- Falha de equipamentos (quedas de energia, falhas no disco rígido, danos físicos, etc.).
- Erros humanos acidentais, como exclusão não intencional de dados ou perda de um dispositivo BYOD.
- Focos de incêndio.
- Acidentes industriais.
- Um insider malicioso sabotando um sistema.
- Ameaças de bomba.
- Um ataque cibernético vindo de fora da organização (DDoS, injeções de SQL, ataques de ransomware etc.).
- Uma violação de dados.
Muitas vezes, as empresas combinam recuperação de desastres e planejamento de continuidade de negócios em uma única iniciativa (BCDR). No entanto, apesar de alguma sobreposição, existe uma distinção clara entre BC e DR:
- A continuidade dos negócios é um conjunto proativo de práticas que minimizam os riscos e garantem que a empresa possa continuar a fornecer serviços sem interrupções.
- Um plano de recuperação de desastres é um processo reativo que descreve etapas específicas que uma empresa deve seguir para retomar as operações de TI em caso de desastre.
Leia detalhadamente sobre suas diferenças em nosso artigo Continuidade de negócios versus recuperação de desastres.
Por que a recuperação de desastres é importante?
A recuperação de desastres é vital porque permite que uma empresa:
- Prever e prevenir incidentes evitáveis.
- Responda e recupere-se de eventos inevitáveis.
Quando ocorre um desastre, um plano de recuperação reduz os danos e ajuda a equipe a responder ao problema corretamente. Como resultado, a DR permite os seguintes benefícios durante e após uma emergência:
- Economia de custos: a preparação para um evento perturbador pode economizar centenas de milhares de dólares em danos (equipamentos mais seguros, melhor proteção de dados, menos consequências legais, etc.).
- Recuperação rápida: uma empresa pode reiniciar serviços de missão crítica mais rapidamente com uma DR do que sem um plano de reação.
- Sem interrupções de serviço: um plano de DR garante que os serviços continuem funcionando como se o desastre não tivesse acontecido.
- Diminua o estresse da equipe: a preparação para desastres reduz a pressão sobre os funcionários, dando à equipe um plano de ação claro em caso de emergência.
Algumas empresas exigem planos de recuperação de desastres para atender aos regulamentos de conformidade. As empresas que operam nos setores financeiro, de saúde e governamental são normalmente obrigadas por lei a ter alguma forma de preparação para DR.
Tipos de recuperação de desastres
As empresas podem escolher entre uma variedade de tipos e métodos de DR para formar uma estratégia de recuperação eficaz. O tipo de recuperação de desastres que você configura depende de:
- Ambiente de TI e suas necessidades exclusivas.
- Quais ativos requerem proteção (digital e física).
- Níveis de risco da indústria.
- Os métodos preferidos de backup e recuperação.
- Orçamento geral.
Aqui estão os tipos mais comuns de recuperação de desastres:
- Recuperação de desastres do data center: este tipo de DR garante que a empresa tenha um site de failover em um data center secundário ou em uma instalação de colocação. Este plano também deve incluir medidas para recuperar o data center primário (por exemplo, ferramentas de supressão de incêndio ou fontes de energia de backup).
- Recuperação de desastres na nuvem: em vez de configurar uma instalação secundária, você pode usar a recuperação de desastres na nuvem para configurar o failover automático de carga de trabalho para uma nuvem em caso de interrupção. Esse tipo de DR pode incluir qualquer coisa, desde recursos de reserva de computação em nuvem até um data center virtual (VDC) em espera.
- Recuperação de desastres de rede: esta estratégia de DR é um plano para restaurar a funcionalidade da rede durante um desastre. Este plano normalmente envolve acesso a sites e dados de backup.
- Recuperação de desastres virtualizada: a virtualização permite replicar cargas de trabalho de pequeno porte em um local alternativo ou na nuvem.
- Recuperação de desastres como serviço (DRaaS): DRaaS é uma versão baseada em serviço de recuperação de desastres na nuvem. Se houver uma emergência, o provedor de DRaaS moverá todo o processamento do computador para sua infraestrutura em nuvem e permitirá que você continue as operações.
Observação: saiba mais sobre failover e failback e suas diferenças, como métodos de recuperação de desastres.
Dependendo do escopo e da complexidade da sua configuração de TI, você pode precisar de vários (ou até mesmo de todos) os tipos de recuperação listados acima.
Como funciona a recuperação de desastres
A recuperação de desastres depende da replicação de dados e processos de computação em um local externo, não afetado pelo incidente em andamento. Esses locais podem ser físicos ou virtuais e se enquadram em uma das três categorias:
- Sites frios: um site frio é uma instalação secundária com recursos de energia e rede. Esses sites não incluem armazenamento de dados, portanto, configurá-los em caso de desastre é demorado e sujeito a erros.
- Sites quentes: um site quente contém todos os elementos de um local frio, além do hardware de armazenamento de dados. Esses sites estão prontos para funcionar em caso de desastre, mas a equipe ainda precisa transportar os dados atuais.
- Hot sites: um hot site é um site de backup totalmente operacional com espelhos atualizados de todos os dados críticos. Esses locais são demorados para configurar e manter, mas garantem pouco ou nenhum tempo de inatividade em caso de emergência.
O tipo de site que uma empresa cria depende da complexidade do ambiente de TI e do orçamento alocado. Como os sites frios são baratos para configurar e os locais quentes são altamente complexos e caros, a maioria das empresas opta por um backup quente.
Exemplos de recuperação de desastres
As estratégias de recuperação variam em complexidade dependendo do tipo de incidente e do valor dos ativos que você está tentando proteger. Aqui estão alguns exemplos de recuperação de desastres:
- Um plano de como a equipe deve reagir a um incêndio dentro ou próximo a um data center.
- Instruções sobre como recuperar conteúdo de um backup de dados e manter as operações normais se um servidor da Web ou de aplicativos ficar inativo.
- Orientação sobre como retomar as operações caso o sistema ERP em nuvem da empresa fique indisponível.
- Uma estratégia para colocar um site novamente on-line após um ataque cibernético.
- Instruções sobre como proteger equipamentos em áreas propensas a furacões e usar backups de failover para manter os serviços online.
- Orientações sobre como a equipe deve mitigar a situação se um dos funcionários abrir acidentalmente um arquivo em um e-mail de phishing.
- Um plano de DR de prevenção contra ransomware que fornece etapas sobre como a equipe deve isolar sistemas infectados e usar backups imutáveis para restaurar dados.
O que é um plano de recuperação de desastres?
Um plano de recuperação de desastres é um documento para toda a empresa que especifica como a equipe deve responder a interrupções ou desastres específicos. Este documento fornece todas as informações de que os funcionários precisam para minimizar os efeitos do desastre e proteger o negócio.
Embora cada plano de DR seja único, cada documento deve incluir:
- Principais objetivos e tempos de recuperação do plano de desastre.
- Pessoal de referência e suas informações de contato.
- Uma visão geral das ameaças e riscos potenciais.
- Uma análise dos ativos críticos de TI.
- Uma descrição detalhada das ações e procedimentos de resposta.
Um plano de recuperação de desastres deve estar em constante evolução. Garanta que a estratégia de resposta permaneça eficaz e precisa, atualizando o documento sempre que você adicionar novos equipamentos ou expandir a pilha de ferramentas.
Elementos de um plano de DR
Um plano de recuperação de desastres completo deve incluir os seguintes elementos:
- Análise de risco: uma avaliação de todos os riscos potenciais que a empresa pode enfrentar.
- Análise de impacto nos negócios: A BIA avalia os efeitos dos perigos descritos pela análise de risco. Esta avaliação prevê impactos potenciais na segurança, finanças, reputação e conformidade de uma empresa.
- Metas de recuperação de desastres: uma definição clara do que a organização pretende alcançar com o plano de recuperação de desastres.
- Objeto de tempo de recuperação (RTO): RTO é o tempo que leva para a infraestrutura de TI voltar a ficar on-line após um incidente. Esta métrica define o tempo máximo de inatividade que um sistema crítico pode enfrentar em caso de desastre.
- Objeto de ponto de recuperação (RPO): RPO é a quantidade aceitável de dados (medida pelo tempo) que você pode perder entre o início do incidente e a recuperação completa da TI.
- Pessoal de referência: uma lista clara de nomes e contatos dos membros da equipe responsáveis pela execução do plano de DR.
- Um inventário de TI: uma lista detalhada de ativos de hardware e software, criticidade de TI e dependências.
- Locais de recuperação: uma visão geral de todos os locais frios, quentes e quentes nos quais a equipe pode contar em caso de emergência.
- Procedimentos de backup: instruções sobre como, quando e onde você faz backup de recursos e como recuperar conteúdo.
- Procedimentos de recuperação de desastres: respostas de emergência passo a passo para diferentes cenários de incidentes.
- Guias de restauração: planos detalhados para recuperação de operações de TI.
Como criar um plano de recuperação de desastres?
Abaixo está um guia passo a passo sobre como criar um plano básico de recuperação de desastres:
- Realize análises de risco: mapeie as ameaças que você provavelmente enfrentará, incluindo desastres naturais, falhas de equipamentos e ameaças cibernéticas.
- Definir objetivos de DR: descreva as principais metas do plano de recuperação de desastres e defina os tempos de recuperação esperados (RTO e RPO).
- Mapeie ativos: identifique o que você está tentando proteger, incluindo equipamentos de rede, servidores, estações de trabalho, software, recursos de nuvem e dados críticos. Liste a localização de cada ativo (seja físico ou digital), configuração, modelo, número de série, versão e dependências.
- Priorize os ativos: defina a prioridade de cada ativo (alta, média e baixa) com base no quanto a perda prejudicaria os negócios.
- Forneça um resumo das instalações: Crie uma visão detalhada de suas instalações (plantas baixas, necessidades de energia, requisitos de segurança, mecanismos anti-incêndio, etc.).
- Defina o pessoal responsável: Forneça nomes e contatos de funcionários e equipes responsáveis pela execução de medidas de DR.
- Explicar os procedimentos de backup: Faça um guia detalhado sobre como, quando e onde a empresa faz backup dos dados.
- Descreva os procedimentos de recuperação de desastres: forneça procedimentos de resposta a emergências para cada incidente potencial.
- Explicar os procedimentos de recuperação: explique como a equipe deve restaurar as operações e os dados de TI após um desastre. O plano deve abranger respostas a todas as ameaças descritas na análise de risco.
- Escreva instruções para locais de backup: Se a equipe não puder continuar a usar o data center primário após o desastre, os funcionários deverão saber como chegar a locais alternativos (sejam eles frios, quentes ou quentes).
- Forneça instruções de restauração: escreva um plano detalhado para restaurar toda a configuração de TI a um estado anterior ao desastre.
Antes de formalizar o plano, você deve realizar um exercício realista para cada tipo de desastre. Você pode organizar um teste de penetração para todos os desastres baseados em software para ver se o procedimento funciona em um ambiente real.
>Formando uma equipe forte de DR
Seja criando um plano de DR do zero ou melhorando uma estratégia existente, formar a equipe certa de especialistas é fundamental para o sucesso. Divida sua equipe de DR em quatro grupos principais responsáveis por:
- Decisões executivas: esses membros da equipe aprovam estratégias, políticas e orçamentos relacionados à DR.
- Gerenciamento de crises: esta equipe lança planos de recuperação, coordena esforços de restauração e lida com problemas imprevistos. Esses funcionários são o contato principal para todos os problemas relacionados à DR.
- Continuidade operacional: esses especialistas são responsáveis pelas práticas recomendadas de continuidade dos negócios e por garantir que os serviços permaneçam disponíveis durante o desastre.
- Avaliação de impacto e recuperação: esta equipe avalia os danos e lidera a fase de recuperação do plano de DR.
O treinamento é a chave para criar uma equipe de DR capaz. Execute exercícios e testes regulares para manter os funcionários em boa forma e garantir que a equipe de DR se mantenha atualizada com as mudanças no ambiente de TI.
Espere pelo melhor, planeje o pior
Quanto mais tempo você demorar para se recuperar de um incidente, maior será o impacto em suas operações e finanças. Um plano de DR sólido garante uma recuperação rápida de interrupções e, como tal, deve ser parte integrante da sua estratégia de TI e de negócios. Para saber mais sobre backup e como ele se compara à recuperação de desastres, confira nosso artigo Backup versus recuperação de desastres.