O que é RPO (Recovery Point Objective) e quais são suas aplicações
Datacenters são estruturas dinâmicas, onde novas aplicações e dados são introduzidos milhares de vezes todos os dias.
Nesses ambientes os dados são atualizados continuamente, e algumas horas podem representar o armazenamento de vários terabytes de informação.
Mesmo mantendo o backup dos servidores sempre atualizados, a principal questão que ainda fica sem resposta é qual será o impacto nas operações em caso de falhas.
É neste panorama que métricas bem estabelecidas de RPO tornam-se essenciais, pois podem reduzir os danos decorrentes de falhas inesperadas, limitando o período durante o qual os dados podem ser perdidos.
O que é RPO (Recovery Point Objective)?
RPO (Recovery Point Objective) é a métrica que determina a quantidade máxima de dados que uma organização pode perder em caso de falha do sistema. Esse indicador define o intervalo máximo de tempo para a perda de trabalho desde o último backup, seja em uma aplicação, serviço ou ambiente.
Também chamado de objetivo do ponto de recuperação, essa métrica auxilia na avaliação se a frequência de backup atual da organização é adequada para garantir a continuidade das operações após um incidente.
Em outras palavras, o RPO é o indicador que calcula o volume máximo de trabalho em uma infraestrutura que será perdido em um eventual cenário de interrupção.
Essa métrica é usada para identificar se o ponto mais antigo de backup armazenado pode assegurar a continuidade de negócios, causando o mínimo de impacto após uma interrupção.
O ponto de recuperação é calculado a partir da última cópia realizada, ou seja, se o backup é feito apenas uma vez por dia, o RPO será de 24 horas.
Considerando uma aplicação com um RPO de duas horas, por exemplo, os dados devem ser salvos pelo menos a cada duas horas. Assim, caso ocorra uma falha no sistema, a perda máxima de trabalho no ambiente seria de duas horas.
Estabelecer um RPO adequado é um exercício que requer equilíbrio, pois envolve ponderar os custos associados à perda de dados contra os custos de manter soluções de backup mais velozes e complexas.
Qual é a forma de medir um Recovery Point Objective?
O Recovery Point Objective é expresso como um intervalo de tempo, que geralmente é quantificado em dias, horas, minutos ou segundos.
Se o RPO de uma empresa for de uma hora, isso significa que a empresa deve realizar backup a cada hora para evitar perdas de dados superiores a esse limite.
Se um dos servidores apresentar problemas causando a interrupção nos serviços, a empresa pode recuperar os dados a partir do backup mais recente que foi feito, no máximo, de uma hora atrás.
A definição de cada indicador RPO varia de acordo com cada necessidade de negócio. Algumas empresas precisam ter RPOs muito baixos, como instituições financeiras e serviços públicos.
Outras empresas são mais tolerantes a perda de dados, suportando algumas horas ou mesmo dias de trabalho, desde que não afetem diretamente suas operações.
O RPO é apenas um aspecto do planejamento para a continuidade de negócios. Outro conceito associado ao tema é o Recovery Time Objective (RTO), que mede o tempo para recuperar o ambiente após uma interrupção.
A implementação do RPO pode envolver o uso de tecnologias como o snapshot, replicação de dados e o uso de servidores e storages de alta disponibilidade.
O RPO, ou Objetivo do Ponto de Recuperação, não é calculado de uma maneira quantitativa tradicional. Em vez disso, é determinado por uma análise de negócios das necessidades e tolerâncias à perda de dados.
Quais os níveis de classificação de RPO para ambientes empresariais?
Diferentes empresas terão RPOs associados com a natureza individual de cada negócio, ou seja, suas operações e as respectivas exigências associadas ao tema.
Embora não existam níveis de classificação padronizados, a forma geral para categorizar o RPO em ambientes empresariais é assim dividida:
Crítico (RPO = Alguns minutos): Uma operação ou serviço pode ser considerada crítica se interrupções de minutos causar um impacto significativo na perda de dados e nas operações da empresa.
Essas aplicações incluem o processamento de milhares de transações de um e-commerce ou o uso de um sistema de gerenciamento de registros médicos em um hospital.
Empresas com pouca ou nenhuma tolerância a perda de dados geralmente precisam implantar soluções de backup eficientes e ter suas aplicações hospedadas em ambientes de alta disponibilidade.
Importante (RPO = Algumas horas): Se a perda de dados de algumas horas pode causar danos importantes a uma organização, vale a pena fazer backup duas ou três vezes ao dia.
A boa notícia é que sistemas de armazenamento em rede como os storages NAS estão cada vez mais baratos e podem ser ótimas ferramentas para manter o backup atualizado nesse tipo de ambiente.
Normal (RPO = 24 horas ou mais): A maioria das pequenas e médias empresas podem conviver com a possibilidade de perda de dados dentro desse limite de tempo em aplicações locais.
Apesar do retrabalho trazer diversos custos indiretos, muitas empresas ainda possuem seus sistemas de backup baseados em fita e programados para funcionar apenas uma vez ao dia.
Como determinar o RPO ideal para cada empresa?
Por ser uma métrica intimamente relacionada ao sistema e aos recursos disponíveis, cada aplicação ou serviço terá seu nível de tolerância à perda de dados limitado ao ambiente. Os passos básicos para definir um RPO são:
Identificação de dados críticos: O primeiro passo é identificar quais dados são críticos para as operações do negócio. Dados críticos são aqueles que, se perdidos, tem um impacto significativo nas operações da empresa.
Avaliação do impacto em caso de falha: O próximo passo é avaliar qual seria o impacto se esses dados fossem perdidos. Isso inclui variáveis como a perda de receita, danos à reputação, multas e outros impactos operacionais.
Determinação da tolerância à perda de dados: Com base na avaliação do impacto, a empresa então determina qual é sua tolerância à perda de dados. Este é o ponto qualquer perda de dados já se torna inaceitável para a empresa.
Definição do RPO: O objetivo então é definido com base nesse limite de tolerância. Por exemplo, se a empresa não pode tolerar mais do que uma hora de perda de dados, o RPO deve ser definido como uma hora.
Revisão e ajuste do RPO: Finalmente, essa métrica não deve ser tomada como um valor fixo. Ela deve ser revisada e ajustada regularmente, com base nas mudanças das operações, no ambiente de TI e em outros fatores.
Via de regra, quanto menor é o RPO, menor será a perda de dados, maior será a frequência de cópias e mais caro será manter a solução de backup.
Como o RPO se alinha com a gestão da continuidade de negócios?
Em essência, o RPO ajuda a determinar a frequência com que o backup de dados deve ser realizado para garantir a continuidade de negócios.
Por exemplo, se o objetivo de perda máxima de dados de um servidor ou storage for de uma hora, esses sistemas precisam fazer a cópia de seus dados uma vez por hora para garantir que não haverá perdas adicionais.
Um recovery point objetive eficaz é aquele que equilibra o custo de perder dados com o investimento necessário para ter soluções de backup com maior desempenho.
Se esse custo for muito alto, a organização deve estabelecer investir em soluções capazes de entregar um RPO mais baixo, ou seja, fazer backup com mais frequência.
Onde essa métrica pode ser aplicada?
O RPO é uma métrica que pode ser aplicada a qualquer tipo de ambiente de TI, seja ele baseado em nuvem ou em uma infraestrutura local (on-premise).
Em um ambiente de nuvem, o objetivo de recuperação ajudará a determinar com que frequência os dados devem ser sincronizados ou replicados com outros provedores ou serviços.
Em uma infraestrutura local, o RPO pode determinar a frequência dos backups de dados para uma fita, disco ou sistema de armazenamento externo, por exemplo.
Vale lembrar que quanto maior for a importância das aplicações e serviços, menor deverá ser o RPO, pois nesses ambientes qualquer perda de dados pode ter um grande impacto nas operações.
Por que investir servidores e storages de alta disponibilidade?
A implementação de servidores e storages de alta disponibilidade é essencial para a otimização do Recovery Point Objective (RPO).
Ambientes equipados com servidores e storages tolerantes a falhas contribuem para a continuidade de negócios, seja em ambientes de nuvem ou redes locais.
Esses sistemas possuem diversos componentes redundantes para reduzir a possibilidade de perda de dados, por isso contribuem para um RPO mais baixo.
Além disso, essa redundância minimiza o tempo de inatividade, o que, embora esteja mais diretamente relacionado ao Recovery Time Objective (RTO), também impacta o RPO, pois menos tempo de inatividade implica menos dados perdidos.
Precisa proteger seus dados? Traga seu projeto e tire suas dúvidas. Somos especialistas em servidores, sistemas de armazenamento e soluções de backup.
Tecnologias
Tudo o que você precisa saber sobre soluções de Tecnologias.
Storages All Flash Array - Sistemas de Armazenamento Totalmente Flash
Quer comprar um storage All Flash Array barato? Conheça nossas soluções de armazenamento híbridas e totalmente Flash não proprietárias e não se preocupe com o preço.
7 erros mais comuns ao comprar um sistema de armazenamento
Saiba como evitar os erros mais comuns antes de adquirir um servidor ou storage. Confira aqui algumas dicas para facilitar esse processo de compras.
O que é um Storage de alta disponibilidade (HA)?
O que é um Storage de alta disponibilidade (HA)? Conheça nossas soluções resistentes a falhas de hardware, software e energia e não perca mais dados.