Data Archiving - Arquivamento de dados
Data Archiving ou arquivamento de dados é o processo de mover arquivos, pouco ou não mais utilizados do armazenamento primário para áreas seguras e fora da infraestrutura de TI principal, que farão a retenção dessas informações por um longo prazo.
Dados envolvidos nesse processo geralmente deixaram de ser acessados, mas ainda são importantes para a organização. Por isso, são retidos em áreas de armazenamento secundária para futuras consultas ou por motivos de compliance.
Esses dados sem uso que foram movimentados são indexados, para que possam ser facilmente localizados e recuperados caso seja necessário.
Ao armazenar essas informações em uma camada de menor custo como storages SATA ou sistemas de fita, administradores de TI reduzem os custos do armazenamento primário, aumentam a longevidade da estrutura existente e melhoram a performance do sistema.
Como escolher meu equipamento para archiving?
Alguns equipamentos voltados para o archiving permitem que os dados sejam armazenados no formato "somente leitura" para protegê-los contra modificações, enquanto outros permitem gravação e leitura dos dados a qualquer tempo.
Sistemas de fita LTO baseados na tecnologia WORM utilizam mídias que não são regraváveis, enquanto sistemas baseados em hard disks como storages, podem ter seus dados atualizados quando necessário.
Antes de implementar uma estratégia para o arquivamento de dados em qualquer empresa, é necessário inventariar os dados, identificar quais são candidatos a serem guardados e se os mesmos poderão ou não serem alterados.
O data archiving é principalmente voltado para dados que devem ser retidos devido a exigências operacionais ou regulamentares dentro da organização, como registro de atividades e acesso aos dados feitas pelos usuários, arquivo de documentos não mais utilizados, mensagens de e-mail antigas e registros do banco de dados.
Benefícios do Data Archiving
Dentre os benefícios do data archiving destacam-se a melhora de performance, mais espaço livre e a redução dos custos totais na matriz de armazenamento primário dentro da infraestrutura de TI.
Como qualquer sistema deve produzir um nível suficiente de IOPS para atender a atividade de leitura/gravação das aplicações, ao deslocar os dados não utilizados para sistemas mais baratos melhora-se a performance geral do sistema e diminui-se a necessidade de investimento em upgrades.
Armazenar informações pouco acessadas por períodos longos geralmente custa menos, pois utiliza-se equipamentos de menor desempenho e maior capacidade de armazenamento.
Assim, identificar corretamente a capacidade necessária, a performance ou segurança exigida para cada necessidade antes de implementar um sistema de data archiving é muito importante.
Arquivos de dados com pouco ou nenhum acesso podem ser armazenados em soluções baseadas em: disco rígido (HDDs) de baixo custo, fitas ou sistemas de armazenamento óptico, também conhecidas como áreas de cold storage ou “armazenamento a frio”, mais lentas e baratas que unidades de disco SAS ou sistemas de armazenamento flash.
O armazenamento desses arquivos "mortos" também reduzem o tempo e o volume de dados que devem ser guardados no backup.
O deslocamento dos dados acessados com pouca frequência do conjunto de dados principal para sistemas secundários aumenta o desempenho das rotinas de backup e a restauração das aplicações vitais.
Data archiving ou backup?
O data archiving não deve ser confundido com o backup, que é a cópia de segurança dos dados.
Embora ambos processos sejam realizados em sistemas de armazenamento secundários, de menor desempenho e maior capacidade que o primário, cada um deles serve a propósitos diferentes.
O data archiving cumpre a finalidade de retenção dos dados, enquanto os backups são usados para proteção e recuperação de desastres.
Os arquivos armazenados através do processo de data archiving devem ser tratados como parte de um repositório de dados, que apesar da pouca frequência de acesso, estão sempre disponíveis.
Os backups, por outro lado, fazem parte de um mecanismo voltado para recuperação de dados que será usado para restaurar informações importantes rapidamente no caso de informações serem corrompidas ou destruídas do sistema primário de armazenamento.
Armazenamento de dados online e offline
O data archiving tem assumido diferentes formas, onde alguns sistemas utilizam o armazenamento online através de bibliotecas de fita ou utilizam sistemas baseados em discos com recursos como o tiering, que coloca as informações mais acessadas nos arranjos de discos mais rápidos, onde eles são facilmente acessíveis.
Os sistemas de armazenamento são frequentemente baseados em arquivos, mas o armazenamento baseado em objetos está crescendo muito em popularidade.
Outros sistemas de archiving usam o armazenamento de dados off-line, onde os dados são gravados em fita ou em outras mídias removíveis via software para arquivamento de dados, em vez de serem mantidos on-line.
Como a fita pode ser removida, esse sistema consome menos energia que os baseados em disco e isso se traduz em custos menores no longo prazo.
O armazenamento em nuvem é outra opção possível. O Amazon Glacier, por exemplo, foi projetado para Data Archiving.
É um método barato, mas requer um investimento contínuo. Além disso, os custos podem aumentar com o tempo, à medida que mais dados são adicionados à nuvem.
Os provedores de nuvem, por sua vez, geralmente armazenam dados arquivados em fita ou em unidades de disco rígido mais lentas e de alta capacidade.
Arquivamento e gerenciamento do ciclo de vida dos dados
O processo de arquivamento é quase sempre automatizado usando um software específico.
Os recursos desse software variam de um fornecedor para outro, mas a maioria dos softwares de arquivamento move automaticamente os dados antigos para o sistema de archiving de acordo com a política de arquivamento definida pelo administrador.
Esta política também pode incluir requisitos de retenção específicos para cada tipo de dados.
Alguns softwares profissionais de arquivamento vão limpar automaticamente os dados do archiving, uma vez que tenham excedido a vida útil exigida pela política de retenção de dados da organização.
Muitas plataformas de software de backup e gerenciamento adicionam a funcionalidade de arquivamento a seus produtos.
Conformidade
É necessário que algumas empresas mantenham dados por determinados períodos devido à conformidade regulamentar.
Desta forma, permanecer dentro das diretrizes de conformidade é uma preocupação comercial predominante.
As multas podem incluir pagamentos por danos e/ou contratos anulados.
O Data Archiving ajuda as empresas a cumprir a conformidade, armazenando dados a longo prazo e consolidando-os para facilitar o acesso em caso de auditoria.
As regras variam de acordo com o setor e o tipo de arquivos que os negócios desse setor geram.
Consulte nossos especialistas em Data Archiving e backup
Traga seu projeto e tire suas dúvidas. Consulte nossos especialistas, somos distribuidores Seagate, Qnap, Synology e Infortrend. Nossos profissionais estão capacitados para fornecer soluções de armazenamento e backup para suas necessidades.
Tecnologias
Tudo o que você precisa saber sobre soluções de Tecnologias.
O que é Replicação Remota?
Com a Replicação Remota é possível duplicar e disponibilizar dados em diferentes ambientes. Conheça os tipos de replicação de dados e muito mais.
O que é failover?
O que é failover? Saiba mais como essa tecnologia mantém servidores e storages dentro de estruturas de TI funcionando mesmo em de falhas ou manutenção