Tiering Storage ou Armazenamento em Camadas
A produção de dados continua crescendo exponencialmente, levando ao colapso o planejamento de investimento feito para compra de sistemas de armazenamento dentro da maioria das organizações.
A escolha de qual servidor de armazenamento usar em cada aplicação, num determinado momento do tempo, é uma equação que envolve equilíbrio entre a frequência de acesso, a entrega de desempenho, custo e capacidade do sistema.
Porém esse equilíbrio nem sempre está alinhado com as expectativas dos usuários, cada vez mais exigentes e menos sensíveis a explicações sobre a quantidade de recursos consumidos pelo novo sistema operacional.
A correta classificação de dados (taxonomia) é o ponto de partida para qualquer investimento em servidores de armazenamento.
A taxonomia classifica todos os dados, ajuda a identificar o ciclo de vida da informação e equilibra o desempenho necessário do sistema em relação ao custo desse plano.
Atributos como disponibilidade, desempenho e serviço devem ser claramente definidos, porém uma simples atualização de software não prevista pode fazer ruir qualquer planejamento decente sobre o assunto.
Storages para produção, backup e archiving
Como a maioria das empresas não possui recursos financeiros para comprar soluções totalmente flash para todas suas aplicações, traçar um cenário com as prioridades para cada tipo de serviço reduz a necessidade de investimento e melhora o tempo médio de atendimento aos usuários.
Essa preocupação não é nova. A IBM foi pioneira nesse tipo de estudo com seus computadores mainframe. Como o investimento em servidores e storages para produção sempre foram altos, manter o backup e arquivos do tipo “cold storage” fora desses sistemas sempre fez muito sentido.
Isso resultou na criação do gerenciamento hierárquico de armazenamento, onde os dados são analisados e distribuídos de acordo com a importância, volume de acesso e o tipo de serviço prestado.
O que é tiering?
Tiering ou armazenamento em camadas é a alocação dos dados de forma hierárquica dentro de storages e servidores. Dados mais importantes são alocados nas camadas mais velozes dos sistemas de armazenamento, geralmente compostas por armazenamento flash, mais rápido e caro que hard disks.
O armazenamento em camadas ou tierização é uma forma de atribuir diferentes categorias aos dados, associando-os a diferentes equipamentos e tipos de mídia, com o objetivo de reduzir o custo total de propriedade.
As camadas são determinadas pelo desempenho e o custo da mídia, e os dados são classificados de acordo com a frequência com que os usuários os acessam. Geralmente os dados mais importantes são armazenados e estão disponíveis na mídia de armazenamento mais rápida, que normalmente é a mais cara.
O tiered storage
A ascensão do gerenciamento hierárquico de armazenamento ajudou a reduzir o processo manual de classificação por taxonomia. A automação de software transfere os dados dinamicamente entre diferentes sistemas de armazenamento, tipos de drive ou grupos de RAID em tempo real, de forma transparente para todos os usuários.
O tiered storage, que por anos envolveu a alocação dos dados apenas entre sistemas configurados com arranjos de discos (RAID) das tecnologias SAS e/ou SATA e soluções baseadas em fita, evoluiu com a chegada dos sistemas híbridos e soluções all flash.
De uma forma geral, a camada de armazenamento mais rápida sempre foi a responsável pelos sistemas de produção exigentes em desempenho, enquanto outros dados são gravados nos sistemas secundários mais baratos.
Além disso, todos os outros dados que precisavam ser mantidos indefinidamente eram endereçados para uma terceira camada de archive, geralmente formada por soluções baseadas em fita.
Quais são classificadas as camadas de armazenamento de um storage?
Assim como os datacenters, os sistemas de armazenamento também são classificados por sua performance e modo de funcionamento através do termo "tier", que indica o nível de serviço que cada dispositivo pode entregar.
Porém, ao contrário da classificação que determina a disponibilidade de um datacenter, onde quanto maior for o tier melhor será o serviço entregue, os tiered storages possuem outra forma para identificar o nível de cada componente.
As camadas de armazenamento em um sistema de armazenamento compreendem:
Tier 0 (memórias SSD de alta velocidade, geralmente SLC do tipo NVMe)
Tier 1 (unidades de disco/SSD conectadas através de fibre channel)
Tier 2 (discos rígidos convencionais, SATA ou SAS)
Tier 3 (discos magnéticos removíveis como unidades de fita)
Cada camada tem diferentes níveis de velocidade, disponibilidade, capacidade e custo, e os dados são migrados para camadas mais baratas conforme se tornam menos frequentemente acessados. O objetivo é maximizar a eficiência e o desempenho do sistema de armazenamento.
A importância dos tiered storages
A implementação do armazenamento em camadas (tiered storage), antes disponível apenas para grandes pools de armazenamento, já é uma realidade para a maioria das empresas, graças a redução constante nos preços das memórias flash.
A classificação hierárquica de dados é uma estratégia chave para otimizar o investimento e o uso de recursos de armazenamento, otimizando o investimento de TI através da classificação dos dados automática.
Fabricantes como a Qnap, Seagate e Infortrend já dispõe em suas linhas de produtos tiered storages, como sistemas de armazenamento híbrido e tiered NAS baseados em memórias flash de baixo custo.
Esses sistemas oferecem várias tecnologias para entregar níveis muito altos de desempenho, sem onerar orçamentos e as funcionalidades necessárias para a execução de aplicações exigentes em performance.
A ascensão do flash e a chegada dos storages tier 0
A ascensão do armazenamento de estado sólido (flash) gerou o que muitos chamam de armazenamento de nível 0. A topologia baseada em disco permanece popular, embora o armazenamento de estado sólido (SSD) tenha suplantado o hard disk como a mídia principal para dados da Camada 0 nas grandes empresas.
Assim como os conceitos de armazenamento primário e secundário (limitados antes a memórias voláteis e não voláteis) evoluíram desde os antigos mainframes, o storage tier 1 também deixou de ser o armazenamento primário, dando lugar para as soluções baseadas em flash, agora conhecidas como storages tier 0.
Quando os sistemas de armazenamento ainda eram baseados apenas em hard disks, os dados da Camada 1 eram armazenados em unidades de disco rígido (HDDs) mais rápidas e caras (SCSI, FC e SAS), enquanto os discos mais lentos e baratos (IDE, ATA e SATA) eram usados para dados menos importantes e sistemas cold storage.
Isso significa que as aplicações e dados mais importantes, antes classificadas como camada 1 (tier 1) foram conceitualmente deslocadas para a camada 0 (tier 0).
Os storages tier 0 são mais rápidos do que os sistemas de armazenamento tier 1 (baseados em hard disks), assim como muitos dos dados anteriormente considerados "camada 1" agora são armazenados na "camada 0".
O armazenamento da Camada 0 são os mais rápidos e caros na hierarquia, adequados para aplicativos com pouca tolerância para tempo de inatividade ou latência. Os dados colocados em uma "camada zero" geralmente incluem bancos de dados transacionais escaláveis, sistemas de finanças, saúde e segurança.
Os sistemas de armazenamento híbridos
O advento dos hybrid flash array ou storage híbridos, que combinam flash e HDDs no mesmo sistema, trouxe a necessidade de um software de classificação hierárquica de armazenamento (tiering) para garantir que apenas os dados mais importantes sejam alocados nos SSDs dentro do arranjo.
A classificação por níveis de armazenamento começou como um processo manual, mas a automação por software assumiu um papel maior na análise do posicionamento de dados.
O ideal é que todos os dados sempre estejam na camada mais rápida disponível, mas isso não é prático para a maioria dos casos. Mover dados em uma matriz de disco tradicional consome solicitações de entrada/saída (I/O) do servidor, criando gargalos enquanto o sistema aguarda a movimentação dos dados entre as camadas.
O cache de armazenamento
As tecnologias de armazenamento em camadas e de cache são frequentemente usadas em storages mas são processos diferentes, especialmente ao lidar com as mídias flash.
Enquanto o tiering identifica e move os dados entre os dispositivos de armazenamento (mídias) conforme os padrões de acesso aos dados mudam, o cache aloca temporariamente uma cópia dos dados em mídias de alto desempenho, como memórias DRAM ou SSD, para melhorar a performance do sistema.
O software ou controlador responsável pelo sistema de armazenamento coloca uma cópia dos dados no cache de memória, posicionada entre o aplicativo e o armazenamento back-end. Mas a diferença é que os dados do cache também residem em uma camada de armazenamento inferior, geralmente um arranjo de disco.
A implantação de um sistema de cache é uma ótima alternativa para conseguir mais performance com baixos orçamentos, pois permite que os dados mais acessados sejam copiados e fiquem alocados em memórias, mais rápidas que os hard disks da matriz de armazenamento.
Tiering ou cache?
A escolha entre comprar um novo sistema totalmente flash, optar por um sistema de armazenamento híbrido utilizando tiering ou simplesmente implementar cache no storage pode ser uma decisão complexa.
Nossos sistemas de armazenamento suportam hard disks SATA, NL-SAS, SAS e/ou memórias SSD. Temos soluções de armazenamento híbrida, totalmente flash e que suportam cache e/ou tiering de diversos fabricantes.
Traga seu projeto e tire suas dúvidas. Somos especialistas em sistemas de armazenamento, distribuidores autorizados de empresas Seagate, Qnap, Synology, Infortrend e WD, e nossos técnicos estão prontos para ajudá-lo.
Armazenamento de dados
Tudo o que você precisa saber sobre soluções de Armazenamento de dados.
iSCSI ou Fibre Channel (FC) - Qual a melhor SAN?
Conheça as diferenças entre iSCSI e Fibre Channel e suas vantagens e desvantagens ao montar a melhor SAN para pequenas e médias empresas.
7 erros mais comuns ao comprar um sistema de armazenamento
Saiba como evitar os erros mais comuns antes de adquirir um servidor ou storage. Confira aqui algumas dicas para facilitar esse processo de compras.
O que é um Storage de alta disponibilidade (HA)?
O que é um Storage de alta disponibilidade (HA)? Conheça nossas soluções resistentes a falhas de hardware, software e energia e não perca mais dados.