O que é TBW e como calcular a vida útil de um SSD
As memórias do tipo SSD estão gradualmente substituindo os discos rígidos em muitas aplicações. Esses módulos são muito silenciosos, mais rápidos e menos propensos a falhas que os HDDs, pois não possuem partes mecânicas.
Apesar das virtudes, os módulos flash possuem baixa capacidade de armazenamento, custam mais caro que os hard disks e também apresentam problemas de funcionamento, geralmente causando a perda de dados.
O grande problema é que a maioria dos usuários nem sempre acredita que um SSD vai falhar em algum momento de sua vida útil, por isso não toma os cuidados necessários com os dados de suas vidas digitais.
Para evitar qualquer imprevisto, a primeira providência importante que qualquer usuário deve tomar é manter seu backup sempre em dia. Além disso, o melhor remédio contra falhas desse tipo de periférico é saber qual será sua durabilidade na hora da compra.
Como é fabricado um SSD?
Para nos aprofundarmos sobre qual será a vida útil de um SSD, vale saber que esses módulos são semicondutores (unidades de estado sólido) voltados para o armazenamento de dados.
Um SSD geralmente é fabricado com o uso de memórias flash do tipo NAND, que armazena dados (bits) em suas células. Um único SSD é composto de diversos chips de memória, repleto de células, que são instalados em uma placa de circuito.
Mas, ao contrário de uma memória DRAM, as células de um SSD se desgastam mais rápido, principalmente porque a gravação de dados desgasta mais um módulo de memória que as tarefas de leitura.
O nivelamento e o controle dos ciclos de gravação e leitura
Todos os dispositivos de armazenamento NAND possuem um número limitado de ciclos de gravação e leitura, por isso quando um desses ciclos se encerra, a memória para de funcionar.
Outro ponto importante sobre esse assunto é que, caso alguma célula de armazenamento seja mais usada que outra, a chance dessa célula parar e causar uma falha generalizada aumenta.
Para que isso não aconteça, a maioria dos fabricantes de SSD possuem um controlador flash que gerencia o desgaste de cada célula, distribuindo os dados de forma homogênea em todas as células do módulo.
Esse controlador prolonga a vida útil das memórias SSD, pois garante que todos os dados serão gravados de forma uniforme em todos os blocos físicos, não gerando desgaste prematuro de uma área do NAND mais rapidamente do que outra.
Os tipos de SSD e a expectativa de vida útil de cada um
Atualmente são fabricados cinco tipos de memória flash NAND. A principal diferença entre elas é que cada uma usa um tipo diferente de célula em sua fabricação.
Cada tipo de célula pode armazenar um número determinado de bits, possui uma vida útil estimada diferente, um nicho de aplicações específico e entrega dados com taxas de desempenho distintas.
Os módulos SSD fabricados com a tecnologia SLC armazenam apenas um bit por célula, custam mais caro e geralmente possuem vida útil mais longa. Além dele, também temos os módulos MLC que grava dois bits por célula, os SSD TLC que grava três bits, o QLC que grava quatro bits e o PLC com cinco bits por célula.
Assim, como um SLC NAND suporta apenas um bit por célula, esses módulos vão armazenar um “0” ou “1” em cada posição, enquanto um MLC NAND armazenaria “00”, “01”, “10” ou “11” em cada célula e assim por diante.
Cada tipo de SSD NAND oferece diferentes níveis de desempenho e características de resistência, sendo que os módulos SLC são os mais caros e de melhor desempenho.
Células diferentes, características diferentes
Cada tipo de memória flash SSD possui um número limitado de ciclos de gravação antes que as células falhem, que é diretamente associado com a expectativa de vida útil, por isso sai de fábrica com sua classificação de resistência indicada pelo próprio fabricante.
A causa disso é física: Toda vez que é necessário gravar ou apagar uma informação, a camada de óxido da célula de uma memória flash se deteriora. Assim, cada tipo de célula tem um diferente tempo de deterioração, de acordo com o número de ciclos de gravação antes da falha.
Ao comparar módulos do tipo SLC, MLC e TLC, temos as principais diferenças:
Módulos SLC: Cada memória flash desse padrão possui células que suportam 50.000 a 100.000 ciclos de gravação. Esse alto volume de gravação permite que os módulos SLC equipem sistemas de armazenamento all flash de uso intensivo, ou seja, dentro de grandes data centers.
Módulos MLC: MLC pode ser traduzido como flash de célula multinível. Esses módulos usam células que gravam 2 bits e geralmente suportam até 3.000 ciclos de gravação.
Uma versão mais profissional dessa tecnologia é o eMLC (Enterprise MLC), que suporta até 10.000 ciclos de gravação e pode atingir 35.000 ciclos em módulos 3D NAND.
Módulos TLC: O módulo TLC é o mais barato dos três e utiliza células de nível triplo (gravação de 3 bits). Esses módulos suportam entre 300 e 1000 ciclos de gravação na configuração básica e podem atingir entre 1500 e 3000 ciclos de gravação com a tecnologia 3D NAND.
A gravação é um processo contínuo
Ao pensar em ciclos de gravação de um hard disk ou memória SSD, a maioria dos usuários comuns não sabem que um computador possui diversos processos que acontecem sem o controle humano.
Isso significa que uma célula não recebe apenas as gravações geradas somente pelas camadas de aplicativo ou de usuário, mas também move e replica dados de forma autônoma em diversas situações.
Muitas dessas gravações são exigidas para que os dados sejam preservados, pois garantem a redundância em caso de alguma falha quando um processo é iniciado. Geralmente o controlador NAND é o responsável por esse processo e copia dados para fornecer redundância.
A amplificação de gravação
Cada célula de memória flash deve ser apagada antes de ser reescrita. Apesar dessa limpeza acontecer com uma granularidade mais grosseira que o sistema usa para gravar dados, todas as células envolvidas sofrem desgaste.
O processo que executa essas operações geralmente também precisa mover ou reescrever dados e metadados armazenados existentes para outras áreas do SSD, organizando assim os dados já gravados em novas áreas do módulo.
O fato é que escrever ou reescrever alguns dados requer que uma parte já usada do flash seja lida, atualizada e regravada em um novo local. Isso implica que cada local que receberá os dados movidos também seja verificado e apagado, caso o mesmo tenha sido usado anteriormente.
Essa forma de funcionamento exige que porções muito maiores do SSD sejam apagadas e reescritas do que realmente foi exigido pela quantidade de novos dados.
Esse efeito multiplicador aumenta consideravelmente o número de gravações necessárias durante a vida útil do SSD, o que reduz muito seu tempo de operação e sua confiabilidade.
Essa amplificação da gravação também consome a largura de banda da memória flash, reduzindo o desempenho de gravação aleatória na unidade SSD e todos os sistemas de armazenamento equipados esses dispositivos.
Outros fatores que também amplificam a gravação de um módulo SSD incluem aplicações como a desduplicação, sistemas de arquivos, registros de metadados, estruturas de log e a coleta de lixo.
Como calcular a vida útil de um SSD?
Apesar da amplificação de gravação ser um complicador importante para calcular o tempo de vida útil de uma memória SSD, algumas ferramentas podem ajudar na nessa tarefa.
A vida útil de um módulo flash está totalmente associada ao tipo de uso (aplicação) do sistema, softwares, quais células foram utilizadas, o DWPD e o TBW especificado.
A maioria dos fabricantes classificam suas unidades SSD com base em quatro características principais: Qual a capacidade de armazenamento da memória, o tipo de célula utilizada, qual a capacidade de escrita durante sua vida útil e qual o volume de dados escritos que a unidade suporta por dia (DWPD).
Assim, para calcular a vida útil de uma memória SSD, basta saber qual o TBW/DWPD fornecido pelo fabricante e qual o desgaste que esse módulo já sofreu com o uso.
O que é TBW de um SSD?
TBW (Terabytes written) significa Terabytes gravados, ou seja, é uma estatística de qual a capacidade total de armazenamento que um módulo SSD pode gravar durante sua vida útil. Essa informação permite estimar qual será a vida útil da memória antes que suas células comecem a se deteriorar.
Por exemplo, caso a embalagem de um SSD de 500GB possua a informação 150 TBW, significa que você poderá transferir 150TB de dados antes que esse módulo precise ser substituído.
Em um modelo teórico, podemos dizer que esse SSD de 500GB com capacidade de 150 TBW suportará até 300 ciclos de gravação (150TB dividido por 500GB) antes de precisar ser trocado. Isso significa que, caso o módulo seja reescrito totalmente todos os dias (500GB), sua vida útil será de 300 dias corridos.
Portanto, assim que a gravação da capacidade de armazenamento estimada for atingida será altamente recomendável substituir essa unidade, pois os dados armazenados já não estarão tão seguros quanto antes.
Como é calculado o DWPD?
A maioria dos fabricantes de memórias SSD também informa o DWPD (Data Writing Per Day) de seus SSD. O DWPD nada mais é do que a capacidade total de gravação estimada de um módulo SSD (TBW) dividida pelo número de dias cobertos pela garantia.
Essa informação é importante porque alguns módulos SSD de uso corporativo equipam sistemas all flash, possuem alta capacidade, são robustos e podem custar centenas de milhares de reais.
Nesses casos, quase sempre a interrupção dos serviços pode custar ainda mais caro que o valor investido em equipamentos e softwares, pois apenas uma falha pode interromper o trabalho de muitas empresas e milhares de funcionários.
Essa é a principal razão que leva fabricantes de SSD como a Micron a ter diversas linhas de fabricação desses módulos, cada uma com um tipo de célula, durabilidade e aplicação definida.
Vale lembrar que a maioria das aplicações corporativas exigem um alto volume de gravação de dados e superam em muito o TBW/DWPD suportado pelas memórias SSD de uso doméstico.
Isso significa que é muito arriscado instalar memórias domésticas ou fora das especificações em servidores e storages corporativos, sob pena de reduzir a vida útil da memória, causar interrupções indesejadas no sistema ou não conseguir exercer o direito de garantia em caso de falha.
Lembre-se: A garantia dos SSD geralmente cobre a quantidade total de dados transferida pela unidade ou o tempo de uso expresso em anos, o que acontecer primeiro. Isso significa que, caso o módulo tenha um alto volume de uso e seu TBW seja esgotado antes, o mesmo não será coberto pela garantia.
Por que o TBW é importante?
Como os módulos SSDs possuem uma vida útil limitada, saber qual a capacidade de escrita de dados total é uma informação crítica para o funcionamento contínuo em sistemas de alta disponibilidade.
Todos os SSDs usam células de memória para armazenar informações e, embora a leitura dos dados dessas células não os afete, a vida útil desses componentes decai a cada gravação, movimentação ou exclusão de dados.
Com o uso, cada célula de armazenamento flash pode se degradar a ponto de falhar. Assim, ter o TBW de cada memória determina quanta informação você pode armazenar antes que as células de memória falhem.
As métricas de TBW são vitais para escolher corretamente um SSD, pois apesar dos fabricantes entregarem SSDs mais baratos e de maior capacidades, quase sempre eles também sacrificam o tempo de vida útil dos produtos.
Como escolher o melhor SSD?
Caso sua escolha de compra esteja entre duas unidades com métricas equivalentes em capacidade, velocidade de leitura e de gravação, a capacidade total de escrita de dados deve ser o primeiro atributo a ser considerado.
Vale ficar atento para a informação que as unidades SSD de maior capacidade geralmente possuem uma classificação TBW maior, pois possuem mais células de armazenamento flash para gravar dados.
Assim, se um módulo SSD de 500GB possuir 300 TBW e seu par de 1TB tiver em suas especificações 600 TBW, ambos possuem a mesma capacidade de escrita total por célula, só que o módulo de maior capacidade possui o dobro de células.
Isso significa que apesar de possuir um TBW informado maior, o módulo de 1TB não possui células de melhor qualidade, apenas possui o dobro da quantidade de células que o módulo de 500GB.
Dito isto, comprar uma unidade SSD de 1TB com um TBW maior que seus pares de mesma capacidade garantirá que seu servidor seja mais confiável e tenha uma vida útil mais longa do que instalar uma unidade SSD com TBW menor.
Mesmo assim vale lembrar que usar alguns métodos de proteção como o backup 3-2-1 e manter todas as atualizações de suas aplicações em dia ajudarão a manter seu servidor ou storage funcionando corretamente e seus dados seguros contra falhas.
Como verificar o TBW no SSD?
Após descobrir como a referência de TBW de cada SSD é importante, o próximo passo é saber se seu servidor, computador ou sistema de armazenamento está em risco.
Como não é possível verificar manualmente o TBW de um SSD, sempre será necessário o uso de uma ferramenta (software) para verificar o TBW de cada flash SSD.
Assim como existem vários tipos de SSD, também temos diversos dispositivos de armazenamentos que usam esse tipo de tecnologia.
Isso significa que não podemos generalizar e indicar uma única ferramenta para testar a integridade de um SSD, pois verificar a vida útil de um SSD instalado em um computador doméstico não é a mesma coisa que verificar um módulo flash instalado em um storage híbrido ou em uma solução all flash.
De qualquer forma, como os grandes fabricantes de soluções totalmente flash possuem diversas ferramentas para manter suas unidades funcionando, vamos indicar uma ferramenta de verificação para computadores equipados com um único SSD.
O CrystalDiskInfo é um utilitário gratuito, que informa quase tudo sobre a eficiência de hardware do seu hard disk/SSD e a probabilidade de um desses componentes falhar em breve.
Para informar o que há de errado com seus discos, ele emprega o S.M.A.R.T. (Self-Monitoring, Analyzing, Reporting Technology), que é uma tecnologia incorporada na maioria dos HDD/SSDs e que é muito usada em sistemas de armazenamento modernos.
O CrystalDiskInfo
O CrystalDiskInfo registra informações importantes como a temperatura atual da unidade SSD, o número de tentativas mal sucedidas de leitura ou gravação, o tempo em que a unidade está em operação contínua e qual a frequência que ela foi inicializada ou interrompida.
Além disso, com essa ferramenta é possível verificar facilmente o TBW do SSD instalado.
Para verificar o TBW de um SSD usando CrystalDiskInfo, siga as instruções:
Passo 1: Baixe e instale o CrystalDiskInfo no seu computador e abra o programa.
Passo 2: Inicie a verificação do sistema de armazenamento clicando no botão Iniciar e aguarde alguns minutos;
Após algum tempo os resultados serão exibidos. Após receber a informação, selecione o nome do seu SSD; Caso o disco local C:/ do seu computador seja o seu SSD, clique nele.
Passo 3: Agora, à esquerda da tela, será apresentado um valor adjacente à coluna Total Host Writes: Este é o TBW calculado do seu SSD.
Nota: Com o software CrystalDiskInfo é possível comparar o TBW atual com o descrito pelo fabricante. Além disso, também é possível verificar a saúde da unidade, a temperatura de trabalho, etc.
Qual é a quantidade típica diária que um SSD pode gravar?
Embora o uso de cada módulo SSD varie de acordo com sua aplicação, foi constatado que um usuário típico de escritório grava entre 10 e 35GB diariamente.
Caso essa quantidade seja aumentada para 40 GB, ainda sim um SSD com células TLC pode gravar dados por mais de cinco anos antes de atingir o limite um TBW de 70TB. Além disso, a estatística média para um SSD de 250 GB em aplicações de escritório está entre 60 e 150 Terabytes gravados.
Isso indica que, para exceder um TBW prometido de 70 em um módulo flash, um usuário final deve gravar 190 GB de dados todos os dias durante um ano.
O que acontece caso o SSD atinja o TBW suportado?
Muitos usuários acreditam que um SSD não funcionará mais assim que atingir o limite completo de seu TBW. Felizmente essa informação não é verdadeira.
Mesmo que o TBW de uma memória flash atinja seu limite, isso não significa que ela estará inutilizado. Depois de esgotar sua cota de gravação, um SSD geralmente manterá seus dados íntegros e ainda poderão ser acessados sempre que necessário.
Nesses casos, muitos fabricantes de memórias flash simplesmente desabilitam as funcionalidades de gravação para garantir que seus módulos SSD não se tornarão inúteis imediatamente.
Nesses casos, como todos já sabem, o perigo de perda de dados ou falha da unidade aumenta muito quando esse limite é atingido.
Além disso, tanto o tempo médio entre falhas (MTBF) como a gravação total de terabytes (TBW) são apenas dados estatísticos informados pela indústria. Todos esses números só indicam que as células NAND possuem uma capacidade de gravação restrita e precisam ser substituídas com o passar do tempo.
No entanto, é bastante comum encontrar diferentes SSDs que podem exceder essas restrições. Muitos usuários distraídos já usam suas unidades SSDs por mais tempo que o recomendado, sem mesmo saber que excederam sua vida útil estimada.
O problema é que em várias circunstâncias um SSD pode simplesmente interromper seu funcionamento antes mesmo que o limite TBW seja atingido. Em alguns casos isso pode levar alguns dias ou vários meses, porém o inevitável sempre acontece e sem nenhum tipo de aviso prévio.
Somos distribuidores Micron
É inegável que um módulo SSD torna o desempenho do seu sistema mais rápido e seguro. Além disso, sistemas de armazenamento com um NAS NVMe pode melhorar muito o desempenho de suas aplicações e aumentar a produtividade da empresa.
Porém, entender como esses módulos funcionam, os tipos de células que eles usam e interpretar corretamente informações como o TBW fornecido são fatores essenciais para estender a vida útil de seus sistemas.
Traga seu projeto e tire suas dúvidas. Somos especialistas em servidores, sistemas de armazenamento e distribuidores Seagate, Western Digital, Micron, Qnap e Infortrend.
Discos SDD
Tudo o que você precisa saber sobre soluções de Discos SDD.
NVMe (Non-volatile Memory Express)
NVMe (Non-volatile Memory Express), a tecnologia para performance em SSD. Saiba mais sobre o padrão que está revolucionando sistemas de armazenamento.
O que é e quais são as vantagens do iSER?
iSER é um recurso que garante melhorias significativas na performance do ambiente de armazenamento, menor latência e maior largura de banda, confira
Qual a melhor marca de SSD para NAS?
Os SSDs são ideais para melhorar a performance da estrutura de armazenamento e a melhor marca possui algumas características ideais para uso em NAS.