Como recuperar o RAID de servidor ou storage NAS com problemas
Muitas empresas confiam demais em seus servidores e soluções de armazenamento em disco, não dando a devida atenção para seus sistemas de backup e nas regras para a continuidade de negócios.
Mesmo equipamentos robustos como servidores e storages redundantes também falham, por isso qualquer ambiente de TI corporativo deve manter regras e processos atualizados e testados para a recuperação de dados.
Um servidor ou mesmo um NAS defeituoso representam não apenas o risco de interrupção dos serviços, mas também a possível perda de informações, danos à reputação da empresa e outros prejuízos associados.
Mas o que fazer nosso servidor, estação de trabalho ou sistema de armazenamento falha e não temos backup?
Por que servidores e storages falham?
Servidores e storages sempre podem falhar. Apesar da complexidade desse tipo de evento, boa parte dessas interrupções podem ser evitadas se as principais causas dos problemas forem mapeadas e monitoradas.
A maioria das falhas de hardware geralmente envolvem componentes mecânicos como discos rígidos e sistemas de refrigeração baseados em ventoinhas, presentes em racks, gabinetes e fontes de alimentação.
Além disso, problemas elétricos como picos de energia em ambientes que não possuem estabilizadores ou no-breaks também podem afetar o funcionamento de um arranjo de discos de servidores e sistemas de armazenamento.
Erros humanos, problemas de infraestrutura e imprevistos menos frequentes como desastres naturais completam nossa lista, todos com capacidade de interromper nossas aplicações e serviços.
O RAID degradado é um aviso importante
A complexidade da recuperação de dados em um servidor ou NAS aumenta quando temos um ou mais arranjos RAID (Redundant Array of Independent Disks) configurado.
Qualquer arranjo de disco, seja ele de tecnologia SATA ou SAS, sempre é criado para trazer mais espaço de armazenamento, desempenho e segurança aos dados.
Essas matrizes podem ser compostas por dezenas de hard disks, que trabalham em conjunto em infraestruturas de TI como datacenters para trabalho 24x7.
Nesses sistemas, a falha de um ou mais discos pode ser mitigada sem perda de dados, pois os arquivos são distribuídos dentro do arranjo utilizando algoritmos capazes de reconstruir a informação no caso de falhas.
Por isso, quando um dos hard disks falha, o sistema entra em modo degradado e avisa o administrador sobre o mal funcionamento.
O RAID degradado é o sinal que um ou mais hard disk do arranjo de discos do sistema está falhando. Apesar de assustadora, essa constatação é um fato comum em ambientes de TI e datacenters de todos os portes.
Existe algum indício que um NAS irá falhar?
A detecção precoce e a ação imediata ao se deparar com um problema técnico pode fazer a diferença entre manter as aplicações em execução ou ter uma falha de hardware que leva à perda de dados.
O reconhecimento preventivo de alguns sinais de mal funcionamento pode ser determinante para a proteção de dados e garantir a continuidade das operações.
Portanto, esteja sempre atento a qualquer tipo irregularidade. Ao suspeitar de qualquer problema, faça backup de tudo e tome as medidas corretivas necessárias imediatamente.
É importante estar atento aos seguintes sinais:
O aumento nas mensagens de erro é um sinal de problemas. Essas mensagens podem ocorrer durante o acesso aos arquivos, na transferências de dados ou durante a execução de aplicativos que acessam o sistema de armazenamento.
A degradação do desempenho é um mau sinal. Outro sinal de que alguma coisa está errada é quando o acesso as aplicações ou a transferência de dados do NAS está significativamente mais lento do que o normal.
Aumento na atividade do disco rígido sem uma razão óbvia. Se os discos rígidos do arranjo estão trabalhando de forma ininterrupta mesmo que nenhuma tarefa esteja sendo executada, isso também pode ser um sinal de falha iminente.
Aumento no ruído e/ou na temperatura dos hard disks. Ao notar que os hard disks estão fazendo mais barulho do que o normal ou que a temperatura do sistema subiu, atualize seu backup.
O aumento no ruído de funcionamento e a alta temperatura são sinais claros que os HDDs estão trabalhando de forma suspeita e podem parar a qualquer momento.
Avisos do sistema de monitoramento do NAS. Por último, caso o storage possua algum software para monitoramento ou diagnóstico de funcionamento, qualquer alerta ou aviso emitido sobre a saúde do equipamento deve ser levado a sério.
Esses avisos do sistema geralmente são o primeiro indicativo de que algo está errado, por isso qualquer email ou sinal sonoro deve ser interpretado como um possível problema com o aparelho.
Arranjos de disco falham por ter pouco espaço disponível
A falta de espaço em disco também é um dos grandes causadores de falha. Apesar de óbvia, essa é situação é muito comum em empresas que não possuem um sistema de gestão para as cotas de armazenamento.
Quando um servidor ou storage está próximo de utilizar todo o espaço livre da matriz de discos, a maioria desses sistemas começa a reduzir seu desempenho.
Isso acontece porque os sistemas operacionais precisam de algum espaço em disco disponível para executar as operações de entrada/saída e fazer o armazenamento temporário de arquivos (caching).
Assim, ao atingir sua capacidade máxima de armazenamento, processos executados em servidores podem ser prejudicados, resultando em problemas de desempenho e falhas no sistema.
Esse problema se agrava quando o espaço em disco do RAID estiver totalmente ocupado, pois todos os sistemas que precisam de espaço em disco terão seus processos interrompidos.
A melhor forma de resolver esse tipo de problema é migrar os dados frios (cold storage) para um disposto de backup, liberando o espaço de armazenamento para as aplicações principais.
O que NÃO FAZER ao constatar problemas?
Stress não ajuda: Apesar de não ser uma situação confortável, entrar em pânico por ter um servidor ou storage com defeito pode levar a decisões apressadas e potencialmente danificar ainda mais seus dados.
Pare de usar o equipamento: Se você suspeita que há um problema, pare de usar o dispositivo imediatamente. Continuar a escrever dados no arranjo de discos pode sobrescrever informações que você está tentando recuperar.
Não faça a manutenção por conta própria: Se você não tem experiência técnica, não tente abrir o servidor ou fazer qualquer coisa que possa danificar fisicamente os dispositivos de armazenamento. Isso pode levar a danos irreparáveis aos dados armazenados.
Não altere as configurações do sistema: Alterar as configurações de um equipamento que estava em uso pode ser improdutivo e perigoso. Qualquer mudança deve ser realizada por um técnico especializado, sob pena de correr o risco de danificar mais o sistema.
Não confie nos softwares para a recuperação de dados: Embora seja tentador tentar recuperar os dados com um software que você encontrou online, nem todos eles servem para solucionar o seu problema.
Na realidade, alguns podem ser mais prejudiciais do que úteis. Caso você não tenha certeza do que está fazendo, sempre é melhor consultar um profissional.
Não subestime seu backup: Mesmo que você tenha sérios problemas com seu servidor de aplicação, storage ou NAS, isso não significa que você deve subestimar seus sistemas de backup.
Uma solução robusta de backup pode simplificar a recuperação de um ambiente de produção rapidamente, inclusive com todos os aplicativos e dados, sem precisar envolver o equipamento problemático.
Não presuma que todos os dados estão perdidos: Mesmo em situações ruins, muitas vezes é possível recuperar total ou parcialmente o sistema de armazenamento. Mantenha a mente aberta e explore todas as opções antes de presumir que tudo está perdido.
Como recuperar os dados de um RAID?
Recuperar dados de um servidor ou dispositivo de armazenamento pode envolver várias etapas, dependendo da natureza do problema.
Além disso, recuperar dados não é uma ciência exata: Ela pode ser ocasionada por falhas de hardware, software ou mesmo softwares maliciosos como malwares.
Antes de tentar recuperar os dados, verifique os seguintes pontos:
1- Verifique se não é apenas um problema de conexão: Antes de começar a tomar qualquer providência, verifique se todos os cabos de energia e de rede estão conectados corretamente.
Verifique ainda se computadores, switches e outros dispositivos da rede local estão funcionando corretamente. Esse passo pode eliminar problemas não associados ao equipamento.
2- Tente reiniciar o dispositivo: Muitos problemas estão associados a necessidade de reiniciar um dispositivo. Muitas vezes uma atualização pendente ou um pico de energia pode ocasionar uma pequena falha nos serviços.
Infelizmente essa não é a melhor recomendação para todos os casos. Alguns sistemas com problemas técnicos graves podem simplesmente não voltar a funcionar após a reinicialização.
Por isso, antes de reinicializar seu servidor, computador ou storage, atualize seu backup e faça um inventário das aplicações em execução.
3- Use as ferramentas de recuperação de dados: Muitos servidores NAS possuem ferramentas próprias para o data recovery. Converse com seu fornecedor sobre quais são as ferramentas disponíveis para esse fim e como você pode como usá-las.
4- Use um software de terceiros: Caso seu equipamento não tenha nenhuma ferramenta para a recuperação de dados do fabricante, sempre é possível usar um software de terceiros.
Esse passo já exige algum conhecimento técnico, pois utilizar softwares desse tipo sem conhecimento pode causar a perda definitiva de todos os arquivos.
5- Envie o equipamento para profissionais: Caso nenhuma das opções acima funcione, pode ser necessário enviar o dispositivo para empresas especializadas no assunto.
Distribuidores autorizados possuem profissionais qualificados para identificar corretamente o problema. Além disso, caso seja necessário, a maioria dessas empresas podem prestar serviços especializados na recuperação de dados.
Alguns problemas técnicos mais complexos exigem o uso de equipamentos específicos e profissionais especializados para a tarefa quando as outras opções de recuperação não foram bem-sucedidas.
No entanto, vale lembrar que esse processo é o último recurso e pode ser demorado, custar muito caro e nem sempre resultar em êxito.
Cuidados ao recuperar dados de um servidor NAS
Falhas em sistemas de armazenamento são frequentemente causadas por problemas físicos em discos rígidos ou módulos SSD.
Além disso, bugs ou corrupção no firmware, sistema operacional ou no software de gerenciamento podem ser difíceis de diagnosticar e resolver sem a assistência de um profissional.
Quando todos os cuidados básicos não são suficientes para restabelecer os serviços, tentar recuperar os dados de arranjos RAID problemáticos por conta própria pode não ser uma tarefa simples.
Não se engane: Tentar resolver os problemas sozinho, especialmente sem a experiência técnica necessária, sempre é um processo complexo e delicado.
Muitas vezes, ao tentar reconstruir um arranjo RAID através de soluções improvisadas, pode ainda resultar em mais danos e aumentar a probabilidade de perda de dados.
Tentativas mal orientadas na recuperação de dados podem resultar em mais tempo de inatividade ou interromper definitivamente as operações, causando a perda de produtividade e perdas financeiras.
Ao se deparar com uma falha em um arranjo de disco, a melhor solução é procurar a ajuda de um profissional. Eles têm a experiência, o conhecimento e as ferramentas para recuperar seus dados.
Quer saber mais sobre o assunto? Ligue e tire suas dúvidas. Somos distribuidores Seagate, Western Digital, Synology, Qnap e Infortrend.
Armazenamento de dados
Tudo o que você precisa saber sobre soluções de Armazenamento de dados.
Seagate Rescue: Serviço para recuperação de dados em caso de desastre
Seagate Rescue, seus dados recuperados pela fábrica. A ControleNet disponibilizou o serviço para recuperação de dados p/ seu HD ou storage, clique e saiba mais.
Vai comprar um Network attached storage (NAS)? Confira nossas dicas.
Escolher o melhor NAS não é uma tarefa complicada. Confira as dicas de quem entende no assunto para manter os dados de sua empresa seguros e online.
O que é um Storage de alta disponibilidade (HA)?
O que é um Storage de alta disponibilidade (HA)? Conheça nossas soluções resistentes a falhas de hardware, software e energia e não perca mais dados.