Como proteger os seus dados usando ZFS
Uma pergunta frequentemente feita na indústria de servidores é, ‘o que é melhor – RAID por software ou RAID por hardware? Se você pesquisar este tópico, muitas das informações sobre RAID sugerem que uma placa RAID de hardware é preferível ao uso de um RAID de software. Mas eu não concordo. Na minha opinião, para a maioria das aplicações, o RAID por software é muito melhor do que o RAID por hardware. O RAID por hardware tem um lugar sob certos sistemas operacionais, mas vou lhes dizer porque o Software é geralmente muito superior.
O RAID por hardware em detrimento do RAID por software vem de uma época em que o hardware não era suficientemente poderoso para lidar com o processamento RAID por software, juntamente com todas as outras tarefas para as quais ele estava sendo usado. Nessa altura, a solução era utilizar uma placa RAID de hardware com um processador incorporado que lidava com os cálculos RAID ‘offline’. Ela se apresentava no SO do computador como um único disco, e internamente processava os dados movendo-se para dentro e para fora dos múltiplos dispositivos de armazenamento (discos rígidos). Isto fazia com que as coisas funcionassem suavemente enquanto se beneficiava da segurança do RAID.
Hardware RAID ainda é popular entre algumas pessoas e muitas das placas RAID de hardware de hoje em dia oferecem um desempenho de ponta enquanto aliviam a carga na CPU, mas ainda há alguns problemas sérios e desvantagens:
- Desafios de recuperação de dados quando grandes falhas acontecem
- Protocolos proprietários/não-padronizados, o que significa que seu array só funciona com a mesma placa de raid de hardware. Você não pode conectar seu conjunto de discos rígidos a nenhuma placa RAID e esperar que ela leia seus dados.
- Hardware RAID tem a capacidade de pegar um grupo de unidades e fazê-lo aparecer como um único disco. Esta arquitectura é elegante na sua simplicidade. No entanto, isto também impede fundamentalmente a integração de recursos no sistema operacional e no sistema de arquivos. Esta integração é realmente o que permitiu que o RAID por software ultrapassasse drasticamente o RAID por hardware.
- Categorias: Sem categoria
Onde Acredito que Estamos Hoje
Duas coisas aconteceram que beneficiaram o RAID por software sobre o RAID por hardware e permitiram que ele assumisse a liderança. A potência computacional cresceu tão radicalmente que a carga computacional apresentada pelo RAID não é mais significativa. Em segundo lugar, a força, características e integração de Software RAID cresceu drasticamente.
Hardware RAID continua a oferecer soluções arquitectónicas sólidas e simples para combinar múltiplas unidades em matrizes RAID e apresentá-las ao SO como um único dispositivo. Isto é particularmente útil com o MS Windows que tem uma implementação dolorosamente lenta de software RAID. No entanto, ele continua a ter um risco de segurança de dados porque você precisa usar um controlador idêntico (ou compatível) para recuperar dados no caso de falha de hardware.
No lado do software, o RAID de software atual é super-rápido (pelo menos com Linux e BSD), extremamente flexível, e altamente integrado aos sistemas operacionais. É também muito mais capaz e poderoso em situações de recuperação do que o RAID por hardware. Para recuperar seus dados, tudo o que você precisa é de outro servidor de armazenamento com o mesmo sistema operacional. Depois disso os passos são simples, basta conectar as unidades e começar a trabalhar – você deve ser capaz de recuperar de praticamente qualquer situação em que sua perda de dados não tenha ultrapassado os limites fundamentais.
Está claro que computadores e software percorreram um longo caminho e está ficando mais claro que o RAID definido por software será cada vez mais prevalecente com o passar do tempo.
ZFS File System and Volume Manager
Agora vamos cavar em um de nossos sistemas de arquivos e gerenciadores de volume favoritos, o ZFS. Vamos falar sobre alguns dos recursos que tornam o ZFS único e depois dar-lhe um exemplo de um dos nossos clientes que economizou muito dinheiro porque ele estava usando ZFS com software RAID.
Adoramos ZFS porque ele pode contornar muitos dos problemas que podem surgir ao usar placas RAID tradicionais. Por exemplo, ao invés de uma placa RAID de hardware obter o primeiro crack em suas unidades, ZFS usa uma placa JBOD que pega as unidades e as processa com seu gerenciador de volume e sistema de arquivos embutidos. Isto dá ao ZFS um maior controle para contornar alguns dos desafios que as placas RAID de hardware normalmente têm. Devido a esse controle e suas características funcionais – o ZFS pode lidar com erros extremamente bem. Estes recursos, incluindo Copy on Write, Snapshots, escalonamento praticamente infinito, auto-cura com check sums e virtualização incorporada para seu pool de armazenamento, dão ao ZFS um nível extra de robustez.
ZFS tem sua própria maneira de estruturar novas escritas chamadas Copy on Write. Isto é diferente da forma como a maioria dos gestores de volume estruturam as novas escritas. Normalmente quando uma modificação ou novos dados é escrita, ela é escrita sobre os dados antigos. No entanto, se houver uma falha de energia durante essa gravação – os dados podem ser perdidos. Ao invés de escrever sobre os dados antigos, ZFS escreve os dados em um novo local e copia o caminho para o novo local. Isto significa que seus dados não se perdem se você perder a energia enquanto estiver escrevendo. Ele também dá ao ZFS a capacidade de outra de suas características mais úteis; Snapshots.
Snapshots são essencialmente selos de tempo que mostram qual foi o caminho para os dados em um ponto específico no passado, estes são armazenados em sua própria tabela separada dos dados. Como o ZFS não sobregrava dados e, em vez disso, grava-os em um novo local, você pode reverter para um carimbo de tempo anterior, ele está quase funcionando como um backup. Os instantâneos têm muito menos despesas gerais do que um backup real, pois um backup completo requer a cópia dos seus dados. Snapshots podem ser tiradas rápida e facilmente em comparação.
ZFS também tem uma incrível capacidade de se curar contra erros de escrita, corrupção de dados ou apodrecimento de bits. Ele analisa os dados armazenados em locais redundantes usando checksums e reparos em si com base em inconsistências. Ele também tem a tradicional funcionalidade RAID – utilizando espelhamento, striping e verificações de paridade. Ao utilizar uma placa RAID de hardware, o verificador do estado do disco é mascarado quando os discos são conectados a ela. Isto é um problema porque você não consegue ver os sinais que se aproximam de um dos seus discos vai chutar o balde. ZFS contorna isso porque não tem nenhuma operação escrita nas unidades antes que elas sejam apresentadas ao SO.
Exemplo de Caso do Cliente
Todos nós cometemos erros, alguns podem ser mais caros do que outros. Um de nossos clientes que usava ZFS em seu Storinator teve que mover escritórios e não tirou os discos rígidos antes de mover e de alguma forma danificou os discos durante a mudança.
Quando o cliente tentou inicializar o Storinator e importar o pool ZFS – algumas das unidades estavam danificadas e algumas estavam mal colocadas – havia até metadados corrompidos. No entanto, porque o cliente estava usando ZFS ele foi capaz de reconstruir o pool razoavelmente facilmente.
Nossa equipe de suporte aqui na 45Drives foi capaz de importar manualmente o pool como degradado. Uma vez que o pool estava dentro, nós fomos capazes de adicionar novos drives, limpar o pool e as coisas voltaram ao normal.
Nós só fomos capazes de fazer isso por causa da resiliência do ZFS, mas isso não teria sido possível se nosso cliente estivesse usando RAID por hardware, porque ele é muito mais sensível a falhas de componentes. Se eles estivessem usando RAID por hardware, havia uma boa chance de que seus dados tivessem sido perdidos – sem algum tipo de recuperação cara.
Resumo
Se você precisar do máximo em segurança, recursos e desempenho, o RAID por software é a resposta. Note que você precisará usar um SO de alto desempenho como Linux ou BSD; e se fizer isso, você realmente deve considerar o ZFS. Seu desempenho é excelente nas máquinas atuais, leva a segurança dos dados a um nível sem precedentes e como um bônus, e é realmente fácil de usar uma vez que você suba na curva de aprendizado.
admin12:03 pm