Hoje em dia é muito comum em servidores de arquivos, conhecidos como file server, encontrarmos diversos arquivos duplicados, nos quais resultam em problemas de espaço em disco.
Esse tipo de problema é muito sensível atualmente, pois o crescente aumento do volume de dados nas corporações é um assunto recorrente em reuniões de planejamento de capacidade. Normalmente a complexidade em gerenciar os dados é proporcional à massa de dados alocadas no ambiente.
Um recurso conhecido como deduplicação de dados (Data Deduplication) surgiu para apoiar neste desafio, pois o recurso permite otimizar ao máximo os dados alocados em disco, reduzindo assim, o desperdício do precioso espaço destinado aos volumes lógicos.
O data deduplication é uma tecnologia baseada em software e/ou hardware que permite maximizar ao máximo o uso da capacidade em disco, fazendo-se assim a não necessidade de armazenamento do mesmo arquivo várias vezes.
A assertividade sobre a eliminação dos dados duplicados está muito atrelada ao tipo de arquivo alocado no volume, porém, segundo a Microsoft, temos uma taxa de economia de 30% a 90%.
Após diversos testes em laboratório, a Microsoft divulgou uma lista contendo os principais serviços/tipos de servidores que possuem uma boa aderência ao adotarem Data Deduplication:
Serviços/tipos de servidores
- Servidores de Arquivos;
- Datastore para ambientes virtualizados;
- Repositórios de backups SQL Server e Exchange Server.
- Da mesma forma que existem cenários com boa aderência, vamos listar os cenários que não possuem uma boa aderência para a implementação de Data Deduplication:
Cenários que não possuem uma boa implementação
- Hosts Hyper-V;
- Servidores WSUS;
- Servidores rodando SQL Server ou Exchange Server;
- Arquivos com tamanho próximo a 1 TB ou que sejam maiores que isso.
Para que você possa ter mais embasamento na hora de classificar como elegível ou não o seu ambiente para adotar a tecnologia Data Deduplication, seguem mais algumas considerações técnicas importantes:
Considerações técnicas
- O volume lógico alvo não pode ser o de inicialização associado ao sistema operacional;
- A partição pode ser MBR ou GPT;
- Arquivos criptografados e arquivos menores que 32 KB não são processados pelo Data Deduplication;
- Dispositivos removíveis não são suportados.
A implementação do recurso data deduplication proporciona muitos resultados positivos para as corporações. Dentre eles, podemos ressaltar a redução do espaço utilizado para armazenamento de dados, maior agilidade na realização e restore de backups e, redução do custo de investimento em TI, liberando assim o budget para outros projetos.