Hoy en día es muy común en los servidores de archivos, conocidos como *file servers*, encontrar múltiples archivos duplicados, lo que provoca problemas de espacio en disco.
Este tipo de problema es especialmente crítico hoy en día, ya que el constante aumento del volumen de datos en las corporaciones es un tema recurrente en las reuniones de planificación de capacidad. Por lo general, la complejidad de gestionar los datos es proporcional a la cantidad de información almacenada en el entorno.
Un recurso conocido como deduplicación de datos (*Data Deduplication*) surgió para ayudar en este desafío, ya que permite optimizar al máximo los datos almacenados en disco, reduciendo así el desperdicio del valioso espacio destinado a los volúmenes lógicos.
La deduplicación de datos es una tecnología basada en software y/o hardware que permite maximizar el uso de la capacidad en disco, eliminando así la necesidad de almacenar el mismo archivo varias veces.
La efectividad en la eliminación de datos duplicados está muy ligada al tipo de archivo almacenado en el volumen; sin embargo, según Microsoft, la tasa de ahorro oscila entre el 30 % y el 90 %.
Tras diversas pruebas en laboratorio, Microsoft publicó una lista con los principales servicios/tipos de servidores que presentan una buena adopción al implementar la deduplicación de datos (*Data Deduplication*):
Servicios/tipos de servidores
- Servidores de archivos;
- Almacén de datos para entornos virtualizados;
- Repositorios de copias de seguridad de SQL Server y Exchange Server.
- Del mismo modo que existen escenarios con buena adopción, vamos a enumerar los escenarios que no presentan una buena adecuación para la implementación de la deduplicación de datos (*Data Deduplication*):
Escenarios con una implementación deficiente
- Hosts Hyper-V;
- Servidores WSUS;
- Servidores que ejecutan SQL Server o Exchange Server;
- Archivos con un tamaño cercano a 1 TB o superior.
Para que pueda tener más fundamento a la hora de determinar si su entorno es elegible o no para adoptar la tecnología de deduplicación de datos (*Data Deduplication*), a continuación se presentan algunas consideraciones técnicas importantes:
Consideraciones técnicas
- El volumen lógico de destino no puede ser el de arranque asociado al sistema operativo;
- La partición puede ser MBR o GPT;
- Los archivos cifrados y los archivos de menos de 32 KB no son procesados por la deduplicación de datos (*Data Deduplication*);
- Los dispositivos extraíbles no son compatibles.
La implementación de la deduplicación de datos aporta muchos resultados positivos a las corporaciones. Entre ellos, podemos destacar la reducción del espacio utilizado para el almacenamiento de datos, una mayor agilidad en la realización y restauración de copias de seguridad, y la reducción del coste de inversión en TI, liberando así el presupuesto para otros proyectos.


