RAID 6: la matriz de discos con una elevada seguridad ante fallos

Desde hace décadas existe la tradición de agrupar diversos discos en una unidad lógica individual. Con el paso de los años, distintas configuraciones han demostrado ser especialmente exitosas, por lo que se han estandarizado como niveles RAID (Redundant Arrays of Independent Disks). El RAID 6 es un enfoque poco utilizado pero bastante relevante gracias a su elevada fiabilidad. Sigue leyendo para saber qué hace tan especial a este enfoque RAID, qué puntos fuertes y débiles tiene y para qué ámbitos de aplicación es adecuado.

¿Qué es RAID 6?

El RAID 6 es un principio de almacenamiento en el que se combinan cuatro o más discos duros en una unidad lógica individual. De esta manera, aumentan la fiabilidad y al mismo tiempo la velocidad de lectura en comparación con los soportes de datos individuales. Para esto es fundamental la combinación de striping y paridad, que también se aplican en el nivel original RAID 5. No es casualidad que el RAID 6 también se conozca como la extensión de RAID 5.

Los sistemas RAID 6 implementan el enfoque del striping de la manera clásica: todos los datos se dividen en bloques y reparten uniformemente en los discos duros conectados. Esto brinda a los usuarios la posibilidad de acceder simultáneamente a varios discos y leer parte de los bloques de una franja de datos en paralelo.

Con relación a la paridad, el RAID 6 toma su propio camino. El sistema almacena siempre dos frases de información de paridad, lo que en caso de fallo de uno o dos discos permite restaurar los datos vinculados con ellos. Para ello, el sistema RAID 6 utiliza la disyuntiva XOR o la mezcla con la corrección de errores de varios bits mediante el código Reed‑Solomon. Este último mecanismo de corrección también es demandado, por ejemplo, en la transmisión de señales de televisión según el estándar DVB, en el que mejora la tasa de error binario de la señal recibida.

Nota

XOR significa “Exclusivo O” (del inglés, eXclusive OR). Las conexiones XOR vinculan dos mensajes uniendo dos dígitos del mismo nombre "exclusivo o", "o este o este". Para los datos de una matriz RAID 6, implica lo siguiente: todos los elementos de una división de datos se unen en el proceso de escritura con la información de paridad correspondiente mediante la lógica XOR. Si los dispositivos acceden al stock de datos, pueden reconstruir los datos correspondientes gracias al bloque de paridad adecuado en caso de que no estuvieran disponibles.

La capacidad total de un sistema RAID 6 se reduce considerablemente frente al almacenamiento de una unidad individual. El lugar disponible para los datos de usuario se calcula con la siguiente fórmula:

(Número de discos - 2) x Espacio de almacenamiento del disco más pequeño

Con cuatro discos, cada uno de 1 gigabyte de capacidad de almacenamiento, solo estaría disponible el 50 % del almacenamiento para los datos de usuario. No obstante, conforme aumenta el número de discos, mejora la relación entre la capacidad para datos de usuario y la paridad.

Definición

Un RAID (Redundant Array of Independent Disks) es una matriz de al menos dos unidades de almacenamiento que forman una única gran unidad lógica. Su función concreta viene determinada por la configuración específica de los discos, que se define en niveles RAID, como el RAID 6. La fiabilidad y una mejorada velocidad de transferencia de datos son algunos de los puntos fundamentales.

Diagrama del principio de funcionamiento del RAID 6

Los sistemas RAID distribuyen todos los datos de usuario y la información de paridad uniformemente entre los discos conectados. Esto hace que cada disco almacene a veces los bloques de datos de usuario (en este casi: A1, A2, etc.) y a veces los bloques de paridad (en este caso: Ap1, Ap2 etc.) en una división de datos. El siguiente diagrama ilustra el funcionamiento del RAID 6, para lo cual hemos elegido un grupo de cinco discos duros como ejemplo.

Ventajas e inconvenientes de una matriz RAID 6

En comparación con el RAID 5, el enfoque del RAID 6 ofrece un cambio importante: la información de paridad que sirve para restaurar posteriormente los datos perdidos se almacena por duplicado. Esta diferencia es al mismo tiempo la gran fortaleza de este concepto de almacenamiento ya que los datos de paridad almacenados por duplicado son no solo una variante especialmente eficiente para generar redundancia, sino que además también garantizan un nivel muy elevado de seguridad ante fallos. En el sistema RAID 6, pueden fallar simultáneamente hasta dos discos sin peligrar el funcionamiento del sistema.

Nota

La mayor fiabilidad de un RAID 6 no debe equipararse con asegurar los datos mediante una copia de seguridad. Una matriz de discos RAID nunca debe verse como una alternativa; solo una extensión de la solución de copia de seguridad.

Las ventajas del RAID 6 también están estrechamente vinculadas a los puntos fuertes del RAID 5 en otros aspectos, como es la posibilidad de un acceso en paralelo, que garantiza una mejor tasa de rendimiento en la lectura de datos. No obstante, mediante la doble paridad, esta ventaja está más reducida que con los sistemas del nivel 5. La relación entre espacio libre para datos de usuario y el espacio omitido (para la paridad) también es menor que con el RAID 5. Sin embargo, el RAID 6 ya ofrece una mejor utilización de los recursos a partir de cinco discos (que también mejora con cada disco adicional) que los RAID que dependen completamente de reflejar los datos con el método espejo.

En comparación con una unidad individual, la reducción significativa del posible espacio de almacenamiento es una clara desventaja, que se dará sobre todo con la configuración mínima de cuatro discos (solo el 50 % de almacenamiento). El rendimiento de la escritura también es uno de los inconvenientes claros de una matriz RAID 6. Si los datos se almacenan en discos enlazados, cada vez se lleva a cabo un doble cálculo y distribución de la paridad. La tasa de escritura minimizada resultante se nota sobre todo en la reconstrucción del sistema, es decir, al integrar un nuevo hardware para sustituir copias defectuosas.

Ventajas Inconvenientes
Alta fiabilidad gracias a la paridad doble Velocidad de escritura considerablemente menor a la de las unidades individuales
Rendimiento ligeramente mejorado en el proceso de lectura en comparación con unidades individuales Capacidad de almacenamiento de los discos individuales, sobre todo en matrices más pequeñas, se limita significativamente

¿Dónde se implementa un RAID 6?

RAID 6 permite almacenar grandes cantidades de datos a prueba de fallos a largo plazo al amortiguar dos posibles fallos. Por tanto, los sistemas de servidores en los que se archivan datos son un caso de aplicación ideal. Los servidores de bases de datos o de transacciones, escenarios clásicos de RAID 5, también pueden aprovecharse de la estructura de almacenamiento de RAID 6 si dan prioridad a la seguridad de los datos y la minimización de la velocidad de escritura es compatible con las exigencias de la aplicación en concreto.

Consejo

Si almacenas datos sensibles, no debes prescindir de una estrategia de copia de seguridad de buen funcionamiento. Backup Cloud de IONOS asegura tus datos encriptados en los centros de datos certificados de IONOS.

¿Qué otros niveles de RAID se utilizan?

El RAID 6 es en gran medida una alternativa más fiable que el más común RAID 5. Pero no es el único camino que se utiliza para lograr la redundancia mediante la paridad. Otros estándares como RAID 1 y RAID 10 almacenan los datos con el método del espejo, es decir, siempre por duplicado. Este último enfoque mezcla dos niveles RAID, ya que no solo utiliza la técnica del espejo del RAID 1; también distribuye los datos entre todos los discos según el RAID 0.

Para más información sobre las similitudes y diferencias de los distintos conceptos consulta nuestra detallada comparativa de niveles RAID.