Almacenamiento Raid
Almacenamiento Raid
Almacenamiento Raid
La matriz redundante de discos independientes (RAID) es una tecnología de almacenamiento que crea una pérdida de datos a prueba de fallas
al fusionar dos o más unidades de disco duro (HDD) o unidades de estado sólido (SSD) en una unidad de almacenamiento cohesiva o matriz.
El almacenamiento RAID protege contra la pérdida total de los datos de una unidad de disco al repetir o recrear esos datos y almacenarlos en la
unidad o unidades adicionales, un proceso también conocido como redundancia de datos .
La pérdida total de datos , que puede ocurrir en caso de falla de una unidad de disco, puede devastar las empresas y organizaciones que
requieren un acceso frecuente a la información almacenada para llevar a cabo sus responsabilidades diarias.
La pérdida total de datos puede ser especialmente devastadora para las aplicaciones de misión crítica, por lo que una falla potencial podría
resultar en pérdidas financieras, desaprobación pública, lesiones graves e incluso la muerte.
Gracias a RAID, el personal de misión crítica puede continuar concentrándose en la ejecución de sus tareas esenciales sin tener que
preocuparse por las ramificaciones potencialmente graves de una falla en la unidad de disco.
no todos los niveles de almacenamiento RAID protegen contra la pérdida de datos. De hecho, solo hay uno que no lo hace.
Las configuraciones que ofrecen protección contra la pérdida de datos se denominan "tolerantes a fallas". Esto solo significa que la matriz
seguirá funcionando correctamente y proporcionará datos recuperables en caso de que falle la unidad de disco.
Tipos de RAID: RAID de software frente a RAID de hardware
Gráfico: RAID de software frente a RAID de hardware. Icono de disco duro fabricado por Surang en Flaticon
La implementación y administración del almacenamiento RAID se puede ejecutar mediante software RAID, mediante el cual un controlador en
una computadora ejecuta el procesamiento RAID, o mediante hardware RAID, mediante el cual se utiliza una tarjeta controladora RAID que
utiliza la ranura PCI Express de una placa base .
La efectividad del software RAID depende de la potencia de procesamiento de la computadora. No es ideal para configuraciones RAID
complejas.
Para esas configuraciones de alto rendimiento, necesitará un controlador RAID dedicado, cuyo único propósito es ejecutar el procesamiento
RAID.
Los usuarios de escritorio promedio pueden arreglárselas con el software RAID, ya que la mayoría de los sistemas operativos, incluidos Apple y
Windows, admiten RAID. Además, el software RAID es la opción más económica.
Sin embargo, las aplicaciones RAID más grandes y complejas deberán ir con RAID de hardware para lograr el mayor rendimiento posible.
Historia de RAID
Gráfico: Los informáticos Dave Patterson, Garth Gibson y Randy Katz. Al trío se le atribuye haber acuñado el acrónimo RAID y despertar el interés comercial en la
tecnología. Crédito: Museo de Historia de la Computación
El acrónimo "RAID" fue acuñado por los informáticos de la Universidad de California, Berkeley David Patterson, Garth Gibson y Randy Katz en
su artículo de investigación, " A Case for RAID ", presentado en la conferencia anual de 1988 del Grupo de Interés Especial de la Association for
Computing Machinery. de Gestión de Datos (SIGMOD).
RAID originalmente significaba "Matriz redundante de discos económicos" debido al factor de gasto del artículo de Patterson, Gibson y Katz.
El trío argumentó que una matriz de varios discos económicos podría superar técnicamente a su contraparte más grande y cara: la unidad de
disco del mainframe.
Aunque el concepto de combinar unidades de disco para mejorar el rendimiento no era nuevo, el artículo del trío despertó el interés comercial en
RAID.
Desde entonces, la Storage Networking Industry Association (SNIA) ha estandarizado varios niveles de RAID.
Las configuraciones generalmente se evalúan en función de su nivel de tolerancia a fallas, sus velocidades de lectura y escritura y su capacidad
de almacenamiento.
En la actualidad, se utilizan muchos niveles de RAID, algunos de los cuales son raros.
Las configuraciones RAID más comunes son RAID 0, RAID 1, RAID 5, RAID 6 y RAID 10.
RAID 0
RAID 1 utiliza la duplicación de disco , que crea copias del mismo archivo para su almacenamiento.
En RAID 1, el archivo original se almacena en una unidad de disco y copias idénticas del archivo se almacenan en las otras unidades de disco
de la matriz.
Como resultado, RAID 1 produce unidades de disco que son copias duplicadas entre sí.
A diferencia de RAID 0, RAID 1 proporciona redundancia de datos, creando una matriz tolerante a fallas.
Entonces, en una configuración RAID 1 de dos discos, si falla una unidad de disco, la segunda unidad de disco contiene los mismos datos, ergo,
los datos no se perdieron y se pueden recuperar fácilmente. Como resultado, se ha logrado la tolerancia a fallos.
De manera similar, en una configuración RAID 1 de cinco discos, si fallan tres unidades de disco, el cuarto y quinto disco proporcionan a los
usuarios dos copias de seguridad completas de los mismos datos.
Cuantas más unidades de disco haya en la matriz, más copias de los archivos se crearán y, a su vez, mayor será el grado de tolerancia a fallos.
RAID 1 es útil para aplicaciones de misión crítica, donde la pérdida total de datos vitales, sensibles o clasificados es inaceptable.
Los consultorios médicos, firmas de contabilidad, bufetes de abogados, bancos, departamentos de policía, departamentos de salud y otras
oficinas gubernamentales podrían beneficiarse de una configuración de almacenamiento RAID 1.
Pero incluso los usuarios promedio y cotidianos pueden beneficiarse de las capacidades de clonación de datos de RAID 1.
Los jugadores, los fotógrafos, los videógrafos y los productores de música, cada uno de los cuales sin duda se beneficiaría de las mayores
velocidades de lectura y escritura de RAID 0, posiblemente estarían mejor sacrificando la velocidad de RAID 0 por la redundancia de datos y la
tolerancia a fallas de RAID. 1.
RAID 0 frente a RAID 1
Al decidir entre RAID 0 y RAID 1, los usuarios de RAID 1 pueden estar tranquilos sabiendo que, en caso de falla de la unidad de disco, sus
archivos se han duplicado de forma segura.
Los datos de RAID 1 no se han segmentado, por lo que si se produce una falla en la unidad de disco, los datos no tienen que recomponerse del
disco fallado y, por lo tanto, pueden recuperarse.
Sin embargo, RAID 1 no debería reemplazar las copias de seguridad regulares.
Otro inconveniente de la configuración clásica de RAID 1 de dos discos es que su capacidad de almacenamiento es solo la mitad de la
capacidad total de su unidad de disco.
Entonces, si está utilizando dos unidades de disco de 2 TB, para un total de 4 TB de capacidad de almacenamiento, técnicamente se le asignan
2 TB de espacio porque la segunda unidad contiene los mismos datos que la primera.
Ahora, si agrega una unidad de disco de 2TB a esa misma matriz RAID 1, todavía solo se le asignan 2TB de espacio, porque ahora, las otras
dos unidades de disco de 2TB contienen los mismos datos que la primera.
Y en una matriz RAID 1 de cuatro discos con, por ejemplo, dos unidades de disco de 2TB y dos unidades de disco de 4TB, para un total de 12
TB de capacidad de almacenamiento, solo se le asignan 2TB de espacio.
¿Por qué? Porque si está guardando 2TB de datos en la matriz, la unidad de 2TB se llena con los datos originales, la segunda 2TB se llena con
copias de esos datos y las dos unidades de 4TB se han llenado con copias en solo la mitad de las unidades. 'capacidad de almacenamiento
utilizable.
Entonces, en esta configuración, tendrías que usar 6 TB para la protección de datos y 4 TB de espacio no utilizado.
Compare cada uno de estos escenarios con una configuración RAID 0, en la que la capacidad de almacenamiento del arreglo sería equivalente
a la capacidad total de la unidad de disco.
La compensación para RAID 0 es la tolerancia a fallas y la compensación para RAID 1 es la velocidad y la eficiencia.
Esto de RAID puede volverse bastante complejo, ¿eh? Bueno, ¡todavía no has visto nada!
Asegúrese de consultar la calculadora de almacenamiento RAID de Synology para probar diferentes matrices RAID y combinaciones de
almacenamiento.
Gráfico: configuración de RAID 5
RAID 5
RAID 5 es quizás la configuración RAID más común y, a diferencia de RAID 0 y RAID 1, requiere un mínimo de tres unidades de disco para
funcionar.
RAID 5 utiliza la división de datos, mediante la cual los datos se separan en segmentos y se almacenan en unidades de disco independientes en
la matriz.
Pero RAID 5 también utiliza un proceso llamado paridad , mediante el cual se crea una suma de comprobación de todos los datos y se almacena
en cada una de las unidades de la matriz.
Por lo tanto, en una matriz RAID 5 de cuatro discos, los datos y sus sumas de verificación de paridad se dividirían y distribuirían en las cuatro
unidades para su custodia.
Y en el caso de una falla en la unidad de disco, las sumas de verificación de paridad permiten la recreación de los datos almacenados.
La desventaja de RAID 5 es que solo puede soportar la falla de una unidad de disco.
Afortunadamente, RAID 5 es intercambiable en caliente , lo que significa que una unidad de disco se puede reemplazar mientras que las demás
en la matriz siguen siendo completamente funcionales.
Desafortunadamente, si falla una segunda unidad de disco mientras se recrean los datos de la primera, se perderán todos los datos de la matriz.
En términos de capacidad de almacenamiento, dado que se requiere el espacio de una unidad de disco para almacenar las sumas de
verificación de paridad, la capacidad total de almacenamiento del arreglo en configuraciones RAID 5 se reduce en una unidad completa.
Por ejemplo, en una configuración RAID 5 de cinco discos con cinco unidades de disco de 1TB, para un total de 5TB de capacidad de
almacenamiento, solo se pueden utilizar 4TB ya que las sumas de verificación de paridad ocupan el espacio de una unidad de disco completa.
De manera similar, en una configuración RAID 5 de ocho discos con ocho unidades de disco de 2 TB, para un total de 16 TB de capacidad de
almacenamiento, solo se pueden utilizar 14 TB.
RAID 5 eclipsa a RAID 0 y RAID 1 en términos de tolerancia a fallas y tiene una mayor capacidad de almacenamiento total que una matriz RAID
1.
Al igual que RAID 0, las velocidades de lectura de RAID 5 son rápidas debido a la contribución de salida simultánea de cada unidad, pero a
diferencia de RAID 0, las velocidades de escritura de RAID 5 sufren debido a la creación redundante de las sumas de comprobación de paridad.
RAID 5 frente a RAID 6
RAID 5 y RAID 6 no son tan diferentes. Ambos utilizan los procesos de paridad y división de datos.
Las principales diferencias entre las dos configuraciones son que RAID 6 requiere cuatro unidades para funcionar y utiliza doble paridad, por lo
que se crean dos sumas de verificación en lugar de una.
En RAID 6, dos unidades de disco pueden fallar sin que se produzca una pérdida total de datos. Esto significa una mejor seguridad que RAID 5,
pero también significa velocidades de escritura aún más lentas, ya que se debe crear una suma de verificación adicional.
A veces, se hace referencia a RAID 10 como “RAID 1 + 0”, ya que combina los procesos de duplicación y creación de bandas que se encuentran
en las configuraciones RAID 1 y RAID 0, respectivamente.
En una configuración RAID 10, que requiere un mínimo de cuatro discos, los datos se segmentan antes de duplicarse en las unidades de la
matriz.
Al igual que en RAID 0, donde un archivo se segmenta y se almacena en dos unidades de disco separadas en una configuración de dos discos,
en RAID 10, cada uno de esos segmentos de archivo se refleja, lo que requiere espacio de almacenamiento adicional.
Una configuración estándar de RAID 10 de cuatro discos solo puede soportar una falla de unidad en cada par de unidades de disco duplicadas.
Y al igual que con la configuración estándar de RAID 1 de dos discos, la capacidad total de almacenamiento de RAID 10 se reduce a la
mitad. Por lo tanto, seis unidades de disco de 1 TB solo le proporcionarán 3 TB de espacio utilizable.
De hecho, RAID 10 es lo mejor de RAID 0 y RAID 1, con velocidades de lectura y escritura rápidas y una increíble tolerancia a fallas.
No tolerante a
Tolerancia Tolerante a fallos Tolerante a fallos Tolerante a fallos Tolerante a fallos
fallas
La mejor configuración RAID para su sistema de almacenamiento dependerá de si valora la velocidad, la redundancia de datos o ambos.
Si valora más la redundancia de datos, recuerde que las siguientes configuraciones de unidad son tolerantes a fallas: RAID 1, RAID 5, RAID 6 y
RAID 10.
P: ¿Es una gran empresa u organización con varios servidores y numerosos empleados que necesitan un acceso constante a los datos
almacenados en esos servidores?
P: ¿Es una pequeña empresa u organización en la que la velocidad no es una prioridad tan importante como el mantenimiento de registros
adecuado?
P: ¿Eres un jugador, fotógrafo, camarógrafo, productor musical u otro usuario que valora la velocidad y la eficiencia sobre la tolerancia a fallas?
R: Elija RAID 0 con el controlador RAID de software de su sistema operativo. Pero asegúrese de realizar copias de seguridad periódicas.
Conclusión
Esperamos que esta publicación de blog ayude a aclarar las diferencias entre los niveles RAID comunes y cómo cada uno de ellos puede
ofrecer un beneficio único para su programa o aplicación.
Trenton Systems fabrica sistemas de almacenamiento resistentes personalizables que pueden utilizar tecnología RAID. Estos sistemas incluyen
nuestros sistemas de almacenamiento resistente JBOF / JBOD y 5U .
No solo ofrecemos sistemas de almacenamiento resistentes con capacidad RAID, sino que también diseñamos, fabricamos, ensamblamos,
integramos y respaldamos estos sistemas aquí mismo en los Estados Unidos. Así es. Lo hacemos todo en una sola instalación en EE. UU. Para
brindarle soluciones informáticas resistentes de alta calidad, reducir los posibles riesgos de seguridad, respaldar la economía estadounidense y
los trabajos estadounidenses, y ofrecer un servicio y soporte interno al cliente súper rápido.
RAID 0: ¿qué hay tras este nivel de RAID?
En la lista de los niveles más comunes de RAID, el RAID 0 ocupa un lugar fijo, aunque en sentido estricto este estándar no sea un Redundant Array
of Independent Disks (así es como se desglosa RAID). El principio base, es decir, el almacenamiento redundante de datos, no se da en este tipo de discos duros
interconectados. En una matriz RAID 0, siempre compuesta por al menos dos medios de almacenamiento, se forma una unidad lógica individual cuyo único objetivo
es la optimización del acceso de lectura y escritura. Sin embargo, no aumenta la seguridad de los datos como en otros niveles RAID.
¿Qué es RAID 0?
RAID 0 es un nivel estandarizado de RAID que describe la unión de dos o más discos en beneficio de una optimización del rendimiento. Con este fin, se
distribuyen todos los datos de manera uniforme en bandas (stripes) o bloques entre los dispositivos de almacenamiento implicados. Por eso, la tecnología base se
conoce como “striping”. Por ejemplo, en el proceso de escritura, el disco 1 recibe el bloque de datos A1, mientras que, al mismo tiempo, el disco 2 almacena el
bloque de datos A2. Juntos, ambos bloques dan como resultado el conjunto de datos A o una parte de este grupo de datos (dependiendo del tamaño). Si el conjunto
de datos se solicita más tarde, puede leerse en paralelo, de la misma manera que se había almacenado en los discos.
Nota
El tamaño de los bloques individuales también se denomina tamaño de franja o chunk size en círculos técnicos. Suele ser de 64 kilobytes (KB).
RAID 0 maximiza tanto la velocidad de lectura como la de escritura gracias al método striping. Sin embargo, si un disco falla, los datos se pierden ya que los
discos intactos solo han almacenado sus respectivos stripes.
Definición
Un RAID (Redundant Array of Independent Disks) es una matriz de al menos dos dispositivos de almacenamiento distintos que crean una única unidad lógica
grande. Las configuraciones de los discos son las que determinan la función concreta que se define en los niveles de RAID como RAID 0. Entre los puntos
fundamentales se encuentran la seguridad de datos y una tasa de transferencia de datos mejorada.
Diagrama del principio de RAID 0
En principio, no importa cuántos discos compongan una matriz RAID 0, es decir, un grupo de distintos discos que sigue el estándar RAID 0. No obstante, obviamente
cuanto mayor sea la cantidad de discos, mayor es la complejidad y los gastos de administración. El software operativo que conecta los soportes de datos a una
única unidad lógica tiene más trabajo con cada componente adicional.
En el siguiente diagrama, se utilizan a modo de ejemplo cuatro discos. Los conjuntos de datos A, B y C tienen el mismo tamaño. Los datos se reparten
uniformemente para que cada dispositivo de almacenamiento contenga un cuarto de la división de datos correspondiente.
La gran desventaja en comparación con tener un único medio de almacenamiento es la mayor probabilidad de fallo. Todos los discos de la matriz pueden fallar por
problemas de hardware o software, algo que garantiza simultáneamente el fallo de todo el sistema. Por lo tanto, el riesgo de un fallo total aumenta automáticamente
con una mayor cantidad de soportes de datos vinculados.
Además, está el hecho de que tal escenario esté casi sin excepción asociado a una pérdida de la mayoría de los datos almacenados si aplicamos una estrategia
de copia de seguridad independiente. Como mencionamos al principio, el RAID 0 no ofrece ninguna redundancia en comparación con otros RAID, por lo que al
reconstruir las divisiones de datos más grandes, que se han distribuido entre todos los componentes del RAID, faltarán las partes del disco defectuoso después del
fallo. Solo es posible reconstruir los archivos más pequeños que se encuentran en las memorias individuales aún intactas del RAID 0.
Mayor ancho de banda que en una unidad Mayor probabilidad de fallo que en una unidad
individual individual
Consejo
Las copias de seguridad periódicas son esenciales para proteger a largo plazo los datos sensibles y personales. Con la copia de seguridad en la nube de IONOS
aseguras los datos de tu infraestructura informática, tu smartphone o tu PC encriptados en los centros de datos certificados de IONOS.
La característica exclusiva de RAID 0 es la falta de un mecanismo de seguridad. El resto de niveles estandarizados de RAID se basan en métodos que evitan la
pérdida de datos. Algunos enfoques como el RAID 1 o la combinación RAID 10 utilizan un método de espejo con los datos. Todos los archivos se almacenan
siempre en al menos dos discos duros diferentes. Otros modelos como RAID 5 y RAID 6 recurren a la información de paridad, que se genera durante el proceso de
escritura para reconstruir los datos en caso de que falle el hardware.
Consejo
En nuestra comparativa de niveles de RAID entramos de lleno en las diferencias y similitudes de los conceptos RAID más importantes.
¿Qué es un RAID 1?
El RAID 1 es un estándar cuyo objetivo es mejorar la seguridad de los datos almacenados. Para lograrlo, el concepto se basa en una matriz de dos o más discos
duros que almacena todos los datos en forma de espejo, es decir, por duplicado. Este reflejo de los datos, que es fundamental para el RAID 1, se conoce como
“mirroring” (espejo). En un RAID 1, todos los datos escritos y guardados en el disco duro 1 se escribirán también en el disco 2 y los demás discos, mediante lo cual el
sistema ofrece una redundancia completa en el factor deseado. Si un disco falla, el siguiente tomará el relevo.
Nota
La máxima capacidad de una matriz de RAID 1, es decir, un grupo de discos que sigue el estándar de RAID nivel 1, solo es tan alta como la cuota de
almacenamiento del disco vinculado más pequeño.
Si la controladora RAID (de un hardware RAID) o el software de gestión ofrecen esa función, es posible incrementar aún más la seguridad controlando más de un
disco duro durante el proceso de lectura y comparando entre sí los flujos de datos leídos. En caso de que haya discrepancias, el sistema emite un aviso de error.
De esta manera se puede detectar los posibles problemas de hardware de manera precoz. No obstante, en este caso el rendimiento del sistema se deteriora
ligeramente. Otra cosa que puede mejorar con la funcionalidad adecuada de las instancias de control es la velocidad de lectura. Para hacerlo, el sistema RAID 1
accede a más de un disco duro durante la lectura y lee paralelamente distintos sectores de estos discos, de manera similar a lo que ocurre con un grupo de
discos RAID 0. Así, la potencia de salida de dos soportes de datos vinculados se duplica.
Definición
Un RAID (Redundant Array of Independent Disks, o un grupo redundante de discos independientes) es una matriz de al menos dos unidades de almacenamiento de
datos distintas que componen una única unidad lógica grande. La función concreta de este sistema viene determinada por la configuración de los discos duros, que
se define en niveles de RAID, como el RAID 1. Entre los puntos clave se encuentran la seguridad de los datos y una mejor velocidad de transferencia de datos.
El siguiente diagrama representa el principio de funcionamiento del RAID 1 utilizando como ejemplo una variante de combinación clásica con solo dos discos duros.
Diagrama “RAID 1 con dos discos duros”
Nota
No hay que confundir un RAID con una alternativa o sustituto de una copia de seguridad. Si los datos de una matriz RAID 1 se pierden, por ejemplo, porque se han
borrado accidentalmente o porque un bloque de datos se ha dañado, no hay forma de recuperarlos.
Como mencionamos, el RAID 1 ofrece como ventaja una mayor velocidad de lectura y una protección adicional del disco duro si la controladora o el software de
gestión permite acceder a más de una unidad de almacenamiento al mismo tiempo. En el primer caso es posible accediendo a distintos sectores en paralelo; en el
segundo, sincronizando los datos.
La gran ventaja, una redundancia completa, también conlleva que se debilite considerablemente el sistema RAID 1. Dado que cada disco de la matriz debe contar
con el mismo stock de datos, automáticamente se pierde mucha capacidad de almacenamiento posible. Como conclusión inversa esto significa que el RAID 1 es
como mínimo el doble de caro (cuando se unen dos discos) que un soporte de datos con la misma capacidad de almacenamiento. Si lo comparamos con otros
niveles de RAID que generan redundancia gracias a la paridad, otra desventaja es el elevado coste del RAID 1.
Ventajas Inconvenientes
Consejo
Realizar copias de seguridad periódicamente también es adecuado en configuraciones de hardware con RAID 1. Las copias de seguridad en la nube de IONOS
aseguran los datos de tu infraestructura informática, tu smartphone o tu PC cifrados en los centros de datos certificados de IONOS.
¿Qué es un RAID 5?
Un RAID 5 es una matriz de tres o más discos duros que funcionan como una unidad lógica y que supera considerablemente a los soportes de datos individuales
en términos de seguridad ante los fallos y velocidad de lectura. Para poder ofrecer estas dos ventajas, el sistema RAID 5 apuesta por dos procesos activos
conjuntamente. Por una parte, una matriz de este estilo distribuye los datos que se van a almacenar en todos los discos conectados simultáneamente, lo que se
conoce como “striping” (del inglés “stripes”, franjas, divisiones). Por otra parte, un RAID 5 calcula la información de paridad adecuada para todos los datos de
usuario almacenados, que también se distribuye a las diferentes unidades de almacenamiento. El sistema de almacenamiento permite entonces reconstruir los
bloques de datos perdidos o dañados mediante el vínculo XOR.
Hecho
XOR significa “eXclusive OR” (exclusivo o). Una disyunción exclusiva vincula dos mensajes uniendo dos dígitos del mismo nombre “exclusivo o”, “o este o este”. Para
los datos de una matriz RAID 5, implica lo siguiente: todos los elementos individuales de una división de datos que se distribuyen uniformemente en los discos se
conectan mediante la disyuntiva exclusiva (XOR) con la información de paridad correspondiente. Si los dispositivos acceden al stock de datos, pueden leer,
por ejemplo, los datos A1 del disco 1 directamente desde este disco o reconstruirlos con el bloque de paridad Ap.
La capacidad total que ofrece un sistema RAID 5 para datos de usuario se calcula con la siguiente fórmula:
Definición
Un RAID (Redundant Array of Independent Disks) es una matriz de al menos dos unidades de almacenamiento distintas que forman una gran unidad lógica
individual. La configuración de los discos determina la función concreta del RAID, que se define en niveles, como RAID 5. Entre las características clave se
encuentran la seguridad de los datos y una mejor velocidad de transferencia de datos.
Para entender mejor el funcionamiento de RAID 5, el siguiente diagrama ilustra el almacenamiento de datos de un sistema de este tipo con tres discos duros a modo
de ejemplo.
Otro punto fuerte de RAID 5 es que aumenta la seguridad ante fallos. Si un disco falla porque está defectuoso o se pierden los datos de un disco por algún otro
motivo, el funcionamiento se mantiene. No obstante, como las otras unidades de almacenamiento se utilizan a pleno rendimiento durante el proceso de restauración,
en este momento aumenta considerablemente el riesgo de fallos.
El enfoque del RAID 5 no está libre de inconvenientes. Cada proceso de escritura del grupo de discos está vinculado a un paso adicional de lectura para comprobar
y recalcular la información de paridad ya existente. A continuación, hace falta otro paso para distribuir los datos de paridad en los datos de usuario recién
guardados en los discos. Por eso, en comparación con las unidades individuales y otros niveles RAID como el RAID 0, la velocidad de escritura de los soportes de
datos en un sistema RAID 5 es mucho menor.
Ventajas Inconvenientes
Nota
Un RAID 5 no es una copia de seguridad. Si falla más de un disco de la matriz, la mayoría de datos no podrán restaurarse, solo los datos más pequeños presentes
en los discos intactos.
En nuestra comparativa de niveles RAID puedes encontrar una comparación detallada de los distintos niveles.
Consejo
¿Buscas una solución en la nube para asegurar tus dispositivos o sistemas? Backup Cloud de IONOS almacena tus datos de manera segura y encriptada en los
centros de datos certificados de IONOS.
RAID 6: la matriz de discos con una elevada seguridad ante fallos
Desde hace décadas existe la tradición de agrupar diversos discos en una unidad lógica individual. Con el paso de los años, distintas configuraciones
han demostrado ser especialmente exitosas, por lo que se han estandarizado como niveles RAID (Redundant Arrays of Independent Disks). El RAID 6 es un
enfoque poco utilizado pero bastante relevante gracias a su elevada fiabilidad. Sigue leyendo para saber qué hace tan especial a este enfoque RAID, qué puntos
fuertes y débiles tiene y para qué ámbitos de aplicación es adecuado.
¿Qué es RAID 6?
El RAID 6 es un principio de almacenamiento en el que se combinan cuatro o más discos duros en una unidad lógica individual. De esta manera, aumentan la
fiabilidad y al mismo tiempo la velocidad de lectura en comparación con los soportes de datos individuales. Para esto es fundamental la combinación de striping y
paridad, que también se aplican en el nivel original RAID 5. No es casualidad que el RAID 6 también se conozca como la extensión de RAID 5.
Los sistemas RAID 6 implementan el enfoque del striping de la manera clásica: todos los datos se dividen en bloques y reparten uniformemente en los discos duros
conectados. Esto brinda a los usuarios la posibilidad de acceder simultáneamente a varios discos y leer parte de los bloques de una franja de datos en paralelo.
Con relación a la paridad, el RAID 6 toma su propio camino. El sistema almacena siempre dos frases de información de paridad, lo que en caso de fallo de uno o dos
discos permite restaurar los datos vinculados con ellos. Para ello, el sistema RAID 6 utiliza la disyuntiva XOR o la mezcla con la corrección de errores de varios
bits mediante el código Reed-Solomon. Este último mecanismo de corrección también es demandado, por ejemplo, en la transmisión de señales de televisión
según el estándar DVB, en el que mejora la tasa de error binario de la señal recibida.
Nota
XOR significa “Exclusivo O” (del inglés, eXclusive OR). Las conexiones XOR vinculan dos mensajes uniendo dos dígitos del mismo nombre "exclusivo o", "o este o
este". Para los datos de una matriz RAID 6, implica lo siguiente: todos los elementos de una división de datos se unen en el proceso de escritura con la información
de paridad correspondiente mediante la lógica XOR. Si los dispositivos acceden al stock de datos, pueden reconstruir los datos correspondientes gracias al
bloque de paridad adecuado en caso de que no estuvieran disponibles.
La capacidad total de un sistema RAID 6 se reduce considerablemente frente al almacenamiento de una unidad individual. El lugar disponible para los datos de
usuario se calcula con la siguiente fórmula:
Definición
Un RAID (Redundant Array of Independent Disks) es una matriz de al menos dos unidades de almacenamiento que forman una única gran unidad lógica. Su función
concreta viene determinada por la configuración específica de los discos, que se define en niveles RAID, como el RAID 6. La fiabilidad y una mejorada velocidad de
transferencia de datos son algunos de los puntos fundamentales.
Nota
La mayor fiabilidad de un RAID 6 no debe equipararse con asegurar los datos mediante una copia de seguridad. Una matriz de discos RAID nunca debe verse como
una alternativa; solo una extensión de la solución de copia de seguridad.
Las ventajas del RAID 6 también están estrechamente vinculadas a los puntos fuertes del RAID 5 en otros aspectos, como es la posibilidad de un acceso en
paralelo, que garantiza una mejor tasa de rendimiento en la lectura de datos. No obstante, mediante la doble paridad, esta ventaja está más reducida que con los
sistemas del nivel 5. La relación entre espacio libre para datos de usuario y el espacio omitido (para la paridad) también es menor que con el RAID 5. Sin embargo, el
RAID 6 ya ofrece una mejor utilización de los recursos a partir de cinco discos (que también mejora con cada disco adicional) que los RAID que dependen
completamente de reflejar los datos con el método espejo.
En comparación con una unidad individual, la reducción significativa del posible espacio de almacenamiento es una clara desventaja, que se dará sobre todo
con la configuración mínima de cuatro discos (solo el 50 % de almacenamiento). El rendimiento de la escritura también es uno de los inconvenientes claros de una
matriz RAID 6. Si los datos se almacenan en discos enlazados, cada vez se lleva a cabo un doble cálculo y distribución de la paridad. La tasa de escritura
minimizada resultante se nota sobre todo en la reconstrucción del sistema, es decir, al integrar un nuevo hardware para sustituir copias defectuosas.
Ventajas Inconvenientes
Para más información sobre las similitudes y diferencias de los distintos conceptos consulta nuestra detallada comparativa de niveles RAID.
RAID 10: la combinación de RAID basada en el espejo y el striping
Aunque el factor original del ahorro de costes está en segundo plano y muchas veces ni siquiera se menciona, los RAID siguen utilizándose hoy día, sobre todo en
entornos de servidores. El objetivo de los distintos estándares, que llamamos niveles RAID, es principalmente optimizar la seguridad de los datos y el rendimiento.
También existe la opción de combinar los niveles, como en el caso de RAID 10, para unir los puntos fuertes de distintos enfoques.
¿Qué estándares se unen en la combinación del RAID 10? ¿Qué ventajas y desventajas tiene este sistema tan complejo? ¿Y cómo funciona exactamente la
agrupación de un RAID 10?
Al seguir el principio base del RAID 1, se aplica el método del espejo con los datos de un grupo RAID 10. Todos los datos están disponibles al menos por duplicado,
por lo que se garantiza una redundancia completa. Además, también se hace un striping de los datos. Los bloques de datos se descomponen en divisiones
individuales (en inglés, stripes) y se almacenan de manera distribuida en los discos que forman el RAID 10. Por tanto, las unidades de almacenamiento de una matriz
RAID 1 siempre tienen el mismo estado de datos, el cual difiere del estado de datos del resto de matrices RAID 1. De esta manera, cada matriz gestiona partes
separadas de la información, por lo que este estado no es evidente para una aplicación que acceda a él.
Nota
Ambos procesos pueden realizarse también en orden inverso. Primero se generan las divisiones y luego se duplican todos los datos, más concretamente, un RAID
1 a partir de varias instancias de RAID 0. Para designarlo, se suele utilizar el nombre RAID 0+1 o RAID 01. Sin embargo, en teoría, el reflejo de bloques de datos
que ya han sido divididos en franjas es más propenso a errores que el striping de una estructura de datos en espejo.
En un RAID 10, si un disco duro falla, puede compensarse por subgrupo, es decir, por RAID 1, ya que en todo momento se dispone de una variante en espejo con
exactamente el mismo stock de datos. Sin embargo, esto también significa que como mucho la mitad de la capacidad de almacenamiento de las unidades
individuales está disponible para los datos de usuario. Al mismo tiempo, la distribución uniforme de los datos garantiza que los usuarios se beneficien de una mayor
velocidad de lectura al acceder a los datos.
Definición
Un RAID (Redundant Array of Independent Disks) es una matriz de al menos dos unidades de almacenamiento que forman una única gran unidad lógica. Su
configuración concreta depende del nivel RAID elegido; los niveles también pueden combinarse entre sí como el RAID 10 (1+0). La fiabilidad y un aumento del
rendimiento de los discos son algunos de los puntos fundamentales.
Para explicar el funcionamiento de este nivel RAID, representamos en el siguiente gráfico la estructura y el almacenamiento de datos de un sistema RAID 10 con
cuatro unidades de almacenamiento.
Nota
En teoría, el RAID 10 ofrece asimismo una mejor velocidad de lectura, dado que los datos nuevos se pueden escribir en los discos en paralelo. No obstante, como
el sistema también tiene que generar siempre una copia exacta de estos datos, en la práctica no hay una mejor tasa de entrada.
La combinación de striping y método de espejo de los datos, que es relativamente costosa, no solo tiene ventajas. Hay dos inconvenientes que cabe resaltar
especialmente. Por una parte, limita considerablemente la capacidad de almacenamiento máxima, ya que por cada gigabyte de datos de usuario, también hay
que calcular un gigabyte para la copia de los datos. Por otra parte, RAID 10 conlleva el riesgo de una pérdida directa de los datos si ambos soportes de una pareja
de espejo caen simultáneamente. En este caso, el fallo de dos discos no se puede compensar con el striping (a diferencia del fallo de dos discos de subgrupos
distintos).
Ventajas Inconvenientes
Mayor fiabilidad de los discos implicados El fallo de dos discos de un subgrupo lleva a la
caída de todo el sistema
Por tanto, los típicos ámbitos de aplicación son los servidores de bases de datos y servidores de aplicación que dependen de una alta fiabilidad y una buena tasa
de salida.
Nota
Las matrices RAID como RAID 10 ofrecen una elevada fiabilidad, pero nunca deberían entenderse como una alternativa a una estrategia de copia de seguridad. Las
copias de seguridad almacenan datos separados temporal y espacialmente de los datos originales: una medida de seguridad que permite restauraciones
posteriores, algo que no desempeña ningún papel en los conceptos RAID.
RAID es una tecnología para implementar la tolerancia a fallas en un subsistema de disco mediante el uso de redundancia de datos.
¿Qué es RAID?
RAID significa matriz redundante de discos independientes, es una tecnología para implementar la tolerancia a fallas en un subsistema de disco
usando redundancia de datos, ya sea usando software o usando una unidad de almacenamiento RAID de hardware separada.
Ejemplo de RAID
Los datos se distribuyen entre las unidades de una de varias formas, denominadas niveles RAID, según el nivel requerido de redundancia y
rendimiento. Los diferentes esquemas, o diseños de distribución de datos, se nombran con la palabra "RAID" seguida de un número, por
ejemplo, RAID 0 o RAID 1. Cada esquema, o nivel de RAID, proporciona un equilibrio diferente entre los objetivos clave: confiabilidad,
disponibilidad , rendimiento y capacidad. Los niveles de RAID superiores a RAID 0 brindan protección contra errores de lectura de sector
irrecuperables, así como contra fallas de unidades físicas completas.
RAID 0 (división del disco): los datos se escriben en un disco en bandas. Los conjuntos de bandas no proporcionan tolerancia a fallos,
pero proporcionan un rendimiento de lectura / escritura rápido. Windows NT Server y Windows 2000 Server admiten RAID 0.
RAID 1 (duplicación de disco): los datos se escriben simultáneamente en dos (o más) discos, lo que hace que una unidad de disco sea
una imagen duplicada de la otra. Se puede duplicar cualquier partición del sistema de archivos NTFS, incluida la partición de arranque o del
sistema. El uso de conjuntos de réplicas mejora ligeramente el rendimiento de lectura, pero no tiene ningún efecto sobre el rendimiento de
escritura en un sistema de disco único. Windows NT Server y Windows 2000 Server admiten RAID 1.
RAID 2 (división de discos con verificación y corrección de errores [ECC]): la información se almacena en varios discos.
RAID 3 (división de discos con paridad ECC): la información de paridad se escribe en un solo disco para la recuperación de errores.
RAID 4 (división de discos con bandas grandes): los registros completos se escriben en unidades individuales y la información de
paridad se almacena en un solo disco para la recuperación de errores.
RAID 5 (división de discos con paridad): tanto los datos como la información de paridad se escriben en todos los discos en bandas
para proporcionar una recuperación total de datos en caso de que falle una sola unidad. La creación de bandas en discos con paridad es una
manera excelente de proteger los datos del tiempo de inactividad causado por fallas en el disco. RAID 5 requiere un mínimo de tres discos y
es compatible con Windows NT Server y Windows 2000 Server.
RAID 6 (división de discos con dos esquemas de paridad): una extensión de RAID 5 que tiene tolerancia a fallas adicional
incorporada y está diseñada para proteger los datos contra múltiples unidades de disco fallidas simultáneamente. No es de uso común.
RAID 10 (división de discos con duplicación de discos): una solución costosa que tiene el mismo nivel de tolerancia a fallas que RAID
1. No se usa comúnmente.
RAID 53 (división de discos de conjuntos de bandas): consta de un conjunto de bandas (RAID 0) de matrices de discos RAID-3
individuales. RAID 53 tiene el mismo nivel de tolerancia a fallos que RAID 3. Es muy caro y no se utiliza habitualmente.
Windows Server proporciona una solución RAID basada en software en la que el software del sistema operativo habilita varios tipos de
funcionalidad RAID en el subsistema de disco interno, generalmente una interfaz de sistema de computadora pequeña (SCSI) o subsistema de
disco SAS. El otro tipo de solución RAID es el RAID basado en hardware, en el que las matrices de discos RAID-5 externas independientes
suelen conectarse a servidores mediante conexiones SCSI o de canal de fibra.
Cuando compre una unidad RAID-5 de hardware, asegúrese de que tenga capacidades de reconstrucción en caliente, intercambio en caliente y
repuesto en caliente. Estas funciones protegen los datos críticos para la empresa y garantizan una alta disponibilidad.
Foto: Unidad de almacenamiento resistente JBOD / JBOF de Trenton Systems . Los 24 SSD NVME de esta unidad se pueden configurar en RAID para un mejor
rendimiento y un mayor grado de tolerancia a fallas.
RAID (Redundant Array of Independent Disks)
El concepto RAID incrementa la fiabilidad de las memorias de datos. Se desarrolló para los clásicos discos duros HDD y hoy en día sigue utilizándose en el
entorno de los servidores.
Un RAID (Redundant Array of Independent Disks) es una matriz de al menos dos unidades de almacenamiento distintas convertidas en una única unidad lógica
grande. El principio base de un sistema RAID es almacenar datos de manera redundante, lo que garantiza que la integridad y funcionalidad de la matriz completa
no queden comprometidas por un fallo en un disco duro.
El término “RAID” se utilizó por primera vez en 1988 en la publicación “A case for redundant arrays of inexpensive disks (RAID)” de un grupo de informáticos de la
Universidad de California en Berkeley. En esa obra, los autores debaten la posibilidad de combinar discos duros para PC de bajo coste en una matriz y hacerlos
funcionar como una gran unidad lógica para tener una alternativa a los entonces costosísimos discos duros SLED (Single Large Expensive Disks) de las unidades
centrales. Como con esto, el riesgo de fallo aumenta automáticamente, el concepto prevé el almacenamiento redundante de datos.
En los años siguientes, RAID se estandarizó y desarrolló cada vez más, pasando a primer plano su uso en aplicaciones de servidor. Como resultado, el ahorro de
costes dejó de desempeñar un papel importante; ahora el objetivo principal de la matriz era sustituir fácilmente los discos duros durante el funcionamiento sin dar
problemas. El desglose del acrónimo RAID: Redundant Array of Independent Disks (matriz redundante de discos independientes en español) hace referencia a esta
misma función. La tecnología RAID está basada en las propiedades de los discos duros HDD clásicos. Los SSD modernos también se dejan agrupar, pero pierden
rendimiento y, debido a la falta de funcionalidad TRIMP en los RAID, también vida útil.
El papel de los sistemas RAID en los entornos de servidores
Los sistemas RAID siguen siendo demandados como una parte importante de los entornos de servidores. Su aspecto más relevante es la redundancia de los datos
almacenados que en este caso no se equiparan a una copia de seguridad al uso. En las estructuras de servidores, los RAID están pensados para que el fallo de un
solo disco duro no tenga consecuencias, ya que los datos que contiene están también archivados en otros lugares de la matriz RAID.
Otra de las ventajas que tiene utilizar un sistema RAID es el aumento de la capacidad de almacenamiento y una mayor velocidad de lectura y escritura al
acceder a las memorias de disco duro.
Nota
Desde el punto de vista del usuario, una matriz RAID, que está compuesta siempre como mínimo de dos dispositivos de almacenamiento, no se diferencia de un
único soporte de datos lógico.
La forma exacta en la que interactúan los dispositivos de almacenamiento individuales de un sistema RAID y la función que finalmente debería realizar una matriz
en una red de servidores pueden variar enormemente. No obstante, existen distintas configuraciones estandarizadas que definen los niveles RAID. Además, se
distingue entre los RAID de software y de hardware en función de si la interacción de la matriz se organiza en el software o en el hardware.
¿Qué diferencia hay entre los RAID de software y de hardware?
La categorización en RAID de software o de hardware puede dar una idea equivocada de en qué consisten estos dos tipos de matrices de discos duros. Para su
funcionamiento, ambas variantes necesitan software; los términos hacen referencia únicamente al tipo de implementación.
En los RAID por hardware, la organización de los dispositivos de almacenamiento individuales recae en un hardware especial y potente, también
llamado controladora RAID. Esta controladora se instalará, o bien en la torre del ordenador o en una matriz de discos (“disk array”), en la que también se alojan los
discos duros. Esta última variante es la preferida por los centros de procesamiento de datos, donde los sistemas externos suelen utilizarse bajo las denominaciones
DAS (Direct Attached Storage), SAN o NAS. La gran ventaja de una organización de RAID por hardware es el excelente rendimiento, que se traduce, entre otras
cosas, en una elevada velocidad de transferencia de datos.
En un RAID por software, un software que se ejecuta directamente en la CPU del host asume la gestión de la cuota de almacenamiento. Por esta razón, también
se conoce como sistema RAID basado en host. Los sistemas operativos comunes como Windows (a partir de NT) o las distribuciones de Linux proporcionan los
componentes necesarios para este RAID, que, en comparación con la alternativa de hardware, es mucho más barato y rápido de configurar. Los inconvenientes de
este sistema son la alta carga de CPU para el host y la falta de independencia de la plataforma. Además, el rendimiento también es peor, ya que los accesos al disco
no pueden regularse de manera tan elegante como con una controladora RAID:
Visión general de los niveles RAID más comunes
Los números de los distintos niveles no tienen ninguna relación; solo indican los diferentes enfoques para la estructura y la posterior función del RAID. Los niveles
más utilizados son RAID 0, RAID 1, RAID 5 y RAID 6. También se pueden combinar dos niveles RAID. RAID 10, por ejemplo, se refiere a un sistema RAID 0
ensamblado a partir de varios sistemas RAID 1.
Nota
Los niveles RAID presentados a continuación indican los sistemas RAID estandarizados por la Raid Advisory Board (RAB). Paralelamente, existen numerosas
configuraciones RAID específicas a algunos fabricantes con nombres o designaciones individuales que sin embargo no incluimos en este artículo.
RAID 0: striping
En sentido puramente estricto, las matrices de discos duros que llevan la etiqueta RAID 0 no cuentan como sistemas RAID, ya que no se basan en la redundancia
para el almacenamiento. Este modelo solo sirve para acelerar el acceso a los datos combinando dos o más discos duros en una unidad lógica. Para ello, los
datos se distribuyen uniformemente entre los distintos soportes de datos en bloques sucesivos. Estos bloques se denominan stripes en inglés, por lo que el
RAID 0 también se conoce como “striping”. Mientras que la matriz proporciona más capacidad de almacenamiento y una mayor tasa de rendimiento, también
reduce automáticamente la seguridad. Si un disco duro falla, se pierden todos los datos. Para más información sobre el enfoque del striping, consulta nuestra
detallada guía sobre RAID 0.
RAID 1: espejo
El RAID de nivel 1 se conoce como “espejo”. En esta matriz, todos los discos duros integrados presentan el mismo estado de datos en todo momento, por lo que
ofrece una redundancia completa y puede suplir fácilmente el fallo de las unidades de almacenamiento individuales. Como consecuencia, la capacidad del RAID
siempre es, como mucho, tan alta como la capacidad del disco duro más pequeño involucrado. La velocidad de escritura de un RAID 1 es tan rápida como la de una
unidad individual, pero si se conectan los discos implicados a sus propios canales, como por ejemplo en SATA, la velocidad de lectura se duplica. Para más
información sobre el método de almacenamiento del “espejo”, consulta nuestro completo artículo temático “RAID 1”.
El RAID 5 describe una matriz de tres o más discos cuya cantidad suele ser impar: tres, cinco, siete, etc. El concepto de almacenamiento utiliza el striping conocido
por el RAID 0 y distribuye los datos en bloques en los distintos soportes de datos. Junto con los bloques de datos, la información paritaria se distribuye
uniformemente por los discos montados; esto puede utilizarse para recuperar los datos perdidos si falla un dispositivo de almacenamiento. Por eso, RAID 5
proporciona una mayor velocidad de lectura, así como más seguridad que una unidad individual. Al recalcular constantemente los bloques de paridad, la
velocidad de escritura se reduce, pero en comparación solo ligeramente. Obtén más información sobre este concepto en nuestro especial artículo sobre RAID 5.
RAID 6: striping con doble información de paridad distribuida
El nivel RAID 6 tiene un enfoque similar al del RAID 5. Con él también se distribuyen los datos en bloques uniformemente por los componentes de almacenamiento
integrados. Mediante la información de paridad, aumenta la seguridad. Sin embargo, estos últimos datos que se recuperan se generan por duplicado, por lo que
este tipo de RAID puede lidiar con el fallo simultáneo de hasta dos discos (con una cantidad mínima de cuatro). De esta manera, la matriz ofrece una alta seguridad
de datos y un buen acceso a la lectura. Dado que el cálculo de los bloques de paridad requiere aún más tiempo que con el RAID 5, la velocidad de escritura es
incluso menor. En nuestra guía específica sobre RAID 6 examinamos los puntos fuertes y débiles del striping con doble información de paridad distribuida más de
cerca.
El RAID 10, o RAID 1+0, combina las propiedades de RAID nivel 0 y RAID nivel 1: una mayor velocidad de transmisión de datos y una elevada seguridad de
datos. Con este fin, se juntan varios sistemas RAID 1 en una matriz RAID 0, donde se necesitan al menos cuatro discos. Te explicamos en detalle cuándo merece la
pena esta combinación y qué desventajas tiene en nuestro artículo sobre RAID 10.
Al montar y poner en funcionamiento un sistema RAID, hay que tener varias cosas en cuenta. La primera pregunta es inevitablemente qué tipo de matriz instalar. Si
por ejemplo únicamente queremos aumentar el rendimiento de los datos, tenemos disponible, además de un sistema de nivel 0, una unidad SSD como alternativa. Si
en cambio lo que queremos es aumentar la seguridad de los datos, con el espejo (por ejemplo, el nivel 1) y el almacenamiento con información de paridad (por
ejemplo, el nivel 5) contamos con dos enfoques distintos.
A la hora de seleccionar discos duros, lo ideal es dar preferencia a modelos idénticos. En muchas configuraciones RAID, el volumen máximo de
almacenamiento se basa en el disco más pequeño, por lo que con distintos tamaños se perdería potencial de almacenamiento. Es aún más importante confiar en
un hardware, como los discos duros NAS, que están diseñados para ser muy longevos. El tamaño de los soportes de datos también desempeña un papel al
sustituir posteriormente hardware defectuoso o al ampliar el RAID. Los componentes nuevos han de tener como mínimo el tamaño del soporte de datos más
pequeño que se ha utilizado hasta el momento o del soporte de datos defectuoso.
Otra cuestión que nunca deberíamos olvidar al utilizar una matriz RAID: la interacción de los diferentes discos duros aumenta la seguridad de los datos almacenados
mediante la redundancia, pero una copia de seguridad bien organizada no puede ni debe sustituir a un RAID.
Consejo
¿Buscas una solución para crear copias de seguridad seguras y sencillas de tu smartphone, tu PC o tu nube? Con Backup Cloud de IONOS obtendrás una
protección fantástica para todos tus datos y dispositivos.