Tecnología RAID

ASIGNATURA:

MANTENIMIENTO DE HARDWARE

TEMA:

TECNOLOGÍA RAID

PROFESOR:

OSCAR GIOVANNI LAZO ÁLVAREZ

ALUMNOS:

RIGOBERTO ALEXANDER DIAZ GARCIA

JOSE LUIS GUZMAN MARTÍNEZ

GRUPO:

EEV10

FECHA DE ENTREGA:

SANTA TECLA, 28 DE NOVIEMBRE DE 2010

Tecnología RAID (Redundant Array of Independent Disks)

(Arreglo Redundante de Disco Independientes)

Qué es RAID?

Acrónimo de "RedundantArray of Independent Disks" (matriz redundante de discos

independientes), RAID es un método de combinación n de dos a más discos duros para

formar una única unidad lógica en la que se almacenan los datos de forma redundante. Para

el sistema operativo aparenta ser un sólo disco duro lógico.

La tecnología RAID (excepto en el nivel 0) protege los datos contra la caída de un disco

duro. Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta

que se sustituye la unidad defectuosa.

Todos los sistemas RAID suponen la pérdida de parte de la capacidad de almacenamiento

de los discos para almacenar los datos de paridad y conseguir la redundancia.

La idea del RAID fue presentada primero por David A. Patterson, Garth Gibson y Randy

H. Katz en la Universidad de California en Berkeley en 1998. RAID tiene el propósito de

almacenar la misma información en diferentes lugares y en múltiples discos duros además

de mejorar el desempeño del subsistema de almacenamiento.

La ventaja de RAID es proporcionar un mejor desempeño en la transferencia de datos y/o

tolerancia a fallas. El mejor desempeño se cumple al distribuir la carga de trabajo en

paralelo entre múltiples discos duros físicos. La tolerancia a fallas se alcanza a través de la

operación de redundancia, dónde si una (o más) de las unidades fallas o tiene un sector

defectuoso, una copia espejo de los datos se puede encontrar en otra de las unidades.

Un RAID aparece en el sistema operativo como un solo disco duro lógico. El controlador

RAID controla como los datos se almacenan y se acceden a través de los arreglos físicos y

lógicos. El controlador RAID ayuda a los usuarios a asegurar que el sistema operativo solo

ve las unidades lógicas y los usuarios no necesitan preocuparse acerca de la administración

de este complicado esquema.

Para resultados óptimos de desempeño, seleccione discos duros idénticos para los arreglos,

esto ayuda al desempeño y al funcionamiento del arreglo como un solo disco duro.

Conceptos básicos relacionados a RAID

Para entender cómo funciona la tecnología RAID debemos entender los conceptos o

principios sobre los que se basa. Dichos principios son:

Mirroring: Consiste en copiar los datos en más de un dispositivo.

Striping: es la división de la data en los múltiples discos duros.

Corrección de errores: Es donde la data redundante es guardada para permitir la corrección

de errores y su posible reparación

Hot Swap o Intercambio en Caliente: Esta característica permite cambiar un disco

defectuoso con el sistema en funcionamiento, evitando interrupciones de trabajo.

Requiere:

· Discos con conector específico. En SCSI, el conector es tipo SCA (Single Connector

Attachmnet)

· Módulo de discos con Backplane eléctronico que actúa como equilibrador de tensión

Hot Spare o Repuesto en Caliente: Un disco de recambio instalado se asigna como Hot

Spare de forma que si algún disco del RAID cae, automáticamente sustituye al defectuoso

y se reconstruye de nuevo el RAID evitando la degradación de funcionamiento.

Es el “repuesto AUTOMÁTICO” o desasistido.

La cosa interesante de RAID es que dependiendo de la configuración que se use (nivel),

cambia las funciones y propósitos del arreglo entero.

VE N TA JA S

Alta Disponibilidad: RAID aumenta el tiempo de funcionamiento y la

disponibilidad de la red.

Tolerancia a fallos: RAID protege contra la pérdida de datos y proporciona

recuperación de datos en tiempo real con acceso ininterrumpido en caso de que

falle un disco.

Mejora del Rendimiento/ Velocidad: RAID permite a varias unidades trabajar en

paralelo, lo que aumenta el rendimiento del sistema y ante el sistema principal

funcionan como un único dispositivo.

Mayor Fiabilidad: Las soluciones RAID emplean dos técnicas para aumentar la

fiabilidad: la redundancia de datos y la información de paridad

Tipos de Tecnología RAID

Por Software

El RAID lo realiza una aplicación software al 100%

· La gestión RAID la hace el procesador del sistema

· Ralentización de otras aplicaciones instaladas

· Productividad más baja del usuario

· Costes más altos de gestión y reconfiguración

· No ofrece protección para el sistema operativo

· No soporta HotSwap de discos (cambio en caliente)

Por Hardware

La gestión RAID la realiza una controladora hardware dedicada

o Independencia de la plataforma o sistema operativo

o Alto Rendimiento

o Total integridad de datos y sistema operativo

o Controlador RAID específico

o Gestiona HotSwap y HotSpare

RAID INTERNO

Los componentes que integran el RAID están ubicados en el mismo chasis que alberga la

placa base del servidor:

- Controladora RAID

- Módulo de discos (backplane)

- Discos

RAID EXTERNO

Las operaciones RAID se llevan a cabo mediante un controlador situado en el subsistema

de almacenamiento RAID externo, que se conecta al servidor mediante un adaptador de bus

de host SCSI o Fibre Channel

LOS NIVELES RAID

RAID ofrece varias opciones, llamadas niveles RAID, cada una de las cuales proporciona

un equilibrio distinto entre tolerancia a fallos, rendimiento y coste, diseñadas para satisfacer

las diferentes necesidades de almacenamiento de los usuarios.

La mayoría de los niveles RAID pueden satisfacer de manera efectiva sólo uno o dos de

estos criterios. No hay un nivel de RAID mejor que otro; cada uno es apropiado para

determinadas aplicaciones y entornos informáticos. De hecho, resulta frecuente el uso de

varios niveles RAID para distintas aplicaciones del mismo servidor.

Existen siete niveles diferentes de RAID (0 a 6) definidos y aprobados por el RAID

Advisory Board (RAB)

Nivel RAID 0

El nivel 0 es el arreglo de discos más

rápido que pueda tener, es un método

de mapeo de disco orientado al

desempeño. Los datos en este arreglo se

escriben a través de una línea o de

diferentes discos para una mejor

transferencia. Esta técnica tiene una línea pero no redundancia de datos. Ofrece el mejor

desempeño pero no es tolerante a fallas. Escribe y lee sectores de datos entre múltiples

unidades. Cuando un disco miembro del arreglo falla, afecta a todo el arreglo. El

desempeño es mejor que un solo disco debido a que la carga de trabajo esta balanceada

entre los miembros del arreglo. Este arreglo es para sistemas de alto desempeño. Se

recomienda usar unidades de disco idénticas para ayudar al desempeño así como la

eficiencia del almacenamiento de datos. La capacidad del arreglo de discos es igual al

número de miembros multiplicado por el miembro de menor capacidad. Por ejemplo un

disco de 40GB y uno de 60GB formaran una arreglo de 80GB (40GBx2).

Esquema lógico RAID 0

Nivel RAID 1

Espejo (Mirror (RAID 1):

El RAID de nivel 1 usa al menos dos

discos duros duplicados y almacena

exactamente los mismos bloques de

información entre ellos. Esta es el

método de tolerancia a fallas más

lento debido a que la información se

debe replicar en los dos discos al

mismo tiempo. Sin embargo, es el método más simple para proporcionar alta confiabilidad.

Si uno de los disco espejo sufre una falla mecánica o no responde, la unidad remanente

continuará funcionando y proporcionando los datos correctos. Si una de la unidades tiene

un error de sector físico, el disco espejo continuara la función.

Debido a la redundancia, la capacidad del arreglo es la mitad de la capacidad de las

unidades de disco. Por ejemplo dos unidades de 40GB tienen una capacidad combinada de

80GB pero tendrán una capacidad de 40GB de almacenamiento usable. Con discos de

diferentes capacidades, puede existir un espacio de almacenamiento no usado en la unidad

más grande. RAID 1 incrementa el costo porque usa el doble de discos duros para construir

el arreglo.


Raid 0+1 ó Raid 10

En Línea con Espejo (RAID 0 + RAID 1)

Como lo sugiere el nombre, RAID 0+1

es combinado. Este RAID combina la

mejor de ambos. Toma el arreglo en

línea usando dos discos, y hace espejo

con otro juego de disco para la

tolerancia a fallas. Los datos se escriben

en línea a través de varios discos, cada

disco tiene un compañero con la misma

información. Usted obtiene el beneficio

de una mayor velocidad de acceso a

datos como en RAID 0, pero con la

tolerancia a fallas de RAID 1. Esta

configuración proporciona una velocidad y confiabilidad óptimas. Se necesita el doble de

unidades de disco como en RAID 0, la mitad para cada lado del espejo. Al menos se

requieren 4 discos para implementar el RADI 0+1. Existen otras configuraciones RAID

además de las aquí mencionadas, pero estos son los tipos más comúnmente usados en la

industria.


RAID 2:

"Acceso paralelo con discos especializados. Redundancia a través

del código Hamming":

El RAID nivel 2 adapta la técnica comúnmente usada para detectar y corregir errores en

memorias de estado sólido. En un RAID de nivel 2, el código ECC (Error Correction Code)

se intercala a través de varios discos a nivel de bit. El método empleado es el Hamming.

Puesto que el código Hamming se usa tanto para detección como para corrección de errores

(Error Detection and Correction), RAID 2 no hace uso completo de las amplias capacidades

de detección de errores contenidas en los discos. Las propiedades del código Hamming

también restringen las configuraciones posibles de matrices para RAID 2, particularmente

el cálculo de paridad de los discos. Por lo tanto, RAID 2 no ha sido apenas implementado

en productos comerciales, lo que también es debido a que requiere características especiales

en los discos y no usa discos estándares.

Debido a que es esencialmente una tecnología de acceso paralelo, RAID 2 está más

indicado para aplicaciones que requieran una alta tasa de transferencia y menos conveniente

para aquellas otras que requieran una alta tasa de demanda I/O.

RAID 3:

"Acceso síncrono con un disco dedicado a paridad":

Dedica un único disco al almacenamiento de información de paridad. La información de

ECC (Error Checking and Correction) se usa para detectar errores. La recuperación de

datos se consigue calculando el O exclusivo (XOR) de la información registrada en los

otros discos. La operación I/O accede a todos los discos al mismo tiempo, por lo cual el

RAID 3 es mejor para sistemas de un sólo usuario con aplicaciones que contengan grandes

registros.

RAID 3 ofrece altas tasas de transferencia, alta fiabilidad y alta disponibilidad, a un coste

intrínsecamente inferior que un Mirroring (RAID 1). Sin embargo, su rendimiento de

transacción es pobre porque todos los discos del conjunto operan al unísono.

Se necesita un mínimo de tres unidades para implementar una solución RAID 3.

RAID 4:

"Acceso Independiente con un disco dedicado a paridad":

Basa su tolerancia al fallo en la utilización de un disco dedicado a guardar la información

de paridad calculada a partir de los datos guardados en los otros discos. En caso de avería

de cualquiera de las unidades de disco, la información se puede reconstruir en tiempo real

mediante la realización de una operación lógica de O exclusivo. Debido a su organización

interna, este RAID es especialmente indicado para el almacenamiento de ficheros de gran

tamaño, lo cual lo hace ideal para aplicaciones gráficas donde se requiera, además,

fiabilidad de los datos. Se necesita un mínimo de tres unidades para implementar una

solución RAID 4. La ventaja con el RAID 3 está en que se puede acceder a los discos de

forma individual.

RAID 5:

"Acceso independiente con paridad distribuida":

Este array ofrece tolerancia al fallo, pero además, optimiza la capacidad del sistema

permitiendo una utilización de hasta el 80% de la capacidad del conjunto de discos. Esto lo

consigue mediante el cálculo de información de paridad y su almacenamiento alternativo

por bloques en todos los discos del conjunto. La información del usuario se graba por

bloques y de forma alternativa en todos ellos. De esta manera, si cualquiera de las unidades

de disco falla, se puede recuperar la información en tiempo real, sobre la marcha, mediante

una simple operación de lógica de O exclusivo, sin que el servidor deje de funcionar.

Así pues, para evitar el problema de cuello de botella que plantea el RAID 4 con el disco de

comprobación, el RAID 5 no asigna un disco específico a esta misión sino que asigna un

bloque alternativo de cada disco a esta misión de escritura. Al distribuir la función de

comprobación entre todos los discos, se disminuye el cuello de botella y con una cantidad

suficiente de discos puede llegar a eliminarse completamente, proporcionando una

velocidad equivalente a un RAID 0.

RAID 5 es el nivel de RAID más eficaz y el de uso preferente para las aplicaciones de

servidor básicas para la empresa. Comparado con otros niveles RAID con tolerancia a

fallos, RAID 5 ofrece la mejor relación rendimiento-coste en un entorno con varias

unidades. Gracias a la combinación del fraccionamiento de datos y la paridad como método

para recuperar los datos en caso de fallo, constituye una solución ideal para los entornos de

servidores en los que gran parte del E/S es aleatoria, la protección y disponibilidad de los

datos es fundamental y el coste es un factor importante. Este nivel de array es

especialmente indicado para trabajar con sistemas operativos multiusuarios.

Se necesita un mínimo de tres unidades para implementar una solución RAID 5.

Los niveles 4 y 5 de RAID pueden utilizarse si se disponen de tres o más unidades de disco

en la configuración, aunque su resultado óptimo de capacidad se obtiene con siete o más

unidades. RAID 5 es la solución más económica por megabyte, que ofrece la mejor relación

de precio, rendimiento y disponibilidad para la mayoría de los servidores.

RAID 6:

"Acceso independiente con doble paridad":

Similar al RAID 5, pero incluye un segundo esquema de paridad distribuido por los

distintos discos y por tanto ofrece tolerancia extremadamente alta a los fallos y a las caídas

de disco, ofreciendo dos niveles de redundancia. Hay pocos ejemplos comerciales en la

actualidad, ya que su coste de implementación es mayor al de otros niveles RAID, ya que

las controladoras requeridas que soporten esta doble paridad son más complejas y caras que

las de otros niveles RAID. Así pues, comercialmente no se implementa.

Niveles RAID anidados

Para mejorar en el desempeño del sistema o ganar en redundancia, los niveles básicos de un

RAID pueden combinarse para crear niveles híbridos o anidados.

Cuando se anidan niveles RAID, generalmente se anida un nivel que ofrezca redundancia

con un nivel 0 para mejorar en rendimiento. Con ´esta idea en mente, es preferible tener el

nivel 0 en el tope y el arreglo redundante debajo de este. De esta manera se necesitara

regenerar una menor cantidad de discos en caso de una falla. Los casos de uso más

comunes son los siguientes:

RAID 0+1: Utiliza un mínimo de 4 discos, y esto se debe a que en esencia es un espejo de

una división de bloques de datos. Este nivel provee tolerancia a fallos si uno o más de los

discos que fallan son del mismo conjunto del espejo. Si los discos que fallan son los que

poseen los mismos datos a ambos lados del espejo, entonces los datos se pierden.

RAID 1+0: Al igual que el nivel anidado expuesto anteriormente, este nivel también

requiere de al menos 4 discos. Para visualizar de forma más clara esta configuración, se

podría decir que es un conjunto de discos que son copias idénticas, dentro de un conjunto

de discos que se dividen los bloques de datos. En caso de una falla, este nivel se comporta

mejor que un RAID 0+1, porque todos los otros discos siguen funcionando. Incluso el

arreglo puede soportar diversas fallas de disco, a menos que fallen todos los discos de un

conjunto de espejos.

RAID 5+0: Esta configuración se basa en una división de bloques de datos a través de un

arreglo con paridad distribuida como lo es el RAID 5. Esta configuración soporta que falle

uno de los discos de cualquiera de los arreglos RAID 5, pero si falla otro de los discos de

ese mismo conjunto, el sistema falla completamente.

RAID 5+1: La diferencia principal de esta configuración con respecto a la anterior radica

en que en esta se hace una copia del RAID 5, pudiendo fallar una mayor cantidad de discos

para que el conjunto total de discos falle por completo.

Tecnología RAID

Technology

Transcript of Tecnología RAID