Tecnología RAID
-
Upload
jose-guzman -
Category
Technology
-
view
2.243 -
download
0
description
Transcript of Tecnología RAID
ASIGNATURA:
MANTENIMIENTO DE HARDWARE
TEMA:
TECNOLOGÍA RAID
PROFESOR:
OSCAR GIOVANNI LAZO ÁLVAREZ
ALUMNOS:
RIGOBERTO ALEXANDER DIAZ GARCIA
JOSE LUIS GUZMAN MARTÍNEZ
GRUPO:
EEV10
FECHA DE ENTREGA:
SANTA TECLA, 28 DE NOVIEMBRE DE 2010
Tecnología RAID (Redundant Array of Independent Disks)
(Arreglo Redundante de Disco Independientes)
Qué es RAID?
Acrónimo de "RedundantArray of Independent Disks" (matriz redundante de discos
independientes), RAID es un método de combinación n de dos a más discos duros para
formar una única unidad lógica en la que se almacenan los datos de forma redundante. Para
el sistema operativo aparenta ser un sólo disco duro lógico.
La tecnología RAID (excepto en el nivel 0) protege los datos contra la caída de un disco
duro. Si se produce un fallo, RAID mantiene el servidor activo y en funcionamiento hasta
que se sustituye la unidad defectuosa.
Todos los sistemas RAID suponen la pérdida de parte de la capacidad de almacenamiento
de los discos para almacenar los datos de paridad y conseguir la redundancia.
La idea del RAID fue presentada primero por David A. Patterson, Garth Gibson y Randy
H. Katz en la Universidad de California en Berkeley en 1998. RAID tiene el propósito de
almacenar la misma información en diferentes lugares y en múltiples discos duros además
de mejorar el desempeño del subsistema de almacenamiento.
La ventaja de RAID es proporcionar un mejor desempeño en la transferencia de datos y/o
tolerancia a fallas. El mejor desempeño se cumple al distribuir la carga de trabajo en
paralelo entre múltiples discos duros físicos. La tolerancia a fallas se alcanza a través de la
operación de redundancia, dónde si una (o más) de las unidades fallas o tiene un sector
defectuoso, una copia espejo de los datos se puede encontrar en otra de las unidades.
Un RAID aparece en el sistema operativo como un solo disco duro lógico. El controlador
RAID controla como los datos se almacenan y se acceden a través de los arreglos físicos y
lógicos. El controlador RAID ayuda a los usuarios a asegurar que el sistema operativo solo
ve las unidades lógicas y los usuarios no necesitan preocuparse acerca de la administración
de este complicado esquema.
Para resultados óptimos de desempeño, seleccione discos duros idénticos para los arreglos,
esto ayuda al desempeño y al funcionamiento del arreglo como un solo disco duro.
Conceptos básicos relacionados a RAID
Para entender cómo funciona la tecnología RAID debemos entender los conceptos o
principios sobre los que se basa. Dichos principios son:
Mirroring: Consiste en copiar los datos en más de un dispositivo.
Striping: es la división de la data en los múltiples discos duros.
Corrección de errores: Es donde la data redundante es guardada para permitir la corrección
de errores y su posible reparación
Hot Swap o Intercambio en Caliente: Esta característica permite cambiar un disco
defectuoso con el sistema en funcionamiento, evitando interrupciones de trabajo.
Requiere:
· Discos con conector específico. En SCSI, el conector es tipo SCA (Single Connector
Attachmnet)
· Módulo de discos con Backplane eléctronico que actúa como equilibrador de tensión
Hot Spare o Repuesto en Caliente: Un disco de recambio instalado se asigna como Hot
Spare de forma que si algún disco del RAID cae, automáticamente sustituye al defectuoso
y se reconstruye de nuevo el RAID evitando la degradación de funcionamiento.
Es el “repuesto AUTOMÁTICO” o desasistido.
La cosa interesante de RAID es que dependiendo de la configuración que se use (nivel),
cambia las funciones y propósitos del arreglo entero.
VE N TA JA S
Alta Disponibilidad: RAID aumenta el tiempo de funcionamiento y la
disponibilidad de la red.
Tolerancia a fallos: RAID protege contra la pérdida de datos y proporciona
recuperación de datos en tiempo real con acceso ininterrumpido en caso de que
falle un disco.
Mejora del Rendimiento/ Velocidad: RAID permite a varias unidades trabajar en
paralelo, lo que aumenta el rendimiento del sistema y ante el sistema principal
funcionan como un único dispositivo.
Mayor Fiabilidad: Las soluciones RAID emplean dos técnicas para aumentar la
fiabilidad: la redundancia de datos y la información de paridad
Tipos de Tecnología RAID
Por Software
El RAID lo realiza una aplicación software al 100%
· La gestión RAID la hace el procesador del sistema
· Ralentización de otras aplicaciones instaladas
· Productividad más baja del usuario
· Costes más altos de gestión y reconfiguración
· No ofrece protección para el sistema operativo
· No soporta HotSwap de discos (cambio en caliente)
Por Hardware
La gestión RAID la realiza una controladora hardware dedicada
o Independencia de la plataforma o sistema operativo
o Alto Rendimiento
o Total integridad de datos y sistema operativo
o Controlador RAID específico
o Gestiona HotSwap y HotSpare
RAID INTERNO
Los componentes que integran el RAID están ubicados en el mismo chasis que alberga la
placa base del servidor:
- Controladora RAID
- Módulo de discos (backplane)
- Discos
RAID EXTERNO
Las operaciones RAID se llevan a cabo mediante un controlador situado en el subsistema
de almacenamiento RAID externo, que se conecta al servidor mediante un adaptador de bus
de host SCSI o Fibre Channel
LOS NIVELES RAID
RAID ofrece varias opciones, llamadas niveles RAID, cada una de las cuales proporciona
un equilibrio distinto entre tolerancia a fallos, rendimiento y coste, diseñadas para satisfacer
las diferentes necesidades de almacenamiento de los usuarios.
La mayoría de los niveles RAID pueden satisfacer de manera efectiva sólo uno o dos de
estos criterios. No hay un nivel de RAID mejor que otro; cada uno es apropiado para
determinadas aplicaciones y entornos informáticos. De hecho, resulta frecuente el uso de
varios niveles RAID para distintas aplicaciones del mismo servidor.
Existen siete niveles diferentes de RAID (0 a 6) definidos y aprobados por el RAID
Advisory Board (RAB)
Nivel RAID 0
El nivel 0 es el arreglo de discos más
rápido que pueda tener, es un método
de mapeo de disco orientado al
desempeño. Los datos en este arreglo se
escriben a través de una línea o de
diferentes discos para una mejor
transferencia. Esta técnica tiene una línea pero no redundancia de datos. Ofrece el mejor
desempeño pero no es tolerante a fallas. Escribe y lee sectores de datos entre múltiples
unidades. Cuando un disco miembro del arreglo falla, afecta a todo el arreglo. El
desempeño es mejor que un solo disco debido a que la carga de trabajo esta balanceada
entre los miembros del arreglo. Este arreglo es para sistemas de alto desempeño. Se
recomienda usar unidades de disco idénticas para ayudar al desempeño así como la
eficiencia del almacenamiento de datos. La capacidad del arreglo de discos es igual al
número de miembros multiplicado por el miembro de menor capacidad. Por ejemplo un
disco de 40GB y uno de 60GB formaran una arreglo de 80GB (40GBx2).
Esquema lógico RAID 0
Nivel RAID 1
Espejo (Mirror (RAID 1):
El RAID de nivel 1 usa al menos dos
discos duros duplicados y almacena
exactamente los mismos bloques de
información entre ellos. Esta es el
método de tolerancia a fallas más
lento debido a que la información se
debe replicar en los dos discos al
mismo tiempo. Sin embargo, es el método más simple para proporcionar alta confiabilidad.
Si uno de los disco espejo sufre una falla mecánica o no responde, la unidad remanente
continuará funcionando y proporcionando los datos correctos. Si una de la unidades tiene
un error de sector físico, el disco espejo continuara la función.
Debido a la redundancia, la capacidad del arreglo es la mitad de la capacidad de las
unidades de disco. Por ejemplo dos unidades de 40GB tienen una capacidad combinada de
80GB pero tendrán una capacidad de 40GB de almacenamiento usable. Con discos de
diferentes capacidades, puede existir un espacio de almacenamiento no usado en la unidad
más grande. RAID 1 incrementa el costo porque usa el doble de discos duros para construir
el arreglo.
Esquema lógico RAID 1
Raid 0+1 ó Raid 10
En Línea con Espejo (RAID 0 + RAID 1)
Como lo sugiere el nombre, RAID 0+1
es combinado. Este RAID combina la
mejor de ambos. Toma el arreglo en
línea usando dos discos, y hace espejo
con otro juego de disco para la
tolerancia a fallas. Los datos se escriben
en línea a través de varios discos, cada
disco tiene un compañero con la misma
información. Usted obtiene el beneficio
de una mayor velocidad de acceso a
datos como en RAID 0, pero con la
tolerancia a fallas de RAID 1. Esta
configuración proporciona una velocidad y confiabilidad óptimas. Se necesita el doble de
unidades de disco como en RAID 0, la mitad para cada lado del espejo. Al menos se
requieren 4 discos para implementar el RADI 0+1. Existen otras configuraciones RAID
además de las aquí mencionadas, pero estos son los tipos más comúnmente usados en la
industria.
Esquema lógico RAID 10
RAID 2:
"Acceso paralelo con discos especializados. Redundancia a través
del código Hamming":
El RAID nivel 2 adapta la técnica comúnmente usada para detectar y corregir errores en
memorias de estado sólido. En un RAID de nivel 2, el código ECC (Error Correction Code)
se intercala a través de varios discos a nivel de bit. El método empleado es el Hamming.
Puesto que el código Hamming se usa tanto para detección como para corrección de errores
(Error Detection and Correction), RAID 2 no hace uso completo de las amplias capacidades
de detección de errores contenidas en los discos. Las propiedades del código Hamming
también restringen las configuraciones posibles de matrices para RAID 2, particularmente
el cálculo de paridad de los discos. Por lo tanto, RAID 2 no ha sido apenas implementado
en productos comerciales, lo que también es debido a que requiere características especiales
en los discos y no usa discos estándares.
Debido a que es esencialmente una tecnología de acceso paralelo, RAID 2 está más
indicado para aplicaciones que requieran una alta tasa de transferencia y menos conveniente
para aquellas otras que requieran una alta tasa de demanda I/O.
RAID 3:
"Acceso síncrono con un disco dedicado a paridad":
Dedica un único disco al almacenamiento de información de paridad. La información de
ECC (Error Checking and Correction) se usa para detectar errores. La recuperación de
datos se consigue calculando el O exclusivo (XOR) de la información registrada en los
otros discos. La operación I/O accede a todos los discos al mismo tiempo, por lo cual el
RAID 3 es mejor para sistemas de un sólo usuario con aplicaciones que contengan grandes
registros.
RAID 3 ofrece altas tasas de transferencia, alta fiabilidad y alta disponibilidad, a un coste
intrínsecamente inferior que un Mirroring (RAID 1). Sin embargo, su rendimiento de
transacción es pobre porque todos los discos del conjunto operan al unísono.
Se necesita un mínimo de tres unidades para implementar una solución RAID 3.
RAID 4:
"Acceso Independiente con un disco dedicado a paridad":
Basa su tolerancia al fallo en la utilización de un disco dedicado a guardar la información
de paridad calculada a partir de los datos guardados en los otros discos. En caso de avería
de cualquiera de las unidades de disco, la información se puede reconstruir en tiempo real
mediante la realización de una operación lógica de O exclusivo. Debido a su organización
interna, este RAID es especialmente indicado para el almacenamiento de ficheros de gran
tamaño, lo cual lo hace ideal para aplicaciones gráficas donde se requiera, además,
fiabilidad de los datos. Se necesita un mínimo de tres unidades para implementar una
solución RAID 4. La ventaja con el RAID 3 está en que se puede acceder a los discos de
forma individual.
RAID 5:
"Acceso independiente con paridad distribuida":
Este array ofrece tolerancia al fallo, pero además, optimiza la capacidad del sistema
permitiendo una utilización de hasta el 80% de la capacidad del conjunto de discos. Esto lo
consigue mediante el cálculo de información de paridad y su almacenamiento alternativo
por bloques en todos los discos del conjunto. La información del usuario se graba por
bloques y de forma alternativa en todos ellos. De esta manera, si cualquiera de las unidades
de disco falla, se puede recuperar la información en tiempo real, sobre la marcha, mediante
una simple operación de lógica de O exclusivo, sin que el servidor deje de funcionar.
Así pues, para evitar el problema de cuello de botella que plantea el RAID 4 con el disco de
comprobación, el RAID 5 no asigna un disco específico a esta misión sino que asigna un
bloque alternativo de cada disco a esta misión de escritura. Al distribuir la función de
comprobación entre todos los discos, se disminuye el cuello de botella y con una cantidad
suficiente de discos puede llegar a eliminarse completamente, proporcionando una
velocidad equivalente a un RAID 0.
RAID 5 es el nivel de RAID más eficaz y el de uso preferente para las aplicaciones de
servidor básicas para la empresa. Comparado con otros niveles RAID con tolerancia a
fallos, RAID 5 ofrece la mejor relación rendimiento-coste en un entorno con varias
unidades. Gracias a la combinación del fraccionamiento de datos y la paridad como método
para recuperar los datos en caso de fallo, constituye una solución ideal para los entornos de
servidores en los que gran parte del E/S es aleatoria, la protección y disponibilidad de los
datos es fundamental y el coste es un factor importante. Este nivel de array es
especialmente indicado para trabajar con sistemas operativos multiusuarios.
Se necesita un mínimo de tres unidades para implementar una solución RAID 5.
Los niveles 4 y 5 de RAID pueden utilizarse si se disponen de tres o más unidades de disco
en la configuración, aunque su resultado óptimo de capacidad se obtiene con siete o más
unidades. RAID 5 es la solución más económica por megabyte, que ofrece la mejor relación
de precio, rendimiento y disponibilidad para la mayoría de los servidores.
RAID 6:
"Acceso independiente con doble paridad":
Similar al RAID 5, pero incluye un segundo esquema de paridad distribuido por los
distintos discos y por tanto ofrece tolerancia extremadamente alta a los fallos y a las caídas
de disco, ofreciendo dos niveles de redundancia. Hay pocos ejemplos comerciales en la
actualidad, ya que su coste de implementación es mayor al de otros niveles RAID, ya que
las controladoras requeridas que soporten esta doble paridad son más complejas y caras que
las de otros niveles RAID. Así pues, comercialmente no se implementa.
Niveles RAID anidados
Para mejorar en el desempeño del sistema o ganar en redundancia, los niveles básicos de un
RAID pueden combinarse para crear niveles híbridos o anidados.
Cuando se anidan niveles RAID, generalmente se anida un nivel que ofrezca redundancia
con un nivel 0 para mejorar en rendimiento. Con ´esta idea en mente, es preferible tener el
nivel 0 en el tope y el arreglo redundante debajo de este. De esta manera se necesitara
regenerar una menor cantidad de discos en caso de una falla. Los casos de uso más
comunes son los siguientes:
RAID 0+1: Utiliza un mínimo de 4 discos, y esto se debe a que en esencia es un espejo de
una división de bloques de datos. Este nivel provee tolerancia a fallos si uno o más de los
discos que fallan son del mismo conjunto del espejo. Si los discos que fallan son los que
poseen los mismos datos a ambos lados del espejo, entonces los datos se pierden.
RAID 1+0: Al igual que el nivel anidado expuesto anteriormente, este nivel también
requiere de al menos 4 discos. Para visualizar de forma más clara esta configuración, se
podría decir que es un conjunto de discos que son copias idénticas, dentro de un conjunto
de discos que se dividen los bloques de datos. En caso de una falla, este nivel se comporta
mejor que un RAID 0+1, porque todos los otros discos siguen funcionando. Incluso el
arreglo puede soportar diversas fallas de disco, a menos que fallen todos los discos de un
conjunto de espejos.
RAID 5+0: Esta configuración se basa en una división de bloques de datos a través de un
arreglo con paridad distribuida como lo es el RAID 5. Esta configuración soporta que falle
uno de los discos de cualquiera de los arreglos RAID 5, pero si falla otro de los discos de
ese mismo conjunto, el sistema falla completamente.
RAID 5+1: La diferencia principal de esta configuración con respecto a la anterior radica
en que en esta se hace una copia del RAID 5, pudiendo fallar una mayor cantidad de discos
para que el conjunto total de discos falle por completo.