Sunteți pe pagina 1din 13

RAID (Redundant Array of Independent disks) Un importante objetivo de la industria informtica es aumentar la capacidad de procesamiento de los sistemas y la seguridad

de los datos. Dentro de este ltimo concepto, se exige disponibilidad de los datos: habilidad del sistema para acceder al 100% de la informacin, aun en caso de que falle un dispositivo del subsistema de almacenamiento. Uno de los dispositivos alrededor del cual se buscaron soluciones que satisfagan estos principios es el disco magntico. La preocupacin estriba fundamentalmente en que, a pesar de su evolucin constante, se mantiene la desfavorable diferencia relativa de velocidad de procesamiento y sus restricciones a la performance general y a la confiabilidad total de los equipos informticos. En ese marco, se considero la posibilidad de analizar la factibilidad de trabajar en paralelo con varios dispositivos independientes de acceso directo, para ganar eficiencia. Naci el (RAID Redundant Array of Independent Disks.) Universidad California, Berkley en 1987. Bajo esta sigla fueron incluidos un conjunto de esquemas que proveen un balance entre performance y proteccin de datos. Algunos de los cuales fueron tomados por la industria como standard, para asegurar migrabilidad de bases de datos. El aumento de requerimientos de volumen de informacin a procesar, transform a los discos en la piedra angular para sostener dicho crecimiento. La industria intent extender las ventajas relativas de estas ideas, a diferentes Bases de Datos, como atributos destacables en la calidad de dichos productos. Si bien estos conceptos se haban orientado inicialmente, hacia los mainframes, se extendieron para sistemas operativos que administran sistemas pequeos. Con los esquemas RAID, se trato de obtener beneficios integrales, tales que superaran la suma de aportes de sus componentes o atributos individuales. De acuerdo a los objetivos anteriormente enunciados, la bsqueda se tradujo en obtener PERFORMANCE y posibilidad de RECUPERACION de informacin en caso de cada del dispositivo, a travs de redundancia de informacin. Obviamente, la performance depender fundamentalmente del uso o tipo de aplicaciones vinculadas al sistema de memoria secundaria. El beneficio se hace evidente en aquellas aplicaciones donde es importante la lectura o recuperacin de la informacin, debido a los costos en procesamiento que tienen las grabaciones por la necesidad de control de paridad. Diferentes implementaciones, recibieron una denominacin propia: desde RAID 0 hasta RAID 6 sin que este sufijo numrico indique evolucin o complejidad. Los mas comunes (y vigentes) son el RAID1 RAID 0+1 RAID 3 RAID 5 y RAID 6. Obviamente, su adopcin, no implica abandonar otras prcticas habituales y necesarias, como el back-up, en todas sus modalidades.

El acceso simultneo a muchos drives, considerndolo como un nico vector, increment la probabilidad de falla. Por eso, surgi la necesidad de dotar a los sistemas, de mecanismos de redundancia, para cubrir necesidades de reconstruccin de la informacin. CARACTERSTICAS COMUNES: Se decidi trabajar con discos econmicos y de volumen no muy grande El conjunto de discos se ve como un UNICO DISPOSITIVO, con un controlador propio del mtodo y que administra los controladores nativos de cada unidad Los datos se distribuyen a lo largo del conjunto de discos como en un vector nico Grabacin de datos redundantes, para poder reconstruir en caso de fallo de disco o prdida de informacin. RAID 0 Respecto de los otros esquemas de RAID, el RAID0 resulta un hbrido, pues no tiene mecanismos de redundancia. Solo provee performance, al ofrecer segmentacin de datos (striping). Esto se obtiene al distribuir un archivo entre mltiples discos fsicos, entre mltiples ejes. Un strip podra tener la longitud de un sector. Un mismo strip (informacin posicional) a lo largo de los discos que conforman el RAID se llama stripe. Dado un pedido de lectura/grabacin de datos, todo se posiciona en n strips. En consecuencia el sistema se posiciona en n stripes contiguos por lo que los strips son tratados en paralelo. Esto reduce notablemente los tiempos de transferencia

Si la estructura RAID ocupa 4 discos, un archivo se divide en segmentos (en general del tamao de un sector) que se almacenan distribuidos de la siguiente forma: los primeros 4 segmentos, uno en cada uno de los discos (en las mismas posiciones relativas de cada disco), los segmentos 5 al 8 se distribuyen nuevamente en los segundos sectores y as sucesivamente, hasta el ltimo sector del archivo (Ver figura 1). Esta segmentacin no requiere operaciones adicionales para su administracin, por lo que su performance es independiente del uso del conjunto de discos. Ante un requerimiento de E/S, el sistema RAID 0 se posiciona en el mismo nmero de strip en varios drives. De all el concepto de tratamiento en paralelo, que reduce el tiempo de transferencia al aprovechar el posicionamiento simultaneo de los diferentes dispositivos. Evita el lgico atascamiento en caso de disponer de un nico drive. Es til para la recuperacin de datos de archivos de gran volumen, pues al distribuirse la informacin en varios drives reales, esta puede ser accedida simultneamente. Ventajas: proporciona alto rendimiento no tiene costo en discos adicionales ni calculo de paridad se usa en forma completa la capacidad de los discos diseo sencillo y de implementacin fcil mejora performance por distribucin de la informacin y posibilidad de lecturas paralelas el mapeo entre el espacio lgico y fsico puede hacerse por HW o por SW Inconvenientes:

No tiene mecanismo de integridad o redundancia. No es tolerante a fallos un error en un disco implica la total prdida de sus datos, debido a la falta de control de redundancia. no puede usarse en aplicaciones crticas.

Figura 1

ESQUEMA RAID 0

RAID 1 Bajo este concepto, se incluye uno de los criterios ms sencillos de redundancia: DUPLICACIN DE ARCHIVOS. Esta tcnica recibe el nombre de espejo (mirroring). Cada disco, tiene su espejo correspondiente. Es prcticamente un backup permanente. Es decir, que para n discos con informacin real, RAID 1 exige 2*n dispositivos (Ver figura 2). Su principal desventaja, es su elevado costo. Sin embargo, adems de la recuperacin inmediata de informacin perdida, tiene otras ventajas relativas. Si el proceso es orientado a lecturas, se aprovecha el posicionamiento del brazo lector en los discos espejos, leyendo desde aquel disco que puede acceder al mismo dato en menor tiempo. Se aprovecha el principio de referencia localizada, tambin utilizado para la fundamentacin del uso de memorias cache, sacando provecho de la alta probabilidad de que la secuencia de lecturas a un mismo archivo, se corresponda a registros fsicamente vecinos. Mas aun, cada necesidad de lectura puede ser hecha desde dos discos, el que menos tiempo de posicionamiento requiera, con lo que se gana eficiencia. Si bien la grabacin se hace por duplicado, no implica el doble de tiempo de acceso: la clave esta en el procesamiento paralelo administrado por el RAID. Si falla un disco, la informacin no se pierde. Esto da lugar a no interrumpir los procesos, hasta la reparacin o reemplazo del disco fallado. El nmero de requerimientos de lectura y tiempos de espera para el posicionamiento del brazo del disco, baja drsticamente. Se denomina HOT SWAP a la tcnica que tienen ciertos RAID por los cuales, si falla un disco, el proceso sigue. El reemplazo del disco fallado se hace en caliente, es decir, sin detener ningn proceso. Cuando se instala la nueva unidad, el mismo mtodo RAID

se encarga de volver a llenar de contenido correcto al nuevo disco. Esto, obviamente influye en el rendimiento del disco, hasta que el proceso de actualizacin finaliza.

Figura 2. RAID 1

Ventajas: Inconvenientes: Costo, se requiere el doble de espacio y mucho overhead si se implementa por software no soporta hot swap moderada lentitud en grabacin, ya que se repite la grabacin en localizaciones diferentes. Por ello se sugiere implementacin por hardware mayor rendimiento que un disco convencional, en lectura recuperacin de datos completa, en caso de falla de un disco, sin necesidad de reconstruccin. Solo requiere copia de disco bajo ciertas circunstancias, puede soportar fallas simultaneas de discos diseo sencillo de subsistema de administracin bueno para aplicaciones de alta disponibilidad

RAID 0+1 Es una metodologa que suma los conceptos del RAID 0 y RAID 1: striping y espejado.

Figura 3 RAID Level 0+1 requiere un mnimo de 4 discos para su implementacin. El orden de los datos sigue el concepto de striping, mostrado en la figura 1

Ventajas Se implementa como un espejado cuyos segmentos son arrays RAID 0 Tiene el mismo overhead para tolerancia de fallas que el espejado simple Alta tasa de E/S obtenida gracias a la distribucin de informacin en stripes. Desventajas muy costoso, con mucho overhead

los discos deberan procesarse en estricto paralelo, para no degradar performance en demasa Escalabilidad limitada por aumento proporcional de costos

RAID 3

Figura 4

ESQUEMA RAID 3

Aqu se incorpora un mecanismo de redundancia por clculo. Se define REDUNDANCIA, como la informacin adicional a la real necesaria para reconstruir informacin, en caso de que un soporte se haya estropeado. No requiere necesariamente la copia o duplicacin de datos (esto es solo valido para el RAID 1 y el RAD 0+1) Es necesario utilizar un disco adicional (Ver Figura 4) para registrar dicha redundancia. Los datos redundantes se guardan en la misma zona relativa del disco adicional. Lo curioso en este esquema es que, con solo un disco adicional, se puede recuperar la informacin de cualquier disco que falle, incluso el de redundancia. Se obtiene eficiencia en lectura y grabacin, conservando la habilidad de reconstruccin en caso de fallas, manteniendo integridad de datos. Tiene buen rendimiento para tratamiento de grandes archivos secuenciales y tiene bajo costo relativo. El mtodo de redundancia se puede definir as: Sea X(D) (i) se refiere a la informacin ubicada en el strip Xi del disco D. Sea un esquema de 4 drives con informacin til La operacin signada con + es la EXCLUSIVE OR cuya tabla es la que sigue:

XOR 0 1
X4(i)= X3(i) + X2(i) + X1(i)+ X0(i)

0
0 1

1
1 0

Con esta aplicacin reiterada entre sectores de los cuatro discos del sistema, se calcula el correspondiente sector del disco redundante. La reconstruccin se produce, reemplazando el operando con informacin del disco fallado, con la informacin resultante de la anterior operacin. Se recalcula la formula

antes escrita. Si se cae el disco 2, se recalcula y se regraba el nuevo disco, que reemplazo al fallado. X2(i)= X3(i) + X4(i) + X1(i)+ X0(i) Mientras dura el reemplazo del disco, se regeneran los datos del drive daado. La performance se degrada durante este lapso, pero con beneficios indiscutibles. Este nivel RAID es una buena alternativa para aplicaciones de velocidad de transferencia alta, ya que gracias a la distribucin de datos podemos emplear todos los discos en paralelo. Ventajas: Inconvenientes: Costo relativamente bajo, pues con un disco adicional hay recuperacin de datos en caso de falla de un disco. complicado diseo del controlador pesado si su implementacin es por software Tiempo mas lento de grabacin, debido a la paridad recuperacin de datos completa, en caso de falla de un disco. No influye en una importante degradacin

El principal problema de este mtodo, es la sobrecarga de accesos al disco de paridad. Supongamos la existencia de un conjunto de cinco discos con informacin til y un sector de paridad. Cada modificacin exige 4 accesos a disco: Acceder a la informacin existente Acceder a la informacin correspondiente de redundancia Acceder para actualizar la informacin til Acceder para grabar la nueva redundancia En resumen, una modificacin implica dos accesos al disco donde se encuentra la zona a modificar y dos al disco de redundancia. Supongamos ahora, que cinco usuarios piden sendas modificaciones en discos diferentes: Se necesitaran dos accesos a cada disco con informacin til y dos accesos por usuario al disco de redundancia: total 10 accesos. Esta distribucin despareja de los accesos hace que sea ms lenta. Esto se resuelve en RAID5 al distribuir la informacin de redundancia.

RAID 5

Figura 5

ESQUEMA RAID 5

ESQUEMA RAID 5

Como puede observarse en el grafico 5, su utiliza la tcnica de striping. Se calcula la paridad y su resultado se guarda en el disco de paridad, en el strip correspondiente al control de redundancia. El concepto de striping se generaliza tambin al disco de paridad. De modo que tanto la informacin real como la redundante si distribuye alrededor de todos los discos. Cada disco es tratado independiente, de modo que se pueden utilizar en forma paralela. Esto evita la acumulacin de riesgo en el drive de paridad. A la formacin de discos con informacin, se agrega un disco adicional, para albergar la informacin redundante. Si falla un disco cualquiera, no se pierde informacin. Slo si se pierden dos, el sistema queda invalidado. Tiene un costo reducido, comparado con la disponibilidad que ofrece. Adems se toma el recaudo de que la informacin de redundancia correspondiente a un conjunto de informacin, se distribuya, disminuyendo los riesgos y hacindola ms confiable y de respuesta mas veloz, pues las actualizaciones de la paridad ya no se concentran en un disco exclusivo. En consecuencia, cada actualizacin implica dos lecturas y dos grabaciones. Es el costo necesario para mantener confiabilidad y disponibilidad de datos. En RAID 5 los datos y la paridad son guardados entre todos los discos, por lo que se aumenta la velocidad de respuesta, ya que cada disco puede satisfacer una demanda en forma independiente de los dems. A diferencia con el RAID 3, el RAID 5 guarda la paridad del dato dentro de los discos y no hace falta un disco especfico para paridades. La paridad se genera haciendo un XOR de los datos A0, B0, C0, DO creando la zona de paridad PAR0, como se ve la paridad nunca se guarda en los disco que contienen los datos que han generado dicha paridad, ya que en el caso que uno de ello se estropeara como por ejemplo el dato A0 bastara con regenerar las banda B0,C0,D0,PAR0 para que el dato volviera ha reestablecerse. Sugerido para administracin de BD, para servers de e-mail e intranet

Ventajas: alto rendimiento para aplicaciones interactivas No desaprovecha un disco exclusivamente para paridad Se pueden recuperar datos Inconvenientes: rendimiento bajo en grabacin no aumenta rendimiento en aplicaciones, aunque la velocidad de transferencia sea alta RAID 6

Figura 6

ESQUEMA RAID 6

Aqu se utilizan dos mecanismos de control de redundancia: uno de paridad e igual a los RAID 3 y RAID 5. Sin embargo, cada fabricante agrega otro control de redundancia que lo mantiene secreto. El resultado de cada uno de ellos, se guarda en bloques separados y en discos diferentes (Ver figura 6). Para un esquema de n discos de informacin real esta metodologa agrega dos discos. En consecuencia , RAID 6 necesita 2 discos adicionales, al total de discos con informacin. Es un costo importante. Es el mecanismo que da mayor seguridad y disponibilidad de datos. Paga por ello una fuerte penalidad por la necesidad de leer calcular y grabar dos controles de redundancia. La performance en grabacin es peor que en RAID 5 pues deben accederse el dato a modificar y sus correspondientes dos paridades en dos oportunidades. Es el doble que para RAID 5. Por dichos motivos, la performance es superior en la lectura que en la grabacin. Para paliar esta situacin, es aconsejable utilizar una cache de escritura, acelerando el proceso de grabacin. Ventajas

Podemos recuperar diversos errores simultneamente. Es una extensin de RAID 5 con doble control de paridad

Inconvenientes

El rendimiento en escrituras de datos es bastante lento. Diseo complicado del controlador Costo de n+2 discos, para n discos de informacin

RESUMEN ESQUEMAS RAID Categora Striping Espejo Striping + espejo Acceso paralelo Nivel Descripcin aplicaciones tpicas 0 sin redundancia alta performance para datos no crticos 1 Espejo dispositivos de sistemas, archivos crticos 0+1 Espejo Redundancia costosa 3 paridad XOR CAD, o tratamiento imgenes, requerimientos de largo tamao Alta tasa de requerimiento, intensivo-lectura extrema necesidad de disponibilidad de datos

acceso independiente acceso independiente

paridad XOR distribuida paridad XOR distribuida y Error Correction Code distribuido (dos paridades)

Esquema simplificado de RAID

Ejemplo de aplicacin del mtodo XOR Paridad.

Ejemplo de una modificacion, donde se proce a cambiar el contenido de un conjunto de bits. Primer ejemplo Sean 4 strips con el siguiente contenido. Cada strip corresponde a un conjunto de bits que ocupa las mismas posiciones relativas en 4 discos que forman el RAID
1101 1000 0100 1010

Se calcula la redundancia

1011

Calculos auxiliares 1 1 0 1 con 1 0 0 0 da como resultado 0 1 0 1. El que sigue 0 1 0 0 con 0 1 0 1 da como resultado 0 0 0 1. El que sigue 1 0 1 0 con 0 0 0 1 da como resultado 1 0 1 1 que es la informacion redundante
Supongamos que se modifica el segundo strip, que pasa de tener Tomo el valor original del strip Le aplico el nuevo valor (modificado) luego aplico la redundancia anterior 1000 1001 1011 1 0 0 0 a contener 1001

1 0 0 1 con 1 0 0 0 da como resultado 0 0 0 1 El que sigue 1 0 1 1con 0001 da como resultado 1 0 1 0 (*)

Ahora planteamos un control, sobre el resultado antes calculado. Los cuatro strips son ahora 1101 1 0 0 1 (valorf modificado) 0100 1010 1010

Se calcula la redundancia

Calculos auxiliares 1 0 0 1 con 1 1 0 1 da como rfesultado El que sigue 0 1 0 0 con 0 1 0 0 das como resultado El que sigue 1 0 1 0 con 0 0 0 0 das como resultado
Este resultado concuerda con el anterior (*)

0 1 0 0. 0 0 0 0. 1010

CONCLUSION: dada una modificacin en un strip, el recalculo se hace tomando: valor anterior a la modificacin valor nuevo (modificado) valor anterior de redundancia hacer XOR de a pares (en cualquier orden) y se obtiene el nuevo valor de redundancia. Hacen falta dos lecturas y dos modificaciones.

Diccionario del RAID. En este diccionario se intenta aclarar algunos conceptos referentes a los sistemas RAID y a la integridad del sistema de datos...

Hot swap: Son discos que se reemplazan en caliente. Esto quiere decir que si alguno de los discos RAID se estropeara fsicamente bastara con quitarlo y poner otro sin tener que apagar el sistema. Integridad de los datos: es la capacidad que tiene un disco de aguantar un error de grabacin, de corrupcin o prdida de datos. Para tal efecto se tiene que seleccionar un disco RAID o una alternativa. El nivel de integridad es uno de los primeros criterios que se han de investigar. Mirroring: Haciendo espejo. Es un nivel de RAID (el nivel 1) que pasa por hacer una copia ntegra de un disco en otro. Paridad: es una informacin redundante que es guardada para regenerar datos perdidos por un error en el disco. La paridad se genera haciendo un XOR sobre los datos de los discos y guardndolo en otro disco o en un disco dedicado a este efecto, esto depender del nivel RAID que usemos. RAID:Redundat Array of Inexpensive Disk Conjunto de discos con informacin redundante de bajo costo. Reconstruccin o regeneracin: Cuando un disco falla la informacin redundante en los discos y los datos en los discos buenos son usados para regenerar la informacin del disco averiado. Redundancia informacin adicional requerida para la reconstruccin de informacin perdida por falla de disco Redundant Power Supplies: Fuente de alimentacin redundante. El sistema consta de dos fuentes de alimentacin. Si una se estropea, se pone en marcha la otra, pudindose cambiar la estropeada en caliente. Sistemas basados en velocidad de demanda: son aquellos en los que se requiere un gran nmero de demandas de Entrada / salida en el menor tiempo posible. Una alta velocidad de demanda es tpica en sistemas multiusuario o en aplicaciones de bases de datos en las que se generan un gran nmero de pequeas demandas de Entrada / salida. En este caso cada disco del conjunto puede procesar simultneamente una demanda (request.

Sistemas basados en velocidad de transferencia: son aquellos que intentan satisfacer una sola demanda con la mxima velocidad. Un claro ejemplo son las aplicaciones de ingeniera, cientficas, imgenes, etc. En estos sistemas el tamao de la demanda es mucho ms grande que en los sistemas basados en velocidad de demanda, para el que emplea todos los discos del conjunto en paralelo para satisfacer una mayor demanda en el mnimo tiempo posible.

Striping: es el acto de unir dos o ms discos fsicos en un solo disco lgico con el fin de dividir los datos entre los diferentes discos para ofrecer una significativa mejora en el rendimiento del conjunto de los discos.

Como seleccionar un disco RAID.


En esta pgina veremos lo que hay que tener en cuenta para seleccionar el nivel de RAID que nos interesa, as como los diferentes sistemas que existen en el mercado para hacer un sistema mas seguro y rpido en el caso de que se estropeara algn disco duro. El seleccionar un disco RAID puede ser una dura tarea, ya que no existen criterios establecidos para saber cual es la mejor solucin. Una equivocacin bastante comn es juntar todos los discos RAID en el mismo nivel, por lo que debemos elegir una solucin correcta para el grupo completo de disco, no metiendo todos en el mismo nivel, sino estructurando los discos dependiendo de las necesidades en seguridad e integridad de los datos. Para seleccionar un disco RAID en primer lugar tenemos que conocer nuestras necesidades o saber los tipos de aplicaciones que se emplean. Podemos separar las aplicaciones en dos tipos: Aplicaciones de demanda: explicado en diccionario

Podramos seleccionar el RAID 5 ya que ofrece una alta velocidad de demandas, tanto en escrituras como en lecturas. Aplicaciones de transferencia: explicado en diccionario

La mejor opcin pasara por RAID 3 ya que ofrece una alta velocidad de transferencia para grficos, imgenes y aplicaciones en general en las que necesitamos gran transferencia de datos. Adems del tipo de aplicacin, habremos de tener en cuenta los factores que nos guiarn a optar por la eleccin de un RAID u otro como son: Integridad y costo: Normalmente nos decantaremos por una solucin RAID que asegure la integridad de los datos del disco, ya que de esta manera tendremos preservados nuestros datos sobre posibles errores del disco. El RAID 0 es el nico nivel que no proporciona integridad. Costo:

El costo, vendr marcado por nuestro poder adquisitivo, ser uno de los factores ms importantes a la hora de seleccionar nuestro disco. No solo tenemos que pensar en la integridad de los datos sino en cuanto que cuando se estropee un disco tenemos que apagar el sistema.

S-ar putea să vă placă și