lunes, 28 de junio de 2010

Niveles de RAID

RAID (conjunto redundante de discos independientes). Es una forma de almacenar los mismos datos en distintos lugares en múltiples discos duros. Al colocar los datos en discos múltiples, las operaciones I/O (input/output, de entrada y salida) pueden superponerse de un modo equilibrado, mejorando el rendimiento del sistema. Dado que los discos múltiples incrementan el tiempo medio entre errores el almacenamiento redundante de datos incrementa la tolerancia a fallos. Busca subsanar algunos de los problemas comunes presente en los sistemas de almacenamiento tradicionales, y lograr importantes mejoras a un bajo costo.
Las principales finalidades de un sistema RAID son:
• Mejorar la tolerancia a fallos y errores
• Aumentar la integridad de los datos
• Mejorar el rendimiento

RAID 0


O Disk Striping (particionamiento de disco). En un RAID 0 se usa para incrementar el rendimiento, aunque también puede utilizarse como forma de crear un pequeño número de grandes discos virtuales a partir de un gran número de pequeños discos físicos. Un RAID 0 puede ser creado con discos de diferentes tamaños, pero el espacio de almacenamiento añadido al conjunto estará limitado por el tamaño del disco más pequeño.
Ventajas• Fácil de implementar• Poca perdida de espacio (depende de la configuración)• Alto rendimientoDesventajas• No es un RAID 100%, ya que no provee sistema de recuperación de errores o tolerancia de fallos, un error en un disco y muere el arreglo completo

El RAID 1




(DISK MIRRORING), consiste en asociar a cada disco primario del RAID un segundo disco ESPEJO, en el que se duplica la información. Si el disco primario falla el espejo continúa trabajando. Una vez sustituído el disco averiado, los datos se reconstruyen al 100%. En escritura se pierden prestaciones, al tener que escribir la misma información simultáneamente en dos discos. Por ello, en ocasiones, se utiliza la duplicación de controladoras del disco además de la duplicación de los discos. A este recurso se le denomina DUPLEXING. Dicho recurso resulta caro, ya que requiere instalar en el RAID el doble de la capacidad requerida. Por tanto, su uso se limita a aquellos casos en los que seguridad y continuidad sean fundamentales.






RAID 2


"Acceso paralelo con discos especializados. Redundancia a través del código Hamming"
El RAID nivel 2 adapta la técnica comúnmente usada para detectar y corregir errores en memorias de estado sólido. En un RAID de nivel 2, el código ECC (Error Correction Code) se intercala a través de varios discos a nivel de bit. El método empleado es el Hamming. Puesto que el código Hamming se usa tanto para detección como para corrección de errores (Error Detection and Correction), RAID 2 no hace uso completo de las amplias capacidades de detección de errores contenidas en los discos. Las propiedades del código Hamming también restringen las configuraciones posibles de matrices para RAID 2, particularmente el cálculo de paridad de los discos. Por lo tanto, RAID 2 no ha sido apenas implementado en productos comerciales, lo que también es debido a que requiere características especiales en los discos y no usa discos estándares.Debido a que es esencialmente una tecnología de acceso paralelo, RAID 2 está más indicado para aplicaciones que requieran una alta tasa de transferencia y menos conveniente para aquellas otras que requieran una alta tasa de demanda I/O.





RAID 3

Sistemas de disco en paralelo con disco de paridad para corrección de errores. Conocido también como Striping con paridad delicada.
Utiliza también un disco de protección de información separado para almacenar información de control codificada con lo que se logra una forma mas eficaz de proporcionar redundancia de datos. Este control de información codificada o paridad proviene de los datos almacenados en los discos y permite la reconstrucción de información en caso de fallas. Se requieren como mínimo 3 discos y se utiliza la capacidad de un disco para la información de control. Uno de sus efectos secundarios es que normalmente no puede atender varias peticiones simultáneas, debido a que por definición cualquier simple bloque de datos se dividirá por todos los miembros del conjunto, residiendo la misma dirección dentro de cada uno de ellos. Así, cualquier operación de lectura o escritura exige activar todos los discos del conjunto.




RAID 4


Distribuye la información a nivel de bloques y dedica un solo disco a almacenar la información de paridad, lo que permite que cada disco funcione independiente cuando se realiza una petición al sistema, ya sea de lectura o de escritura. Si su controladora lo permite, un sistema RAID 4 puede servir varias peticiones de lectura o de escritura simultáneamente. El atasco se da en el disco dedicado a la información de paridad. Basa su tolerancia al fallo en la utilización de un disco dedicado a guardar la información de paridad calculada a partir de los datos guardados en los otros discos. En caso de avería de cualquiera de las unidades de disco, la información se puede reconstruir en tiempo real mediante la realización de una operación lógica de O exclusivo. Debido a su organización interna, este RAID es especialmente indicado para el almacenamiento de ficheros de gran tamaño, lo cual lo hace ideal para aplicaciones gráficas donde se requiera, además, fiabilidad de los datos.















RAID 5




El RAID 5, (INDEPENDENT DATA ACCESS), difiere del RAID 3 en que la información se divide en bloques en vez de en bytes. Debido a ello las lecturas pueden ser independientes, mejorando por tanto el número de transacciones E/S que puede gestionar el RAID de forma simultánea. La otra gran diferencia con el RAID 3 radica en el hecho de que la información de la paridad se reparte entre todos los discos de forma ROTATORIA, aliviando así el cuello de botella que se forma en operaciones simultáneas de E/S. Esto ocurre, en concreto, gracias a que solo se debe leer la paridad de un único disco, como es el caso del RAID 3. Con lo que resuelve las limitaciones de escritura en RAID-4. Así, todas las operaciones de lectura y escritura pueden superponerse. Este nivel RAID es recomendable para aplicaciones que trabajen con ficheros pequeños pero con un gran número de transacciones E/S, como es el caso de las bases de datos relacionales o las aplicaciones de gestión.Aplicaciones: Servidores de archivos y aplicaciones, Servidores de Base de Datos, Servidores www, correo, noticias, Servidores de Intranet.




RAID 6




RAID 6: "Acceso independiente con doble paridad"
Similar al RAID 5, pero incluye un segundo esquema de paridad distribuido por los distintos discos y por tanto ofrece tolerancia extremadamente alta a los fallos y a las caídas de disco, ofreciendo dos niveles de redundancia. Hay pocos ejemplos comerciales en la actualidad, ya que su coste de implementación es mayor al de otros niveles RAID, ya que las controladoras requeridas que soporten esta doble paridad son más complejas y caras que las de otros niveles RAID. Así pues, comercialmente no se implementa.







Anidados



RAID 0+1

Combinación de los RAID (RAID 0 Y RAID 1) que proporciona velocidad y tolerancia al fallo simultáneamente. El nivel de RAID 0+1 fracciona los datos para mejorar el rendimiento, pero también utiliza un conjunto de discos duplicados para conseguir redundancia de datos. Al ser una variedad de RAID híbrida, RAID 0+1 combina las ventajas de rendimiento de RAID 0 con la redundancia que aporta RAID 1. Sin embargo, la principal desventaja es que requiere un mínimo de cuatro unidades y sólo dos de ellas se utilizan para el almacenamiento de datos. El RAID 0+1 tiene un rendimiento similar al RAID 0 y puede tolerar el fallo de varias unidades de disco. Una configuración RAID 0+1 utiliza un número par de discos (4, 6, 8) creando dos bloques.




RAID 1+0
También conocido como RAID 10 que es una división de espejos.
En cada división RAID 1 pueden fallar todos los discos salvo uno sin que se pierdan datos. Sin embargo, si los discos que han fallado no se reemplazan, el restante pasa a ser un punto único de fallo para todo el conjunto. Si ese disco falla entonces, se perderán todos los datos del conjunto completo. Como en el caso del RAID 0+1, si un disco que ha fallado no se reemplaza, entonces un solo error de medio irrecuperable que ocurra en el disco espejado resultaría en pérdida de datos. El RAID 10 es a menudo la mejor elección para bases de datos de altas prestaciones, debido a que la ausencia de cálculos de paridad proporciona mayor velocidad de escritura.






RAID 3+0



Es ideal para aplicaciones no interactiva, tal como señales de grafico e imágenes .Se conoce también como Striping de arreglos de paridad dedicada .La información es distribuida a través de los discos, como en Raid 0 y utiliza paridad dedicada, como Raid 3, en un segundo canal, requiere mínimo 6 discos.
• Proporciona una alta confiabilidad igual que el Raid 10 ya que también es capaz de tolerar dos fallas físicas en canales diferentes, manteniendo la información disponible. Raid 30 es mejor para aplicaciones no interactivas, tal como señales de video , gráficos, que procesan secuencial mete grandes archivos y requieren alta velocidad y disponibilidad.



RAID 5+0
combina la división a nivel de bloques de un RAID 0 con la paridad distribuida de un RAID 5, siendo pues un conjunto RAID 0 dividido de elementos RAID 5.Un disco de cada conjunto RAID 5 puede fallar sin que se pierdan datos. Sin embargo, si el disco que falla no se reemplaza, los discos restantes de dicho conjunto se convierten en un punto único de fallo para todo el conjunto. Si uno falla, todos los datos del conjunto global se pierden. El tiempo necesario para recuperar (detectar y responder al fallo de disco y reconstruir el conjunto sobre el nuevo disco) representa un periodo de vulnerabilidad del conjunto RAID.





RAID 10+0




Conocido como RAID 100. Es una división de conjuntos RAID 10. Todos los discos menos unos podrían fallar en cada RAID 1 sin perder datos. Sin embargo, el disco restante de un RAID 1 se convierte así en un punto único de fallo para el conjunto degradado. A menudo el nivel superior de división se hace por software. Los principales beneficios de un RAID 100 (y de los RAID cuadriculados en general) sobre un único nivel RAID son mejor rendimiento para lecturas aleatorias y la mitigación de los puntos calientes de riesgo en el conjunto. Por estas razones, el RAID 100 es a menudo la mejor elección para bases de datos muy grandes, donde el conjunto software subyacente limita la cantidad de discos físicos permitidos en cada conjunto estándar.


Conclusión



Los niveles RAID es efectiva para aquellos usuarios que necesiten una gran demanda y seguridad en cuando almacenamiento de datos se refiere, de modo que cada nivel RAID se utiliza para guardar datos de manera efectiva en un sistema o sistemas que cuentan con grandes bases de datos.



Bibliografía

http://www.madboxpc.com/contenido.php?id=1183&pag=3
http://www.onraidservices.com/raid_4.htm
http://www.smdata.com/NivelesRAID.htm

Creado por:

Daniel Delgado

Farah Hurtado

Andrea Pinto

Osiris Rodríguez

Carolina Tristá