RAID y Almacenamiento de Datos Flashcards
¿Qué significan las siglas RAID?
Redundant Arrays of Inexpensive Disks (RAID), más adelante se reemplazó la I por Independent.
¿Qué propone el concepto de RAID?
Ante el alto costo de discos de gran capacidad, propone usar un conjunto de discos de menor capacidad con un controlador que se encargue de administrarlos. Se introduce redundancia para compensar el aumento en la tasa de fallas.
¿Qué significa la sigla SLED?
Single Large Expensive Disk (SLED)
¿Qué significa JBOD?
Just a Bunch Of Disks (JBOD). Significa tener muchos discos pero sin un controlador inteligente para administrarlos.
¿Cuáles son las principales ventajas de usar RAID frente a SLED?
Ventajas de usar RAID:
- Paralelismo: Se puede acceder a distintas posiciones de memoria al mismo tiempo mientras estas no se encuentren en el mismo disco.
- Costo: El costo de muchos discos con poca capacidad de almacenamiento es menor al de uno solo con mucha capacidad.
- Modularidad: El sistema es más flexible y escalable.
¿Cuáles son las principales desventajas de usar RAID en vez de SLED?
Desventajas de usar RAID:
- Menor confiabilidad: Al aumentar la cantidad de discos, aumenta la probabilidad de falla del conjunto.
- Requiere controlador: La administración de un arreglo es más complicada que la de un único disco. Es necesario usar un controlador RAID para agregar un nivel de abstracción tal que externamente se comporte como un gran disco.
¿Qué es un strip?
Son franjas de memoria de tamaño fijo. Cada archivo se descompone en una cierta cantidad de strips para poder distribuirlo entre varios discos. Esto permite paralelizar al máximo pero disminuye la confiabilidad.
¿En qué consiste RAID 0?
Es un conjunto de discos administrados por un controlador que divide los archivos en strips y los reparte entre varios discos, para así poder paralelizar. Si embargo, no implementa redundancia, por lo que si se rompe un disco se pierde 1 strip de cada archivo.
Requiere N discos.
¿Cuál es la principal crítica a RAID 0?
Es poco confiable. Al no implementar redundancia, si falla un disco se pierde información.
¿En qué consiste RAID 1?
Es un arreglo RAID con redundancia absoluta, toda información está duplicada. Se agrega un disco mellizo por cada uno en el conjunto (“mirror disk”). Así, cuando se rompe un disco el conjunto sigue funcionando y al escribir se graba el dato en cada disco de forma simultánea.
Requiere 2N discos.
¿Cuál es la principal crítica a RAID 1?
El costo. Además de costear el doble de discos, se requiere más espacio físico, más consumo eléctrico, más refrigeración, etc.
¿En qué consiste RAID 2?
Es un arreglo RAID que implementa paridad de Hamming y trabaja a nivel de bit. Entonces si se trabaja con datos de 16 bits, también se guardarán los 5 bits de Hamming, uno en cada disco.
Requiere N + r discos.
¿En qué consiste RAID 3?
Es un arreglo RAID que implementa paridad de Hamming a nivel de bit y guarda 1 sólo bit de paridad en un disco. Entonces si se trabaja con datos de 8 bits, se usarán 9 discos donde el noveno guarda el bit de paridad.
Requiere N + 1 discos.
¿Cuál es la principal crítica a RAID 2 y 3?
Que trabajan a nivel de bit. No son consistentes con las tecnologías actuales por lo que no son prácticos.
¿En qué consiste RAID 4?
Es un arreglo RAID que implementa paridad a nivel de bloques. Se agrega un disco que guarda la paridad de cada strip, frente a la falla de algún disco se puede recuperar la información con los demás. Soporta una única falla.
Requiere N + 1 discos.
¿Cuál es la principal crítica a RAID 4?
Al guardar todas las paridades en el mismo disco, la escritura no se puede paralelizar. Aunque se actualicen discos distintos, siempre se deberá editar el disco de paridad, generando un cuello de botella.
¿En qué consiste RAID 5?
Es un arreglo RAID que implementa paridad a nivel de bloques y la guarda en discos distintos. De esta forma las paridades quedan distribuidas y se puede paralelizar la escritura. Frente a la falla de algún disco se puede recuperar la información con los demás. Soporta una única falla.
Requiere N + 1 discos.
¿Cuál es la principal crítica a RAID 5?
Como tiene que recalcular paridades, es lento en la escritura ya que requiere 4 operaciones. Se tiene que leer el dato nuevo, crear la nueva paridad, guardar la paridad y guardar el dato nuevo.