RAID y Almacenamiento de Datos Flashcards

1
Q

¿Qué significan las siglas RAID?

A

Redundant Arrays of Inexpensive Disks (RAID), más adelante se reemplazó la I por Independent.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

¿Qué propone el concepto de RAID?

A

Ante el alto costo de discos de gran capacidad, propone usar un conjunto de discos de menor capacidad con un controlador que se encargue de administrarlos. Se introduce redundancia para compensar el aumento en la tasa de fallas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

¿Qué significa la sigla SLED?

A

Single Large Expensive Disk (SLED)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

¿Qué significa JBOD?

A

Just a Bunch Of Disks (JBOD). Significa tener muchos discos pero sin un controlador inteligente para administrarlos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

¿Cuáles son las principales ventajas de usar RAID frente a SLED?

A

Ventajas de usar RAID:
- Paralelismo: Se puede acceder a distintas posiciones de memoria al mismo tiempo mientras estas no se encuentren en el mismo disco.
- Costo: El costo de muchos discos con poca capacidad de almacenamiento es menor al de uno solo con mucha capacidad.
- Modularidad: El sistema es más flexible y escalable.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

¿Cuáles son las principales desventajas de usar RAID en vez de SLED?

A

Desventajas de usar RAID:
- Menor confiabilidad: Al aumentar la cantidad de discos, aumenta la probabilidad de falla del conjunto.
- Requiere controlador: La administración de un arreglo es más complicada que la de un único disco. Es necesario usar un controlador RAID para agregar un nivel de abstracción tal que externamente se comporte como un gran disco.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

¿Qué es un strip?

A

Son franjas de memoria de tamaño fijo. Cada archivo se descompone en una cierta cantidad de strips para poder distribuirlo entre varios discos. Esto permite paralelizar al máximo pero disminuye la confiabilidad.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

¿En qué consiste RAID 0?

A

Es un conjunto de discos administrados por un controlador que divide los archivos en strips y los reparte entre varios discos, para así poder paralelizar. Si embargo, no implementa redundancia, por lo que si se rompe un disco se pierde 1 strip de cada archivo.
Requiere N discos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

¿Cuál es la principal crítica a RAID 0?

A

Es poco confiable. Al no implementar redundancia, si falla un disco se pierde información.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

¿En qué consiste RAID 1?

A

Es un arreglo RAID con redundancia absoluta, toda información está duplicada. Se agrega un disco mellizo por cada uno en el conjunto (“mirror disk”). Así, cuando se rompe un disco el conjunto sigue funcionando y al escribir se graba el dato en cada disco de forma simultánea.
Requiere 2N discos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

¿Cuál es la principal crítica a RAID 1?

A

El costo. Además de costear el doble de discos, se requiere más espacio físico, más consumo eléctrico, más refrigeración, etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

¿En qué consiste RAID 2?

A

Es un arreglo RAID que implementa paridad de Hamming y trabaja a nivel de bit. Entonces si se trabaja con datos de 16 bits, también se guardarán los 5 bits de Hamming, uno en cada disco.
Requiere N + r discos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

¿En qué consiste RAID 3?

A

Es un arreglo RAID que implementa paridad de Hamming a nivel de bit y guarda 1 sólo bit de paridad en un disco. Entonces si se trabaja con datos de 8 bits, se usarán 9 discos donde el noveno guarda el bit de paridad.
Requiere N + 1 discos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

¿Cuál es la principal crítica a RAID 2 y 3?

A

Que trabajan a nivel de bit. No son consistentes con las tecnologías actuales por lo que no son prácticos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

¿En qué consiste RAID 4?

A

Es un arreglo RAID que implementa paridad a nivel de bloques. Se agrega un disco que guarda la paridad de cada strip, frente a la falla de algún disco se puede recuperar la información con los demás. Soporta una única falla.
Requiere N + 1 discos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

¿Cuál es la principal crítica a RAID 4?

A

Al guardar todas las paridades en el mismo disco, la escritura no se puede paralelizar. Aunque se actualicen discos distintos, siempre se deberá editar el disco de paridad, generando un cuello de botella.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

¿En qué consiste RAID 5?

A

Es un arreglo RAID que implementa paridad a nivel de bloques y la guarda en discos distintos. De esta forma las paridades quedan distribuidas y se puede paralelizar la escritura. Frente a la falla de algún disco se puede recuperar la información con los demás. Soporta una única falla.
Requiere N + 1 discos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

¿Cuál es la principal crítica a RAID 5?

A

Como tiene que recalcular paridades, es lento en la escritura ya que requiere 4 operaciones. Se tiene que leer el dato nuevo, crear la nueva paridad, guardar la paridad y guardar el dato nuevo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

¿Cuántas operaciones requiere una escritura en RAID 5?

A

Cuatro, dos lecturas y dos escrituras.
Se tiene que leer el dato nuevo, crear la nueva paridad, guardar la paridad y guardar el dato nuevo.

20
Q

¿En qué consiste RAID 6?

A

Es un arreglo RAID que implementa paridad a nivel de bloques, la guarda en discos distintos y además agrega un disco que guarda la paridad de las strips en diagonal. Frente a la falla de 2 discos se puede recuperar la información con los demás. Soporta dos fallas.
Requiere N + 2 discos.

21
Q

¿Qué es un On-line Spare?

A

Es un disco adicional al necesario en el RAID, que se encuentra inactivo. Cuando el controlador detecta que un disco falla, activa el disco adicional y el sistema vuelve a ser redundante, a la espera de que un operador humano reemplace el repuesto.

22
Q

¿En qué estados puede estar un disco?

A
  • Funcionando correctamente (luz verde)
  • Degradado o deteriodado (luz amarilla)
  • Roto o sin funcionar (luz roja)
23
Q

¿Qué es un BBWC?

A

Un Battery Back Write Caché (BBWC) es una placa con memoria SRAM que actúa como buffer de escritura para el RAID. De esta forma se reduce la latencia que percibe el software, mitigando la principal desventaja de RAID 5.
Cuenta con baterías para guardar la información ante un corte de luz y volver a escribirla cuando se reestablezca.

24
Q

¿En qué consiste el concepto de Hot Plug?

A

Se refiere a la capacidad de conectar o desconectar equipos durante el funcionamiento. El sistema redistribuye el RAID en momentos de inactividad.

25
Q

¿Qué significa la sigla SMART?

A

Self Monitoring Analysis Reporting Technology (SMART)
Es un sistema de monitoreo para los discos. Detecta y registra los defectos y las demoras con el objetivo de dar alertas temprana a fallas en los discos.

26
Q

¿Qué significan las siglas NAS?

A

Network Attached Storage (NAS) o “almacenamiento conectado en red” es una tecnología de almacenamiento dedicada a compartir la capacidad de almacenamiento de un servidor con clientes a través de una red (no cloud).

27
Q

¿Qué significan las siglas SAN?

A

Storage Area Network (SAN) es una red de almacenamiento integral que se utiliza para proporcionar un grupo de almacenamiento compartido al que pueden acceder varios clientes y servidores.

28
Q

¿A qué se refiere el término “cinco nueves”?

A

Que un servicio debe estar disponible el 99.999% del tiempo.

29
Q

¿En qué consiste un clúster de servidores?

A

Consiste en un conjunto de dos o más servidores con un sistema de almacenamiento compartido, que trabajan de forma simultánea.

30
Q

¿Para qué sirve el heartbeat en un clúster de servidores?

A

El heartbeat es una señal compartida que utilizan los servidores para monitorearse entre sí. Cuando un servidor deja de funcionar, se deja de recibir la señal y luego de un tiempo (time out) se asume que está caído.

31
Q

¿Qué ocurre cuando se deja de recibir el heartbeat?

A

Luego de cierto tiempo de time out, los demás servidores ejecutan un Fail Over, donde se hacen cargo de las tareas críticas que le corresponden al servidor caído.

32
Q

¿Qué es un Fail Over?

A

Se refiere a la redistribución de la tareas críticas de un servidor caído a los demás servidores. Puede ser automático o manual y está definido por la política de fail over.

33
Q

¿Qué es un Fail Back?

A

Cuando un servidor vuelve a estar disponible, se realiza un Fail Back, donde se vuelve a encargar de sus tareas asignadas. Este proceso siempre es manual.

34
Q

¿A qué se refiere un el concepto de Single Point Of Failure (SPOF)?

A

Se refiere a un sistema que tiene un elemento sin redundancia, que si se rompe falla todo el sistema.

35
Q

¿Cómo se puede mantener la disponibilidad ante un corte de luz?

A

Se suele utilizar baterías (o UPS) que mantienen funcionando el sistema hasta que el grupo electrógeno termina de iniciar.

36
Q

¿Cómo se evita que algún desastre impida el funcionamiento de los servidores?

A

Se instalan clústers en distintas zonas para que frente a un desastre en una de ellas, el otro sitio pueda mantener el servicio.

37
Q

¿Cómo se evita que algún desastre impida el funcionamiento de los servidores?

A

Se instalan clústers en distintas zonas para que frente a un desastre en una de ellas, el otro sitio pueda mantener el servicio.

38
Q

¿En qué consiste la replicación remota?

A

En tener duplicado el almacenamiento.

39
Q

¿Para qué sirve un Disaster Recovery Plan?

A

Define el procedimiento a seguir frente a un desastre que deje sin servicio a alguna parte del sistema.

40
Q

¿Cómo se puede proteger el sistema del sabotaje?

A

Se utilizan sistemas de log shipping que introducen un retardo de tiempo en los datos que se mandan desde un sistema de almacenamiento a copias. Además registra los cambios realizados sobre el sistema de almacenamiento.

41
Q

¿En qué consiste un snapshot?

A

Un snapshot congela el estado de un sistema en un instante para luego hacer una copia externa del mismo. Mientras tanto, va guardando en una copia auxiliar sólo los datos que se están por modificar. Eventualmente se deberá realizar la copia completa a un disco externo.

42
Q

¿Qué es la deduplicación?

A

Cuando el sistema de almacenamiento detecta que un mismo archivo está guardado en muchos lugares, en vez de guardarlo muchas veces lo guarda una sóla vez y se entrega un “puntero” a los demás usuarios. Si alguno modifica el archivo, ahí sí se guarda una copia.

43
Q

Si tenemos un RAID 5 con 5 discos y falla uno tal que queda funcionando con 4 discos ¿Cómo se realizan las escrituras que correspondes a stripes del disco fallido?

A

A la hora de escribir, la controladora lee todos los demás stripes y la paridad antigua, calcula la nueva paridad y escribe sólo la paridad porque ya no existe el stripe correspondiente.
Es más lento porque se hacen 4 lectura en vez de 2, pero se hace 1 sola escritura en vez de 2.

44
Q

Los equipos “inteligentes” de almacenamiento de datos…

a) únicamente soportan funciones de replicación remota a nivel de archivos (files).
b) ofrecen deduplicación para optimizar el espacio usado por carpetas y documentos de usuarios.
c) recurren a un mecanismo de “registro de cambios” para soportar funciones de snapshot.
d) son necesarios para implementar réplicas diferidas por medio de log shipping.
e) pueden emplear réplicas diferidas para prevenir diversos ataques y errores operativos.

A
45
Q

Las funciones de almacenamiento de datos pueden ser planteadas en un modelo por capas, análogo al modelo ISO-OSI. Con ese enfoque…
a) una placa HBA (SCSI, Fibre Channel, etc.) se asocia con la capa fisica del modelo.
b) una interfaz SATA, SAS, o NVMe se asocia, en general, con las capas superiores del modelo.
c) la gestión de buses y redes de tipo SAN pueden quedar a cargo de drivers, y corresponden a capas medias, o medio-bajas, del modelo.
d) la gestión de carpetas, archivos y espacio disponible son funciones del sistema de archivo, y corresponden a las capas superiores del modelo.
e) las capas superiores brindan servicios a las capas inferiores del modelo.

A
46
Q

“Storage-Area” Networks (SAN):

a) Una SAN suele incluir elementos muy variados, de funcionamiento intermitente y que pueden moverse entre distintos sitios a lo largo del tiempo.
b) Una SAN basada en protocolos FibreChannel sólo puede implementarse mediante fibra óptica, siendo incompatible con cables metálicos (“cobre”).
c) Una SAN implementada según iSCSI puede aprovechar dispositivos de hardware y componentes de software que también se utilizan en redes de datos basadas en Ethernet y en TCP/IP.
d) Una SAN puede incluir equipos de almacenamiento que replican información en forma autónoma, sin depender de los servidores, computadoras o elementos de software.
e) Un “canal” es similar a una red, pero por su especialización no requiere el overhead que las redes precisan para soportar mayor diversidad. Así, el canal ofrece mayor eficiencia, a igualdad de otros aspectos.

A