V4_Raid Flashcards

1
Q

Ziel von Raid

A

Kein Datenverlulst beim Ausfall einer oder mehrerer Festplatten

Uneingeschränkte Verfügbarkeit der Daten.

Keine Auswirkungen des zusätzlichen Sicherungsmechanismus auf die Applikationen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vorteile von Raid

A
  • Höhere Verfügbarkeit der Daten bei Ausfall einer oder mehrerer Platten durch Redundanz

-Bessere Performance. Je nachdem welches RAID

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Aufgabe des RAID Controllers

A

Hat die Rolle des Festplattencontrollers / -treibers

  • Stellt das RAID Array gegenüber dem Host als eine logische Festplatte dar.

RAID Controller übersetzt Schreib- und Lesezugriffe auf diese logische Festplatte in entsprechende Zugriffe auf die physikalischen Festplatten des RAID Arrays.

  • Sammelt ggf. Informationen über den Status der einzelnen Festplatten und stellt diese Information zur Verfügung.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Realisierung des RAID Controllers in ..

A
  • Hardware
  • Software
    • und getrennt von der
      Implementierung des
      Dateisystems
    • zb RAID Module im Linux
      Kernel
    • Benutzt den Standart
      Festplattencontroller
  • Software als Teil des
    Dateisystems
    • RAID Funktionalität integriert
      in den Dateisystemtreiber
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

RAID Architektur - Host-Based RAID

A

RAID ist Teil des Host Systems.

Die Realisierung kann dann entweder als Software oder Hardware RAID sein.

Einfache host-basierte RAID Lösungen belasten den Prozessor und die Datentransferbusse des Hosts sehr stark

  • Performanceeinbußen
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vor- und Nachteile von Software RAID

A

+ Keine Hardware für den RAID Controller benötigt.
+ Kann zu existierendem Rechner zur Laufzeit hinzugefügt werden

  • Belastet CPU und Bussysteme des Rechners
  • Arbeitsspeicher des Rechners als Cache
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

RAID über Festplatten oder Partitionen

A

Einige RAID Implementierungen können nicht nur ganze Festplatten zu einem RAID kombinieren, sondern alternativ auch einzelne Partitionen verschiedener Festplatten

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

RAID 1

A

Mirroring der Daten über die Festplatten des RAID 1 Arrays

Redundanz der Daten: die gleichen Daten gespiegelt auf allen Platten
- Daten redundant gespeichert selbst beim Ausfall von bis zu n-2 Platten
- Daten noch vollständig verfügbar selbst beim Ausfall von bis zu n-1 Platten

Kapazität des RAID 1 Arrays bestimmt durch die Kapazität der kleinsten Platte / Partition

Sehr einfaches Funktionsprinzip.
- Hat positive Auswirkungen auf die Verfügbarkeitsaspekte.

RAID 1 arbeitet mit einr festen Blockgröße (chunk size) von meist 64kB.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

RAID 1 Verfügbarkeitsaspekte

A

Hohe Ausfallsicherheit, insbes. bei n > 2 Disks

Sehr einfaches Rebuild der Redundanz nach Ausfall von n-1 Disks

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

RAID 1 geringe Kosteneffizienz

A
  • Hohe Kosten für Redundanz.

Benutzt n-1 Platten nur für Redundanzzwecke.
Diese Platten bieten keine zusätzliche Speicherkapazität.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

RAID 1 Performanceaspekte

A

Erhöhte Leseperformance durch Lesen von mehreren Festplatten des RAID 1 Arrays.

Ausfall von bis zu n-1 Platten hat erst einmal keine Auswirkungen auf die operative Performance des RAID 1 Arrays

Das Schreiben der gespiegelten Nutzdaten erfordert zusätzlilche Datentransfer-Kapazität zwischen Controller und Platte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

RAID 5

A

Daten werden über die Festplatten des RAID 5 Arays verteilt -> striping

Plus Datenredundanz mittels Paritätsinformation.
Paritätsblöcke gleichmäßig über alle Platten verteilt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

RAID 5 Paritätsinformation

A

Daten des Paritätsblocks durch bit-by-bit XOR Verknüfung der Daten des RAID 5 Stripeset.

Bei n Festplatten im RAID 5 Array: Jeweils ein Paritätsblock pro n-1 Datenblöcken

Egal welche Platte ausfällt: Die Daten dieser Festplatte sind immer aus den Daten der anderen Platten berechenbar.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

RAID 5 Charakteristika

A

RAID 5 arbeitet mit einr festen BLockgröße (chunk size) von meist 64 kB.

Redundanz der Daten: Redundante Paritätsinformation erlaubt den Rebuild einer Platte bei deren Verlust.

Erhöhte Leseperformance durch Lesen von mehreren Festplatten des RAID 5 Arrays.

Nutzerdatenkapazität des RAID 5 Arrays: (Anzahl Platten -1)*Kapazität der kleinsten Platte

-> Bei vier 200 GB Festplatten.
(4-1)*200GB = 600GB Nutzdaten, 200GB Paritätsdaten verteilt auf alle vier Festplatten.

Berechnung der Paritätsdaten erfordert Processing-Kapazität, und Schreiben der Paritätsdaten erfordert Datentransfer-Kapazität zwischen Controller und Platte.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

RAID 5 Kosteneffizienz

A

Relativ geringe Kosten für die Redundanz.

Effiziente Nutzung der Gesamtkapazität aller Platten.

Hardware RAID ist empfehlenswert.
- Kosten des Hardware RAID Controllers.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

RAID 5 Verfügbarkeitsaspekte

A

Datenintegrität des RAID 5 Arrays beim Ausfall von maximal einer Platte.

Beim Ausfall einer Platte ist ein Rebuild erforderlich um die Redundanz wiederherzustellen.
- Neue Platte / Hot Spare Platte erzählt Nutz- und Paritätsdaten gemäß dem RAID 5 Schema.
- Aufgabe des RAID Controllers.
- Datenverlust bei einem weiteren Festplattenausfall.
Bei nur einem einzigen nicht korrigierbaren Lesefehlern während des Rebuilds verweigert der RAID Controller ggfs. den Rebuild des “Rests” und “Betrieb als operatives Array mit einem kleinen Fehler”
- Rebuild Zeiten sind aus operativer Sicht zu beahten, da Unrecoverable Read Error während dieser Zeit nicht kompensierbar sind.

17
Q

Beispiel RAID 5 Rebuild

A

RAID 5 Array mit 3 Festplatten, je 3TB.

Eine Festplatte fällt aus und wird ersetzt, Rebuild.

RAID Controller muss 6 TB an Nutzdaten lesen um alle Paritäten neu zu berechnen.

Bei URE von 10^-14 bedeutet dies eine Wahrscheinlichkeit von 50%, dass es während des Rebuilds einen URE gibt un dder Rebuild fehlschlägt.

Der RAID Controller kann belegte und nicht belegte Teile der Festplatten nicht unterscheiden.

Ein URE im eigentlich nicht belegten Teil der Festplatte fürht also zur gleichen Konsequenz wie ein URE bei, “wirklichen Daten”

18
Q

RAID 5 Performanceaspekte

A

Erhöhte Leseperformance durch Lesen von mehreren Festplatten des RAID 5 Arrays.

Schreibperformance ist nicht optimal.
- Für jeden zu schreibenden Nutzdatenblock muss auch ein Paritätsblock geschrieben werden.
- Aber weniger zu schreibende Daten als bei RAID 1.
- Schreiben der Paritätsinformation ist gleichmäßig über alle Platten verteilt.

Hardware RAID ist empfehlenswert.

19
Q

Hot Spare Disk in einem RAID Array

A

Hot Spare Disks sind schon in das RAID Array “verkabelt”, aber noch nicht aktiv eingebunden, d.h. keine Datenspeicherung.

Vorteil:
Im Fehlerfall kan die fehlerhafte Festplatte sehr schnell durch eine Hot Spare Platte ersetzt werden.

20
Q

RAID 6

A

Erweiterung von RAID 5, so dass der Ausfall von bis zu zwei Festplatten kompensiert werden kann.

Zwei Sätze von Redundanzinformation pro RAID 6 Stripe.

21
Q

RAID 6 Charakteristika

A

Erhöht Leseperformance durch Lesen von mehreren Festplatten des RAID 6 Arrays.

Nutzdatenkapazität des RAID 6 Arrays:
(Anzahl Platten -2)*Kapazität der kleinsten Platte.

22
Q

RAID 6 Verfügbarkeitsaspekte

A

Datenintegrität des RAID 6 Arrays beim Ausfall von bis zu zwei Platten.

Insbesondere können nach dem Ausfall einer Platte auch Lesefehler während des Rebuilds ausgeglichen werden. Sogar der komplette Ausfall einer zweiten Platte kann toleriert werden.

23
Q

RAID 6 Performanceaspekte

A

Erhöhte Leseperformance durch Lesen von mehreren Festplatten des RAID 6 Arrays.

Schreibperformance ist nicht optimal.
-Für jeden zu schreibenden Nutzdatenblock müssen zwei Kontrollblöcke geschrieben werden.
-Schreiben der Kontrollinformation gleichmäßig über alle Platten verteilt.

24
Q

RAID 0

A

Daten werden über die Festplatten des RAID 0 Arrays verteilt -> striping

25
Q

RAID 0 Charakteristika

A

RAID 0 arbeitet mit einer festen Blockgröße (chunk size) von meist 64 kB.

26
Q

RAID 0 Verfügbarkeitsaspekte

A

Keine Redundanz!

Ausfall einr Platte ist schlimmer als bei n unabhängigen Platten.
- Bei n unabhängigen Platten: Nutzdaten auf n-1 Platten bleiben intakt.
- Bei RADI 0: im worst case sind alle Dateien der Nutzdaten von dem Ausfall der einen Platte betroffen -> Betriebsunterbrechung

27
Q

RAID 0 Performanceaspekte

A

Erhöhte Lese- und Schreibperformance durch Benutzung mehrerer Festplatten des RAID 0 Arrays.

28
Q

Nomenklatur

A

RAID XY… RAID 10. 1 ist der untere Raid und 0 ist der RAID darüber.