V4_Raid Flashcards
Ziel von Raid
Kein Datenverlulst beim Ausfall einer oder mehrerer Festplatten
Uneingeschränkte Verfügbarkeit der Daten.
Keine Auswirkungen des zusätzlichen Sicherungsmechanismus auf die Applikationen
Vorteile von Raid
- Höhere Verfügbarkeit der Daten bei Ausfall einer oder mehrerer Platten durch Redundanz
-Bessere Performance. Je nachdem welches RAID
Aufgabe des RAID Controllers
Hat die Rolle des Festplattencontrollers / -treibers
- Stellt das RAID Array gegenüber dem Host als eine logische Festplatte dar.
RAID Controller übersetzt Schreib- und Lesezugriffe auf diese logische Festplatte in entsprechende Zugriffe auf die physikalischen Festplatten des RAID Arrays.
- Sammelt ggf. Informationen über den Status der einzelnen Festplatten und stellt diese Information zur Verfügung.
Realisierung des RAID Controllers in ..
- Hardware
- Software
- und getrennt von der
Implementierung des
Dateisystems - zb RAID Module im Linux
Kernel - Benutzt den Standart
Festplattencontroller
- und getrennt von der
- Software als Teil des
Dateisystems- RAID Funktionalität integriert
in den Dateisystemtreiber
- RAID Funktionalität integriert
RAID Architektur - Host-Based RAID
RAID ist Teil des Host Systems.
Die Realisierung kann dann entweder als Software oder Hardware RAID sein.
Einfache host-basierte RAID Lösungen belasten den Prozessor und die Datentransferbusse des Hosts sehr stark
- Performanceeinbußen
Vor- und Nachteile von Software RAID
+ Keine Hardware für den RAID Controller benötigt.
+ Kann zu existierendem Rechner zur Laufzeit hinzugefügt werden
- Belastet CPU und Bussysteme des Rechners
- Arbeitsspeicher des Rechners als Cache
RAID über Festplatten oder Partitionen
Einige RAID Implementierungen können nicht nur ganze Festplatten zu einem RAID kombinieren, sondern alternativ auch einzelne Partitionen verschiedener Festplatten
RAID 1
Mirroring der Daten über die Festplatten des RAID 1 Arrays
Redundanz der Daten: die gleichen Daten gespiegelt auf allen Platten
- Daten redundant gespeichert selbst beim Ausfall von bis zu n-2 Platten
- Daten noch vollständig verfügbar selbst beim Ausfall von bis zu n-1 Platten
Kapazität des RAID 1 Arrays bestimmt durch die Kapazität der kleinsten Platte / Partition
Sehr einfaches Funktionsprinzip.
- Hat positive Auswirkungen auf die Verfügbarkeitsaspekte.
RAID 1 arbeitet mit einr festen Blockgröße (chunk size) von meist 64kB.
RAID 1 Verfügbarkeitsaspekte
Hohe Ausfallsicherheit, insbes. bei n > 2 Disks
Sehr einfaches Rebuild der Redundanz nach Ausfall von n-1 Disks
RAID 1 geringe Kosteneffizienz
- Hohe Kosten für Redundanz.
Benutzt n-1 Platten nur für Redundanzzwecke.
Diese Platten bieten keine zusätzliche Speicherkapazität.
RAID 1 Performanceaspekte
Erhöhte Leseperformance durch Lesen von mehreren Festplatten des RAID 1 Arrays.
Ausfall von bis zu n-1 Platten hat erst einmal keine Auswirkungen auf die operative Performance des RAID 1 Arrays
Das Schreiben der gespiegelten Nutzdaten erfordert zusätzlilche Datentransfer-Kapazität zwischen Controller und Platte.
RAID 5
Daten werden über die Festplatten des RAID 5 Arays verteilt -> striping
Plus Datenredundanz mittels Paritätsinformation.
Paritätsblöcke gleichmäßig über alle Platten verteilt.
RAID 5 Paritätsinformation
Daten des Paritätsblocks durch bit-by-bit XOR Verknüfung der Daten des RAID 5 Stripeset.
Bei n Festplatten im RAID 5 Array: Jeweils ein Paritätsblock pro n-1 Datenblöcken
Egal welche Platte ausfällt: Die Daten dieser Festplatte sind immer aus den Daten der anderen Platten berechenbar.
RAID 5 Charakteristika
RAID 5 arbeitet mit einr festen BLockgröße (chunk size) von meist 64 kB.
Redundanz der Daten: Redundante Paritätsinformation erlaubt den Rebuild einer Platte bei deren Verlust.
Erhöhte Leseperformance durch Lesen von mehreren Festplatten des RAID 5 Arrays.
Nutzerdatenkapazität des RAID 5 Arrays: (Anzahl Platten -1)*Kapazität der kleinsten Platte
-> Bei vier 200 GB Festplatten.
(4-1)*200GB = 600GB Nutzdaten, 200GB Paritätsdaten verteilt auf alle vier Festplatten.
Berechnung der Paritätsdaten erfordert Processing-Kapazität, und Schreiben der Paritätsdaten erfordert Datentransfer-Kapazität zwischen Controller und Platte.
RAID 5 Kosteneffizienz
Relativ geringe Kosten für die Redundanz.
Effiziente Nutzung der Gesamtkapazität aller Platten.
Hardware RAID ist empfehlenswert.
- Kosten des Hardware RAID Controllers.