Basics Flashcards

Question

Welche möglichen Klassen gibt es nach Flynn?

Answer 1

SISD: Einprozessorrechner MIMD: Mehrprozessorrechner SIMD: Vektorrechner, GPUs MISD: Existiert nicht

Answer 2

NORMA: No Remote Memory Access UMA: Uniform Memory Access NUMA: Nonuniform Memory Access

Answer 3

- Nachrichtengekoppelte Systeme - Verteilter Speicher, verteilter Adressraum - Kommunikation über Nachrichten - Distributed Memory Systeme (DMM) - Gute Skalierbarkeit

Answer 4

- Speichergekoppelte Systeme - Globaler Speicher, gemeinsamer Adressraum - Alle Prozessoren greifen in gleicher Weise und in gleicher Zeit auf den Speicher zu - Kommunikation und Synchronisation über gemeinsamen Speicher - Symmetrische Multiprozessoren (SMP), Multicore-CPUs - Begrenzte Skalierbarkeit

Answer 5

- Speichergekoppelte Systeme - Verteilter Speicher, gemeinsamer Adressraum - Zugriff auf lokalen Speicher schneller als auf entfernten - Distributed Shared Memory Systeme (DSM) - Kombiniert gemeinsamen Speicher mit Skalierbarkeit

Answer 6

Ein schnelle Zwischenspeicher, in der Nähe der CPU. Er speichert Kopien der zuletzt verwendeten Daten aus dem Hauptspeicher. Wenn sich die Daten im Cache befinden ist kein Zugriff auf den Hauptspeicher erforderlich

Answer 7

Caches sind in Multiprozessor-Systemen unerlässlich, denn sonst können Speicher und Verbindungsnetz schnell zu einem Engpass werden. So wird die Eigenschaft der Lokalität ausgenutzt und jeder Prozess arbeitet meist auf seinen "eigenen" Daten

Answer 8

Die Existenz mehrfacher Kopien kann zu Inkonsistenzen in den Daten führen

Answer 9

Bei einem Schreibzugriff müssen alle Caches mit Kopien benachrichtigt werden.

Answer 10

Bus dient als Verbindungsnetz, somit ist jeder Zugriff auf den Hauptspeicher für alle sichtbar. Einfache Cache-Kohärenzprotokolle aber schlechte Skalierbarkeit, da der Bus eine gemeinsame, zentrale Ressource ist

Answer 11

Zugriffe auf den Hauptspeicher sind in der Regel nicht für andere Prozesse sichtbar. Daher müssen die betroffenen Caches explizit benachrichtigt werden. Die Cache-Kohärenzprotokolle werden sehr komplex aber man hat eine gute Skalierbarkeit

Answer 12

Bei SMPs und DSMs können CPUs mit dynamischem Befehlsscheduling oder Schreibpuffern zu scheinbar unmöglichen Ausgaben einen Programms führen -> Programmzeilen werden in einer anderen Reihenfolge ausgeführt

Answer 13

Eine sequentielle Konsistenz liegt vor, wenn Prozessoren die Speicheroperationen eines parallelen Programms in Programmordnung ausführen

Answer 14

Eine sequentielle Konsistenz bedeutet starke Einschränkungen für die Rechnerarchitektur, daher nutzen Parallelrechner mit gemeinsamen Speicher abgeschwächte Konsistenzmodelle. Jeder Prozessor sieht seine eigenen Speicheroperationen, jedoch immer in Programmordnung

Answer 15

1. Partitioning 2. Communication 3. Agglomeration 4. Mapping

Answer 16

Die Tasks beschreiben identische Aufgaben für einen Teil der Daten und es ist ein hoher Parallelitätsgrad möglich

Answer 17

Tasks beschreiben unterschiedliche Teilaufgaben des Problems und können nebenläufig oder als pipeline arbeiten. Der maximale Gewinn entspricht der Zahl der Teilaufgaben

Answer 18

Die Definition der Kommunikationsstruktur und der zu versendenden Nachrichten

Answer 19

local vs. global structured vs. unstructured static vs. dynamic synchronous vs. asynchronous

Answer 20

Die Ziele der Agglomeration sind die Reduktion der Kommunikationskosten und die Beibehaltung der Flexibilität

Answer 21

1. Nebenläufige Tasks auf unterschiedliche Prozessoren | 2. Kommunizierende Tasks auf einen Prozessor

Answer 22

Static Mapping (Feste Zuweisung von Tasks zu Prozessoren zum Programmstart) vs. Dynamic Mapping ( Zuweisung erfolgt zur Laufzeit)

Answer 23

- Embarassingly Parallel - Manager/ Worker Modell - Work Pool Model - Divide and Conquer - Data Parallel Modell SPMD - Fork/ Join Modell - Task-Graph Modell - Pipeline Modell

Answer 24

Die zu lösende Aufgabe kann in eine Menge vollständig unabhängiger Teilaufgaben zerlegt werden, die keinen Datenaustausch oder Kommunikation benötigen

Answer 25

Es gibt einen Manager, der Tasks erzeugt und diese den Workern zuteilt. Es sind mehrere Manager und sogar eine Hierarchie möglich. Der Manager kann weitere Tasks erzeugen während die Worker arbeiten. Ein mögliches Problem ist, dass der Manager zum Bottleneck werden kann

Answer 26

Es existiert ein zentraler oder verteilter Pool mit einer Liste von zu bearbeiteten Tasks. Die einzelnen Prozesse holen sich die Tasks aus dem Pool. Wichtig ist, dass diese Zugriffe synchronisiert werden müssen und die Prozesse können ggf. auch neue Tasks in den Pool legen

Answer 27

Es erfolgt eine rekursive Aufteilung der Aufgabe in unabhängige Teilaufgaben. Problem ist dabei die begrenzte Anzahl an Threads.

Answer 28

Man hat eine feste, konstante Anzahl von Prozessoren und eine 1 zu 1 Zuordnung von Tasks zu Prozessoren. Alle Prozesse arbeiten denselben Programmcode ab und man hat meist einen losen synchronen Ablauf bei dem abwechselnde Phasen unabhängiger Berechnungen und Kommunikation/Synchronisation stattfinden

Answer 29

Das Programm besteht aus sequentiellen und parallelen Phasen. Für die parallelen Phasen werden die Threads zur Laufzeit erzeugt (Fork) und am Ende der parallelen Phasen erfolgt eine Synchronisation und Beendigung der Threads (Join)

Answer 30

Die Tasks und deren Abhängigkeiten werden als Graph dargestellt. Jede Kante im Graph repräsentiert einen Datenaustausch und die Zuordnung von Tasks zu Prozessoren erfolgt in der Regel so, dass möglichst wenig Kommunikation notwendig wird

Answer 31

Ein Strom von Daten wird durch eine Folge von Prozessen geleitet. Die Bearbeitung einer Task startet, sobald ein Datenelement ankommt. Die Pipeline muss nicht notwendigerweise linear sein und zwischen den Prozessen hat man eine Erzeuger-Verbraucher-Synchronisation

Answer 32

Laufzeit, Durchsatz, Speicherbedarf, | Prozessorauslastung, Entwicklungskosten, Wartungskosten

Answer 33

Die Laufzeit eines Programmes ist die Zeit zwischen dem Start des Programms und dem Ende der Berechnung auf dem letzten Prozessor

Answer 34

Speedup ist der Laufzeit-Gewinn durch Parallelausführung | S(p) = Ts/T(p)

Answer 35

S(p) = T(1)/T(p)

Answer 36

Amdahls Gesetz liefert eine obere Schranke für den Speedup, denn in der Regel können nicht alle Teile des Programms parallelisiert werden

Answer 37

Die Effizienz ist ein Maß für die Ausnutzung des Parallelrechners E(p) = S(p)/p

Answer 38

``` Zugriffsverluste Auslastungsverluste Konfliktverluste Komplexitätsverluste Algorithmische Verluste Wegwerfverluste Bremsverluste ```

Answer 39

Für eine optimale Leistung sollten Prozessoren zwischen zwei (globalen) Synchronisationen gleich lange rechnen

Answer 40

- Ungleiche Rechenlast der Tasks (statisch) - Heterogene Ausführungsplattform (statisch) - Rechenlast der Tasks ändern sich dynamisch (dynamisch) - Hintergrundlast auf den Prozessoren (dynamisch)

Answer 41

Das Ziel beim statischen Lastenausgleich ist die Tasks bei/vor Programmstart so auf die Prozessoren zu verteilen, dass die Rechenlast der Prozessoren identisch ist

Answer 42

Unabhängige Tasks werden dynamisch Prozessoren zugeteilt und bleiben dort bis zum Ende ihrer Bearbeitung mit dem Ziel, dass die Prozessoren nicht untätig werden. Kommunizierende Tasks werden ggf. zwischen den Prozessen verschoben, um eine gleiche Rechenzeit zwischen Synchronisationen zu gewährleisten

Answer 43

``` CPU-Zeit (Enthält keine Wartezeiten) Wall Clock Zeit (Mit Blockierungszeiten) Kommunikationszeit und -Volumen Metriken des Betriebssystems Hardware-Metriken ```

Answer 44

Sampling Profiling Tracing

Answer 45

Sampling ist eine Leistungsanalyse Methode, bei der regelmäßige Unterbrechungen des Programms zum Auslesen des aktuellen Befehlszählerstandes verwendet werden

Answer 46

Profiling ist eine Leistungsanalyse Methode, bei der die Auswertung der Ergebnisse während der Erfassung erfolgt

Answer 47

Tracing ist eine Leistungsanalyse Methode, bei der die Auswertung der Ergebnisse nach Ende des Programmablaufs erfolgt

Answer 48

+ niedrige, vorhersagbare Rückwirkung; Quellcode Bezug | - Begrenzte Genauigkeit, keine Zeitauflösung

Answer 49

+ Reduzierte Datenmenge | - Wenig flexibel

Answer 50

+ Erfassung aller relevanter Daten mit hoher Zeitauflösung | - relativ große Rückwirkungen, große Datenmengen

Basics Flashcards

(74 cards)