Kapitel 4: Simulationsstatistik und Optimierung Flashcards
Pseudo-Zufallszahlen
- Künstlich erzeugt (deterministisch)
- Müssen statistische Eigenschaften aufweisen, die sie als zufällig erscheinen lassen (Näherungsweises Folgen der gewünschten Verteilung, stochastische Unabhängigkeit, Abwesenheit von Häufungspunkten)
- Vorteile:
- Keine Beobachtung natürlicher Prozesse notwendig
- Reproduzierbarkeit
Warum muss man Simulationsläufe mehrfach wiederholen?
- Vertrauen in die statistischen Ergebnisse bekommen
* Reaktion des realen Systems vorherbestimmen
Arten der Zufallszahlenerzeugung
- Lineare Kongruenzmethode
* Mersenne-Twister
Lineare Kongruenzmethode
- Gängige Methode zur Erzeugung diskret-ganzzahlig, gleichmäßig verteilter Zufallszahlen
- Vier Parameter: Modulism, Multiplikator a, additive Konstante c, Initialwert x₀
- xₙ₊₁ = (a * xₙ + c) mod m → Gewinnung der nächsten Zufallszahl xₙ₊₁ aus der letzten Zufallszahl xₙ durch Multiplikation mit a, Addition von c und Betrachtung des Divisionsrestes einer Division durch m
- m bestimmt die maximale Periodenlänge, d.h. m sollte möglichst groß gewählt werden
- c sollte relative Primzahl zu m sein
Mersenne-Twister
- Heute wohl der für „ernste“ Anwendungen am weitesten verbreiteter Zufallszahlengenerator
- Extrem lange Periodenlänge
- Gleichverteilung und nahezu „perfekte“ Unabhängigkeit aller (Ausgabe-)Bits
- Effiziente Berechnung bei moderatem Speicherplatzbedarf
- Verwendung u.a. in DESMO-J
Kontinuierliche Verteilungen
- ⎕ Rechteckverteilung (Gleichmäßige Wahrscheinlichkeitsverteilungzwischen einem Minimum und Maximum,z.B. Wartezeit auf gleichmäßig getaktete Ereignisse)
- ⤷ Exponentialverteilung (Wartezeit auf Ereignisse mit fester Eintrittswahrscheinlichkeit je Zeitabschnitt)
- ∩ Normalverteilung (Aggregation unbekannter Verteilungen (Bsp.: Zentraler Grenzwertsatz)
- ◺ Dreieckverteilung (Bei Kenntnis von Minimum/Maximum kann Schiefe (Modalwert) angepasst werden)
Diskrete Verteilungen
• Gleichverteilung
• Bernoulliverteilung (Ereignis mit zwei Alternativen (oder „Erfolg“/„Misserfolg“))
→ In IYOPRO über Wahrscheinlichkeiten von XOR-Transitionen
• Binomialverteilung (Anzahl von Erfolgen in n-maligem Bernoulli-Experiment)
• Geometrische Verteilung (Anzahl der Misserfolge vor dem ersten Erfolg in einem Bernoulli-Experiment)
→ Benötigte Wiederholungen für n Erfolge
• Konstante Verteilung (für Debugging)
Methoden zur Datenerfassung
- Primäre Erfassung: Interviews, Fragebögen und Reports, Beobachtung
- Sekundäre Erfassung: Analyse von Dokumenten und Inventar
In der Simulation benötigte Daten (Simulation von Produktionssystemen)
• Lastdaten:
- Aufträge (Produktion, Transport, Lagerung) - Produkte (Baupläne, Pläne der Arbeitsgänge)
• Organisatorische Daten
- Arbeits- und Schichtpläne (Schichtzeiten, Pausen) - Verfügbare Ressourcen (Rollen und Qualifikationen, Maschinen) - Steuerung der Produktion (Strategien, Regeln und Restriktionen, Notfallpläne)
• Technische Daten
- Räumliche Verteilung der Ressourcen - Leistungsdaten der Produktion (Output, Kapazität, Materialfluss) - Ausfälle (Häufigkeit und Dauer, Reperaturen)
Chi-Quadrat-Test
- Vorliegen einer Stichprobe
- Unterteilung der Stichprobe in Klassen mit beobachteter Häufigkeit
- Vergleich von beobachteter Häufigkeit und gemäß unterstellter Verteilung erwarteter Häufigkeit durch Berechnung der Prüfgröße
Stationäre Prozesse
Eigenschaften (z.B. Warteschlangenlänge) sind zeitinvariant, d.h. sie hängen nicht vom betrachteten Zeitpunkt ab (zeitinvariant)
→ Bsp.: „Die Wahrscheinlichkeit, dass die Warteschlange leer ist, ist zu jedem Zeitpunkt 30%.“
Anfangszustand
Guter Anfangszustand ist der Systemzustand im eingeschwungenen Zustand des simulierten Systems
→ Bsp.: Mittlere Belegung eines Warteraumes bei einer Praxissimulation
Automatische Erkennung der Anlaufphase
- Abschneiden, solange jeder Wert ein Extremum, also Maximum oder Minimum, bezogen auf die restlichen Beobachtungen ist
- Abschneiden bis zum n-ten (z.B. dritten) Überqueren des Mittelwerts
Konfidenzintervall
• Statistisches Intervall, das die Lage eines wahren Parameters einer Grundgesamtheit mit einer gewissen Wahrscheinlichkeit lokalisieren soll
• Im Gegensatz zum geschätzten Parameter (durch Daten einer Stichprobe) kann ein wahrer Parameter selten exakt bestimmt werden
→ Konfidenzintervalle bieten die Möglichkeit, ihn mit einer gewissen Erfolgswahrscheinlichkeit genauer verorten zu können
• Voraussetzung zur Berechnung: Stationärer Prozess, unabhängige Stichproben
Optimierungsproblem
- Definition: Bestimmung einer „optimalen“ Parameterkonfiguration (Lösung) aus der Menge aller möglichen Parameterkonfigurationen (zulässigen Lösungen) eines Systems
- Bestandteile:
- Modell
- Lösungsraum, der die für das Modell zulässigen Parameterkombinationen enthält
- Zielfunktion als Maß der Güte zulässiger Lösungen
- Konkurrierende Ziele müssen in Beziehung gesetzt werden
→ Typische Beispiele in (logistischer) Simulation: Monetäres Ergebnis, Durchsatz/Produktionsmenge, mittlere Wartezeit