V6_Monitoring Flashcards

1
Q

Nagios

A

Monitoring-Software zur Überwachung von IT-Infrastrukturen

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Nagios überwacht

A
  • Hosts
  • Services
  • Netzwerke
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Parent Hosts

A

definieren eine “Hierarchie der Hosts im Netzwerk”, d.h. direkte bzw. indirekte Erreichbarkeit für Nagios.

Dadurch kann Nagios entscheiden, ob ein Host wirklich nicht funktinoiert oder ggfs. “nur” nicht erreichbar ist, weil ein dazwischenliegender Parent Host nicht funktioniert.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Parent Hosts (2)

A

Ein Host host1 ist parent von
host2, wenn der Weg im Netzwerk
von Nagios zu host2 über host1
führt, und host1 und host2 direkt
verbunden sind.
Auch Router und Switches werden
in diese Relation mit einbezogen,
wenn auch sie von Nagios
überwacht werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Services in Nagios

A
  • ein SW-Dienst auf dem Host ( zB. HTTP, FTP, SSH,..)
  • eine interne Eigenschaft eines Hosts zb. der noch verfügbare Festplattenplatz, Speicher und CPU Auslastung, Uptime, interne Fehlermeldungen..)
  • eine über entsprechende Zusatzhardware messbare Umweltbedingung zb Temperatur.
  • oder aber andere mit einem Host verbundene Information zb DNS Redords, Anzahl offener Tickets…
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Services in Nagios

A
  • ein SW-Dienst auf dem Host ( zB. HTTP, FTP, SSH,..)
  • eine interne Eigenschaft eines Hosts zb. der noch verfügbare Festplattenplatz, Speicher und CPU Auslastung, Uptime, interne Fehlermeldungen..)
  • eine über entsprechende Zusatzhardware messbare Umweltbedingung zb Temperatur.
  • oder aber andere mit einem Host verbundene Information zb DNS Redords, Anzahl offener Tickets…
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Services in Nagios

A
  • ein SW-Dienst auf dem Host ( zB. HTTP, FTP, SSH,..)
  • eine interne Eigenschaft eines Hosts zb. der noch verfügbare Festplattenplatz, Speicher und CPU Auslastung, Uptime, interne Fehlermeldungen..)
  • eine über entsprechende Zusatzhardware messbare Umweltbedingung zb Temperatur.
  • oder aber andere mit einem Host verbundene Information zb DNS Redords, Anzahl offener Tickets…
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Services in Nagios

A
  • ein SW-Dienst auf dem Host ( zB. HTTP, FTP, SSH,..)
  • eine interne Eigenschaft eines Hosts zb. der noch verfügbare Festplattenplatz, Speicher und CPU Auslastung, Uptime, interne Fehlermeldungen..)
  • eine über entsprechende Zusatzhardware messbare Umweltbedingung zb Temperatur.
  • oder aber andere mit einem Host verbundene Information zb DNS Redords, Anzahl offener Tickets…
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Services in Nagios

A
  • ein SW-Dienst auf dem Host ( zB. HTTP, FTP, SSH,..)
  • eine interne Eigenschaft eines Hosts zb. der noch verfügbare Festplattenplatz, Speicher und CPU Auslastung, Uptime, interne Fehlermeldungen..)
  • eine über entsprechende Zusatzhardware messbare Umweltbedingung zb Temperatur.
  • oder aber andere mit einem Host verbundene Information zb DNS Redords, Anzahl offener Tickets…
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Soft State / Error

A

treten auf ..
- wenn ein Host- oder Service-Prüfungsergebnis in einem nicht-OK oder nicht-UP-Status resultiert und die Service-Prüfung noch nicht so oft durchgeführt wurde, wie es in der max check attempts direktive der service- oder Host-Definition angegeben wurde.

Dies wird als Soft-Error bezeichnet.
- wenn sich ein Service oder Host von einem Soft-Error erholt. Dies nennt man Soft-Recovery.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Hard State / Error

A

treten auf..

  • wenn ein Host- oder Service-Prüfungsergebnis in einem nicht-OK oder nicht-UP-Status resultiert und die Prüfung bereits so oft durchgeführt wurde, wie es in der max_check_attempts-Direktive der Service- oder Host-Definition angegeben wurde. Dies wird als Hard-Error bezeichnet.
  • wenn ein Host oder Service von einem Hard-Error-Zustand in einen anderen Fehlerzustand wechselt. zb von warning zu critical.
  • wenn ein Host oder Service sich von einem Hard-Error-Zustand erholt. Dies wird als Hard-Recovery angesehen.

die Kontakte werden über das Host- oder Service-Problem bzw. über die Erholung benachrichtigt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Was bedeutet Flapping?

A

Flapping bedeutet, dass ein Host oder Service zu oft den Zustand wechselt und dadurch einen Sturm von Problem- und Erholungsbenachrichtigungen erzeugt.

Flapping kann..
- auf Konfigurationsprobleme hinweisen (Schwellwerte die zu niedrig gesetzt sind)
- oder auf sich gegenseitig störende Services
- oder auf wirkliche Netzwerkprobleme
- oder anderweitige technische Probleme

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Flap Detection

A
  • Die Ergebnisse der letzten 21 Checks für einen bestimmten Host oder Service werden gespeichert.
  • Durch die Analyse dieser gespeicherten Prüfergebnisse können wir erkennen, wo Statuswechsel aufgetreten sind.
  • Mithilfe dieser erkannten Statuswechsel legen wir eine Rate für den Statuswechsel des Hosts oder Services fest.
  • Nun vergleichen wir diese ermittelte Statuswechselrate mit den vorher festgelegten Flatter-Schwellenwerten.

Sobald die Statuswechselrate den hohen Flatter-Schwellenwert übersteigt, klassifizieren wir den Host oder Service als beginnendes Flapping.

Dieser Prozess gilt auch umgekehrt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Behandlung des Flapping-Starts

A

Event-Meldung protokollieren das Host flattert.

einen nicht-permanenten Kommentar zum Host oder Service hinzufügen dass er flattert.

eine flapping start benachrichtigung für den Host oder Service an die betreffenden Kontakte versenden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Behandlung des Flapping-Endes

A

Das gegenteil von start.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Aktives vs Passives Monitoring

A

Beim Aktiven monitoring fragt Nagios den zu überwachenden Host oder Service über ein Protokoll ab. Zb https , ping etc.

Beim passiven Monitoring hat der Host eine Software welche pro-aktiv die Überwachungsdaten an den Nagios Server schickt.

13
Q

Publicly Available Services

A

von außen zugängliche Services eines Hosts.

Solche Services kann Nagios dann von außen prüfen durch Kontaktieren des Services über sein Protokoll.. tb web server über https..

Es ist also kein Addon zur überwachung notwendig

14
Q

Private Services

A

Sind nicht von außen zugänglich und brauchen deshalb zusätzliche software (agent) auf dem Host um den Zustand des Services auszulesen.

Ausnahme SNMP

15
Q

Ablauf passiver Checks

A
  1. Agent prüft Status des Hosts oder Services
  2. Externe Applikation schreibt die Ergebnisse der Prüfung in das external command file des Nagios Servers.
  3. Nagios verareitet das external command file.
16
Q

Freshness Prüfung

A

Stellt sicher, dass Prüfungsresultate von passiven Prüfungen so regelmäßig wie erwartet empfanegn worden sind.

17
Q

Commands in Nagios

A

…definiere, welche Programme, Skripte etc. Nagios ausführen soll für:

  • Host- und Service-Prüfungen,
  • Benachrichtigungen,
  • Eventhandler,
18
Q

RRDtool

A

RRD, was für “Round-Robin-Database” steht, ist ein Programm, das Daten über Zeit sammelt, zusammenfasst und zeigt.

Wenn man eine RRD-Datei, also eine Art Datenbank, erstellt, reserviert man Speicherplatz für eine bestimmte Zeit. Nach dieser Zeit wird die Datenbank nicht größer, sondern die ältesten Daten werden komprimiert, indem Details immer weiter reduziert werden.

19
Q

RRDTOOL Zusammengefasst

A

Data Collection: It collects and stores time-series data.

Data Handling: It uses a round-robin method to handle data, which helps to manage the size of the database.

Data Visualization: It can generate graphs and visualizations based on the stored data, making it easy to understand trends and patterns.

Efficiency: It's designed for high performance and efficient use of storage.
20
Q

Round-Robin-Databases

A

Anforderungen:

  • Organisation der Daten nach Zeit
  • Hohe Anzahl von Schreibvorgängen
  • Hohe Anzahl von parallelen Datenquellen
  • Hohe Flexibilität bei Definition / Typisierung von Daten

Aktualisierung von Datensätzen sind selten.

Funktionen zum automatisierten Löschen und Komprimieren von Daten.

21
Q

Datensammeln

A

Nagios schreibt die Daten in ein temporäre Datei. Nach Ablauf einer definierten Zeit wird die Datei an einem Stück abgearbeitet und gelöscht.

22
Q

Business Process Add-Ons

A
  • Wir überwachen “Geschäftsprozesse”, die aus vielen Computern und Diensten bestehen, auf eine zusammengefasste Weise.
  • Dies ist besonders wichtig für Service Level Agreements (SLAs), da diese Vereinbarungen auf der Grundlage der Auswirkungen auf die Geschäftsprozesse festgelegt werden.
  • Das Zusatztool “Business Process View” nutzt die Ergebnisse der einzelnen Überwachungen, die Nagios durchführt.
  • Wir können Dienste / Computer verbinden und dann festlegen: “Die Anwendung ist für den Kunden nutzbar, wenn keines der Teile im kritischen Zustand ist.”