IoT 4 - Datenspeicherung und - verarbeitung Flashcards

1
Q

Was ist Linked Data ?

A

Eine Ansammlung von in unterschiedlichster Weise miteinander in Beziehung stehenden, verknüpften Datensätzen im Web.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Was wird mit Hilfe von Linked Data getan ?

A

Daten werden im Web nicht mehr in HTML Dokumenten, sondern in maschinenlesbaren Strukturen veröffentlicht.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Wie kann Linked Data behandelt werden ?

A

Wie eine einzige große Datenbank.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Was können Maschinen mit HTML-Dokumenten tun und was nicht ?

A

Maschinen können HTML-Dokumente zwar nach Schlüsselwörtern durchsuchen, sie jedoch nicht in einen sinnvollen Kontext bringen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Was müsste man tun um HTML-Daten mit eigenen Applikationen verarbeiten oder austauschen möchte ?

A

Man müsste entsprechende Schnittstellen erstellen oder die Daten in ein passendes Format überführen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Was ist der RDF-Standard ?

A

Resource Description Framework.

Beschreibt ein Datenmodell das auf einer graphenorientierten Datenbank basiert und inhaltliche Metadaten erstellt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Von wem und wann wurde der RDF-Standard entwickelt ?

A

Durch das W3C

(World Wide Web Consortium) in 2014

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Wozu wurde der RDF Standard entwickelt ?

A

Um zeitaufwendige Konversionen zu vermeiden und um ein einheitliches Format für den Datenaustausch zu nutzen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Woraus besteht eine graphenorientierte Datenbank ?

A

Aus einer Ressource, die Beziehungen zu anderen Ressourcen hat.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Woraus besteht ein RDF-Statement ?

A

Subjekt
Prädikat (Beziehung)
Objekt

Auch RDF-Triple genannt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Was sind RDF-Triple ?

A

Die grundlegenden Bausteine für graphenorientierte Datenbanken.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Was kann mittels RDF getan werden und was nicht ?

A

Mittels RDF können Aussagen über einzelne Ressourcen, jedoch nicht über generische Mengen von Personen oder Organisationen definiert werden.
Außerdem können keine logischen Zusammenhänge zwischen Ressourcen oder Klassen definiert werden.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Was ist RDFS ?

A

RDF-Schema.
Teil der W3C-Empfehlung zu RDF.
Beinhaltet wichtige fehlende Funktionen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Was macht RDFS ?

A

RDFS stellt ein passendes Vokabular zur Verfügung um mittels eines Klassenkonzeptes bestehen aus Klassen und Eigenschaften RDF-Elemente formal zu beschreiben.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Was ermöglicht ein Semantic Reasoner ?

A

Er ermöglicht das automatisierte Suche nach Wissen und das Ziehen logischer Schlussfolgerungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Woher bezieht ein Semantic Reasoner sein Wissen ?

A

Aus einer Knowledge Base (KB) = Wissensdatenbank

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Was ist in einer Knowledge Base gespeichert ?

A

Allgemeine Aussagen über Klassen und Aussagen über individuelle Instanzen dieser Klassen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

In welchem Bezug steht der Semantic Reasoner zur Knowledge Base ?

A

Aus den Infos der KB zieht der Semantic Reasoner logische Schlussfolgerungen und kann Informationen auf ihre Konsistenz prüfen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Wo werden Semantic Reasoner eingesetzt ?

A

In vielen Webanwendungen, wie z.B. Portalen von Autovermietungen.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Was ist CEP ?

A

Complex Event Processing.
Eine Softwaretechnologie um massive Datenströme aus heterogenen Quellen in Echtzeit dynamisch zu analysieren und diese mit anderen Datenströmen zu korrelieren.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Wie unterscheidet sich CEP von der klassischen Datenverarbeitung ?

A

In der klassischen Datenverarbeitung werden häufig kontinuirliche Datenbankabfragen auf persistente Datenbestände generiert

Im CEP leiten sich dynamisch-verändernde Datenströme auf persistente Analyseregelwerke um.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Was sind Anwendungsszenarien von CEP ?

A

Finanzmärkten (Analyse von Kurwerten)

Sensornetze (Überwachung von Materialflüssen mit RFID)

Handel (Überwachung von Warenein- und -ausgängen)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Was sucht CEP in großen komplexen Datenströmen ?

A

Nach Ereignismustern. Ein Ereignis = Veränderung eines Zustandes

24
Q

Wo werden Ereignismuster definiert ?

A

In Ereignisregeln mittels EPL (Event Processing Languages)

25
Q

Was ist ein Event Processing Agent (EPA) ?

A

Kernkomponente eines jeden CEP-Systems. Besteht aus:
Ereignismodell
Ereignisregeln
Event Processing Engine

26
Q

Was ist ein Ereignismodell in einem EPA ?

A

definiert Ereignistypen, Attribute und Abhängigkeiten

27
Q

Was sind Ereignisregeln in einem EPA ?

A

Verarbeitung der Ereignisse mittels EPL

28
Q

Was ist eine Event Processing Engine in einem EPA ?

A

Komponente zur Mustererkennung in Ereignisströmen

29
Q

Was ist Voraussetzung für die Einbettung eines Event Processing Agents ?

A

Event-Driven Architecture (EDA) = ereignisgesteuerte Gesamtarchitektur

30
Q

Aus welchen Elementen besteht eine Event-Driven Architecture (EDA) ?

A

Ereignisquellen
Ereignisverarbeitung
Ereignisbehandlung

31
Q

Was sind Ereignisquellen in einer EDA ?

A

Alle Objekte die Ereignisse generieren z.B. RFID-Sensoren

32
Q

Was ist die Ereignisverarbeitung in einer EDA ?

A

Ein CEP-System bestehend aus einem oder mehreren EPAs

33
Q

Was ist eine Ereignisbehandlung in einer EDA ?

A

Auslösen eins Ereignisses bei Mustererkennung

34
Q

Was ermöglichen In-/Out-Adapter ?

A

Einbindung unterschiedlichster Datenformate und Protokolle.

35
Q

Was sind wichtige Anforderungen an ein CEP-System ?

A

flexible Integration unterschiedlichster Ereignisquellen- und -behandlungen.
Hohe Skalierbarkeit
Hohe Verfügbarkeit

36
Q

Was bedeutet es, dass ein CEP-System skalierbar sein muss ?

A

Es soll die rasant wachsenden Datenmengen verarbeiten können .

37
Q

Was bedeutet es, dass ein CEP-System verfügbar sein muss ?

A

Es soll sicherstellen, dass die Informationen aus der Ereignisverarbeitung dann verfügbar sind, wenn Sie auch benötigt werden.

38
Q

Wofür bieten sich NoSQL-Datenbanksysteme an ?

A

Um viele heterogene Datenformate in großen Mengen möglichst in echtzeit verarbeiten zu können.

39
Q

Was sind NoSQL-Datenbanksysteme ?

A

Datenbanksysteme die für die Kommunikation zwischen Server und Client nicht ausschließlich SQL, sondern auch andere Protokolle nutzen.

40
Q

Was ist SQL ?

A

SQL (Structured Query Language) ist eine standardisierte Datenbank­abfragesprache, um auf Daten in relationalen Datenbanken zugreifen und diese verändern zu können.

41
Q

Was bedeutet RDBMS ?

A

Relational Database Management Systems

42
Q

Wie funktionieren relationale Datenbanksysteme ?

A

Daten mithilfe einer Sammlung von Tabellen bestehend aus Zeilen (Datensätze) und Spalten (Attribute) gespeichert. Jeder Datensatz ist dabei über einen Primärschlüssel identifizierbar.

43
Q

Was ist ein Fremdschlüssel ?

A

Ein Primärschlüssel kann als sogenannter Fremdschlüssel in eine andere Tabelle übernommen werden, um Beziehungen zwischen Tabellen abbilden zu können.

44
Q

Zu was führt es, wenn sehr viele verschiedene Daten in verschiedenen Tabellen abgespeichert sind und über Relationen verbunden sind ?

A

Es erhöht die Komplexität des Designs der Datenbank und führt zu vielen datenbankabfragen, die die Performance negativ beeinflussen.

45
Q

Worauf sind relationale Datenbanken ausgelegt ?

A

Auf kleine Transaktionen bei relativ statischen Datenbeständen. Nicht für große Datenmengen, die sich dynamisch verändern.

46
Q

Inwiefern unterscheiden sich NoSQL Datenbanken von relationalen Datenbanken ?

A

NoSQL-Datenbanken verzichten auf starre Datenbankstrukturen und speichern Daten ohne ein festes Schema so ab, dass der Zugriff auf diese Daten deutlich performanter erfolgen kann.

47
Q

Welches Konsistenzmodell wird von relationalen Datenbanken verwendet ?

A

Relationale Datenbanken achten sehr streng auf die Konsistenz ihrer Datenbestände und verwenden häufig das sogenannte ACID-Modell als Kriterium für erwünschte Voraussetzungen verlässlicher Datenbanksysteme.

48
Q

Welches Konsistenzmodell wird von NoSQL Datenbanken verwendet ?

A

NoSQL Datenbanken orientieren sich häufig am sogenannten BASE-Modell, welches die Konsistenz zugunsten der Verfügbarkeit in den Hintergrund stellt

49
Q

Was ist das ACID-Modell ?

A

atomicity
consistency
isolation
durability

50
Q

Was ist das BASE-Modell ?

A

Basically Available (Verfügbarkeit ist wichtiger als Konsistenz)

Soft State (nach Transaktionsende wird Konsistenz fließend erreicht)

Eventual Consistency (schlussendlich sind die Daten konsistent)

51
Q

Zwischen welchen Arten der Datenspeicherung unterscheidet man bei NoSQL ?

A

dokumentenorientierte Datenbanken
Graphdatenbanken
Key Value-Datenbanken
spaltenorientierte Datenbanken

52
Q

Wozu wird MapReduce benötigt ?

A

Um große, unstrukturierte Datenmengen zu verarbeiten die in einem verteilten System wie NoSQL gespeichert sind.

53
Q

Was ist MapReduce ?

A

Ein durch Google entwickeltes Programmiermodell, das die Verarbeitung und das Durchsuchen großer, verteilter Datenmengen in einem Cluster ermöglicht.

54
Q

Welche Phasen gibt es beim MapReduce-Konzept ?

A

Map

Reduce

55
Q

Was passiert in der “Map” Phase bei MapReduce ?

A

Aufteilung der Eingabedatei auf mehrere Prozesse, die dann parallelisiert Zwischenergebnisse kalkulieren.

56
Q

Was passiert in der “Reduce” Phase bei MapReduce ?

A

Nachdem alle Map-Prozesse beendet wurden, starten mehrere Reduce-Prozesse, die ebenfalls parallel Berechnungen starten, wobei jeder Prozess eine eigene Ausgabedatei erzeugt.

57
Q

Welche Anwendungsfälle gibt es für MapReduce ?

A

Zählen einer Worthäufigkeit

Ermittlung von am häufigsten referenzierten Webseiten