IoT 4 - Datenspeicherung und - verarbeitung Flashcards

Question 1

Q

Was ist Linked Data ?

Answer

A

Eine Ansammlung von in unterschiedlichster Weise miteinander in Beziehung stehenden, verknüpften Datensätzen im Web.

Question 2

Q

Was wird mit Hilfe von Linked Data getan ?

Answer

A

Daten werden im Web nicht mehr in HTML Dokumenten, sondern in maschinenlesbaren Strukturen veröffentlicht.

Question 3

Q

Wie kann Linked Data behandelt werden ?

Answer

A

Wie eine einzige große Datenbank.

Question 4

Q

Was können Maschinen mit HTML-Dokumenten tun und was nicht ?

Answer

A

Maschinen können HTML-Dokumente zwar nach Schlüsselwörtern durchsuchen, sie jedoch nicht in einen sinnvollen Kontext bringen.

Question 5

Q

Was müsste man tun um HTML-Daten mit eigenen Applikationen verarbeiten oder austauschen möchte ?

Answer

A

Man müsste entsprechende Schnittstellen erstellen oder die Daten in ein passendes Format überführen.

Question 6

Q

Was ist der RDF-Standard ?

Answer

A

Resource Description Framework.

Beschreibt ein Datenmodell das auf einer graphenorientierten Datenbank basiert und inhaltliche Metadaten erstellt.

Question 7

Q

Von wem und wann wurde der RDF-Standard entwickelt ?

Answer

A

Durch das W3C

(World Wide Web Consortium) in 2014

Question 8

Q

Wozu wurde der RDF Standard entwickelt ?

Answer

A

Um zeitaufwendige Konversionen zu vermeiden und um ein einheitliches Format für den Datenaustausch zu nutzen.

Question 9

Q

Woraus besteht eine graphenorientierte Datenbank ?

Answer

A

Aus einer Ressource, die Beziehungen zu anderen Ressourcen hat.

Question 10

Q

Woraus besteht ein RDF-Statement ?

Answer

A

Subjekt
Prädikat (Beziehung)
Objekt

Auch RDF-Triple genannt.

Question 11

Q

Was sind RDF-Triple ?

Answer

A

Die grundlegenden Bausteine für graphenorientierte Datenbanken.

Question 12

Q

Was kann mittels RDF getan werden und was nicht ?

Answer

A

Mittels RDF können Aussagen über einzelne Ressourcen, jedoch nicht über generische Mengen von Personen oder Organisationen definiert werden.
Außerdem können keine logischen Zusammenhänge zwischen Ressourcen oder Klassen definiert werden.

Question 13

Q

Was ist RDFS ?

Answer

A

RDF-Schema.
Teil der W3C-Empfehlung zu RDF.
Beinhaltet wichtige fehlende Funktionen.

Question 14

Q

Was macht RDFS ?

Answer

A

RDFS stellt ein passendes Vokabular zur Verfügung um mittels eines Klassenkonzeptes bestehen aus Klassen und Eigenschaften RDF-Elemente formal zu beschreiben.

Question 15

Q

Was ermöglicht ein Semantic Reasoner ?

Answer

A

Er ermöglicht das automatisierte Suche nach Wissen und das Ziehen logischer Schlussfolgerungen.

Question 16

Q

Woher bezieht ein Semantic Reasoner sein Wissen ?

Answer

A

Aus einer Knowledge Base (KB) = Wissensdatenbank

Question 17

Q

Was ist in einer Knowledge Base gespeichert ?

Answer

A

Allgemeine Aussagen über Klassen und Aussagen über individuelle Instanzen dieser Klassen.

Question 18

Q

In welchem Bezug steht der Semantic Reasoner zur Knowledge Base ?

Answer

A

Aus den Infos der KB zieht der Semantic Reasoner logische Schlussfolgerungen und kann Informationen auf ihre Konsistenz prüfen.

Question 19

Q

Wo werden Semantic Reasoner eingesetzt ?

Answer

A

In vielen Webanwendungen, wie z.B. Portalen von Autovermietungen.

Question 20

Q

Was ist CEP ?

Answer

A

Complex Event Processing.
Eine Softwaretechnologie um massive Datenströme aus heterogenen Quellen in Echtzeit dynamisch zu analysieren und diese mit anderen Datenströmen zu korrelieren.

Question 21

Q

Wie unterscheidet sich CEP von der klassischen Datenverarbeitung ?

Answer

A

In der klassischen Datenverarbeitung werden häufig kontinuirliche Datenbankabfragen auf persistente Datenbestände generiert

Im CEP leiten sich dynamisch-verändernde Datenströme auf persistente Analyseregelwerke um.

Question 22

Q

Was sind Anwendungsszenarien von CEP ?

Answer

A

Finanzmärkten (Analyse von Kurwerten)

Sensornetze (Überwachung von Materialflüssen mit RFID)

Handel (Überwachung von Warenein- und -ausgängen)

Question 23

Q

Was sucht CEP in großen komplexen Datenströmen ?

Answer

A

Nach Ereignismustern. Ein Ereignis = Veränderung eines Zustandes

Question 24

Q

Wo werden Ereignismuster definiert ?

Answer

A

In Ereignisregeln mittels EPL (Event Processing Languages)

Question 25

Q

Was ist ein Event Processing Agent (EPA) ?

Answer

A

Kernkomponente eines jeden CEP-Systems. Besteht aus:
Ereignismodell
Ereignisregeln
Event Processing Engine

Question 26

Q

Was ist ein Ereignismodell in einem EPA ?

Answer

A

definiert Ereignistypen, Attribute und Abhängigkeiten

Question 27

Q

Was sind Ereignisregeln in einem EPA ?

Answer

A

Verarbeitung der Ereignisse mittels EPL

Question 28

Q

Was ist eine Event Processing Engine in einem EPA ?

Answer

A

Komponente zur Mustererkennung in Ereignisströmen

Question 29

Q

Was ist Voraussetzung für die Einbettung eines Event Processing Agents ?

Answer

A

Event-Driven Architecture (EDA) = ereignisgesteuerte Gesamtarchitektur

Question 30

Q

Aus welchen Elementen besteht eine Event-Driven Architecture (EDA) ?

Answer

A

Ereignisquellen
Ereignisverarbeitung
Ereignisbehandlung

Question 31

Q

Was sind Ereignisquellen in einer EDA ?

Answer

A

Alle Objekte die Ereignisse generieren z.B. RFID-Sensoren

Question 32

Q

Was ist die Ereignisverarbeitung in einer EDA ?

Answer

A

Ein CEP-System bestehend aus einem oder mehreren EPAs

Question 33

Q

Was ist eine Ereignisbehandlung in einer EDA ?

Answer

A

Auslösen eins Ereignisses bei Mustererkennung

Question 34

Q

Was ermöglichen In-/Out-Adapter ?

Answer

A

Einbindung unterschiedlichster Datenformate und Protokolle.

Question 35

Q

Was sind wichtige Anforderungen an ein CEP-System ?

Answer

A

flexible Integration unterschiedlichster Ereignisquellen- und -behandlungen.
Hohe Skalierbarkeit
Hohe Verfügbarkeit

Question 36

Q

Was bedeutet es, dass ein CEP-System skalierbar sein muss ?

Answer

A

Es soll die rasant wachsenden Datenmengen verarbeiten können .

Question 37

Q

Was bedeutet es, dass ein CEP-System verfügbar sein muss ?

Answer

A

Es soll sicherstellen, dass die Informationen aus der Ereignisverarbeitung dann verfügbar sind, wenn Sie auch benötigt werden.

Question 38

Q

Wofür bieten sich NoSQL-Datenbanksysteme an ?

Answer

A

Um viele heterogene Datenformate in großen Mengen möglichst in echtzeit verarbeiten zu können.

Question 39

Q

Was sind NoSQL-Datenbanksysteme ?

Answer

A

Datenbanksysteme die für die Kommunikation zwischen Server und Client nicht ausschließlich SQL, sondern auch andere Protokolle nutzen.

Question 40

Q

Was ist SQL ?

Answer

A

SQL (Structured Query Language) ist eine standardisierte Datenbankabfragesprache, um auf Daten in relationalen Datenbanken zugreifen und diese verändern zu können.

Question 41

Q

Was bedeutet RDBMS ?

Answer

A

Relational Database Management Systems

Question 42

Q

Wie funktionieren relationale Datenbanksysteme ?

Answer

A

Daten mithilfe einer Sammlung von Tabellen bestehend aus Zeilen (Datensätze) und Spalten (Attribute) gespeichert. Jeder Datensatz ist dabei über einen Primärschlüssel identifizierbar.

Question 43

Q

Was ist ein Fremdschlüssel ?

Answer

A

Ein Primärschlüssel kann als sogenannter Fremdschlüssel in eine andere Tabelle übernommen werden, um Beziehungen zwischen Tabellen abbilden zu können.

Question 44

Q

Zu was führt es, wenn sehr viele verschiedene Daten in verschiedenen Tabellen abgespeichert sind und über Relationen verbunden sind ?

Answer

A

Es erhöht die Komplexität des Designs der Datenbank und führt zu vielen datenbankabfragen, die die Performance negativ beeinflussen.

Question 45

Q

Worauf sind relationale Datenbanken ausgelegt ?

Answer

A

Auf kleine Transaktionen bei relativ statischen Datenbeständen. Nicht für große Datenmengen, die sich dynamisch verändern.

Question 46

Q

Inwiefern unterscheiden sich NoSQL Datenbanken von relationalen Datenbanken ?

Answer

A

NoSQL-Datenbanken verzichten auf starre Datenbankstrukturen und speichern Daten ohne ein festes Schema so ab, dass der Zugriff auf diese Daten deutlich performanter erfolgen kann.

Question 47

Q

Welches Konsistenzmodell wird von relationalen Datenbanken verwendet ?

Answer

A

Relationale Datenbanken achten sehr streng auf die Konsistenz ihrer Datenbestände und verwenden häufig das sogenannte ACID-Modell als Kriterium für erwünschte Voraussetzungen verlässlicher Datenbanksysteme.

Question 48

Q

Welches Konsistenzmodell wird von NoSQL Datenbanken verwendet ?

Answer

A

NoSQL Datenbanken orientieren sich häufig am sogenannten BASE-Modell, welches die Konsistenz zugunsten der Verfügbarkeit in den Hintergrund stellt

Question 49

Q

Was ist das ACID-Modell ?

Answer

A

atomicity
consistency
isolation
durability

Question 50

Q

Was ist das BASE-Modell ?

Answer

A

Basically Available (Verfügbarkeit ist wichtiger als Konsistenz)

Soft State (nach Transaktionsende wird Konsistenz fließend erreicht)

Eventual Consistency (schlussendlich sind die Daten konsistent)

Question 51

Q

Zwischen welchen Arten der Datenspeicherung unterscheidet man bei NoSQL ?

Answer

A

dokumentenorientierte Datenbanken
Graphdatenbanken
Key Value-Datenbanken
spaltenorientierte Datenbanken

Question 52

Q

Wozu wird MapReduce benötigt ?

Answer

A

Um große, unstrukturierte Datenmengen zu verarbeiten die in einem verteilten System wie NoSQL gespeichert sind.

Question 53

Q

Was ist MapReduce ?

Answer

A

Ein durch Google entwickeltes Programmiermodell, das die Verarbeitung und das Durchsuchen großer, verteilter Datenmengen in einem Cluster ermöglicht.

Question 54

Q

Welche Phasen gibt es beim MapReduce-Konzept ?

Answer

A

Map

Reduce

Question 55

Q

Was passiert in der “Map” Phase bei MapReduce ?

Answer

A

Aufteilung der Eingabedatei auf mehrere Prozesse, die dann parallelisiert Zwischenergebnisse kalkulieren.

Question 56

Q

Was passiert in der “Reduce” Phase bei MapReduce ?

Answer

A

Nachdem alle Map-Prozesse beendet wurden, starten mehrere Reduce-Prozesse, die ebenfalls parallel Berechnungen starten, wobei jeder Prozess eine eigene Ausgabedatei erzeugt.

Question 57

Q

Welche Anwendungsfälle gibt es für MapReduce ?

Answer

A

Zählen einer Worthäufigkeit

Ermittlung von am häufigsten referenzierten Webseiten