Woche 4: Grundlagen Daten / Datenorganisation Flashcards
EVA-Prinzip
Eingabe
Mit Eingabe ist hier das Erfassen oder Sammeln von Rohdaten innerhalb des Unternehmens oder in dessen Umfeld gemeint, die in einem Anwendungssystem verarbeitet werden sollen. Die (Daten-) Eingabe erfolgt entweder direkt über Eingabegeräte wie Maus, Tastatur, Joy Stick, Scanner, Mikrofon, QRbzw. Strichcode- Leser, Sensoren oder aber es werden Daten aus einer Datei eingelesen oder über ein Computernetz von einem anderen Computer übertragen.
Verarbeitung
Durch die Verarbeitung werden diese Rohdaten in eine für Menschen verständlichere Form gebracht. Der Begriff «Datenverarbeitung» bezeichnet also den organisierten Umgang mit Datenmengen mit dem Ziel, Informationen über diese Datenmengen zu gewinnen oder diese Datenmengen zu verändern.
Ausgabe
Unter Ausgabe verstehen wir das Verteilen der verarbeiteten Informationen an die Personen, die diese Informationen verwenden.
Dateneingabe über QR-Code und Strichcode
Im Code enthalten sind die Versionsinformation (1.) und das benutzte Datenformat (2.). Der Datenteil (3.) enthält die kodierten Daten in redundanter Form. Die Daten im QR-Code sind durch einen fehlerkorrigierenden Code geschützt. Dadurch wird der Verlust von bis zu 30 % des Codes toleriert. Zur Feldbegrenzung enthält der QR-Code in nur drei seiner Ecken ein bestimmtes Muster (4.1.). Über das fehlende Muster in der vierten Ecke erkennt das Lesegerät die Orientierung. Mit zunehmender Grösse des Codes werden weitere Muster (4.2.) hinzugefügt, um die Ausrichtung des Codes besser erkennbar zu machen. Zwischen den drei Hauptpositionsmarkierungen befindet sich eine Linie (4.3.) aus einer Folge streng abwechselnder Bits, worüber sich die Matrix definiert.
Der maximale Informationsgehalt eines QR-Codes beträgt 23.648 Bit (2.956 Byte). Damit lassen sich 7.089 Dezimalziffern oder 4.296 alphanumerische Zeichen kodieren
Vorläufer der zweidimensionalen (QR-) Codes waren die eindimensionalen, d.h. die Daten nur auf einer Achse speichernden Strichcod
Dateneingabe über Sensoren
Viele Geräte sind mit Sensoren ausgestattet, um eine automatische Datenerfassung zu ermöglichen.
Sensoren sind technische Bauteile zur qualitativen oder quantitativen Messung bestimmter chemischer oder physikalischer Grössen und Eigenschaften, z.B. Temperatur, Licht, Beschleunigung oder Elektrizität. Die erfassten Messwerte werden meist in elektronische Signale umgewandelt. Bereits heute sind wir vielerorts von Sensoren umgeben.
Beispiele einiger auf Smartphones gebräuchlicher Sensoren sind:
* Näherungssensor
* Umgebungslichtsensor
* Feuchtigkeitssensor
* Kompass
Strukturierte Daten
Strukturierte Daten weisen in den Datensätzen eine gleichartige Struktur auf.
Unstrukturierte Daten
Digitalisierte Informationen, die in einer nicht formalisierten Struktur vorliegen und auf die dadurch von Computerprogrammen nicht über eine einzelne Schnittstelle aggregiert zugegriffen werden kann. Beispiele sind digitale Texte in natürlicher Sprache und digitale Tonaufnahmen menschlicher Sprache.
halbstrukturierte Daten
Unstrukturierte Daten, die Strukturinformation [sprich: «Metadaten»] mit sich tragen.
”< vorname > Max < /vorname >”
Grössenordnungen von Daten
- Bit
- Byte
- Kilobyte
- Megabyte
- Gigabyte
- Terabyte
- Petabyte
1 Bit (b) stellt den Wert 0 oder 1 dar.
1 Byte (B) = 8 b
1 Kilobyte (kB) = 1000 B
1 Megabyte (MB) = 1000 kB
1 Gigabyte (GB) = 1000 MB
1 Terabyte (TB) = 1000 GB
1 Petabyte (PB) = 1000 TB
Grundlagen der Datenorganisation
- Bit
- Byte
- Datenelement
Bit
Auf der untersten Ebene repräsentiert ein Bit entweder eine Null oder eine Eins bzw. die kleinste Dateneinheit, die ein Computer verarbeiten kann.
Byte
Durch die Bildung festgelegter Bit-Folgen werden einzelne Zeichen codiert, wobei es sich hierbei um einen Buchstaben, eine Ziffer oder ein anderes Zeichen handeln kann. So wird zur Codierung von Buchstaben nach dem weitverbreiteten ASCII-Zeichensatz eine Gruppe von 8 Bit (auch als Byte bezeichnet) verwendet .
Datenelement
Die kleinste gespeicherte Dateneinheit zur Beschreibung von Information stellt ein Datenelement dar. Ein Datenelement gruppiert somit codierte Zeichen zu einem Wort, einer Gruppe von Wörtern oder einer Zahl, die eine Eigenschaft («Attribut») einer Entität beschreibt. Eine Entität ist ein Phänomen, beispielsweise eine Person, ein Ort, Ding oder Ereignis, über das Daten gespeichert und gepflegt werden sollen. Ein Attribut könnte somit beispielsweise der Name oder das Alter einer Person sein.
Grundlagen der Datenorganisation
- Bit
Bit
Auf der untersten Ebene repräsentiert ein Bit entweder eine Null oder eine Eins bzw. die kleinste Dateneinheit, die ein Computer verarbeiten kann.
Grundlagen der Datenorganisation
- Byte
Durch die Bildung festgelegter Bit-Folgen werden einzelne Zeichen codiert, wobei es sich hierbei um einen Buchstaben, eine Ziffer oder ein anderes Zeichen handeln kann. So wird zur Codierung von Buchstaben nach dem weitverbreiteten ASCII-Zeichensatz eine Gruppe von 8 Bit (auch als Byte bezeichnet) verwendet .
Grundlagen der Datenorganisation
- Datenelement
Die kleinste gespeicherte Dateneinheit zur Beschreibung von Information stellt ein Datenelement dar. Ein Datenelement gruppiert somit codierte Zeichen zu einem Wort, einer Gruppe von Wörtern oder einer Zahl, die eine Eigenschaft («Attribut») einer Entität beschreibt. Eine Entität ist ein Phänomen, beispielsweise eine Person, ein Ort, Ding oder Ereignis, über das Daten gespeichert und gepflegt werden sollen. Ein Attribut könnte somit beispielsweise der Name oder das Alter einer Person sein.
Grundlagen der Datenorganisation
- Datensatz
- Datei
- Datenbank
Datensatz
Eine Gruppe miteinander in Beziehung stehender Datenelemente, d.h. Datenelemente, die verschiedene Attribute derselben Entität beschreiben bilden zusammen einen Datensatz.
Datei
Logisch zusammengehörende, gleichartige Datensätze werden zu einer Datei zusammengefasst. So könnten beispielsweise entsprechende Datensätze eine Kursdatendatei darstellen.
Datenbank
Darüber hinaus können Dateien, zwischen denen logische Abhängigkeiten bestehen, zu einer Datenbank zusammengestellt werden.
Zeichensätze
Diese Version ASCII-Zeichensatz wurde bereits im Jahre 1963 durch die ASA definiert, um eine Vereinheitlichung der Zeichenkodierung zu erreichen. Jeder Buchstabe des (englischen) Alphabets konnte/kann damit in einem Byte dargestellt werden.
Für eine Binärzahl bzw. Dualzahl (engl. «binary») die entsprechende Dezimalzah berchnen:
Die kleinstmögliche mit 8 Bit bzw. 1 Byte darstellbare Dezimalzahl ist somit «0», die höchste mit 8 Bit bzw. 1 Byte darstellbare Dezimalzahl ist «255». Es sind somit mit 8 Bit maximal 256 Zeichen darstellbar.
Unicode-Zeichensatz
Aber nicht die ganze Welt kommuniziert nur mit englischen Zeichen und somit reichen maximal 256 Zeichen nicht aus, die vielen weltweit benötigten Zeichen (inkl. Emojis) darzustellen.
Um diesen Anforderungen gerecht zu werden, wurde der Unicode-Zeichensatz (z.B. «UTF-8») entwickelt. Er verwendet bis zu 32 Bit pro Zeichen und könnte somit über vier Milliarden verschiedene Zeichen unterscheiden.