Text (Formate und Dokumente) Flashcards
Definiere Zeichenkodierung / Charakter Encoding.
Beispiele?
Welche Zeichenkodierungen gibt es?
-> Repräsentation eines Zeichens durch einen sinnvollen Code (Buchstaben, Zahlen, Symbole)
(Computer verstehen nur Zahlen, will man Buchstaben, braucht man Zuordnung)
Beispiele:
ASCI,
Unicode,
Zeichenkodierung / Charakter Encoding
Wie kann die Codierung sein?
Code kann:
- optisch (Lichtzeichen)
- akustisch (Morse-Code, Telefon Impuls-/Frequenzwahl)
- numerisch (ASCII, ANSI, UTF …)
sein
Zeichenkodierung / Charakter Encoding
Definiere ASCII.
ASCII
= American Standard Code for Information Interchange
- > basiert auf engl. Alphabet
- > 7 Bit Code (27 = 128 Zeichen, 33 nicht druckbare Kontrollbefehle, 95 druckbare Zeichen)
- > mit „Luft“, da Computer „8-bit bytes“ verwenden
- > Programmierer haben viel Phantasie entwickelt, was man mit den restlichen 128 freie Plätzen machen kann
Beispiele:
Code 130 ist oft ein (é), aber in Israel der Hebräische Buchstabe Gimel (ג)
Zeichenkodierung / Charakter Encoding
Definiere Windows-1252.
Windows-1252
(auch ANSI)
-> ASCII-Erweiterung, mit zusätzlichen europäischen Zeichen
- > 8 Bit Code (28 = 256 Zeichen)
- > Codepunkte 0-127 sind identisch mit ASCII
- > baut auf ISO 8859-1 auf
- > Standard bis Windows 95
Zeichenkodierung / Charakter Encoding
Definiere ISO-8859-1.
ISO-8859-1
- > 8 Bit Code (28 = 256 Zeichen), aber 16 Varianten
- > 0-127 immer ASCII, 128-255 sprachspezifisch
Zeichenkodierung / Charakter Encoding
Unicode
Was ist Unicode?
Was ist Encoding?
Was ist das Ziel davon?
Worauf muss man Acht geben?
Unicode
-> ist eine Liste von Zeichen mit eindeutigen Nummern (code points):
A = 65, B = 66, C = 67, …
(ersetzen Zeichen in Zahlen)
_________________
Encoding:
-> übersetzt diese Zahlen in Binärzahlen
(UTF-8 Encoding mit 8bit pro Zeichen)
Ziel:
-> alle Sprachen sollen möglich sein (auch Klingonisch) auf allen Programmen oder Plattformen)
__________________
ACHTUNG:
UTF-8
-> 8 Bit/Zeichen und nicht 28 = 256 Zeichen
UTF-16
-> 16 Bit/Zeichen und nicht 216 = 65.536 Zeichen
=> UTF-8 ist 50% kleiner als UTF-16
Unicode - UTF-8 / -16 / -32
Wo werden sie verwendet?
UTF
=> Unicode Transformation Format
_______________
UTF-8
-> erste 128 Zeichen identisch zu ASCII (verwendeter Bereich 1 114 112 code points, 0(hex) to 10FFFF(hex))
- > in UTF-8 wird jeder „code point“ zwischen 0-127 in einem Byte gespeichert
- > „Code points“ über 128 werden in 2, 3, … bis zu 6 Bytes gespeichert
- > in Linux, Unix, E-Mail, www
UTF-16
- > in Windows, OSX, Java, .NET
UTF-32
-> 4 Byte pro „code point“
Text-/Datei-Formate
Welche gibt es? (3
Beispiele)
Text-/Datei-Formate
-> nur Text
(nur das Zeilenende wird definiert)
-> Text mit Metainformation
(Beispiel: XML, HTML, SGML, …)
-> Text mit Formatierung und Metainformation
(Beispiel: PDF, DOCX, RTF, …)
Wozu dient die Dokumenten - Architektur?
Auf welche 2 Weisen ist das möglich?
-> dient Austausch von Informationen
_____________________
Ist auf 2 Weisen möglich:
- Objekt orientiert (Informatik/Java)
- Als strukturierter Text
(SGML, HTML, PDF…)
Was ist die Grundidee von Dokumenten - Architektur?
Grundidee:
-> Strukturierter Text => Trennung von:
- Inhalt
(The Lost by Brown) - Struktur
( The lost by Brown) - Processing
( 25p, Times, Bold, …)
Nenne Vorteile der Dokumenten - Architektur. (2)
Vorteile:
- > schnell Durchsuchbar (nach Überschriften, …)
- > Processing (Darstellung) ist leicht änderbar
Auf welche 3 Weisen lassen Dokumenten - Architekturen betrachten?
Dokumenten-Architekturen lassen sich auf 3 Weisen betrachten:
-> Präsentation
(also bezüglich der Ausgabe auf Bildschirmen oder Browsern)
________________
->Manipulation
(Bearbeitung mithilfe von Editoren am PC)
________________
-> Repräsentation
(Speicherung und Kommunikation auf und zwischen Computern)
Dokumenten - Architektur
Nenne Beispiele für strukturierte Texte.
Beispiele für strukturierte Texte:
-> SGML (alt), XML (neu), HTML, XML, PS, PDF, …
Welche Textformate gibt es? (6)
- > SGML
- > HTML
- > XML
- > XHTML
- > SMIL
- > HTML 5
Was bedeutet Semantik Web?
Semantik Web:
- > es geht nicht mehr nur um Informationen und deren Verknüpfungen oder um Aktion, Reaktion und Partizipation
- > im Web 3.0 (Semantic Web) werden Maschinen in der Lage sein, die Bedeutung von Informationen zu erkennen, Informationen selbst zu interpretieren
- > die erste Ausprägung diese neuen Webs ist die Semantic Search, wie sie von Google mit dem Hummingbird Update eingeführt wurde
Beispiel:
Dresden liegt an der Elbe.
Paul Schuster wurde 1950 in Dresden geboren