Text (Formate und Dokumente) Flashcards
Definiere Zeichenkodierung / Charakter Encoding.
Beispiele?
Welche Zeichenkodierungen gibt es?
-> Repräsentation eines Zeichens durch einen sinnvollen Code (Buchstaben, Zahlen, Symbole)
(Computer verstehen nur Zahlen, will man Buchstaben, braucht man Zuordnung)
Beispiele:
ASCI,
Unicode,
Zeichenkodierung / Charakter Encoding
Wie kann die Codierung sein?
Code kann:
- optisch (Lichtzeichen)
- akustisch (Morse-Code, Telefon Impuls-/Frequenzwahl)
- numerisch (ASCII, ANSI, UTF …)
sein
Zeichenkodierung / Charakter Encoding
Definiere ASCII.
ASCII
= American Standard Code for Information Interchange
- > basiert auf engl. Alphabet
- > 7 Bit Code (27 = 128 Zeichen, 33 nicht druckbare Kontrollbefehle, 95 druckbare Zeichen)
- > mit „Luft“, da Computer „8-bit bytes“ verwenden
- > Programmierer haben viel Phantasie entwickelt, was man mit den restlichen 128 freie Plätzen machen kann
Beispiele:
Code 130 ist oft ein (é), aber in Israel der Hebräische Buchstabe Gimel (ג)
Zeichenkodierung / Charakter Encoding
Definiere Windows-1252.
Windows-1252
(auch ANSI)
-> ASCII-Erweiterung, mit zusätzlichen europäischen Zeichen
- > 8 Bit Code (28 = 256 Zeichen)
- > Codepunkte 0-127 sind identisch mit ASCII
- > baut auf ISO 8859-1 auf
- > Standard bis Windows 95
Zeichenkodierung / Charakter Encoding
Definiere ISO-8859-1.
ISO-8859-1
- > 8 Bit Code (28 = 256 Zeichen), aber 16 Varianten
- > 0-127 immer ASCII, 128-255 sprachspezifisch
Zeichenkodierung / Charakter Encoding
Unicode
Was ist Unicode?
Was ist Encoding?
Was ist das Ziel davon?
Worauf muss man Acht geben?
Unicode
-> ist eine Liste von Zeichen mit eindeutigen Nummern (code points):
A = 65, B = 66, C = 67, …
(ersetzen Zeichen in Zahlen)
_________________
Encoding:
-> übersetzt diese Zahlen in Binärzahlen
(UTF-8 Encoding mit 8bit pro Zeichen)
Ziel:
-> alle Sprachen sollen möglich sein (auch Klingonisch) auf allen Programmen oder Plattformen)
__________________
ACHTUNG:
UTF-8
-> 8 Bit/Zeichen und nicht 28 = 256 Zeichen
UTF-16
-> 16 Bit/Zeichen und nicht 216 = 65.536 Zeichen
=> UTF-8 ist 50% kleiner als UTF-16
Unicode - UTF-8 / -16 / -32
Wo werden sie verwendet?
UTF
=> Unicode Transformation Format
_______________
UTF-8
-> erste 128 Zeichen identisch zu ASCII (verwendeter Bereich 1 114 112 code points, 0(hex) to 10FFFF(hex))
- > in UTF-8 wird jeder „code point“ zwischen 0-127 in einem Byte gespeichert
- > „Code points“ über 128 werden in 2, 3, … bis zu 6 Bytes gespeichert
- > in Linux, Unix, E-Mail, www
UTF-16
- > in Windows, OSX, Java, .NET
UTF-32
-> 4 Byte pro „code point“
Text-/Datei-Formate
Welche gibt es? (3
Beispiele)
Text-/Datei-Formate
-> nur Text
(nur das Zeilenende wird definiert)
-> Text mit Metainformation
(Beispiel: XML, HTML, SGML, …)
-> Text mit Formatierung und Metainformation
(Beispiel: PDF, DOCX, RTF, …)
Wozu dient die Dokumenten - Architektur?
Auf welche 2 Weisen ist das möglich?
-> dient Austausch von Informationen
_____________________
Ist auf 2 Weisen möglich:
- Objekt orientiert (Informatik/Java)
- Als strukturierter Text
(SGML, HTML, PDF…)
Was ist die Grundidee von Dokumenten - Architektur?
Grundidee:
-> Strukturierter Text => Trennung von:
- Inhalt
(The Lost by Brown) - Struktur
( The lost by Brown) - Processing
( 25p, Times, Bold, …)
Nenne Vorteile der Dokumenten - Architektur. (2)
Vorteile:
- > schnell Durchsuchbar (nach Überschriften, …)
- > Processing (Darstellung) ist leicht änderbar
Auf welche 3 Weisen lassen Dokumenten - Architekturen betrachten?
Dokumenten-Architekturen lassen sich auf 3 Weisen betrachten:
-> Präsentation
(also bezüglich der Ausgabe auf Bildschirmen oder Browsern)
________________
->Manipulation
(Bearbeitung mithilfe von Editoren am PC)
________________
-> Repräsentation
(Speicherung und Kommunikation auf und zwischen Computern)
Dokumenten - Architektur
Nenne Beispiele für strukturierte Texte.
Beispiele für strukturierte Texte:
-> SGML (alt), XML (neu), HTML, XML, PS, PDF, …
Welche Textformate gibt es? (6)
- > SGML
- > HTML
- > XML
- > XHTML
- > SMIL
- > HTML 5
Was bedeutet Semantik Web?
Semantik Web:
- > es geht nicht mehr nur um Informationen und deren Verknüpfungen oder um Aktion, Reaktion und Partizipation
- > im Web 3.0 (Semantic Web) werden Maschinen in der Lage sein, die Bedeutung von Informationen zu erkennen, Informationen selbst zu interpretieren
- > die erste Ausprägung diese neuen Webs ist die Semantic Search, wie sie von Google mit dem Hummingbird Update eingeführt wurde
Beispiel:
Dresden liegt an der Elbe.
Paul Schuster wurde 1950 in Dresden geboren
Textformate
Definiere SGML.
(DTD, Parser, Formatierer)
SGML
(Standard Generalized Markup Language)
-> nur Repräsentationsmodell (d.h. Protokoll zum Tausch von Informationen zw. Rechnern)
-> Textteile werden mit Tags markiert
-> SGML legt das Aussehen (Syntax) der Tags fest, nicht die Bedeutung (z.B. eckige Klammern für Tags etc.)
__________________
durch Tags können dann
- > Strukturbeschreibungen (STAR WARS) stattfinden
- > Bezüge (Ae; rger steht für Ärger) hergestellt werden
- > Strukturen oder Regeln definiert sein
-> Anweisungen zur Darstellung erfolgen
___________________
-> nur Text- und Grafik-Einbettung normiert, nicht Audio und Video
-> bildet mithilfe von DTDs die Basis für HTML und XML
(SGML + spezielle DTD = HTML)
____________________
DTD
(Dokument Type Definition)
-> hier wird Tag Bedeutung (Semantik) der Tags festgelegt (Strukturdefinition)
=> Hallo
__________________
Parser
-> prüft, ob Dokument gültig ist
(reale PLZ, E-mail, …)
__________________
Formatierer
-> kennt Tag Bedeutung und setzt sie um
Textformate
Definiere SGML/XML-Tags.
SGML/XML-Tags
________________
Descriptive Markup:
-> Strukturbeschreibung durch Start-tag und /end-tag
______________
Entity Reference:
-> Bezug auf ein anderes Element
Beispiel:
Ae;ger steht für Arger
______________
Markup Declarations:
-> definieren Elemente auf die per Entity Ref. Bezogen wird
-> oder definieren Regeln für die Struktur
____________
Processing Instructions:
-> Anweisungen für andere Programme
Beispiel:
für den Formatierer, Einbinden anderer Medien
Textformate - Hypertext und das WorldWideWeb
Ursprüngliches Ziel?
Bisherige Entwicklung?
Aktuelle Entwicklung?
Komponenten des Hypertexts im WWW?
Hypertext und das WorldWideWeb
_________________
ursprüngliches Ziel:
-> innerhalb desselben Computer-Netzes von verschiedenen Computern auf gemeinsame Bilder und Diagramme zugreifen zu können
-> das WWW folgt im Grunde demselben Prinzip
__________________
Bisherige Entwicklung:
-> Verbesserung der Layout-Möglichkeiten (z.B. durch CCS oder XML
-> Integration von Multimedia (z.B. durch SMIL oder Plug-Ins wie Flash)
__________________
Aktuelle Entwicklung:
-> HTML5, keine Versionierung mehr, sondern permanente Weiterentwicklung
__________________
Komponenten des Hypertexts im WWW:
HTTP
(Hypertext Transfer Protocol)
- Protokoll zur Kommunikation zw. Client & Server
—————————
URL
(= Uniform Resource Locator)
- Adresse der Dokumente im Netz („Telefonnr.“)
—————————-
HTML
(Hypertext Markup Language)
- Beschreibungssprache für WWW-Dokumente
Textformate - HTML
(Was ist das?
Bestandteile?
Metainformationen?)
HTML
(Hyper Text Markup Language)
_________________
-> Weiterentwicklung von SGML
-> Beschreibungssprache zur Strukturierung von Dokumenten im WWW:
(funktioniert also auf Basis von vordefinierten Tags)
- Auszeichnungssprache (Markup Language, definiert Formate)
- Internetsprache,
- ASCII-Text, (in einfacher ASCII-Sprache geschrieben)
- der Browser interpretiert die Tags und stellt anschließend den Inhalt sachgemäß dar
__________________
HTML Dokument Bestandteile:
-> Deklaration
(Angabe der HTML-Version, HTML / SGML Zusammenfassungen, etc.)
-> Kopf / Header
(Enthält Titel & Meta-Tags (z.B. Autor)
-> Body
(der eigentliche Inhalt)
__________________
Metainformationen:
-Tag hat 2 Attribute:
-
Textformate
Definiere HTTP.
HTTP:
-> Beschreibungssprache für WWW-Dokumente:
- Auszeichnungssprache (Markup Language, definiert Formate)
- Interpretersprache
- einfacher ASCII-Text
- Darstellung im Browser, der HTML-Tags interpretiert
Textformate
Definiere CSS.
CSS
(Cascading Style Sheet)
- > Sprache spezialisiert auf Gestaltungsanweisungen
- > wird meistens gemeinsam mit HTML verwendet um Inhalt und Gestaltung zu trennen
- > trennt Layout und Inhalt
- > ist wie eine Schablone
- > einfache „Style“-Änderungen
- > keine neuen Designmöglichkeiten
- > CSS-Angaben werden dazu meistens in einer externen Datei gespeichert
- > im Header erfolgt der Verweis auf die CSS-Datei
Textformate
Definiere XML.
(Was ist das?
Problem?
Lösung?
Nachteil?)
XML
(Extended Markup Language)
-> ebenfalls wie HTML eine Weiterentwicklung von SGML
(hat jedoch keine bereits festgelegten DTDs und ist dadurch vom Nutzer auf seine Bedürfnisse anpassbar)
-> Textdatei mit Struktur (erlaubt Definition einer eigenen „Markup Language)
__________________
Problem:
-> HTML hat definierte DTDs => ist somit beschränkt
Lösung:
-> eigene DTDs definieren
-> Erweiterung von SGML durch W3C (The World Web Consortium)
- dadurch Eingene DTD (Dokument typ definition) machbar
z.B. xmp., metadaten, Canon raw Daten
__________________
Nachteil:
-> sehr formal
(wird für Programmierung verwendet)
Textformate
Definiere XHTML.
XHTML
(Extensible Hypertext Markup Language)
- > Weiterentwicklung von XML
- > bringt eigene Regeln mit, die etwas mehr Ordnung reinbringen
Textformate
Definiere SMIL.
SMIL
(Synchronized Multimedia Integration Language)
-> ist ein spezieller Dialekt von XML
-> soll die Einbindung von multimedialen Inhalten vereinfachen
__________________
Eigenschaften:
-> erlaubt Erstellen von MM Präsentation im Internet
- > ist ähnlich wie HTML aufgebaut
- > URL referenzieren Medienobjekte
- > Synchronisation von Text, Bild, Streaming Audio und Video mit den Tags „sequenziell“ und „parallel“
Textformate
Definiere SMP.
XMP
- > ist eine XML Anwendung von Adobe
- > Container zur Speicherung von Metadaten für RAW-Bildformate
Textformate
Definiere HTML 5.
Nachteile?
HTML 5
Hauptmerkmal:
- > direkte Integration von Animation, Audio und Video anstatt durch Plugins (Flash wird unnötig) und Zugriff auf die Festplatte des Clients (NACHTEIL)
- > Audio + Video Player integriert (Netflix, Amazon Film, …)
- > kann direkt auf die Festplatte des Users schreiben (-)
- > kein Parser mehr, sondern direkt ausführbarer Code
- > hat allgemein mehr Rechte
Textformate
Definiere Bootstrap.
Bootstrap
-> enthält auf HTML und CSS basierende Gestaltungsvorlagen für Typografie, Formulare, Buttons, Tabellen, Grid-Systeme, Navigations- und andere Oberflächengestaltungselemente sowie zusätzliche, optionale JavaScript-Erweiterungen