XML/HTML Flashcards
VL 8
1
Q
Metasprachen
A
- Eine Metasprache bietet ein Vokabular und Grammatikregeln für die Spezifizierung anwendungsdomänen-spezifischer Sprachen (ohne eine eigene Sprache zu sein)
- Eine Metasprache besteht aus mehreren einfachen Sprachen
- Beschreiben von Daten erfordert eine formale Auszeichnungssprache (bestehend aus Vokabular und Grammatikregeln)
- HTML ist formale Auszeichnungssprache, jedoch werden durch HTML Daten strukturiert und dargestellt und nicht beschrieben
- Sprache, die Daten beschreibt muss domänenspezifisch sein (zB. Recht vs. Wirtschaft), deshalb ist eine Meta (Auszeichungs)Sprache erforderlich
2
Q
Relevante XML Begriffe
A
- Parser (=Analysator): Übersetzt ein XML-Dokument in eine Dokumentstruktur, während Elemente für Anwendungen zugänglich gemacht werden
- Style Sheet: Layout Information zur Wiedergabe des Inhalts der XML-Dokumente
- Style Sheet Prozessor: Implementiert die Style Informationen und generiert die Ergebnisseiten
3
Q
Generelle XML Anwendungen
A
- Teilen von Daten zwischen verschiedenen Komponenten einer Anwendung (zB. Excel und Access)
- Speicherung von Daten in einfachen, nicht binären Textdateien (zB. Word Format)
- Förderung des elektronischen Datenaustauschs (EDI – electronic data exchange): Transaktionen zwischen Banken, Hersteller und Lieferanten die Produktdaten teilen
- User Generated Content (zB. Google Maps Layer)
- Zugriff auf Dienste und Anwendungen über das Internet (zB. Web Service APIs)
4
Q
Wann sind XML-Dokumente wohlgeformt?
A
- Nur richtig codierte Unicode Zeichen
- Es gibt ein einzelnes Root-Element, das alle anderen Elemente enthält
- Die Elementtags begin, end und empty sind korrekt verschachtelt, es fehlen keine und sie überlappen sich nicht
- Spezielle Syntaxzeichen sind markiert
5
Q
DTD – XML Document Type Definition
A
- Beschreibt die Struktur eines XML Dokuments und definiert seine Grammatik
- Vergleichbar mit einer Typ- oder Variablendeklaration in einer Programmiersprache
- Definiert, welche Elemente und Referenzen in dem darauf basierenden Dokument vorkommen dürfen
- Deklariert Entitäten, die im XML-Dokument verwendet werden dürfen
6
Q
Valide XML Dokumente
A
- Ein XML-Dokument, das einer DTD entspricht wird gültig genannt
- Die Gültigkeit kann automatisch von einer Parser Software ermittelt werden
- Dieses Konzept ermöglicht Verbrauchern von XML-Dokumenten (z. B. einer Softwareanwendung) zu überprüfen, ob die Inhalte von XML-Dokumenten mit ihrem erwarteten Dokumentenformat übereinstimmen, zB. die angegebene Dokumentstruktur, erlaubte Elemente und Daten
7
Q
XML Schema
A
- Alternative Herangehensweise an DTD
- Beseitigt einige Schwachstellen durch Hinzufügen folgender Features:
o Bessere Inhaltsmodellierung für die Syntaxprüfung
o Reihenfolge und Verschachtelung sind konfigurierbar.
o Konfigurierbare Wertspannen
o Überprüfung von Elementdatentypen
o Bessere Definition der Kardinalitäten mit Min. und Max.
o Größere Auswahl an Datentypen in Analogie zu Programmiersprachen und Datenbanken (z. B. boolean, number, float, date time, …)
8
Q
XML Namespace
A
- XML-Dokumente sind besonders nützlich, wenn Daten zwischen Anwendungen, zwischen Benutzern oder sogar zwischen unabhängigen Unternehmen ausgetauscht werden
- Problem: Wie können Verwechselungen von Tags verhindert werden, wenn Daten aus verschiedenen Quellen mit identischen Namenstags zusammengeführt werden?
- Idee: Ein Universal Resource Identifier (URI), der die Einführung eines definierten Namensraums ermöglicht (durch einen global eindeutigen Pfad)
- Dazu wird ein Präfix für ein Element erstellt
9
Q
Verarbeitung von XML Dokumenten
A
- Die Verarbeitung erfordert einen Parser (=Analysator)
- Ein Parser ist eine Software, die DTDs, Schemas und XML-Dokumente liest und einer Anwendung den Zugriff auf alle XML-Dokumentelemente ermöglicht
- Allgemeiner Analyseprozess:
1. Eine Anwendung (z. B. Microsoft Word) öffnet ein XML-Dokument.
2. Der Parser liest das XML-Dokument und die zugehörigen DTDs und Schemas
3. Der Parser prüft, ob das XML-Dokument wohlgeformt und gültig ist
4. Parser bietet eine Anwendungsschnittstelle mit Funktionen wie “ListElements()”
5. Die Anwendung greift über die verfügbaren Schnittstellen auf die Elemente des XML-Dokuments zu und verarbeitet die empfangenen Daten
6. Die Anwendung speichert das geänderte/ aktualisierte XML-Dokument
10
Q
Document Object Model (DOM) Parser
A
- laden alle Elemente in den Speicher und erzeugen eine Baumdatenstruktur, die dann verarbeitet werden kann
- erlauben freien Zugriff und Änderungen an einem Dokument
- erstellen ein vollständiges Bild des Dokuments im Speicher
- sind nützlich, wenn Sie ganze Dokumente gleichzeitig bearbeiten, zB. zum Bearbeiten eines strukturierten Textes in einem Textverarbeitungsprogramm
11
Q
Simple API for XML (SAX) Parser
A
- navigieren durch ein Dokument, das nur Teile seines Inhalts anbietet, ohne es vollständig in den Speicher zu laden
- können Dateien jeder Größe analysieren
- sind effizient, wenn nur Teile der Datei relevant sind
- sind einfach zu bedienen
- sind nützlich für den schnellen Abruf von Datensätzen, zB. für den Zugriff auf Adressen in einer XML-basierten Kundendatenbank