Otázky Flashcards
Jakou značkovou sadu používá XML?
Unicode
Je možné použivat české znaky v XML?
Ano
Máte fakturu ve formátu isdoc a chcete zobrazit její náhled ve webovém prohlížeči. V jakých jazycích je možné tento úkol provést
XSLT, Java, XQuery
Co je to MathML?
XML schéma pro zápis matematických vzorců
Co je validní dokument?
Dokument, který vyhovuje definici dokumentu (DTD, XSD schéma), dokument splňuje základní syntaktická pravidla, například, všechny tagy musí být uzavřené, kořenový element obsahuje celý dokument.
Jaké kódování používá XML?
UTF-8, UTF-16
Co to je CSS?
Kaskádové styly, které se používájí spolu s HTML (nebo taky mohou být použíté na XML dokument). Neumí dokument před zobrazením transformovat. Mají docela jednoduchou syntaxi. Jsou vhodné pro prezentace.
Máte fakturu a chcete, aby tam bylo datum splatnosti > datum vydání. Pomocí čeho to vyřešíte?
XML schéma spolu se Schematronem, Real NG spolu se Schematronem nebo samotný Schematron.
Je možné pomocí XML Schémat kontrolovat referenční integritu napříč více dokumenty?
Ne
Umí Schematron kontrolovat referenční integritu napříč více dokumenty?
Ano
Potřebujeme udělat podmínku větší/menší. Co na to použijeme?
Cokoli v kombinaci se Schematronem nebo samotný Schematron.
Co je to PSVI?
Post Schema Validation Infoset. Otypovaný XML dokument, využívá se např. v dotazovacích jazycích (XQuery), které potřebují znát typy dat v jednotlivých elementech a atributech.
Máte dokument o velikosti větší než GB, čím ho je nejlepší procházet?
Jakýmkoli sekvenčním parserem, jsou velmi rychlé (SAX, pull-readery: XMLReader, StAX). Nepoužívat parsery založené na stromové reprezentaci (DOM), protože procházejí dokument vícekrát a jsou proto pomalejší.
Dva principy API.
1) Sekvenční (proudové) čtení je velmi rychlé a paměťově nenáročné. Dokument musíme zpracovat během jednoho průchodu. Standardní rozhraní je SAX a pull-parsery (XMLReader, StAX).
2) U stromové reprezentace je celý dokument zpřístupněn jako hierarchie objektů. Dokument můžeme opakovaně a nelineárně procházet. Stromová reprezentace je velmi paměťově náročná a je pomalejší než sekvenční parsery. Pro chybný dokument se stromová reprezentace nevytvoří.
Standardní rozhraní je DOM, mezi novější, specializovaná rozhraní patří JDOM, DOM4J, XOM a další.
Co je to SVG?
SVG (Scalable Vector Graphics) je značkovací jazyk a formát souboru, který popisuje dvourozměrnou vektorovou grafiku pomocí XML. Formát SVG by se měl v budoucnu stát základním otevřeným formátem pro vektorovou grafiku na Internetu. Zatímco pro rastrovou grafiku je na Internetu formátů dostatek (např. GIF, PNG a JPEG), otevřený vektorový formát zatím na Internetu chyběl.
Co jsou to jmenné prostory?
Slouží k rozlišení elementů a atributů se shodnými jmény v případech, kdy by mohlo dojít ke konfliktům. Aplikace si vybere jen ty části dokumentu, které umí zpracovat. Je možné kombinovat více sad značek dohromady. Jména elementů a atributů se skládají ze dvou částí, ze jmenného prostoru a z lokálního názvu. Jmenné prostory se identifikují pomocí URI adresy, ale nic konkrétního se na ní nevyskytuje, slouží pouze jako identifikátor. Pro zkrácení zápisu se při deklaraci jmenného prostoru vytváří prefix.
Co je Atom?
Atom je webový standard pro publikování syndikovaného obsahu, přijatý IETF v prosinci 2005 jako RFC 4287. Je nástupcem formátu RSS. Kromě něj je pod RFC 5023 v říjnu 2007 přijat také Atom Publishing Protocol (zkráceně APP či AtomPub) umožňující vytváření a aktualizaci webových zdrojů ve formátu Atom pomocí HTTP.
Co je XML Encryption?
XML Encryption je standard pro ukládání zašifrovaných dat do XML. Šifrovat lze libovolná data, XML dokument, XML element nebo obsah XML elementu. Podporuje několik algoritmů.
Co je to RSS?
RSS je rodina XML formátů určených pro čtení novinek na webových stránkách a obecněji syndikaci (seskupení) obsahu.
Z jakých prvků se skládá XML?
Elementy, atributy, textové uzly, komentáře, instrukce pro zpracování, sekce CDATA. - vyvinut a standardizován konsorciem W3C, - popisuje strukturu dokumentu z hlediska věcného obsahu jednotlivých částí
- nezabývá se vzhledem, ten může být definována pomocí kaskádových stylů (CSS, XSL, …)
- používá se pro:
o výměnu dat mezi aplikacemi
o publikování dokumentů
o serializaci dat
o transformace do jiného typu dokumentu
Vyjmenujte alespoň pět zabudovaných jednoduchých datových typů w3c xml schémat a uveďte příklady údajů, pro jejichž reprezentaci se hodí?
- String – jméno člověka
- Decimal – částka
- Date – datum narození
- Integer
- Boolean
- Datetime
- Time
Z jakých komponent se skládá XML Infoset?
XML Infoset je abstraktní datový model pro XML dokumenty. Ke každému XML dokumentu existuje reprezentace v podobě infosetu (stromová reprezentace). Využívá se v dalších standardech. Může
obsahovat 11 typů informačních položek: dokument, elementy, atributy, instrukce pro zpracování, entity, znaky, komentáře, deklaraci typu dokumentu, odkazy na entity, informace o notaci, informace o namespacech.
Jaké máme nástroje pro popis schémat dokumentů a čím se liší?
DTD je nejstarší, vychází ještě ze SGML a je přímo součástí specifikace XML. Nepodporuje jmenné prostory a datové typy.
W3C XML Schema podporuje jmenné prostory a datové typy, má poměrně složitou specifikaci a podporuje ho množství komerčních firem (MS, IBM, Oracle, Sun).
Relax NG je nový elegantní jazyk pro popis schématu. Je zatím podporován spíše jen ve světě open source softwaru. Je standardizován v rámci OASIS a ISO.
Schematron je sada XPath výrazů, které musí dokument splňovat.
Když chceme z XHTML stránky získat odkazy tak, aby se neopakovaly, jaký jazyk můžeme použít?
XQuery, XPath 2.0, XSLT 2.0. (ale musí to být 2.0!!! jinak to neumí)