XML Flashcards
Mi az XML?
- Szűkebb értelemben: szintaxis strukturált dokumentumok ábrázolására, mely lehetővé teszi azok automatikus feldolgozását (elektronikus dokumentum formátum).
- Tágabb értelemben: egy sereg közös tőről fakadó specifikációt jelent, melyeket összefoglaló néven XML családnak is neveznek.
XML elnevezese
Az Extensible Markup Language (XML) kifejezés szó szerint jelentése “Kiterjeszthető Jelölőnyelv”.
Az XML és a HTML összehasonlítása
- XML:
1. Nincs előre definiált címkekészlet
2. Célja adatok leírása
3. Adatcsere formátumként használják - HTML:
1. Előre definiált címkekészlet használata
2. Célja információ megjelenítés
3. Egy prezentációs nyelv
4. Tekinthető az XML egy speciális alkalmazásának (XHTML)
xml Előnyök
- Egyszerűség
Az XML dokumentumok közönséges szöveges állományok, melyeket akár a legegyszerűbb szövegszerkesztővel is létre lehet hozni. - Nyíltság
- Gyártófüggetlenség
- Platformfüggetlenség
- Univerzális adatcsere formátum
- Kiterjedt infrastruktúra
- Az iparban de-facto szabvány
xml Hátrányok
- Bőbeszédű és nehézkesen használható szintaxis
- Nagy tárigény
- Bonyolultság
Dokumentum központú XML
- A dokumentumokat jelölésekkel megtűzdelt folyó szöveg alkotja.
- A dokumentumok szerkezete nagy változatosságot mutat.
- Lényeges az elemek sorrendje.
- Az ilyen dokumentumok tartalma elsősorban emberi fogyasztásra szánt.
- Ilyen alkalmazás például az XHTML.
xml érvényes
Adott sémá(k)nak megfelelő XML dokumentumot érvényesnek
(valid) mondunk.
xml érvényesítés
A sémá(k)nak való megfelelés ellenőrzésének folyamata az érvényesítés (validation).
Elemek
Minden elemet nyitó és záró címke határol vagy
egyetlen üres elem címke alkot.
Jólformáltság
- Egyetlen felső szintű elem, az úgynevezett gyökérelem tartalmazza az összes többi elemet.
– Minden nyitó címkéhez tartozik egy megfelelő záró címke.
– Az elemek megfelelő módon egymásba ágyazottak, nem fedhetik át egymást.
– Minden a dokumentumban hivatkozott elemzett egyed jólformált.
Karakterek
Az XML dokumentumok Unicode karakterekből állnak.
Névtoken
egy vagy több névkarakterből álló karaktersorozat.
Literálok
’”’ vagy ‘’’ karakterek által határolt
karaktersorozatok, melyek nem tartalmazzák
magát a határoló karaktert.
Speciális karakterek
Az ‘&’ és ‘<’ karakterek ebben a formában kizárólag
jelölő-határolóként, megjegyzésekben, feldolgozási
utasításokban és CDATA-szakaszokban fordulhatnak elő.
– Helyettünk minden egyéb helyen karakterhivatkozásokat,
illetve az & amp; és & lt; (szokoz nelkl) egyedhivatkozásokat kell használni!
– A ‘>’ karakter megadható az & gt; egyedhivatkozással.
CDATA-szakaszok
Bárhol előfordulhatnak a dokumentumban, ahol előfordulhat karakteres adat.
– Olyan karaktereket tartalmazó szövegrészek levédésére szolgálnak, melyek egyébként jelölőként lennének tekintve.
– A CDATA-részben csak a ‘]]>’ karakterlánc tekintett jelölőnek.
Példa:
– <![CDATA[if (0 < n && n <= 10)]]>
dokumentumtípus-definíció
Dokumentumok egy osztályához egy nyelvtant meghatározó jelölő deklarációkat tartalmaz és/vagy ilyen deklarációkra mutat.
– Ezt a nyelvtant dokumentumtípus-definíciónak (vagy röviden DTD-nek) nevezik.
Érvényesség
Egy XML dokumentum érvényes akkor, ha tartozik hozzá dokumentumtípus-deklaráció és a dokumentum eleget tesz a DTD által kifejezett megszorításoknak.
Elemtípus-deklaráció
- Egy elemtípus-deklaráció megszorítást ír elő az elem tartalmára.
- Érvényességi megszorítás: egy elemtípus nem deklarálható egynél többször.
- az ures elemeknek nem lehet tartalma
Attribútumtípusok
- Sztring típus (CDATA)
– Tokenizált típusok (ID, IDREF, IDREFS, NMTOKEN, NMTOKENS)
– Felsorolt típusok (felsorolások) - az ID típusú attribútumértékek
olyan nevek kell, hogy legyenek, melyek nem fordulnak elő egy XML dokumentumban egynél többször ilyen típusú attribútumértékként. Nem adhato egy elemnek tobb id, es az id-khez #IMPLIED vagy #REQUIRED kotelezo
Adatközpontú XML
- A dokumentumokat nagyszámú adatelem alkotja.
- Kevésbé véletlenszerű dokumentum-szerkezet.
- Az elemek sorrendje kevésbé lényeges.
- Az ilyen dokumentumok elsősorban gépi feldolgozásra szántak.
Ilyen alkalmazás például az SVG.
XML dokumentumok
- Olyan szöveges objektumok, melyek a szabvány előírásai szerint jólformáltak.
- Fizikai és logikai szerkezetük van.
– Fizikailag egyedeknek nevezett tárolási egységekből állnak.
– Logikailag deklarációkból, elemekből, megjegyzésekből, feldolgozási utasításokból és további szerkezeti alkotóelemekből állnak.
XML deklaráció
<?xml version=”1.0”?>
<?xml version=’1.0’ encoding=’UTF-8’?>
karakterhivatkozás
- Szövegben, attribútum értékekben és literális egyed értékekben Unicode karakterek kifejezhetők
az alábbi formájú karakterhivatkozásokkal:
– &#nnnn;, ahol nnnn a kódpontot ábrázoló decimális
számjegysorozat.- Példa: © (©), ( ),☯),
– &#xhhhh;, ahol hhhh a kódpontot ábrázoló
hexadecimális számjegysorozat. - Példa: © (©), ( ),☯),
- Példa: © (©), ( ),☯),
egyedhivatkozás
Hivatkozás egy névvel azonosított egyed tartalmára.
– Hivatkozás elemzett általános egyedre: &név ;
● Példa: &, Á, ©right;
megjegyzés
A dokumentumban bárhol szerepelhetnek más jelölőkön kívül.
– Az egyetlen kivétel a dokumentumtípus-deklaráció, melyben bizonyos helyeken előfordulhatnak.
● Példa:
– <!-- Ez egy megjegyzés -->
feldolgozási utasítás
Az alkalmazások számára tartalmaznak utasításokat.
● Példa:
– <?xml-stylesheet type=”text/css” href=”style.css”?>
üres elemek
Példa üres elem deklarálására és használatára:
<!ELEMENT br EMPTY>
elemtartalom
Tartalommodell megadásánál használható konstrukciók:
– Sorozat, mint például
(street, city, zip, country)
– Alternatíva lista, mint például
(ul | ol | dl)
● Az előfordulások számát szabályozó speciális karakterek (a megelőző részkifejezésre vonatkoznak):
– ?: nulla vagy egy (0, 1) előfordulás
– +: tetszőleges számú, de legalább egy (1, 2, 3, …) előfordulás
– *: tetszőleges számú (0, 1, 2, …) előfordulás
Előre definiált egyedek
- Előre definiált egyedek speciális karakterekhez:
amp (‘&’), lt (‘<’), gt (‘>’), apos (‘’’),
quot (‘”’). - Ezeket az egyedeket minden XML feldolgozó fel kell, hogy ismerje, függetlenül attól, hogy deklaráltak-e vagy sem.