XML Flashcards
Mi az XML?
- Szűkebb értelemben: szintaxis strukturált dokumentumok ábrázolására, mely lehetővé teszi azok automatikus feldolgozását (elektronikus dokumentum formátum).
- Tágabb értelemben: egy sereg közös tőről fakadó specifikációt jelent, melyeket összefoglaló néven XML családnak is neveznek.
XML elnevezese
Az Extensible Markup Language (XML) kifejezés szó szerint jelentése “Kiterjeszthető Jelölőnyelv”.
Az XML és a HTML összehasonlítása
- XML:
1. Nincs előre definiált címkekészlet
2. Célja adatok leírása
3. Adatcsere formátumként használják - HTML:
1. Előre definiált címkekészlet használata
2. Célja információ megjelenítés
3. Egy prezentációs nyelv
4. Tekinthető az XML egy speciális alkalmazásának (XHTML)
xml Előnyök
- Egyszerűség
Az XML dokumentumok közönséges szöveges állományok, melyeket akár a legegyszerűbb szövegszerkesztővel is létre lehet hozni. - Nyíltság
- Gyártófüggetlenség
- Platformfüggetlenség
- Univerzális adatcsere formátum
- Kiterjedt infrastruktúra
- Az iparban de-facto szabvány
xml Hátrányok
- Bőbeszédű és nehézkesen használható szintaxis
- Nagy tárigény
- Bonyolultság
Dokumentum központú XML
- A dokumentumokat jelölésekkel megtűzdelt folyó szöveg alkotja.
- A dokumentumok szerkezete nagy változatosságot mutat.
- Lényeges az elemek sorrendje.
- Az ilyen dokumentumok tartalma elsősorban emberi fogyasztásra szánt.
- Ilyen alkalmazás például az XHTML.
xml érvényes
Adott sémá(k)nak megfelelő XML dokumentumot érvényesnek
(valid) mondunk.
xml érvényesítés
A sémá(k)nak való megfelelés ellenőrzésének folyamata az érvényesítés (validation).
Elemek
Minden elemet nyitó és záró címke határol vagy
egyetlen üres elem címke alkot.
Jólformáltság
- Egyetlen felső szintű elem, az úgynevezett gyökérelem tartalmazza az összes többi elemet.
– Minden nyitó címkéhez tartozik egy megfelelő záró címke.
– Az elemek megfelelő módon egymásba ágyazottak, nem fedhetik át egymást.
– Minden a dokumentumban hivatkozott elemzett egyed jólformált.
Karakterek
Az XML dokumentumok Unicode karakterekből állnak.
Névtoken
egy vagy több névkarakterből álló karaktersorozat.
Literálok
’”’ vagy ‘’’ karakterek által határolt
karaktersorozatok, melyek nem tartalmazzák
magát a határoló karaktert.
Speciális karakterek
Az ‘&’ és ‘<’ karakterek ebben a formában kizárólag
jelölő-határolóként, megjegyzésekben, feldolgozási
utasításokban és CDATA-szakaszokban fordulhatnak elő.
– Helyettünk minden egyéb helyen karakterhivatkozásokat,
illetve az & amp; és & lt; (szokoz nelkl) egyedhivatkozásokat kell használni!
– A ‘>’ karakter megadható az & gt; egyedhivatkozással.
CDATA-szakaszok
Bárhol előfordulhatnak a dokumentumban, ahol előfordulhat karakteres adat.
– Olyan karaktereket tartalmazó szövegrészek levédésére szolgálnak, melyek egyébként jelölőként lennének tekintve.
– A CDATA-részben csak a ‘]]>’ karakterlánc tekintett jelölőnek.
Példa:
– <![CDATA[if (0 < n && n <= 10)]]>