UNICODE Flashcards
Mi a UNICODE?
Univerzális karakterkódolási szabvány.
Ki fejleszti a UNICODEot?
Unicode consortium.
Mi az Universal Coded Character Set (UCS)?
ISO által meghatározott szabványos karakterkészlet.
Mi a UNICODE és az UCS közötti különbség?
A UNICODE további megszorításokat szab az implementáció számára.
Mi a kódtér?
A karaktereket kódoló egész számok tartománya.
Mi a kódpont?
A kódtér egy eleme, egy karaktert kódoló egész szám.
Hogy ábrázolnak a kódpontok?
U+ előtag után az értéket megadjuk 4-6 számjeggyel ábrázol hexadecimális alakban. Elhagyjuk a vezető nullákat, de legalább 4 hexadecimális számjegy szükséges.
Példák: U+0020, U+265F, U+130E0
Mi a tulajdonság?
A karakterekhez jelentést rendelünk hozzá, több 100 tulajdonság azonosítása.
Mi a karakterjel?
Egy karakter vizuális ábrázolása, minden eszközön más kép van hozzárendelve.
Mik a síkok?
A kódtér síkokra van bontva. 17 darab van összesen.
Mik a blokkok?
A síkok blokkokra van felosztva. A kódpontok száma mindig 16 többszöröse.
Mi a Basic Multilingual Plane (BMP)?
Az első 65536 kódpontot tartalmazó sík. A gyakran használ karaktereket tartalmazza, valamint számos ritka és történelmi karakter. BMP-be tartozik a Unicode karakterek többsége szinten minden szöveges adat esetén.
Milyen karakterkódolások léteznek?
UTF-8
UTF-16
UTF-32
Mi a UTF-32 karakterkódolás jellegzetességei?
Minden kódpont 4 byte-on van ábrázolva.
legegyszerűbb.
Feldolgozás szempontjából a leghatékonyabb, viszont a legtöbb tárhelyet igényli.
Mi az UTF-16 karakterkódolás jellegzetességei?
Minden kódpont 2 vagy 4 byte-on van ábrázolva.
A BMP van 2 byte-on, a többi pedig 4-en.
Középút a hatékony feldolgozás és tárhasználat között.