2. dia UNICODE Flashcards

1
Q

Unicode

A

Univerzális karakterkódolási szabvány írott karakterekhez és szövegekhez. Lefedi a világ összes modern és ősi nyelvének összes karakterét. Tartalmaz még szimbólumokat, írásjeleket és sok más karaktert. Széles körben használt és támogatott. Fejlesztője az Unicode Consortium non-profit szervezet.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Kódtér

A

A karaktereket kódoló egész számok tartománya.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Kódpont

A

A kódtér egy eleme, egy karaktert kódoló egész szám. 4-6 hexadecimális számjeggyel ábrázolandó. A vezető nullák elhagyhatóak ha 4 számjegy megvan nélkülük. Kötelező az U+ előtag.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

BMP (Basic Multilingual Plane)

A

Az első 65536 kódpontot tartalmazó sík. A gyakran használt karaktereket tartalmazza, a világ összes karakterrendszeréhez, valamint számos történelmi és ritka karaktert is tartalmaz.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

UTF-32

A

Minden kódpont ábrázolása 4 byte-on történik. Ez a legegyszerűbb karakterkódolás. Feldolgozás szempontjából ez a leghatékonyabb, azonban tárolás szempontjából a legkevésbé hatékony.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

UTF-16

A

Minden kódpont ábrázolása 2 vagy 4 byte-on történik. A BMP karaktereinek ábrázolására van optimalizálva. Kompromiszzumot képvisel a hatékony hozzáférés és a hatákony tárhasználat között.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

UTF-8

A

A kódpontok ábrázolása 1 és 4 byte között történik. Egy kódpontot ábrázoló byte-sorozat első byte-ja meghatározza a sorozat hosszát. Használt byte-ok számának tekintetében a legtömörebb, viszont nem hatékony a kelet-ázsiai írásrendszerek feldolgozása esetében.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

ISO/IEC 8859-2 (Latin 2)

A

A közép-európai nyelvekhez használt 8-bites karakterkódolási szabvány.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

CSS

A

Unikód karakterek megadásához a “\hhhhhh” formátumot használjuk. Ha 6 számjegynél kisebb a szám akkor tetszőleges whitespace karaktert kell a végére tennünk.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

JSON

A

Sztringekben a BMP-hez tartozó Unicode karakterek megadhatók a “\uhhhh” formátumban.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

XML, HTML

A

Szövegekben, attribútumértékekben és literális egyed értékekben Unicode karakterek kifejezhetők így:
&#nnnn (decimális az n)
&#xhhhh (hexadecimális a h)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly