Zeichensätze Flashcards
Zeichensatz
geordnete Menge S an Zeichen, die durchnummeriert sind
auch als character repertoire bezeichnet
Verschiedene Standards Zeichensätze
Internationale: ASCII, Unicode
Nationale: SJIS
Firmenspezifische: MacRoman, Windows
Zeichenkodierung
Zeichensatz zugewiesenen Zahl zu den Zeichen wird das entsprechende Bitmuster zugeordnet
Anzahl darstellbaren Zeichen
unterschiedliche Zeichensätze
viele Zeichensätze, die mit einer gewissen überlappung, unterschiedliche Zeichen darstellen
Anzahl der darstellbaren Zeichen normalerweise geringer als die Anzahl der definierbaren Zeichen:
z.B.: ASCII 7 Bit
128 definierbare Zeichen
95 darstellbare
Grund: nicht druckbare Steuerzeichen: zum druckern,…
ASCII-Zeichenkodierung
American Standard Code for Information Interchange
1963 geschaffen
internationale Zeichenkodierung mit Fokus auf der englischen, angelsächsischen Ländern
Zeichen: 7 Bit
geringe Anzahl darstellbarer Zeichen (95)
ASCII-Zeichentabelle
alle Steuerzeichen und darstellbare Zeichen (128) ziffern lateinischen Alphabet A,a Satzzeichen ! keine deutschen umlaute
ASCII Erweiterungen
erweitert um auch andere Sprachen darzustellen
um 1 Bit=> 8 Bit
Unicode Zeichensatz
1991 Standard auf vielen aktuellen Computern umfangreicher als ASCII fast alle bekannten Schriftzeichen lassen sich darstellen regelmäßig aktualisiert, erweitert
Zeichenkodierungen Unicode
diverse Zeichenkodierungen: Unicode Transformation Format
z.B.: UTF-8: Email, www,…
UTF-16: Windows, macOS, Java
Zeichencodierung UTF-8
für Email, www,..
ersten 128 Zeichen, wie ASCII
meistbenutze Kodierung
jedes Unicode-Zeichen: speziell kodierte Zeichenkette=> max 4 Byte, lassen alle Unicode-Zeichen abbilden
UTF-16
UTF-16, wie UTF-8 maximal 32 Bit lang
Unicode Zeichen => ein oder zwei Einheiten mit 16 Bit-Länge
=> auch alle unicode Zeichen