Кодировки символов Flashcards
cp866
кодовая страница, где все специфические символы европейских алфавитов заменены на кириллицу. Длина 1 байт. Используется в среде DOS и консоли русифицированных систем Microsoft.
windows-1251
стандартная кодировка кириллицы в Windows. Наиболее полная кириллическая кодировка из 8-битных. Минус - отсутсвие псевдографики и проблемы с буквой “я” из-за проблем с восьмым битом в некоторых программах
koi8-r(cp878)
стандарт кириллической кодировки в 1990. Символы была помещена в таблицу так, чтобы позиции кириллических букв фонетически соответствовали позициям латинских. В результате отказа от алфавитного порядка удалось решить проблему срезаемого восьмого бита - кириллический текст заменялся более-менее читаемым латинским.
iso-8859-5
8-битная кодовая страница кирилицы стандарта ISO. Отсутствуют некоторые полезные символы. В основном используется в Сербии и Болгарии.
mac-cyrillic-2000(100007)
кириллица в Mac OS. 8 бит. Благодаря отсутствию псевдографики и «верхних» управляющих символов эта кодировка включает довольно много полезных символов; кроме того, присутствуют все дополнительные буквы, необходимые для записи украинского, белорусского, македонского и сербского языков.
utf-8
формат преобразования Юникода: символы с кодом, меньшим 128, преобразуются в ASCII с тем же кодом; остальные записываются в виде последовательности от 2 до 6 байт. Плюсы: гарантировано распознавание латиницы, цифр и знаков препинания, выигрыш на определенных текстах по сравнению с UTF-16.
otf-16
формат преобразования Юникода в 16-битные слова (один из самых первых). Каждый символ так или иначе будет занимать не меньше 2 байт.