Datové formáty Flashcards
Datové formáty
Datový formát je způsob, jakým jsou (zpravidla v nějakém souboru) organizována data, tj. veškeré obsažené informace a způsob reprezentace dat a jejich následná interpretace.
Základní a nejmenší jednotka informace je bit (Binare digit). Má dvě hodnoty (True, false – 0, 1, - ano, ne). Větší jednotkou je byte (8 bitů). Má 256 kombinací (28). Nejmenší hodnota je 00000000 a největší 11111111.
Znakové sady
ASCII UNICODE Windows 1250 CP 852 Latin 2 Kód Kamenických ISO 8859-2 UTF-8
ASCII
Základní znaková sada se jmenuje ASCII (American Standard Code of Information Iterchange). Znaky ukládáme pomocí bytu (256 znaků). V ASCII tabulce ukládáme písmena, číslice, jiné tisknutelné znaky (+-*/%-), netisknutelné řídící znaky.
UNICODE
je tabulka znaků všech existujících abeced. Obsahuje více než 110 000 znaků. Vývoj začal v roce 1987 a skončil v roce 1991. Mezi cíle UNICODU patří: jednotnost, univerzálnost, jednoznačnost, maximální využití. Využití je například ve Windows, Linux, HTML. Základem tabulky je ASCII.
Windows 1250
Windows 1250 byl navržen pro střední Evropu Microsoftem. Využívá latinku. V znakové sadě je uložena albánština, chorvatština, čeština, polština, slovenština, rumunština, maďarština. Je podobný ISO 8859-2.
CP 852 Latin 2
CP 852 Latin 2 je pro středoevropské jazyky využívající latinku. Především sada pro východoevropské jazyky. Využití v MS-DOS. Byly obětovány některé semigrafické znaky.
Kód Kamenických
Kód Kamenických je pojmenován podle bratrů Kamenických. Používána v MS-DOS. Je to znaková sada pro češtinu a slovenštinu. Jedná se o upravenou sadu CP437.
ISO 8859-2
ISO 8859-2 je známá jako Latin-2. Je vytvořena pro středoevropské a východoevropské jazyky. Užívá se v operačním systému Linux. Vznikla v roce 1987.
UTF-8
UTF-8 je způsob kódování řetězců znaku UNICODE-UCS so sekvencí bajtů. Používá proměnnou délku znaku od 1 bajtu až do 6 bajtů.
Soubor
Je to pojmenovaná sada dat, uložená na nějakém datovém médiu. Obsahem mohou být různá data. Podle toho, jak má být obsah souboru interpretován lze soubory rozdělit na textové a binární. Mezi vlastnosti souborů patří:
Jméno - symbolické jméno v lidsky čitelné podobě
Typ – určuje způsob užití a zpravování
Lokace – ukazatel na zařízení a na umístění na něm
Velikost – aktuální velikost a jeho max. možná velikost
Ochrana – informace o ochraně a přístupu
Datum, čas a uživatelská identifikace
Atributy souborů jsou R – pro čtení, S – systémový, H – skrytý, A – přepisovatelný.
Při převodech formátů lze převádět příbuzné formáty. Pomocí aplikačního softwaru (Import, Export). Každý aplikační software zanechává stopy.
Komprese dat
se používá za účelem zmenšení objemu dat. Ztrátová komprese (zvuk, obrázky) se používá tam, kde je možné ztrátu některých informací tolerovat. Bezeztrátová komprese (wmv, bmp) není tak účinná jako ztrátová. Používá se tam, kde ztráta jednoho znaku by mohla znamenat nenávratné poškození dat.
True type je standart pro popis vektorových počítačových písem. Vyvinutý koncem 80. let společností Apple. Využívá i MS Windows a Gnu/Linux. Má příponu TTF.
Open type je standard pro popis vektorových počítačových písem – fontů. Vyvinutý společností Microsoft. Nástupce standardu True Type. Využití v MS Windows, Mac OS X a Linux s příponou OTF, i když se používá i starší přípona TTF.
PDF (Portable Document Format - přenosný formát dokumentů)
byl vyvinutý firmou Adobe pro ukládání dokumentů nezávisle na SW a HW. PDF může obsahovat obrázky i texty. Stejné zobrazení na všech zařízeních. Je založen na jazyce PostScript.
ODF (Open Document Format)
je formát pro ukládání textových dokumentů, prezentací, tabulek, grafů a databází. Využívá se v programech OpenOffice. Založen na XML.