5: Gegevensformaten Flashcards
Waarom zijn verschillende gegevensformaten noodzakelijk?
Omdat gegevens in de computer altijd voorgesteld wordt door binaire getallen moeten teksten, getallen, geluiden en beelden naar een ander formaat geconverteerd worden om ze in de computer op te slaan en te verwerken.
Waarom zijn er verschillende soorten invoerapparaten?
Omdat er verschillende soorten gegevens zijn.
Wat zal de keuze van het invoerapparaat bepalen?
De soort gegevens die moet verwerkt worden.
Wat is het eenvoudigste invoerapparaat?
Het invoeren van gegevens met het toetsenbord is de eenvoudigste manier.
Hoe werkt de invoer met een toetsenbord?
Het bedienen van een toetsenbord is eenvoudig: je drukt op een toets. Daarop gaan de schakelingen in het toetsenbord een binaire code genereren. Dit noemt men de scancode.
Bij het loslaten van de toets wordt er een andere scancode genereerd.
Er bestaan dus twee verschillende scancodes per toets.
Deze scancodes worden geconverteerd naar de bijhorende ASCII-, EBCDIC-, of Unicode.
Voor elke toets die wordt ingedrukt, genereert het toetsenbord een binaire code. Die code wordt door de computer herkend als de voorstelling van het specifieke teken.
Hoe varieert de moeilijkheidsgraad van conversie?
In functie van het soort gegevens dat moet verwerkt worden.
Waarom is de voorstelling van gegevens bij het opslaan en verzenden vaak anders dan de voorstelling bij de verwerking?
Naast bijvoorbeeld de gegevens die de pixels van een figuur voorstellen, moet ook informatie bewaard worden over de betekenis van die gegevens (metadata).
Zo kan de computer laten weten over welk soort informatie het gaat.
Geef een voorbeeld van metadata.
In bepaalde gevallen is deze data zeer eenvoudig, zoals bij het lezen van een tekstbestand. Het kan voldoende zijn om het aantal tekens op te geven of het einde van de tekst te markeren.
Een figuur of een geluidsfragment zal een meer gedetailleerde beschrijving eisen. Om de figuur te kunnen reproduceren, zal de computer moeten weten welk grafisch formaat (gif, bmp, jpg,…) gebruikt wordt, hoeveel kleuren er bij het voorstellen van beeldpunten gebruikt worden, hoe hoog en hoe breed de figuur is, in welke volgorde de gegevens voor de beeldpunten bewaard zijn, de relatieve schaal van de assen, de plaats van de figuur op het scherm,…
Bij geluidsfragmenten moet de computer weten hoe lang elk sample duurt, het aantal bits per sample en bijvoorbeeld hoe het geluid samen met andere geluiden kan gebruikt worden.
Proprietary format?
Een formaat dat door één bepaalde fabrikant gebruikt wordt.
Wat bepaalt het succes van netwerken?
Het succes van netwerken hangt af van de mogelijkheid om de toegang tot gegevens te delen met andere gebruikers.
Wat is een standaard?
Een standaard is een overeenkomst die het mogelijk maakt om gebruikers van verschillende systemen, zowel qua hardwareplatform als op gebied van toepassingssoftware, toegang te geven tot dezelfde gegevens.
Wanneer is een standaard vooral van belang?
Het gebruik van standaarden is vooral van belang op het ogenblik dat er gegevens moeten doorgegeven worden aan andere pakketten, bij communicatie tussen een programma en de randapparaten en bij in netwerk verbonden computers en systemen die gegevens delen.
Is er een onderscheid tussen het gegevensformaat dat gebruikt wordt voor de in- en uitvoer, het opslaan en het uitwisselen van die gegevens?
Ja, dit is mogelijk. Een programma kan om het even welke voorstelling gebruiken tijdens de verwerking van de gegevens, meestal de meest doeltreffende.
Som enkele standaardformaten op bij aflanumerieke gegevens.
- ASCII
- EBCDIC
- Unicode
Som enkele standaardformaten op bij figuren (bitmap).
- GIF
- PCX
- TIFF
- BMP
- JPG
Som enkele standaardformaten op bij figuren (objecten).
- PICT
- PostScript
Som enkele standaardformaten op bij contouren en lettertypes.
- PostScript
- TrueType
Som enkele standaardformaten op bij geluid.
- MIDI
- MP3
Som enkele standaardformaten op bij bewegende beelden.
- QuickTime
- MPEG-2
Hoe ontstaat een standaard?
De meeste standaarden ontstaan uit een formaat dat door een bepaalde fabrikant gebruikt wordt. Door het veelvuldig voorkomen ervan fungeert het formaat eerst als de facto standaard.
Het gebruik van PostScript is hier een goed voorbeeld van. Het werd ontwikkeld door Adobe om bij het afdrukken een hoge kwaliteit te garanderen.
Andere standaarden werden ontwikkeld omdat er voor een bepaald toepassingsgebied nog geen bestonden. Dan worden de standaard de jure opgesteld door commissies.
Dit was het geval voor de MPEG-2 standaard voor het doorgeven en verwerken van digitale beelden.
Waarom worden standaarden opgelegd?
Standaarden worden arbitrair opgelegd, met als doel bijvoorbeeld vlotte verwerking of doeltreffend gebruik van de opslagcapaciteit.
Het zal de communicatieproblemen sterk vereenvoudigen op het ogenblik dat er verschillende computersystemen gebruikt worden.
Wat zijn alfanumerieke gegevens?
De gegevens die we kunnen voorstellen door letters, cijfers en leestekens noemen we alfanumerieke gegevens.
Waarom worden cijfers niet anders beschouwd dan letters?
Omdat het toetsenbord zelf niets verwerkt, moeten cijfers net zoals letters per teken ingevoerd worden.
Het getal 1234,5 bestaat uit de afzonderlijke alfanumerieke tekens 1, 2, 3, 4, ‘,’, 5. De omzetting naar een getalformaat - double of float - gebeurt in de computer zelf.
Bij het voorstellen van een getal op het scherm of op de printer gebeurt net het omgekeerde.
Waarom is het verleidelijk om cijfers anders te beschouwen dan letters?
Omdat cijfers soms op een andere manier verwerkt worden dan tekst.
Deze redenering is fout!
Waarom is de omzetting van cijfertekens naar getallen niet altijd nodg?
De cijfers kunnen ook gebruikt worden om niet-numerieke waarden voor te stellen, zoals een telefoonnummer.
Hoe wordt beslist om cijfertekens om te zetten naar numerieke getallen?
Die keuze om al dan niet om te zetten, moet gemaakt worden bij het ontwerpen van een programma. Dit gebeurt bij de type-declaratie in het programma.
Welke veel gebruikte coderingsvormen zijn er voor alfanumerieke gegevens?
Er zijn drie veelgebruikte coderingsvormen voor alfanumerieke gegevens.
Deze zijn bekend als ASCII, EBCDIC en Unicode.
Waarvoor staat ASCII?
American Standard Code for Information Interchange
Waarvoor staat EBCDIC?
Extended Binary Coded Decimal Interchange Code
EBCDIC?
EBCDIC werd ontwikkeld door IBM. Het wordt dan ook voornamelijk gebruikt in mainframe-omgevingen van deze fabrikant.
Bijna alle andere fabrikanten houden zich aan de ASCII-standaard.
Alle EBCDIC gecodeerde tekens kunnen in één byte bewaard worden.
Door welke organisatie werd ASCII ontwikkeld?
De ASCII code werd ontwikkeld door het ANSI.
Waarvoor staat ANSI?
American National Standards Institute
Waarom werd er 8-bit uitbreidingen voor ASCII gedefineerd?
Deze uitbreidingen voorzien 128 extra tekens die gebruikt worden voor lijnen, symbolen, letters met accenten,…
Latin-1?
Dit is de naam voor de 8-bit uitbreiding van ASCII, IS-464, omdat de toegevoegde tekens voornamelijk bestonden uit Latijnse letters met accenten.
Wat is een codepagina?
Dit wordt geïntroduceerd in de volgende uitbreiding van ASCII, IS-8859.
Dit is een set van 256 tekens voorzien voor een bepaalde taal of groep talen.
Wat is het nadeel van codepagina’s?
- De software moet bijhouden welke codepagina er gebruikt wordt.
- Er kunnen geen codepagina’s door mekaar gebruikt worden.
- Er is geen ondersteuning voor Japans en Chinees.