Drugi kolokvij Flashcards
- Nastajanje digitalnog videa, načini analiziranja videa
a. Na koje sve načine može nastati digitalni video?
b. Objasniti dva načina analiziranja videa – analiziranje s proredom i progresivno analiziranje
a. Na koje sve načine može nastati digitalni video?
- U kameri
- U računalu
b. Objasniti dva načina analiziranja videa – analiziranje s proredom i progresivno analiziranje
- Analiziranje s proredom (I interlaced)
o slika frame se dijeli na dvije poluslike field od kojih jedna sadrži neparne, a druga parne linije
o vertikalna frekvencija je dvostruko veća od frekvencije izmjene slika - Progresivno analiziranje (P progressive)
o slika se analizira kao cjelina
o vertikalna frekvencija je jednaka frekvenciji izmjene slika
- Digitalizacija videa, formati poduzorkovanja
a. Koji se tip signala koristi pri digitalizaciji videa i zašto?
b. Što znači poduzorkovanje boje u odnosu na svjetlinu, zašto se radi i koji je razlog da se uopće može raditi (da to ima smisla)?
c. Znati nacrtati primjere poduzorkovanja boje u odnosu na svjetlinu za različite formate poduzorkovanja (4:2:2, 4:2:0, 4:1:1, 4:1:0) po uzoru naprimjere dane na slajdu 19 (X i O)
d. Znati izračunati uštedu u broju bita kod pojedinog formata poduzorkovanja
a. Koji se tip signala koristi pri digitalizaciji videa i zašto?
- Koristi se YUV signal
- Iskorištava se manja osjetljivost ljudskog vizualnog sustava na promjenu boje u
odnosu na promjenu svjetline
b. Što znači poduzorkovanje boje u odnosu na svjetlinu, zašto se radi i koji je razlog da se uopće može raditi (da to ima smisla)?
- jako velika količina podataka, pa čak i za moderne diskove od nekoliko terabajta - ljudsko oko osjetljivije je na luminantnu komponentu nego na krominantnu komponentu
- poduzorkovanjem krominantnog signala veću razlučivost pridodajemo luminantnoj nego krominantnoj komponenti
- na optimalnim udaljenostima gledanja ne možemo opaziti smanjenu kvalitetu slike nastalu uzorkovanjem krominantne komponente na nižoj razini
c. Znati nacrtati primjere poduzorkovanja boje u odnosu na svjetlinu za
različite formate poduzorkovanja (4:2:2, 4:2:0, 4:1:1, 4:1:0) po uzoru na
primjere dane na slajdu 19 (X i O)
SLIKA
d. Znati izračunati uštedu u broju bita kod pojedinog formata poduzorkovanja
SLIKA
- Kompresija videa – modovi obrade
a. Nabrojati 4 moda obrade pri kompresiji videa i za svaki od njih objasniti što se odvija u kojem modu
a. Nabrojati 4 moda obrade pri kompresiji videa i za svaki od njih objasniti što se odvija u kojem modu
- Pred obrada
o reduciranje 10 bitnog u 8 bitni zapis
o prebacivanje u odgovarajuću shemu poduzorkovanja
o redukcija šuma , čišćenje slike - Prostorna kompresija – unutarokvirna
o nastaju I okviri
o iskorištava se zalihost u horizontalnoj i vertikalnoj dimenziji slike , tj. sličnost elemenata slike
o kompresija unutar jednog okvira , neovisno o ostalim okvirima
o slična JPEGu - Vremenska kompresija – međuokvirna
o zalihost se pojavljuje u vremenu iskorištava se sličnost u susjednim okvirima
o nastaju P (predviđeni) i B (dvosmjerno predviđeni) okviri - Kontrola protoka
o kompresija može biti:
s konstantnom brzinom protoka podataka
u tom je slučaju kvaliteta videa veća za manje zahtjevan sadržaj
s konstantnom kvalitetom videa
u tom je slučaju brzina protoka podataka manja za manje zahtjevan sadržaj – promjenjiva brzina protoka
- Kompresija videa – unutarokvirno kodiranje (nastajanje I okvira)
a. Kako nastaju I okviri – shema za unutarokvirno kodiranje i objašnjenje svakog bloka sheme s maksimalno jednom rečenicom po bloku
a. Kako nastaju I okviri – shema za unutarokvirno kodiranje i objašnjenje svakog bloka sheme s maksimalno jednom rečenicom po bloku
SLIKA
- 1) Podjela okvira u 8x8 blokove
- 2) Primjena DCT prebacivanje iz prostorne domene u domenu prostorne frekvencije
- 3) Kvantizacija
o unosi gubitke
o kvantizacijski korak različit za različite prostorne frekvencije
o koristi se kvantizacija koja odgovara osjetljivosti ljudskog vizualnog sustava - 4) Cik cak slaganje koeficijenata
- 5) Run length kodiranje
- 6) Variable length kodiranje – entropijsko kodiranje
- Kompresija videa – međuokvirno kodiranje (nastajanje P i B okvira)
a. Kako nastaju P okviri – shema za međuokvirno kodiranje i objašnjenje zašto se ono uopće može raditi?
a. Kako nastaju P okviri – shema za međuokvirno kodiranje i objašnjenje zašto se ono uopće može raditi?
- P okviri
o predviđaju se iz prethodnog I ili P okvira
o iskorištavaju vremensku zalihost
susjedni okviri su slični, mali broj podataka je nov
pokret se istražuje na makroblokovima dimenzije NxM elemenata slike tehnikama korelacije – proračnunava se vektor pokreta, to je smjer translacije najsličnijeg makrobloka - B okviri
o kao P okviri, ali se predviđaju iz prethodnog i sljedećeg I ili P okvira
o dobra predikcija dijelova okvira koji ne postoje još u prethodnom okviru
- MPEG-2 kompresija videa – profili i razine, faktori koji utječu na kvalitetu videa
a. Što opisuje profil, a što razina?
b. Čemu služe profili i razine?
c. Nabrojati koji profili i koje razine postoje kod MPEG-2 i znati objasniti alate koje koriste dvije najvažnije kombinacije Profil-Razina (Main-Main i MainHigh) i njihove značajke
d. Nabrojati faktore koji utječu na kvalitetu videa i objasniti kako pojedini od njih utječe na kvalitetu kodiranog videa
a. Što opisuje profil, a što razina?
- Profil – opisuje funkcionalnosti tj. skupine značajki bitne za pojedine aplikacije
- Razina - opisuje zahtjeve za parametrima (npr. rezolucija, brzina prijenosa, …)
b. Čemu služe profili i razine?
- stvoreni kako bi se omogućila fleksibilnost primjene norme za različite aplikacije
c. Nabrojati koji profili i koje razine postoje kod MPEG-2 i znati objasniti alate koje koriste dvije najvažnije kombinacije Profil-Razina (Main-Main i MainHigh) i njihove značajke
- Profili
o osnovni, glavni, profil sa slojevitošću u odnosu na omjer signal/šum (SNR),
profil s prostornom slojevitošću (Spatial), visoki - Razine
o niska, glavna, visoka 1440, visoka - Main – main
o 4:2:0, 720 x 576, 15 Mb/s- I,P,B, 30 okvira/s - Main – high
o 4:2:0, 1920 x 1152, 80 Mb/s- I,P,B, 60 okvira/s
d. Nabrojati faktore koji utječu na kvalitetu videa i objasniti kako pojedini od njih utječe na kvalitetu kodiranog videa
- Kvaliteta ulaznog signala
o Amplituda i DC razina
nelinearnosti uzrokuju rezanje naponskih nivoa ili neefikasno korištenje 8 bitne 256 razinske kvantizacije
o Frekvencijski pojas
preuzak reže visoke frekvencije sliku je lakše kodirati ali se gubi na kvaliteti
o Šum , jitter
otežavaju digitalizaciju - Kompleksnost slike o puno detalja i brzi pokret predstavljaju veće zahtjeve na kompresiju
- MPEG-4 kompresija videa – osnovne postavke i struktura scene (VOP, VO)
a. Čemu je namijenjena MPEG-4 norma za razliku od MPEG-2 norme?
b. Koje su osnovne postavke MPEG-4 norme?
c. Objasniti strukturu scene kod MPEG-4 norme za kompresiju videa
d. Objasniti koncept VOP-a, te znati objasniti što su VOP, VO i VOL
a. Čemu je namijenjena MPEG-4 norma za razliku od MPEG-2 norme?
- interaktivnu multimediju (web)
- interaktivne grafičke aplikacije
- digitalnu televiziju
b. Koje su osnovne postavke MPEG-4 norme?
- Univerzalne mogućnosti i robusnost u okolini osjetljivoj na pogreške
- Velika interaktivna funkcionalnost
- Kodiranje stvarnih i sintetiziranih podataka
- Učinkovita kompresija
c. Objasniti strukturu scene kod MPEG-4 norme za kompresiju videa
- MPEG4 se temelji na kodiranju objekata
- MPEG 4 definira:
o jedinice za zvučni, vizualni ili audiovizualni sadžaj, nazvane ‘ media objects ‘ (mogu biti prirodni ili sintetizirani)
o opis kompozicije tih objekata radi stvaranja složenog objekta koji definira audiovizualnu scenu o multipleksiranje i sinkronizaciju podataka vezanih uz ‘media objects ‘, kako bi se mogli prenositi mrežom
o interakciju korisnika s audiovizualnom scenom
d. Objasniti koncept VOP-a, te znati objasniti što su VOP, VO i VOL
- VOP (Video Object Plane)
o Svaki se okvir ulazne sekvence segmentira( u nekoliko proizvoljno oblikovanih područja odnosno VOP-ova
cijeli okvir (pravokutni)
proizvoljnog oblika
o Svako područje pokriva jedan dio scene i na taj način opisuje objekt unutar jednog okvira - VO (Video Object)
o Uzastopni VOP-ovi koji pripadaju istom objektu
o Svi VO i imaju svoja prostorna i vremenska obilježja tj sadrže lokalne koordinate koje utvrđuju fiksni položaj danog objekta, a smješteni su unutar scene transformacijama lokalnog koordinatnog sustava u opći, scenski koordinatni sustav - VOL (Video Object Layout)
o Sve informacije o VOP ovima koji pripadaju jednom VO kodiraju se unutar zasebnog VOL-a
o Informacije nužne za identifikaciju svakog VOL-a, te kako se VOL-ovi sastavljaju i rekonstruiraju na prijemnoj strani uključene su u sloj toka bita bitstream layer
- MPEG-4 kompresija videa – novi alati za kodiranje
a. Objasniti na čemu se zasniva kodiranje videa u MPEG-4
b. Objasniti 6 novih naprednih alata čije korištenje omogućava poboljšanje kvalitete komprimiranog videa
a. Objasniti na čemu se zasniva kodiranje videa u MPEG-4
- Temelji se na DCT-u bloka te predikciji pokreta (vektori pokreta )
b. Objasniti 6 novih naprednih alata čije korištenje omogućava poboljšanje kvalitete komprimiranog videa
- 1) 4 vektora pokreta po makrobloku
o makroblokovi 16x16 ili 8x8 elemenata okvira (bira koder za svaki makroblok)
bolja predikcija uz rubove pokretnog objekta i kod brzih pokreta
1 ili 4 vektora pokreta po makrobloku
SLIKA - 2) Neograničeni vektori pokreta (MV)
o koristi se kada je područje “matching” makrobloka (najboljeg odgovarajućeg) dijelom izvan granica referentnog okvira
SLIKA - 3) Intra prediction
o DC koeficijenti 8x8 blokova predviđaju se iz susjednih prethodno kodiranih blokova
o Opcionalna je predikcija i prvog reda i prvog stupca matrice AC koeficijenata DCT-a
SLIKA - 4) Globalna kompenzacija pokreta o G lobalna kompenzacija pokreta zasnovana na “sprite” pozadini
zasnovana na statičkoj slici (eng. sprite ), koja opisuje pozadinu (panoramska slika) za koju se u sljedećim okvirima šalje samo 8 globalnih parametara koji opisuju pokret kamere
SLIKA - 5) Kompenzacija pokreta na razini ¼ elementa slike
- 6) H.263 MPEG 2 kvantizator
- H.264 norma za kompresija videa
a. Za koje je aplikacije namijenjena H.264 norma s obzirom na svoje karaketristike?
b. Objasniti 4 nova napreda alata u odnosu na prethodne norme, čije korištenje omogućava poboljšanje kvalitete H.264 komprimiranog videa
a. Za koje je aplikacije namijenjena H.264 norma s obzirom na svoje karaketristike?
- videotelefonija, videokonferencije, mobilne UMTS i GSM, Internet
b. Objasniti 4 nova napreda alata u odnosu na prethodne norme, čije korištenje omogućava poboljšanje kvalitete H.264 komprimiranog videa
- 1)
predviđanje za unutarokvirno kodiranje
o Unutarokvirna predikcija koristi se za kodiranje I slika (okvira)
o Za predikciju se koriste blokovi 4x4 i 16x16 elemenata slike za svjetlinu, i 8x8 za kromatske komponente o za 4x4 blok postoji 9 modova predikcije
– koeficijenti unutar bloka se
računaju iz već dekodiranih okolnih elemenata
o Razlika između predviđenih i stvarnih vrijednosti se kodira – prvo se koristi cjelobrojna transformacija, a zatim entropijsko kodiranje - 2)
filtri za uklanjanje efekta bloka u petlji za predviđanje i proračun vektora pokreta
o Podjela u blokove potrebna za efikasnu primjenu algoritama – uzrokuje pojavu vidljive pogreške oko rubova blokova
o U dekoderu je moguće napraviti post-procesiranje filtriranjem ovih efekata
o Postavljanjem filtara za smanjenje efekta bloka u koder, popravlja se predikcija vektora pokreta i povećava se kvaliteta
o Potencijalne negativne posljedice – nejasna i zamagljena slika - 3)
proračun vektora pokreta u odnosu na više referentnih okvira
o korištenje više referentnih slika omogućava izbor referentne slike kada je neka od njih oštećena - 4)
ne koristi DCT nego cjelobrojnu transformaciju
o Koristi cjelobrojnu transformaciju (ne DCT, ali zasnovanu na DCT) primijenjenu na 4x4 blokove
o Koristi se i za I iza P, odnosno B okvire za podatke razlike nakon oduzimanja predviđenog od stvarnog okvira
o Cjelobrojna transformacija jednostavnija je za proračun
- Govor - spektar, fizikalni proces nastajanja, model vokalnog trakta
a. Koje frekvencije obuhvaća ljudski govor? Koje su frekvencije najbitnije u ljudskom govoru za prijenos i pohranu?
b. Koji je čujni spektar ljudskog uha?
c. Objasnite ukratko fizikalni proces nastajanja govora
d. Kako izgleda pojednostavljeni model vokalnog trakta? Objasnite ga.
e. U kojem se rasponu kreću osnovne frekvencije titranja glasnica govornika?
a. Koje frekvencije obuhvaća ljudski govor? Koje su frekvencije najbitnije u ljudskom govoru za prijenos i pohranu?
- obuhvaća frekvencije od 50 Hz do 10 000 Hz
- najznačajniji dio od 300 Hz do 3400 Hz
b. Koji je čujni spektar ljudskog uha?
- o d 20 Hz do 20 kHz
c. Objasnite ukratko fizikalni proces nastajanja govora
- Govor nastaje zbog vibracija koje proizvode zvučne valove
- Uzrokovan je vibracijama u ljudskom vokalnom traktu
- Izvor zvučnih valova kod govornog signala -> pluća
- Izdisanje zraka iz pluća -> zračna struja prolazi kroz dušnik i izaziva vibracije glasnica:
o Glasnice nisu potpuno opuštene -> dolazi do periodičkog titranja i formira se periodičko strujanja zraka koji prolazi kroz ostatak vokalnog trakta
o Glasnice potpuno opuštene -> ne dolazi do titranja i zrak iz pluća neometano prolazi kroz vokalni trakt - Osim karakteristika pobudnog signala vokalnog trakta, utjecaj na formiranje glasa imaju i položaji jezika, usana, čeljusti i resice
d. Kako izgleda pojednostavljeni model vokalnog trakta? Objasnite ga.
SLIKA
- Za zvučne glasove pod utjecajem pritiska zraka iz pluća glasnice trepere (titraju) i proizvode varijacije zračnog tlaka s0(t), koji ima oblik impulsa (glotalni puls) osnovne frekvencije f0.
- Nastajanje i podjela glasova
a. Što je glas i kako nastaje?
b. Kako dijelimo glasove prema stupnju otvorenosti glasnica i što karakterizira pojedinu skupinu?
c. Kako dijelimo glasove prema zvučnosti i što karakterizira pojedinu skupinu?
Kako izgleda spektar pojedine skupine glasova iz ove podjele (skicirati ga)?
a. Što je glas i kako nastaje?
- Glas je najmanji odsječak izgovorene riječi
b. Kako dijelimo glasove prema stupnju otvorenosti glasnica i što karakterizira pojedinu skupinu?
- Izgovor samoglasnika -> glasnice potpuno otvorene -> zračna struja neometano prolazi od pluća do usana
- Izgovor suglasnika -> govorni organi su potpuno ili djelomično zatvoreni -> zračna struja ne prolazi neometano do usta
c. Kako dijelimo glasove prema zvučnosti i što karakterizira pojedinu skupinu?
Kako izgleda spektar pojedine skupine glasova iz ove podjele (skicirati ga)?
- Zvučni -> pri prolasku zraka iz pluća kroz govorne organe – glasnice titraju
- Bezvučni -> pri prolasku zraka iz pluća kroz govorne organe – glasnice ne titraju
DVA GRAFA
- Digitalizacija govora, teorija diferencijalne kvantizacije
a. Nacrtajte osnovnu shemu digitalizacije valnog oblika govora i objasnite postupak digitalizacije govora (dvije faze)
b. Koja je osnovna ideja digitalizacije zasnovane na reprezentaciji valnog oblika govora?
c. Kakav se tip kvantizacije koristi kod digitalizacije govora i zašto?
d. Što predstavlja postupak diferencijalne kvantizacije i na kojoj je ideji zasnovan? Koje postupke zasnovane na diferencijalnoj kvantizaciji poznajete?
a. Nacrtajte osnovnu shemu digitalizacije valnog oblika govora i objasnite postupak digitalizacije govora (dvije faze)
SLIKA
- Uzorkovanje
o za telefonski signal koristi se spektar od 300 Hz do 3. 4 kHz
o 8 kHz uzorkovanje (Nyquistov kriterij) - Kvantizacija
b. Koja je osnovna ideja digitalizacije zasnovane na reprezentaciji valnog oblika govora?
- U mikrofonu se tlak zraka na membrani pretvara u električki signal
- Analogno digitalnom pretvorbom kontinuirani električki signal se pretvara u niz brojeva
c. Kakav se tip kvantizacije koristi kod digitalizacije govora i zašto?
- Diferencijalna kvantizacija ??
d. Što predstavlja postupak diferencijalne kvantizacije i na kojoj je ideji zasnovan? Koje postupke zasnovane na diferencijalnoj kvantizaciji poznajete?
- Postoji znatna korelacija između uzastopnih uzoraka govora i ona je znatna čak i za uzorke koji su udaljeni nekoliko intervala uzorkovanja
- Signal se ne mijenja znatno od uzorka do uzorka
o razlika između uzastopnih uzoraka trebala bi imati manju varijancu nego što je varijanca samog signala
o motivacija za općenitu shemu diferencijalne kvantizacije - DPCM i ADPCM
- Linearno prediktivno kodiranje govora
a. Koje su osnovne karakteristike linearnog prediktivnog kodiranja govora?
b. Koje su ideje, a koji ciljevi LPC analize govora? Objasnite
d. Što se šalje dekoderu pri kodiranju pojedinih uzoraka govornog signala LPC koderom?
a. Koje su osnovne karakteristike linearnog prediktivnog kodiranja govora?
- koristi matematički model govornog trakta
- umjesto uzoraka šalje parametre modela
- bit rate 2.4 kb/s
- mehanički govor
b. Koje su ideje, a koji ciljevi LPC analize govora? Objasnite
Ideje:
o Trenutni uzorak govora može se predvidjeti pomoću linearne kombinacije određenog broja prošlih uzoraka
o Ne pridonose svi prošli uzorci jednako iznosu trenutnog uzorka -> prije zbrajanja moraju se pomnožiti odgovarajućim težinskim koeficijentom
o Ti težinski koeficijenti su parametri linearnog prediktora (ak)
- Cilj:
o odrediti parametre prediktora
Govorni signal je promjenjiv
parametri prediktora ne mogu biti konstantni u duljem vremenskom intervalu
računaju se nad okvirima analize signala konačnog trajanja (frame) na kojima se mogu smatrati stalnima (tipično 20-30ms)
d. Što se šalje dekoderu pri kodiranju pojedinih uzoraka govornog signala LPC koderom?
- Šalju se parametri modela
- Dinamički raspon sluha, audio signal – spektar, kodiranje
a. Na koji je način određen dinamički raspon ljudskog sluha i koliko on iznosi?
b. Na koji način ljudsko uho doživljava povećanje glasnoće i objasnite što to znači? Na koji se to način iskorištava pri digitalizaciji audio signala?
c. Što karakterizira linearnu, a što nelinearnu kvantizaciju? Što se postiže nelinearnom kvantizacijom u odnosu na linearnu pri digitalizaciji audia?
d. Kako izgleda spektar audio signala?
e. Treba li pohranjivati sve informacije koje postoje u audio signalu prilikom digitalizacije (kodiranja)? Objasnite odgovor.
a. Na koji je način određen dinamički raspon ljudskog sluha i koliko on iznosi?
- Određen je
o Donjom granicom čujnosti
o Gornjom granicom bola (oštećenja) 12dB - Iznosi 96 dB
b. Na koji način ljudsko uho doživljava povećanje glasnoće i objasnite što to znači? Na koji se to način iskorištava pri digitalizaciji audio signala?
- Povećanje glasnoće doživljavamo logaritamski ,ne linearno – koristimo dB
- Nelinearna kvantizacija je logaritamska ??
c. Što karakterizira linearnu, a što nelinearnu kvantizaciju? Što se postiže nelinearnom kvantizacijom u odnosu na linearnu pri digitalizaciji audia?
- Linearna kvantizacija
o Jednaki korak kvantizacije za sve amplitude
o Jednaki raspon pogreške kvantizacije i šuma kvantizacije na svim razinama amplitude signala
o Manji odnos S/N na malim amplitudama - Nelinearna kvantizacija
o Logaritamska kvantizacija
o Mali intenziteti signala zapisuju se većom rezolucijom nego veliki intenziteti
d. Kako izgleda spektar audio signala?
GRAF
e. Treba li pohranjivati sve informacije koje postoje u audio signalu prilikom digitalizacije (kodiranja)? Objasnite odgovor.
- Ne treba pohranjivati sve informacije koje postoje u audio signalu jer postoje informacije koje ljudsko uho ne može prepoznati
- Psihoakustički model ljudskog čujnog sustava – uho, maskiranje
a. Objasnite kako se približno može modelirati ljudski čujni sustav i objasnite glavne karakteristike tog modela (tj. onoga što je vezano uz njega)
b. Objasnite tri efekta maskiranja na način da za svaki od njih odgovorite na sljedeća pitanja:
i. Kako se provodi eksperiment za pojedini efekt maskiranja? Opišite postupak za svaki od njih.
ii. Skicirati rezultate eksperimenta za pojedini efekt maskiranja.
c. Koje su osnovne ideje za kodiranja audia (a zasnovane na rezultatima svakog od prethodno opisanih triju eksperimenata)? Skicirajte načelnu
blok–shemu
a. Objasnite kako se približno može modelirati ljudski čujni sustav i objasnite glavne karakteristike tog modela (tj. onoga što je vezano uz njega)
- Čujni sustav može biti približno modeliran kao filtarski slog koji se sastoji od 25 pojasno-propusnih filtara koji se preklapaju, od 0 do 20kHz
- Širina kritičnog pojasa je oko 100 Hz za signale ispod 500 Hz, i povećava se linearno
nakon 500 Hz do 5kHz
b. Objasnite tri efekta maskiranja na način da za svaki od njih odgovorite na sljedeća pitanja:
i. Kako se provodi eksperiment za pojedini efekt maskiranja? Opišite postupak za svaki od njih.
- Granica čujnosti u tišini
o Osoba se nalazi u “tihoj sobi”
o Pušta se ton s frekvencijom 1 kHzi povećava mu se razina dok ne postane čujan
o Mijenja se frekvencija i crta se graf
o Granice čujnosti su frekvencijski ovisne
o Ljudsko uho je najosjetljivije na frekvencije 2-4 kHz - Frekvencijsko maskiranje
o Pustiti ton na 1 kHz(maskirajući ton) s fiksnom razinom (60 dB)
o Pustiti testni ton(npr. na 1.1 kHz) i povećavati mu razinu dok se ne počnu razlikovati
o Mijenjati frekvenciju testnog tona i crtati granicu kada zvukovi postaju različiti za slušatelja
o Granica čujnosti za testni ton je puno veća nego granica u tišini, blizu frekvencije maskiranja - Vremensko maskiranje
o Puštamo 1 kHz maskirajući ton na 60 dB i uz njega testni ton na 1.1. kHz na 40 dB -> testni ton se ne čuje (maskiran je frekvencijski)
o Prekine se maskirajući toni mjeri se najkraće vrijeme nakon kojeg se čuje testni ton (npr. 5 ms)
o Ponavlja se s različitim razinama testnog tona
o Što je slabiji testni ton, to treba duže da ga se čuje nakon što stane maskirajući ton
ii. Skicirati rezultate eksperimenta za pojedini efekt maskiranja.
GRAFOVI
c. Koje su osnovne ideje za kodiranja audia (a zasnovane na rezultatima svakog od prethodno opisanih triju eksperimenata)? Skicirajte načelnu
blok–shemu
- Rastaviti signal u odvojene frekvencijske pojaseve koristeći niz filtara (filtarski slog)
- Analizirati energiju signala u različitim pojasevima i odrediti ukupnu granicu maskiranja svakog pojasa zbog signala u drugom pojasu/vremenu
- Kvantizirati uzorke u različitim pojasevima s točnošću proporcionalnom razini maskiranja
BLOK SHEMA