PI Flashcards
Care sunt parametrii extrinseci ai unei camere foto?
vectorul de translație și vectorul de rotație care dă matricea de rotație R
Care este dezavantajul utilizării unei aperturi mari?
poate duce la saturație și un interval de focalizare îngust, ceea ce înseamnă că doar o mică parte a scenei va fi focalizată
Ce sunt momentele centrate de ordinul 2?
sunt calculate pe baza diferențelor față de centrul de masă și sunt utilizate pentru a exprima unghiul axei de alungire și excentricitatea unei elipse care se poate potrivi unui obiect
Cum se calculează varianta imaginii pe baza histogramei?
separarea histogramei în două clase pe baza unui prag și calcularea varianței dintre clase, maximizând această varianță pentru a determina pragul optim
Cum se detectează muchiile folosind derivata de ordin 2?
identificarea punctelor unde derivata a doua a intensității imaginii are zero, indicând schimbări bruște ale intensității
Scrieți ecuația pentru determinarea distanței în stereoviziunea pe imagini rectificate.
Z=bf/d,
b- baza
f- distanta focala
d- disparitatea
Pentru o imagine de dimensiune 256x256, ce fel de structuri de date sunt necesare pentru a stoca rezultatul transformatei Fourier?
un tablou bidimensional care să conțină magnitudinea și faza fiecărei componente de frecvență
Dați exemplu de problemă reală care se poate rezolva folosind o rețea neuronală.
segmentarea semantică a imaginilor
Definiti operatia de inchidere
dilatare urmată de o eroziune
Descrieți pe scurt algoritmul Region Growing.
Algoritmul Region Growing începe cu un punct inițial (seed point) și adaugă iterativ la regiune toți pixelii vecini care au proprietăți similare, până când nu mai pot fi adăugați pixeli noi.
Cum se calculează distanța focală exprimată prin pixeli?
F(x)=f/dpx
F(y)=f/dpy
f - distanta focala reala
dpx,dpy - dimensiunile pixelului pe orizontala si verticala
De ce o cameră obscură cu un orificiu foarte mic nu are nevoie de lentilă?
deoarece orificiul mic limitează razele de lumină care pot intra, formând o imagine clară prin proiecție directă fără aberații optice
Scrieți formula de calcul pentru proiecția verticală a unui obiect binar.
Py=Suma de la x=0 la N-1 din b(x,y)
b(x,y) - valoarea binara a pixelului
Descrieți pe scurt binarizarea cu histereză.
utilizarea a două praguri diferite pentru a identifica pixelii ca fiind margini sau non-margini.
Ce este linia epipolară?
linia geometrică pe care se află punctele corespondente în imaginile stereo atunci când se dă un punct în una dintre imagini.
Este utilizată pentru a reduce căutarea punctelor corespondente la o dimensiune
Cum se elimină frecvențele înalte folosind transformata Fourier?
prin aplicarea unui filtru trece-jos, care păstrează doar componentele de frecvență joasă și elimină componentele de frecvență înaltă din spectrul de frecvență al imaginii
Ce condiții ați pune asupra componentelor R, G, B ale unui pixel din imagine pentru a decide că el este de culoare galbenă?
R>T
𝐺>𝑇
𝐵<𝑇
T - un prag specific
Scrieți formula de calcul pentru rezultatul convoluției cu un nucleu de 3x3 în punctul (i,j).
R(i,j)=∑∑I(i+k,j+l)*K(k+1,l+1)
I- imaginea
K- nucleul
Ce este o operație de pooling?
reducerea dimensiunii spațiale a datelor prin selectarea valorii maxime (max pooling) sau a mediei (average pooling) într-o regiune specifică, pentru a reduce dimensiunea și a controla supraînvățarea .
Care sunt avantajele și dezavantajele unui timp de expunere mare?
Avantaj:
captarea mai multor detalii în condiții de lumină scăzută.
Dezavantaj:
riscul de neclaritate datorată mișcării obiectelor și saturația imaginii în condiții de lumină puternică
Ce este distorsiunea radială?
o aberație optică datorată curburii lentilelor, care face ca liniile drepte să pară curbate în imagine.
Scrieți formula de calcul pentru proiecția orizontală a unui obiect binar.
P(x)=∑ y=0 b(x,y)
M−1
Definiți pe scurt procesul de suprimare a non-maximelor (din cadrul Canny).
eliminarea pixelilor care nu reprezintă maxime locale de-a lungul direcției gradientului, lăsând doar pixelii care sunt potențiale margini
Ce este procesul de rectificare din stereoviziune?
transformarea imaginilor stereo astfel încât liniile epipolare să devină drepte orizontale, simplificând căutarea corespondențelor între imagini
Cum se elimină frecvențele joase folosind transformata Fourier?
prin aplicarea unui filtru trece-sus, care păstrează doar componentele de frecvență înaltă și elimină componentele de frecvență joasă din spectrul de frecvență al imaginii
Care este avantajul spațiului de culoare HSI față de spațiul RGB?
separă informația de culoare (hue) de intensitate și saturație, ceea ce face mai ușoară manipularea și analiza imaginii în funcție de culoare
Cum se calculează perimetrul unui obiect binar?
suma pixelilor care formează marginea obiectului.
Dați două exemple de funcții de activare pentru neuronii artificiali.
funcția sigmoid și funcția ReLU(sa traiasca RELU)
Ce efect are numărul ISO al unei camere foto?
afectează sensibilitatea la lumină a senzorului
Un număr ISO mai mare crește sensibilitatea, permițând captarea de imagini mai luminoase în condiții de lumină scăzută, dar poate adăuga și zgomot în imagine
Ce este adâncimea de focalizare?
intervalul de distanțe în fața și în spatele punctului de focalizare unde obiectele apar clar definite în imagine.
Ce ilustrează varianta unei imagini?
măsura dispersiei intensităților pixelilor în jurul valorii medii, indicând contrastul și distribuția luminanței în imagine
Cum se calculează intensitatea medie a unei imagini pe baza histogramei?
∑ i=0 (i⋅h(i))/N
255
Ce operator de convoluție este bazat pe derivata de ordin 2?
operatorul Laplacian
În ecuația
𝑍=𝑏𝑓/𝑑 ce reprezintă fiecare literă?
Z - distanta de la camera la obiect
b - baza(distanta intre cele doua camere)
f - distanta focala a camerei
d - disparitatea
Ce condiții trebuie să îndeplinească imaginea Fourier pentru ca prin transformata inversă să se obțină o imagine de numere reale?
trebuie să fie simetrică conjugat față de originea transformatei Fourier pentru ca prin transformata inversă să se obțină o imagine de numere reale
De ce nu se poate realiza filtrarea mediană prin convoluție?
deoarece presupune sortarea valorilor pixelilor dintr-o fereastră și selectarea medianei, operație care nu este liniară și nu poate fi exprimată ca o sumă ponderată a pixelilor
Care este utilitatea operației de închidere?
este utilă pentru a închide găurile mici dintr-o imagine și pentru a lega componentele apropiate, îmbunătățind astfel integritatea obiectelor binare
Ce sunt clasele de echivalență în algoritmul de etichetare?
unt grupuri de etichete care indică faptul că diferite regiuni ale imaginii aparțin aceluiași obiect
Care este asemănarea dintre un neuron artificial și operația de convoluție?
ambele implică aplicarea unei funcții de ponderare asupra valorilor de intrare pentru a produce o ieșire
Ce semnificație are saturația din spațiul de culoare HSI?
indică puritatea culorii, măsurând cât de multă culoare este amestecată cu alb
Ce este linia epipolară?
linia geometrică pe care se află punctele corespondente în imaginile stereo atunci când se dă un punct în una dintre imagini.
Cum se calculează direcția gradientului unei imagini grayscale?
folosind derivata parțială a intensității imaginii în direcțiile x și y, cu formula
Ce este segmentarea semantică?
procesul de clasificare a fiecărui pixel dintr-o imagine într-o anumită clasă, identificând și separând diferitele obiecte sau regiuni din imagine pe baza caracteristicilor lor semantice .
Ce efect are mărirea timpului de expunere a unei camere foto?
crește luminozitatea imaginii, permițând captarea mai multor detalii în condiții de lumină scăzută.
Ce condiție trebuie pusă asupra cercului de confuzie pentru ca imaginea să fie focalizată?
cercul de confuzie trebuie să aibă un diametru mai mic decât dimensiunea elementului fotosensibil (pixel) al senzorului
Descrieți transformata Hit and Miss.
este o operație morfologică utilizată pentru a detecta forme specifice într-o imagine binară.
Aceasta implică utilizarea unui șablon (structuring element) pentru a identifica locațiile unde forma șablonului se potrivește exact cu subimaginea
Dacă se dă un prag T, cum se calculează numărul de pixeli al imaginii care au intensitatea mai mică decât T pe baza histogramei?
Numărul de pixeli al imaginii care au intensitatea mai mică decât T se calculează sumând frecvențele intensităților din histogramă pentru toate valorile mai mici decât T
Dați exemplu de operatori de derivare de ordin 1.
operatorul Sobel și operatorul Prewitt
F(x) 0 u0
In matricea A= 0 F(y) v0
0 0 1
ce reprezinta fiecare valoare?
f(x) si f(y) Distante focale in pixeli
v0 si u0 Coordonatele punctului principal
Când se recomandă filtrarea digitală în domeniul frecvențial?
este recomandată atunci când dorim să eliminăm sau să accentuăm anumite frecvențe dintr-o imagine
Descrieți pe scurt un algoritm de etichetare.
Algoritmul de etichetare secvențială implică inițializarea fiecărui pixel obiect cu o etichetă unică, urmată de propagarea etichetelor de sus în jos și de la stânga la dreapta, apoi de jos în sus și de la dreapta la stânga, până când nu se mai produc schimbări
Care este utilitatea operației de închidere?
este utilă pentru a închide găurile mici și pentru a lega componentele dintr-o imagine binară
Care este avantajul folosirii filtrării Gaussiene separabile pe cele două axe, față de aplicarea filtrului Gaussian 2D?
reduce complexitatea de calcul de la O(n^2) la O(n)
Dați exemple de funcții de activare pentru neuronii artificiali.
Funcția sigmoid și funcția ReLU
Care este dezavantajul major al utilizării spațiului de culoare RGB?
Dezavantajul major este că RGB nu separă componentele de luminozitate și culoare, ceea ce poate complica prelucrarea imaginii în prezența variațiilor de iluminare
Ce fel de moment este aria unui obiect binar?
momentul inițial de ordin 0
De ce punctele de muchie corespund trecerilor prin zero ale Laplaceanului?
derivata a doua a unei funcții schimbă semnul în punctele de maxim sau minim, indicând o schimbare bruscă în intensitate
Cum se pot scoate în evidență zone din imagine având textura de o anumită frecvență?
pot fi evidențiate prin aplicarea unui filtru de bandă specific în domeniul frecvențial, folosind transformata Fourier
Dacă se dorește fotografierea unui obiect în mișcare dar pe lumină slabă, cum trebuie reglată camera foto?
Camera foto trebuie să aibă o valoare ISO mai mare pentru a crește sensibilitatea la lumină și o deschidere mai mare a diafragmei pentru a permite mai multă lumină să intre
Cum se poate modifica adâncimea de focalizare la o cameră foto?
prin ajustarea aperturii (diafragmei) și a distanței focale
Ce este o histogramă cumulativă?
este o funcție de densitate de probabilitate cumulativă (CDF) care arată distribuția cumulativă a nivelurilor de gri dintr-o imagine
Dacă se dorește filtrarea unei imagini cu un nucleu de convoluție C, apoi cu un nucleu de convoluție D, cum se pot compune cele două filtre pentru a aplica pe imagine o singură convoluție?
pot fi compuse prin convoluția nucleelor C și D pentru a obține un singur nucleu combinat 𝐾=C∗D, care apoi poate fi aplicat pe imagine
Dacă se cunosc coordonatele unui punct din imaginea stângă și matricea fundamentală, cum se calculează parametrii liniei epipolare?
folosind matricea fundamentală F și coordonatele punctului p din imaginea stângă: 𝑙′=𝐹𝑝
De ce stereoviziunea nu are precizie la distanță?
Stereoviziunea nu are precizie la distanță mare deoarece disparitatea devine foarte mică, ceea ce face dificilă măsurarea precisă a adâncimii
La ce se folosește o rețea neuronală de tip U-Net?
pentru segmentarea semantică a imaginilor, identificând și clasificând obiectele la nivel de pixel
Ce vecini sunt luați în considerare în procesul de suprimare a non-maximelor?
Vecinii de-a lungul direcției gradientului, de obicei 2 vecini în direcția gradientului la fiecare pas, sunt luați în considerare
Ce operație morfologică folosiți pentru a umple găurile unui obiect?
Operația de închidere (dilatare urmată de eroziune)
Scrieți ecuația pentru calculul unghiului axei de alungire pentru un obiect binar.
tan(2θ)=2μ11/(μ20-μ02)
Scrieți ecuația pentru formarea matricei de proiecție.
Matricea de proiecție P se formează combinând parametrii intrinseci A și parametrii extrinseci
[R|T]:P=A[R|T]
Ce este funcția ReLU?
Funcția ReLU (Rectified Linear Unit) este o funcție de activare definită ca f(x)=max(0,x), utilizată în rețelele neuronale pentru a introduce non-liniaritate
Care sunt componentele principale ale unei camere foto?
obiectivul (lens), senzorul de imagine, obturatorul (shutter), diafragma (aperture), și corpul camerei (camera body)
Ce este adâncimea de focalizare?
intervalul de distanțe în fața și în spatele punctului de focalizare în care obiectele apar clar definite în imagine.
Ce este varianta intra-clasica (metoda Otsu)?
este o metodă de binarizare care minimizează varianța intra-clasă și maximizează varianța între clase pentru a găsi pragul optim de segmentare a unei imagini .
Care este motivul pentru care se folosește suprimarea non-maximelor gradientului?
se folosește pentru a reduce grosimea marginilor detectate, lăsând doar pixelii care sunt maxime locale de-a lungul direcției gradientului.
Scrieți ecuația pentru determinarea distanței în stereoviziunea pe imagini rectificate.
Z=bf/d
Cum se realizează un filtru trece-jos în domeniul frecvențial?
e realizează prin multiplicarea transformatei Fourier a imaginii cu o funcție de transfer care permite trecerea componentelor de frecvență joasă și atenuează componentele de frecvență înaltă.
Ce este segmentarea semantică?
procesul de clasificare a fiecărui pixel dintr-o imagine într-o anumită clasă
Care este scopul etichetării?
de a identifica și marca regiuni conectate într-o imagine, atribuind o etichetă unică fiecărei regiuni