Reti Neurali Convoluzionali Flashcards
Cosa intendiamo per convoluzione?
Cosa è kernel? E cosa sono i numeri al suo interno, se cambiano che succede?
Processamento di una matrice attraverso un’altra matrice chiamata kernel (o filtro).
Il kernel (o filtro) è una matrice nxn,
con n dispari per avere un valore centrale.
I valori nella matrice sono i pesi (o coefficienti) che hanno lo scopo di trovare informazioni specifiche: pesi diversi trovano informazioni diverse.
4 fasi del processo di convoluzione
1) punto centrale del kernel viene fatto coincidere con il primo pixel dell’immagine.
2) moltiplico i valori kernel con i valori del pixel corrispondenti e sommo tutto.
3) il valore ottenuto è il valore del primo pixel della immagine “filtrata”.
4) operazione ripetuta per tutti i pixel dell’immagine.
Cosa si crea quando il filtro finisce di analizzare tutta un’immagine?
Questa ha diverse caratteristiche
Si crea la feature map (mappa della caratteristica).
Dopo aver applicato n filtri ottengo delle feature maps di dimensioni hxwxd:
- hxw dimensioni spaziali immagine.
- depht: numero filtri applicati
- size filter
- stride lenght: dimensione matrix pooling
Fase 2: Detection con ReLU
Dopo che il filtro genera la feature map, cosa fa la funzione di attivazione ReLU?
Che tipo di funzione è?
Pixel per pixel sostituisce i valori negativi con zero.
Funzione non lineare
Fase 3: Pooling.
A cosa serve questa operazione?
Cosa è il max pooling?
Riduce la dimensionalità dei dati rinunciando a parte della collocazione spaziale.
Max Pooling: tipologia di pooling, dato un pool restituisce il valore massimo.
Stride Lenght: dimensione n del pool nxn.