Computer vision Flashcards

1
Q

Computer vision

A

AI som gör det möjligt för datorer att förstå och tolka visuell information från bilder och videor

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Vad kallas det nätverk som utför computer vision

A

Convolutional Neural Networks

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

LeNet-5

A

Det första CNN

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

AlexNet

A

Utvecklades från LeNet-5

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

CNN består av lager:

A
  • Input lager
  • Convolutional lager
  • Pooling lager
  • Con
  • Pool
    ……
  • Output lager
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Vad gör input lagret?

A

Alla pixlar från bilden representeras av varsin nod.
Pixlarna sparas i matris som representerar vart de finns på bilden
- 2D

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Vad gör convolutional layer?

A

Filtrerar, behåller det viktiga för viss feature

Består av Karnel
Skapar feature map
Skickar vidare feature map

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Vad gör pooling layer?

A

Sammanfattar informationen ytterligare

  • Tar emot feature map
  • Skapar pooling map
  • Största värdet eller medelvärdet
  • Pooling map skickas vidare till nytt convolutional layer
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Vad händer mellan sista pooling layer och output layer?

A

Flatten

  • Pooling map i 2D blir till 1D
  • Görs till en lista, (eller vektor)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Vad händer i output lagret?

A

Sannolikhet, klassificering

  • Dense lager
  • Softmax - algoritm som avgör vilken neuron som har störs sannolikhet att vara korrekt utifrån listan med värden
  • Den neuronen aktiveras och printar ut sin etikett - “Katt”
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Vad betyder convolution

A

Kallas processen där filtrer, karnelen, rör sig över pixlarna eller då map

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Vad kallas processen som sker i pooling lagren?

A

Subsampling

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Kernels

A

Filter
Rutnät

  • Förtränade vikter som rör sig över bilden
  • 3x3 eller 5x5
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Hur skapas features map via kernels rent matematiskt?

A

Vikterna inom kernelen multipliceras med respektive pixelvärde.
Sedan adderas samtliga.
Värdet skrivs in i feature map

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Pooling

A

Metod som minskar storleken på feature map.
Vill behålla det viktigaste:
- Största värdet…
- … eller medelvärdet
Ett enda värde behålls och skrivs in i pooling map

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Spatial invariance

A

Att CNN kan känna igen objekt oavsett vart i bilden det befinner sig

  • Eftersom filtret flytter över hela bilden
17
Q

Receptive field

A

Den del av ingångsbilden eller map som varje neuron “ser” och kan reagera på.

Längre in i nätverket efter mer pooling blir receptive fields större

18
Q

Strides

A

Hur mycket filtrer, kernelen, ska flytta

19
Q

Hur bygger man djupare CNN?

A

Adderar fler konvolutionslager och poolinglager

  • Ofta mer än 2-3 som är det grundläggande
20
Q

Transfer learning

A

Teknik där en modell som redan tränats på en uppgift används för att lära sig en ny uppgift.

  • Återanvädner feature extractor network
  • Ny Tast-specific network
21
Q

Feature extractor network

A

Backbone i CNN

Fösta delen som består av:
- Convolutional lager
- Pooling lager

Den del som kan känna igen och sammanfatta features

22
Q

Task-specific network

A

Sista delen i CNN som utför klassificeringen

23
Q

Confusion matrix

A

Tabell som visar hur bra en klassificeringsmodell fungerar
Detta gör träningen övervakad

-TP
-FP, typ-1fel
-TN
-FN, typ-2fel

24
Q

Object detectors

A

Har som uppgift att lokalisera och identifiera objekt

25
Objectness
Kallas ett av de stora problemen för object detectors - Att skilja objekt från bakgrund
26
Vad är svårt för object detectors?
Skala Vara snabb Vara korrekt
27
Bounding boxes
Objekt i bilden brukar markeras inom en ruta
28
Multiscale detection
När en object detector kan identifiera objekt av olika storlekar på samma bild
29
Vilket typ av nätverk brukar object detectors bygga på?
Feature extractor network som backbone och sedan task-specifik network
30
Single-shot-detectors
Objectdetekteringsmodell som kan lokalisera och identifiera i en enda beräkning - CNN - Bounding boxes för koordinader, vart - Samtidigt klassificering, vad
31
VGG16
Bildklassificeringsmodell som kan användas som feature extractor i single-shot detectors - 13 convolutional layer ( 5 max-pooling layer) - 3 klassificeringslager
32
Non-Maximum Supression
Teknik som bara behåller det mest exakta Ex flera bounding boxes för samma objekt. Behåller den med störst sannolikhet att vara rätt
33
Intersection over Union
Mått för hur bra en bounding box överlappar objektet i bilden
34
Anchor boxes
Fördefinierade skalor som bounding boxes kan jämföra med
35
YOLO
Metod som utför object detection i ett enda steg. - Rutnät med eget ansvar för allt inom rutan