Deep Learning Flashcards

Question

Czym jest standaryzacja danych?

Answer 1

Standaryzacja polega na przekształceniu danych w taki sposób, żeby miały średnią równą 0 i odchylenie standardowe równa 1. Jest to szczególnie przydatne, gdy algorytmy uczenia maszynowego lub statystyczne są wrażliwe na różnice w skali między zmiennymi. Przykładowo, algorytmy oparte na odległościach (np. k-means, SVM) oraz algorytmy gradientowe (np. regresja liniowa, sieci neuronowe) mogą skorzystać z danych standaryzowanych, aby uniknąć dominacji jednej zmiennej nad innymi ze względu na jej większy zakres.

Answer 2

TFLOPS (Tera Floating Point Operations Per Second) to miara wydajności obliczeń zmiennoprzecinkowych na sekundę. W odniesieniu do modeli deep learningowych, oznacza, ile operacji zmiennoprzecinkowych może wykonać model w ciągu sekundy.

Answer 3

Instance segmentation identyfikuje każdy obiekt na obrazie osobno, przypisując unikalne etykiety. Semantic segmentation przypisuje ogólną kategorię (np. "pies", "samochód") do każdego piksela bez rozróżniania konkretnych instancji.

Answer 4

Modele Faster RCNN zawierają dwa etapy: Region Proposal Network (RPN) i klasyfikator. RPN wykrywa regiony, które mogą zawierać obiekty, a klasyfikator klasyfikuje te regiony jako obiekty lub tło.

Answer 5

RPN to sieć neuronowa, która wykrywa regiony, które mogą zawierać obiekty.

Answer 6

Konwolucja to operacja matematyczna, która przetwarza sygnał wejściowy przez maskę. Maska określa, które wartości sygnału wejściowego zostaną zachowane, a które zostaną odrzucone.

Answer 7

Stride to liczba pikseli, o jaką maska jest przesuwana w każdym kroku. Padding to liczba pikseli, o jaką maska jest rozszerzana na każdym brzegu.

Answer 8

Rozmiar jądra konwolucji to liczba pikseli, które są jednocześnie przetwarzane przez warstwę konwolucyjną. Rozmiar jądra ma wpływ na poziom abstrakcji reprezentowanej przez warstwę konwolucyjną. Małe jądra reprezentują niski poziom abstrakcji, podczas gdy duże jądra reprezentują wysoki poziom abstrakcji.

Answer 9

Główny problem sigmoidu to zjawisko zanikającego gradientu. Wartości sigmoidalne są ograniczone do zakresu (0, 1), co oznacza, że pochodna funkcji w tych wartościach jest mała. W praktyce, podczas propagacji wstecznej błąd może maleć eksponencjalnie w miarę oddalania się od wartości 0 i 1, co prowadzi do bardzo małych gradientów i utrudnia efektywną aktualizację wag w procesie uczenia. To z kolei może prowadzić do bardzo wolnego lub utrudnionego uczenia się modelu.

Answer 10

Dropout to technika regularyzacji stosowana w sieciach neuronowych w celu poprawy ogólnej zdolności uogólniania modelu oraz zapobieżenia przeuczeniu (overfitting). Głównym celem dropout jest zmniejszenie zależności pomiędzy neuronami w sieci poprzez losowe ignorowanie niektórych z nich podczas każdej iteracji uczenia. To pomaga wzmocnić zdolność modelu do ogólnego uogólniania poprzez uniemożliwienie przekształcenia się poszczególnych neuronów w sieć zbyt wyspecjalizowaną dla konkretnego zestawu danych treningowych.

Answer 11

Batch Normalization (normalizacja wsadowa) to technika stosowana w sieciach neuronowych w celu poprawy procesu uczenia oraz przyspieszenia zbieżności modelu. Głównym celem batch normalization jest normalizacja wartości aktywacji wewnątrz sieci neuronowej poprzez standaryzację tych wartości w każdej miniwsadzie (batch) danych treningowych.

Answer 12

Sieć neuronowa, znana również jako sztuczna sieć neuronowa, to model matematyczny inspirowany działaniem ludzkiego mózgu, który służy do rozwiązywania problemów poprzez analizę danych. Składa się z połączonych ze sobą neuronów, które przetwarzają informacje i uczą się rozpoznawać wzorce w danych. Sieci neuronowe są podstawowym elementem uczenia maszynowego i głębokiego uczenia.

Answer 13

Neurony, wagi, funkcje aktywacji, warstwy, funkcje straty, algorytm optymalizacji

Answer 14

Gradient Descent jest wykonywany jako pierwszy krok, aby obliczyć kierunek aktualizacji wag na podstawie gradientów funkcji straty. Następnie Backpropagation jest używany do obliczenia tych gradientów, a konkretnie do przekazywania gradientów wstecz przez sieć w celu aktualizacji wag. Oba te kroki są kluczowe dla procesu uczenia sieci neuronowej.

Deep Learning Flashcards

(39 cards)