Wykład 3 Flashcards

1
Q

Scharakteryzuj miary rozproszenia

A
  • Opisują jak dane są rozproszone (inaczej rozrzucone) wokół głównego punktu rozkładu
  • Podanie wartości przeciętnej jest niewystarczające
  • Np. wartości przeciętne dwóch rozkładów są równe, ale różnie rozproszone
  • Im większa odległość od średniej tym większa zmienność
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Jakie są miary rozproszenia?

A
  • rozstęp ćwiartkowy
  • wariancja
  • odchylenie standardowe
  • współczynnik zmienności
  • kwantyle
  • kurtoza
  • skośność
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Scharakteryzuj wariancję

A
  • Średnia arytmetyczna kwadratów odchyleń (różnic) poszczególnych wartości cechy od średniej
  • Utożsamiana ze zróżnicowaniem zbiorowości
  • Stopień oddalenia od średniej arytmetycznej
  • Jednostką wariancji jest jednostka obserwacji (np. kg) podniesiona do kwadratu (np. kg2)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Scharakteryzuj odchylenie standardowe

A
  • Informuje o ile średnio poszczególne pomiary różnią się od średniej – błąd bezwzględny pojedynczego wyniku
  • Pierwiastek kwadratowy z wariancji
  • Wyrażane w tych samych jednostkach co dane surowe – jest liczbą mianowaną
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Scharakteryzuj współczynnik zmienności

A
  • Iloraz odchylenia standardowego i średniej arytmetycznej
  • Wynikiem jest wartość niemianowana
  • Gdy wartość pomnożymy przez 100 🡪 zmienność będzie w [%]
  • Umożliwia porównywanie zmienności szeregów statystycznych różniących się znacznie wartością średnią, np. zmienność masy człowieka i płetwala błękitnego
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Scharakteryzuj kwantyle

A
  • Dzielą uporządkowany zbiór danych na części o jednakowej liczbie elementów np.:
    -KWARTYLE – podział na 4, mediana = drugi kwartyl
    -KWINTYLE – podział na 5
    -DECYLE – podział na 10
  • Dobre dla rozkładów skośnych
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Jak obliczyć kwartyle dla parzystej liczby elementów?

A
  • Dane to: 1, 2, 3, 4, 5, 6
  • Liczymy medianę jako średnią pomiędzy wartościami 3 i 4, co daje nam wynik 3,5
  • Otrzymujemy dwa podzbiory: 1, 2, 3 oraz 4, 5, 6
  • Liczymy medianę w pierwszym podzbiorze: mediana wynosi 2 – jest ro pierwszy kwartyl
  • Liczymy medianę w drugim podzbiorze: mediana wynosi 5 – jest to trzeci kwartyl
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Jak obliczyć kwartyle dla nieparzystej liczby elementów?

A
  • Liczymy medianę jako wartość środkową, czyli 4
  • Otrzymujemy dwa podzbiory: 1, 2, 3 oraz 5, 6, 7 (mediany nie uwzględniamy)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Scharakteryzuj kurtozę

A
  • Miara koncentracji (spłaszczeni) rozkładu (tj. występowania wartości odstających)
    • = 0 – rozkład normalny (mezokurtyczny)
    • > 0 – rozkład wysmukły (leptokurtyczny)
    • < 0 – rozkład spłaszczony (platykurtyczny)
  • Często im rozkład bardziej wysmukły, tym mniejsze rozproszenie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Scharakteryzuj skośność

A

Współczynnik skośności (asymetrii) rozkładu:
- = 0 – rozkład idealnie symetryczny
- < 0 – rozkład lewoskośny
- > 0 – rozkład prawoskośny

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Jak wybrać miarę rozproszenia w zależności od skali?

A
  • Nominalna -> Wskaźnik różnorodności
  • Porządkowa (rangowa) -> Rozstęp międzykwartylowy
  • Interwałowa -> Rozstęp, Odchyl
  • Ilorazowa -> Rozstęp międzywartylowy
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Jak wybrać miarę rozproszenia w zależności od miary przeciętnej?

A
  • moda -> wskaźnik różnorodności
  • mediana -> rozstęp między kwartylowy
  • średnia -> odch. standardowe
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Czym jest prawdopodobieństwo klasyczne?

A

Prawdopodobieństwo zdarzenia elementarnego A to iloraz mocy zbioru A (liczba zdarzeń sprzyjających A/liczebności zbioru A) i mocy zbioru gamma (liczba wszystkich możliwych zdarzeń).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Podaj aksjomaty Kołomogorowa:

A
  • Prawdopodobieństwo zdarzenia A należy od przedziału (0,1)
    0<P(A)<1
  • Prawdopodobieństwo zdarzenia pewnego jest równe 1
    P(Ω) = 1 P(pusty) = 0
  • Prawdopodobieństwo sumy (alternatyw) dwóch wykluczających się zdarzeń jest równe sumie prawdopodobieństwa tych zdarzeń
    P(A U B) = P(A) + P(B)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Co jest podstawą prawdopodobieństwa?

A

Kombinatoryka

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Na czym polega reguła mnożenia w kombinatoryce?

A

Rzut 3 razy kostką do gry. Ile jest możliwych wyników?

666 = 6^3 = 216

17
Q

Na czym polega kombinacja w kombinatoryce?

A

Np. Na ile sposobów można wybrać 3 małże z próby 12 osobników?

18
Q

Na czym polega permutacja w kombinatoryce?

A

Np. Na ile sposobów można ustawić 5 osobników dorsza?

19
Q

Co to zdarzenia?

A

Podzbiory przestrzeni zdarzeń elementarnych zbioru Ω.

Zdarzenie A zaszło, jeśli jego wynik należy do podzbioru A.

20
Q

Jeśli A = Ω to?

A

Zdarzenie pewne.

21
Q

Jeśli A = φ to?

A

Zdarzenie niemożliwe.

22
Q

Jak liczymy prawdopodobieństwo zdarzenia przeciwnego?

A

P(A’) = 1 – P(A)

Zdarzenie przeciwne A’ = dopełnienie zdarzenia A.

23
Q

Jak liczymy prawdopodobieństwo sumy zdarzeń?

A

P( A U B) = P(A) + P(B)

P(A U B) = P(A) + P(B) – P(A i B)

24
Q

Jak liczymy prawdopodobieństwo warunkowe?

A

P(AIB) = P(A i B)/P(B)

25
Na co pozwala rozkład prawdopodobieństwa?
Umożliwia określenie prawdopodobieństw poszczególnych wartości zmiennej losowej.
26
Czym jest gęstość prawdopodobieństwa?
Funkcja pozwalająca obliczyć prawdopodobieństwo zdarzenia związanego z ciągłą zmienną losową.
27
Podaj cechy rozkładu normalnego (Gaussa):
- symetryczny - kształt krzywej dzwonowej - często występuje w naturze -> ważna rola w opisie zjawisk - dobry model, gdy wartości położone blisko środka rozkładu są częste - zdefiniowany przez funkcję o 2 parametrach: wartość średnią μ (przesuwa rozkład po osi x) i odchylenie standardowe σ (im wyższe, tym rozkład bardziej płaski)
28
Kiedy zmienna losowa ma standaryzowany rozkład normalny?
Gdy μ = 0 (największa gęstość rozkładu) i σ= 1. Posiada stabelaryzowane wartości.
29
Na czym polega reguła trzech sigm odnośnie rozkładu normalnego?
Praktycznie wszystkie obserwacje mieszczą się w granicy trzech odchyleń standardowych od średniej, przy założeniu, że zmienna ma rozkład normalny. I, -σ < μ < +σ – 68,27% wyników II, -2σ < μ < +2σ – 95,45% wyników III, -3σ < μ < +3σ – 99,73% wyników Wystąpienie pomiaru leżącego poza zakresem +-3 odchyleń wynosi 1 – 0,9973 = 0,0027 Wykorzystywana jako system ostrzegania o anormalnym zachowaniu, o czymś niespotykanym lub o występowaniu danych odstających
30
Podaj cechy rozkładu t-studenta:
- rozkład ciągły, symetryczny dla **małych** prób - stosowany do testowania hipotez i przy ocenie błędów pomiaru - parametrem go chrakteryzującym jest liczba stopni swobody **df = n-1** - znając wzór funkcji t i df można wykreślić funkcję gęstości prawdopodobieństwa - wraz ze wzrostem df przybliża się do rozkładu normalnego - opisany przez W.S. Gosseta
31
Co to stopnie swobody?
Jeden z najważniejszych parametrów statystycznych, za pomocą którego można określić właściwy, przybliżony przedział wartości występujących w populacji, na podstawie wyników z zebranej próby.
32
Scharakteryzuj rozkład Chi-kwadrat:
- prawoskośny, ciągły, przyjmuje wartości dodatnie - określony przez liczbę stopni swobody - wraz ze wzrostem df przybliża się do rozkładu normlanego - przydatny do analizy danych kategorialnych (skala nominalna), z użyciem analizy frekwencji
33
Podaj cechy rozkładu F Fishera (Snedecora):
- prawoskośny, ciągły - zdefiniowany przez proporcję dwóch oszacowanych wariancji obliczony z danych o rozkładzie normlanym - określony przez dwa parametry df dwóch wariancji (licznik i mianownik proporcji) - **szczególnie ważny dla porównywania: --> Dwóch wariancji --> Więcej niż dwóch średnich (ANOVA)**
34
Scharakteryzuj rozkład lognormalny:
- silnie prawoskośny, ciągły - po zlogarytmowaniu zmiennej losowej powstaje rozkład normalny - po zlogarytmowaniu surowych danych, gdy rozkład jest zbliżony do normalnego, dane przybliżają rozkład normalny - gdy nie chcemy logarytmować, można użyć średniej geometrycznej
35
Opisz rozkład dwumianowy:
- **dyskretny rozkład prawdopodobieństwa** - liczba sukcesów niezależnych prób, z których każda ma stałe prawdopodobieństwo sukcesu - oparty na tzw. **schemacie Bernoulliego** - określony przez dwa parametry: N liczba osobników w próbie i π prawdziwe prawdopodobieństwo sukcesu dla osobnika - stosujemy, gdy wnioskujemy o proporcjach (np. prawdopodobieństwo wylosowania danej płci z populacji generalnej) - symetryczny dla p = 0,5
36
Opisz rozkład Poissona:
- dyskretny rozkład prawdopodobieństwa - opisuje liczbę zdarzeń pojawiających się niezależnie i losowo w czasie lub przestrzeni - rozkład zdarzeń rzadkich - parametr opisujący - średnia u tj. przeciętna częstość