Prof v2 Flashcards

1
Q

Definicja przestrzeni probabilistycznej i przykłady

A

Przestrzenią probabilistyczną doświadczenia losowego nazywamy trójkę: (Ω, Z, P) gdzie
Ω- zbiór zdarzeń elementarnych
Z - zbiór zdarzeń losowych
P- miara probabilistyczna

Zbiór zdarzeń elementarnych - zbiór wszystkich możliwych wyników doświadczenia losowego
czyli przy rzucie kostką zbiór to 1, 2, 3, 4, 5, 6

Zbiór zdarzeń losowych - dowolny podzbiór przestrzeni zdarzeń elementarnych. Zdarzenia losowe oznaczamy najczęściej dużymi literam

W przypadku jednokrotnego rzutu kostką niech A oznacza zdarzenie, że wypadła ścianka z parzystą liczbą oczek, natomiast zdarzenie B, że wypadła ścianka z liczbą oczek większą od 3. Wówczas A = {2, 4, 6}, B = {4, 5, 6}.

Miara probabilistyczna - funkcja pozwalająca określić prawdopodobieństwo zajścia zdarzenia.

Przestrzeń probabilistyczna służy do dokładnego opisu zjawiska losowego bez uwzględniania czynników zewnętrznych np. przy rzucie kostką taka przestrzeń wyznacza nam idealnie wyważoną kostkę, która pada na zawsze tak samo chropowate płaskie podłoże gdzie grawitacja jest zawsze taka sama, nie ma oporów wiatru, rzut jest zawsze losowy (nieobarczony powtarzalnością ruchu ludzkiej ręki) itd. Przestrzeń probabilistyczna wyznacza nam idealnie matematyczne zasady i pozwala z doskonałą dokładnością wyznaczać prawdopodobieństwo zaistnienia zdarzenia.

Przykład:
Rzut monetą, losowanie kart, rzut kostką.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Definicja zmiennej losowej, funkcja prawdopodobieństwa, gęstości, parametry rozkładu

A

Zmienna losowa
Zmienna losowa jest funkcją mierzalna, zdefiniowaną w przestrzeni probabilistycznej, która zdarzeniom elementarnym ustalonej przestrzeni probabilistycznej (Ω, Z, P) doświadczenia losowego przypisuje liczbę ze zbioru R (rozwiązań?) - zmienna, której wartości zależą od wyników zjawiska losowego.

Możliwe wartości zmiennej losowej mogą reprezentować różne możliwe wyniki eksperymentu, który dopiero ma być przeprowadzony, lub możliwe wyniki eksperymentu przeprowadzonego w przeszłości, którego istniejące wyniki można uznać za niepewne.

Zmienne losowe można koncepcyjnie przedstawiać jako wyniki “obiektywnego” procesu losowego (np. rzutu kostką) lub “subiektywną” losowość, która wynika np. z niepełnej wiedzy odnośnie ilości.

Zmienna losowa powinna być mierzalna, ponieważ pozwala to przypisywać prawdopodobieństwa do zbiorów jej potencjalnych wartości. Często wyniki zależne są od niektórych zmiennych fizycznych, których nie da się dokładnie przewidzieć. Przykładowo, gdy rzucamy monetą, ostateczny wynik zależy od niepewnych warunków fizycznych.

Zmienne losowe mają postać rozkładu prawdopodobieństwa. Mogą być dyskretne lub ciągłe. Znane dyskretne rozkłady prawdopodobieństwa to np. rozkład Poissona, rozkład dwumianowy, natomiast ciągłe rozkłady prawdopodobieństwa to np. rozkład normalny.

Funkcja prawdopodobieństwa
Prawdopodobieństwo jest funkcją P określoną na rodzinie zdarzeń o wartościach w zbiorze liczb rzeczywistych, która zdarzeniu A takiemu, że A ∈ Ω (gdzie Ω jest to zbiór zdarzeń elementarnych) przyporządkowuje wartość P(A) spełniającą następujące warunki:

1) P(A) ≥ 0

Oznacza to, że prawdopodobieństwo jest liczbą dodatnią ewentualnie zerem (nie może być ujemne).

2) P(Ω) = 1

Oznacza to, że prawdopodobieństwo wystąpienia jednego z wszystkich możliwych zdarzeń wynosi 1 czyli jest pewne.

3) P(A1 υ A2 υ A3 υ…)=P(A1) + P(A2) + P(A3) +… gdzie A1, A2, A3, … są zdarzeniami losowymi parami rozłącznymi należącymi do jednej rodziny zdarzeń.

W przypadku gdy Ω jest skończonym zbiorem zdarzeń elementarnych, definicje prawdopodobieństwa możemy przedstawić upraszczając punkt trzeci definicji w następujący sposób:

Funkcja prawdopodobieństwa posiada następujące własności (dla dowolnych A i B należących do tej samej rodziny zdarzeń):

P(∅) = 0 – prawdopodobieństwa zdarzenia niemożliwego wynosi zero, analogicznie prawdopodobieństwo zdarzenia pewnego wynosi jeden

P(A’) = 1-P(A) lub P(A’) + P(A) = 1 – suma zdarzenia A oraz zdarzenia przeciwnego wynosi jeden

P(A υ B)=P(A) + P(B) - P(A ∩ B) – aby obliczyć prawdopodobieństwo sumy zdarzeń A i B należy dodać do siebie prawdopodobieństwo tych zdarzeń i odjąć od nich ich prawdopodobieństwo ich części wspólnej.

Funkcja gęstości prawdopodobieństwa
Funkcja gęstości prawdopodobieństwa (gęstość zmiennej losowej) – nieujemna funkcja rzeczywista, określona dla rozkładu prawdopodobieństwa, taka że całka z tej funkcji, obliczona w odpowiednich granicach, jest równa prawdopodobieństwu wystąpienia danego zdarzenia losowego.

Parametry rozkładu
Parametry rozkładu zmiennej losowej to wartości opisujące rozkład i pozwalające połączyć rachunek prawdopodobieństwa ze statystyką matematyczną.
* Wartość oczekiwana – E(X) - Jest to jedna z miar określających ”środek” zmiennej losowej
* Odchylenie standardowe (σ, D(X))– najczęściej używana miara rozrzutu zmiennej losowej wokół wartości średniej.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Rozkład Bernoulliego, normalny z przykładami

A

Rozkład Bernoulliego
Prawdopodobieństwo osiągnięcia k sukcesów w n próbach, gdzie prawdopodobieństwo osiągnięcia sukcesu w pojedynczej próbie wynosi p wyliczamy wzorem:

P(X=K) = (n nad k)p^k q^n-k

wypadnięcie dokładnie jednego orła w 3 rzutach monetą
(3 nad 1)* 0.5^1 * (1 - 0.5)^3-1 = 3!/1*(3-1)! * 0.5 * 0.5^2 = 6/2 * 0.5 * 0.25 = 0,375

Rozkład normalny
Rozkład normalny opisuje on sytuację, gdzie większość przypadków jest bliska średniemu wynikowi, a im dany wynik bardziej odchyla się od średniej tym jest mniej reprezentowany. Im dalej oddalamy się od średniego wyniku, tym przypadków jest mniej zajścia zdarzenia jest mniej.

Przykład
Wzrost kobiet w pewnej populacji ma rozkład normalny N(165 ,15). Oznacza to, że zmienna losowa jaką jest wzrost kobiet ma rozkład normalny ze średnią równą 165 cm odchyleniem standardowym równym 15 cm. Jaki jest udział w populacji kobiet o wzroście:
do 160 cm
w przedziale 165-170 cm
powyżej 175 cm
dokładnie 150 cm

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Estymator punktowy i przedziałowy, nieobciążoność, efektywność estymatora, przykłady

A

Estymator punktowy parametryczny

Estymatory to wielkości obliczone na podstawie próbki, które oszacowali nieznane parametry populacji.

Estymator punktowy – bierze się pod uwagę jedną konkretną wartość uzyskaną w trakcie analizy wyników badania określonej próby;

Estymator przedziałowy –określany jest przedział liczbowy, gdzie z danym
prawdopodobieństwem zawiera się wartość szacowanego parametru.

Estymacja punktowa zostanie zastosowana gdy na całej uczelni chcemy poznać średni wiek, wzrost czy wagę wszystkich studentów.

Estymujemy na podstawie ankiety przeprowadzonej wśród wybranej grupy studentów i po zrealizowaniu badania możemy powiedzieć z określonym prawdopodobieństwem, że średni wiek studentów uczelni X wynosi np. 25 lat

Estymacja przedziałowa pozwala nam na uzyskanie informacji o tym w jakich granicach może się mieścić średni wiek, np. między 21,5 roku do 32,3 lat. Szacowanie to dokonuje się na podstawie wybranej próby i wyliczonych dla niej statystyk.

Nieobciążoność estymatora - nie występowanie błędu systematycznego w ocenie parametru (np: wariancji) na podstawie estymatora. Jeśli przeprowadzilibyśmy dane badania wielokrotnie to wraz ze wzrostem liczby prób estymator nieobciążony będzie zbliżał się do prawdziwej wartości poszukiwanego parametru. Wraz ze wzrostem liczby prób będzie malał błąd szacunku parametru na podstawie estymatora.

W przypadku estymatora obciążonego oszacowana wartość będzie obciążona błędem systematycznym.

Średnia arytmetyczna jest nieobciążonym estymatorem wartości oczekiwanej w populacji. W przypadku wariancji, gdybyśmy zastosowali wzór na wariancję
w populacji to estymator ten byłby parametrem obciążonym. Wykazano, że oszacowanie wariancji na podstawie takiego wzoru nie przybliża estymatora do poszukiwanego parametru. Dopiero przyjęcie wzoru na wariancję w próbie (dzieląc przez N - 1) eliminuje obciążoność estymatora.

Efektywność estymatora to innymi słowy wielkość wariancji estymatora. Im efektywniejszy jest estymator tym ma mniejszą wariancję w kolejnych pomiarach. Innymi słowy, narzędzie do estymacji parametru tym jest lepsze im dostarcza mniej zmiennych wyników. Załóżmy, że lekarz bada temperaturę ciała u człowieka trzema termometrami, jeden dał wyniki: 36,6; 36,7 i 36,6; drugi termometr: 36,3; 36,6; 36,8 a trzeci termometr: 36,2; 37,2 i 36,6… Ten pierwszy jest najefektywniejszy, bo ma najmniejszą zmienność w dokonywanych pomiarach. Tak samo jest przy estymatorach, ten jest najefektywniejszy, który ma najmniejszą wariancję.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Definicja i procedura testu statystycznego, statystyka testowa, obszar krytyczny

A

Test statystyczny
Test statystyczny jest regułą, która przyporządkowuje każdej realizacji próby losowej jedną z dwóch decyzji dotyczących weryfikowanej hipotezy: przyjąć ją lub odrzucić. Oprócz weryfikowanej hipotezy, którą nazywa się też hipotezą zerową i oznacza zwykle przez H0, wyróżnia się pewną hipotezę alternatywną, oznaczaną zazwyczaj przez H1, która przyjmuje się w przypadku odrzucenia hipotezy zerowej. Test statystyczny wykorzystuje odpowiednio skonstruowaną statystykę Tn = h(X1, … , Xn), zwaną statystyką testową. Powinna ona być tak dobrana, żeby jej wartości tn ∈ R wyraźnie wskazywały na prawdziwość lub fałszywość weryfikowanej hipotezy H0. Przestrzeń wartości statystyki testowej T można podzielić na dwa rozłączne i dopełniające się podzbiory:

Obszar krytyczny K0
Zbiór tych wartości statystyki testowej, dla których odrzuca się sprawdzaną hipotezę
Obszar przyjęć K1
Zbiór tych wszystkich wartości statystyki testowej, dla których podejmuje się decyzję o przyjęciu sprawdzanej hipotezy

Ponieważ w testowaniu hipotezy opieramy się tylko na wynikach (x1, … , xn) próby losowej, występuje ryzyko
podjęcia błędnej decyzji. Możliwe są przy tym dwie sytuacje:
Błąd 1-go rodzaju
Występuje w sytuacji odrzucenia sprawdzanej hipotezy, wtedy gdy jest ona prawdziwa
Błąd 2-go rodzaju
Występuje w sytuacji przyjęcia sprawdzanej hipotezy, wtedy gdy jest ona fałszywa

How well did you know this?
1
Not at all
2
3
4
5
Perfectly