Statystyka Flashcards

1
Q

Statystyka

Przedstaw podstawowe tabelaryczne i graficzne narzędzia statystyki opisowej stosowane w analizie danych. Podaj przykłady ich zastosowań w biznesie.

A

Tabelaryczne narzędzia statystyki opisowej:

  • Tablice częstości: Tabele prezentujące, jak często poszczególne wartości (lub przedziały wartości) występują w zestawie danych.
  • Tabele krzyżowe (tablice kontyngencji): Tabele pokazujące częstości współwystępowania różnych zmiennych kategorialnych.

Graficzne narzędzia statystyki opisowej:

  • Histogramy: Grafy kolumnowe przedstawiające rozkład częstości poszczególnych wartości lub przedziałów wartości zmiennej ciągłej.
  • Wykresy słupkowe: Służą do przedstawienia porównań między różnymi grupami.
  • Wykresy pudełkowe (boxplot): Grafy przedstawiające rozkład danych kwantyfikujące medianę, kwartyle i wartości odstające.
  • Diagramy kołowe: Wykresy przedstawiające strukturę procentową różnych kategorii.

Zastosowania w biznesie:

  • Analityka sprzedaży: Użycie histogramów do analizy rozkładu rachunków sprzedażowych w celu identyfikacji najczęstszych kwot transakcji.
  • Badanie rynku: Wykorzystanie wykresów pudełkowych do analizy rozkładu wieku w grupie klientów dla różnych produktów.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Statystyka

Przedstaw podstawowe numeryczne miary statystyki opisowej stosowane w analizie danych. Podaj przykłady ich zastosowań w biznesie.

A

Podstawowe numeryczne miary statystyki opisowej:

  • Średnia (miara środkowa): Wartość oczekiwana zestawu danych.
  • Mediana: Środkowy punkt danych, gdy są one uporządkowane od najmniejszej do największej wartości.
  • Moda: Najczęściej występująca wartość w zestawie danych.
  • Zakres: Różnica między największą a najmniejszą wartością.
  • Odchylenie standardowe i wariancja: Miary rozproszenia danych wokół średniej.

Zastosowania w biznesie:

  • Analiza finansowa: Użycie średniej do określenia przeciętnego zwrotu z inwestycji.
  • Zarządzanie jakością: Wykorzystanie odchylenia standardowego do monitorowania zmienności procesu produkcyjnego.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Statystyka

Omów koncepcję zmiennej losowej i rozkładu prawdopodobieństwa. Podaj przykłady rozkładów dyskretnych i ciągłych oraz ich zastosowań w biznesie.

A

Zmienna losowa to funkcja, która przypisuje wartościom liczbowym (najczęściej rzeczywistym) wyniki eksperymentu losowego. Innymi słowy, jest to sposób na matematyczne opisanie niepewności związanej z wynikiem zdarzenia.
Przykłady:
* Rzut monetą:
* Liczba wyrzuconych oczek na kostce:
* Czas oczekiwania na klienta w sklepie
* Dochód firmy w danym miesiącu

Rozkład prawdopodobieństwa opisuje, z jakim prawdopodobieństwem dana zmienna losowa przyjmie określoną wartość.
Istnieją dwa główne typy rozkładów:
Dyskretne:
* Zmienne losowe mogą przyjmować tylko skończoną lub przeliczalną liczbę wartości.
* Przykłady: Rozkład Bernoulliego, rozkład Poissona, rozkład dwumianowy
Ciągłe:
* Zmienne losowe mogą przyjmować dowolną wartość w pewnym przedziale.
* Przykłady: Rozkład normalny, rozkład t-Studenta, rozkład chi-kwadrat

Zastosowania w biznesie
* Marketing: Analiza zachowań klientów, np. szacowanie prawdopodobieństwa zakupu danego produktu.; Testowanie hipotez, np. porównywanie efektywności dwóch kampanii reklamowych.
* Finanse: Modelowanie ryzyka, np. szacowanie prawdopodobieństwa bankructwa firmy; Wycena opcji i innych instrumentów pochodnych.
* Zarządzanie projektami: Oszacowanie czasu trwania projektu; Określenie prawdopodobieństwa dotrzymania terminu.
* Logistyka: Zarządzanie zapasami, np. przewidywanie popytu na dany produkt; Optymalizacja tras dostawy.

Przykłady
Rozkład Bernoulliego:
Dyskretny; Stosowany do opisu zdarzeń o dwóch możliwych wynikach (np. orzeł/reszka).
Przykładem w biznesie może być analiza prawdopodobieństwa, że klient dokona zakupu po obejrzeniu reklamy.
Rozkład Poissona:
Dyskretny; Opisuje liczbę zdarzeń zachodzących w określonym przedziale czasu lub przestrzeni.
Przykładem w biznesie może być liczba klientów odwiedzających sklep w ciągu godziny.
Rozkład normalny:
Ciągły; Najpopularniejszy rozkład ciągły, opisujący wiele zjawisk w przyrodzie i społeczeństwie.
Stosowany do analizy danych pomiarowych, np. oceny jakości produktu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Statystyka

Przedstaw koncepcję i podstawowe własności rozkładu normalnego w statystyce. Podaj przykłady jego zastosowań w biznesie.

A

Rozkład normalny (lub rozkład Gaussa)jest fundamentalnym rozkładem prawdopodobieństwa w statystyce, charakteryzującym się symetrycznym kształtem krzywej wokół średniej (środkowej wartości).

Podstawowe własności:

  • Kształt dzwonu: Symetryczny względem średniej.
  • Określony przez średnią i odchylenie standardowe: Średnia określa położenie centrum rozkładu, a odchylenie standardowe - stopień rozproszenia danych.
  • Prawo trzech sigm: Około 68% wartości leży w jednym odchyleniu standardowym od średniej, 95% w dwóch, a 99,7% w trzech.

Zastosowania w biznesie:
* Nauka: analiza danych pomiarowych
* Podejmowanie decyzji: Ocena prawdopodobieństwa osiągnięcia określonych wyników sprzedaży.
* Analiza ryzyka: Określanie prawdopodobieństwa wystąpienia określonych wyników finansowych.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Statystyka

Wyjaśnij koncepcję wnioskowania statystycznego. Omów pokrótce i podaj przykłady estymacji przedziałowej i testowania hipotez statystycznych.

A

Wnioskowanie statystyczne pozwala na wyciąganie konkluzji i podejmowanie decyzji na podstawie danych próbki i teorii prawdopodobieństwa.

Estymacja przedziałowa Celem estymacji przedziałowej jest oszacowanie wartości nieznanego parametru populacji (np. średniej, wariancji) z pewnym stopniem pewności. Np.
Załóżmy, że chcemy oszacować średnią wzrostu studentów na danym uniwersytecie. Badamy losową próbę 100 studentów i mierzymy ich wzrost. Średnia wzrostu w próbie wynosi 175 cm. Stosując estymację przedziałową, możemy obliczyć przedział ufności dla średniej wzrostu wszystkich studentów na uniwersytecie, np. z 95% pewnością możemy stwierdzić, że prawdziwa średnia wzrostu mieści się w przedziale od 172 cm do 178 cm.

Testowanie hipotez statystycznych
Celem testowania hipotez statystycznych jest weryfikacja hipotez dotyczących parametrów populacji. Hipotezy te mogą być proste (np. średnia wzrostu studentów wynosi 175 cm) lub złożone (np. mężczyźni są średnio wyżsi od kobiet)

Zastosowania w biznesie:
* Estymacja przedziałowa: Może być wykorzystywana do określenia przedziału ufności dla przeciętnego czasu reakcji na zapytanie klienta.
* Testowanie hipotez: Może służyć do oceny, czy wprowadzenie nowego produktu do oferty rzeczywiście poprawiło wyniki sprzedażowe.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly