Wstęp Flashcards
Nauka, której przedmiotem zainteresowania są metody pozyskiwania i prezentacji, a przede wszystkim analizy opisujących zjawiska masowe. Nazywamy też tym mianem pewną zmienną (o znanym rozkładzie), która w wyniku doświadczenia przyjmuje losową wartość liczbową.
Statystyka
Sposób badania określonych zbiorowości statystycznych, za pomocą odpowiednich narzędzi i procedur. Mogą być wykorzystywane do badania zjawisk masowych, które dotyczą zbiorowości składających się z jednostek o podobnych, lecz nie identycznych właściwościach.
Metoda statystyczna
Ogół prac zmierzających do poznania struktury określonej populacji. Zbieranie, gromadzenie i opracowywanie danych statystycznych oraz ogłaszanie i udostępnianie wyników dokonanych obliczeń, opracowań i analiz, w tym podstawowych wielkości i wskaźników.
Badanie statystyczne
- Przygotowanie badania (koncepcja metodologiczna badania: ustalanie celu, hipotezy badawczej, przedmiotu i zakresu badania, wybór metody badania).
Etapy badania statystycznego - I etap
- Obserwacja statystyczna (np. pomiar lub zbieranie informacji)
Etapy badania statystycznego - II etap
- Opracowanie i prezentacja materiału statystycznego (grupowanie, zliczanie).
Prezentacja: szeregi statystyczne, wykresy.
Etapy badania statystycznego - III etap
- Analiza statystyczna (opis lub wnioskowanie statystyczne)
Etapy badania statystycznego - IV etap
Określone zbiorowości osób, rzeczy, zjawisk.
Przedmiot badania statystycznego
Zbiór dowolnych elementów objętych badaniem statystycznym (ozn: N - liczba elementów populacji)
Zbiorowość statystyczna (populacja)
Podzbiór populacji generalnej, obejmujący część jej elementów wybranych w określony sposób. (ozn: n - liczba elementów próby)
Zbiorowość próbna (próba)
Element składowy badanej populacji.
Jednostka statystyczna
(W tej samej zbiorowości można wyróżnić różne jednostki statystyczne)
Wartości cechy uzyskane na podstawie obserwacji lub pomiaru
Wynik/obserwacja
Osiągamy, gdy jednostki statystyczne są (precyzyjnie!) określone względem: rzeczowym, przestrzennym, czasowym.
Cel badania
Cel badania rzeczowy
co lub kogo badamy
Cel badania przestrzenny
miejsce przeprowadzonych badań
Cel badania czasowy
jaki okres jest objęty badaniem lub jakiej chwili badanie dotyczy
Jednostki wchodzące w skład badanej zbiorowości odznaczają się pewnymi właściwościami.
Cecha statystyczna
Nie można jej zmierzyć, a tylko określić słownie, np. płeć, kolor włosów
Cecha statystyczna jakościowa
Wartością takiej cechy jest liczba.
Cecha statystyczna ilościowa
Przyjmują co najwyżej przeliczalną liczbę wartości, czyli wartości ze zbioru skończonego lub nieskończonego, ale równolicznego ze zbiorem liczb naturalnych.
Cecha statystyczna ilościowa - skokowa
Przyjmują wartości z pewnego przedziału liczbowego
Cecha statystyczna ilościowa - ciągła
-nominalna (relacja: równe lub różne)
-porządkowe (relacja: większe lub mniejsze)
-przedziałowa (relacja: większe o tyle)
-ilorazowa/stosunkowa (relacja: tyle razy większe)
! KAŻDY KOLEJNY TYP SKAL POMIAROWYCH UMOŻLIWIA WIĘCEJ OPERACJI NIŻ POPRZEDNI !
Skale pomiarowe
Które skale nazywamy skalami słabymi?
Nominalna i porządkowa - cechy jakościowe
Które skale nazywamy skalami mocnymi?
Przedziałowa i ilorazowa - cecha ilościowa
Polega na dzieleniu jakiejś grupy elementów na podgrupy, różniące się ze względu na interesującą nas cechę.
Np.: płeć, kolor oczu, miejsce zamieszkania, ulubiona książka.
Skala nominalna
Liczby wyznaczają kolejność występowania (rangi) elementów, nie określając jednak odległość jednak odległości między nimi.
Np.: miejsce biegacza na mecie, siła trzęsienia ziemi (ocena w skali Richtera), stopień w wojsku.
Skala porządkowa
Informuje nie tylko o porządku mierzonych elementów, ale także o tym ile jeden element jest większy od innego.
Zero jest “względne”.
Np.: wiek wybudowania budowli, temperatura w stopniach Celsjusza, wysokość terenu nad/poniżej poziomu morza.
Skala przedziałowa
Występuje tam zero absolutne (nie istnieją wartości niższe od 0).
Np.: temperatura w stopniach Kelvina, waga wzrost, czas przejazdu.
Skala ilorazowa
- badania całkowite, pełne
- badanie niepełne, częściowe
Rodzaje (metody) badań statystycznych
Obserwacji podlegają wszystkie elementy zbiorowości generalnej np. Narodowy Spis Powszechny Ludności i Mieszkań 2021; Powszechny Spis Rolny 2020
Badanie całkowite (rodzaj badań statystycznych)
Obserwacji podlega tylko część zbiorowości generalnej, próbę.
Reprezentacyjne, monograficzne, ankietowe, np. sondaże wyborcze, ankietowe badania warunków życia na wsi, ankieta jakości usług.
badanie niepełne (rodzaj badań statystycznych)
Jak często mogą być przeprowadzane badania?
Mogą być przeprowadzane okresowo (coroczny spis telefonów stacjonarnych), doraźne (w sytuacji klęsk żywiołowych) lub ciągle (rejestr urodzeń, ewidencja bezrobotnych).
Badanie mogą być obciążone błędami popełnionymi w czasie organizacji badania, pomiaru cech oraz przetwarzania wyników.
Polega na podziale zbiorowości na grupy jednostek podobnych względem siebie.
Jednolity system grupowania określany jest mianem klasyfikacji.
Grupowanie zbiorowości
Podział niejednorodnej zbiorowości z punktu widzenia cechy na jednorodne grupy - na podstawie wariantów cech jakościowych
Grupowanie typologiczne (rodzaj grupowania zbiorowości)
Łączenie jednostek cechy ilościowej o równych lub zbliżonych wartościach cechy w klasy.
Grupowanie wariancyjne (rodzaj grupowania zbiorowości)
- tablice statystyczne
- wykresy statystyczne
Metody graficznej prezentacji danych
powinna być przejrzysta, czytelna oraz zawierać: tytuł, tablicę właściwą (z nazwami wierszy i kolumn) oraz informacji o źródle danych zawartych w tablicy. Należy podać stosowane w tablicy jednostki miary. Wszystkie kolumny powinny zostać wypełnione liczbami lub uwagami wyjaśniającymi (umowne znaki)
tablica statystyczna
zjawisko nie występuje
kreska (-) umowne znaki
zjawisko występuje w ilościach mniejszych niż przyjęta dokładność pomiaru
zero (0) umowne znaki
zupełny brak informacji lub brak informacji wiarygodnych
kropka (.)
wypełnianie pozycji, ze względu na układ tablicy jest nie możliwe lub niecelowe
krzyżyk (x)
nie podaje się wszystkich składników sumy
“w tym”
dane liczbowe prezentowane są w sposób estetyczny i przejrzysty, za pomocą kształtu, wielkości, barw. Jest to alternatywa do opisu słownego i tabelarycznego. Wykresy stanowią wizualizację przeprowadzonych uprzednio analiz statystycznych lub odzwierciedlają dane źródłowe
wykresy statystyczne
- linowe
- kołowe (należące do grupy wykresów powierzchniowych)
- kartogramy (stosowane do analiz strukturalnych w ujęciu przestrzennym)
- piramidy (używane w analizach demograficznych)
- obrazkowe (polegające na ukazaniu wielkości zjawiska przez odpowiednią wielkość znaku obrazkowego)
- słupkowe
najczęściej stosowane typy wykresów
Zebrany materiał statystyczny powinien być usystematyzowany i odpowiednio zestawiony, zgodnie z celami przeprowadzonych badań. W wyniku takiego postępowania otrzymujemy…
… szereg statystyczny (wykres w notatkach)
wykorzystywany do zbiorczej prezentacji różnych istotnych danych statystycznych (cechy wyrażane są w różnych jednostkach)
szereg szczegółowy wyliczający
prezentacja zbiorowości statystycznej podzielonej na części, według wartości/kategorii cechy ilościowej lub jakościowej wraz z podaniem liczebności każdej z wyobrębnionych części. Tego typu szereg prezentuje strukturę zbiorowości pod względem wyróżnionej cechy.
szereg rozdzielczy (strukturalny)
gdy badana zmienna jest zmienną skokową, zaś liczba możliwych jej wariantów jest niewielka, konstruuje się…
… szereg ważony (rozdzielczy punktowy)
gdy możliwych wariantów cechy jest dużo lub gdy analizowana cecha jest zmienną ciągłą, buduje się…
… szereg rozdzielczy z przedziałami klasowymi
budowany jest zazwyczaj dla cech ciągłych. Wartości szeregu szczegółowego grupujemy w pewną liczbę rozłącznych przedziałów (klas), którym przyporządkowujemy odpowiednie liczebności. Liczba i rozpiętości przedziałów powinny być tak dobrane, aby dawały przejrzysty obraz rozkładu
szereg rozdzielczy przedziałowy
wykres słupkowy
histogram
otrzymujemy łącząc odcinkami prostej w układzie współrzędnych punkty, których współrzędnymi są środki przedziałów i odpowiadając tym przedziałom liczebności.
diagram
otrzymujemy łącząc odcinkami prostej punkty o współrzędnych, którymi są górna granica przedziału klasowego i wartość liczebności skumulowanej (ew. częstości skumulowanej) odpowiadająca temu przedziałowi.
krzywa liczebności skumulowanej
(częstością) występowania danego wariantu cechy, nazywamy stosunek liczby jednostek o danej wartości cechy do liczebności ogólnej
wskaźnik struktury
np. liczba bezrobotnych w poszczególnych województwach na dzień 31.12.2013
szereg geograficzny (terytorialny, przestrzenny)
- jeśli ściśle określony moment - szereg dynamiczny momentów (np. stan gotówki na koncie pana X na koniec każdego miesiąca;
- jeśli wartości cechy przypisane są okresom - szereg czasowy okresów (np. roczna produkcja cementu w Polsce w poszczególnych latach ostatniego 10-lecia).
Rodzaje szeregu czasowego (dynamicznego)
nazywamy zestawienie wyników w postaci szeregu rozdzielczego z cechą mierzalną
rozkład empiryczny
nazywamy funkcję przyporządkowującą kolejnym wartościom zmiennej odpowiadających im (empirycznych) częstości skumulowanych
dystrybuanta empiryczna
można stosować, gdy próba jest reprezentatywna. Jego wyniki uogólnia się (korzystając z rachunku prawdopodobieństwa) na całą populację generalną
Wnioskowanie statystyczne
dotyczy zbiorowości generalnej lub próby, niekoniecznie losowej. Ma charakter sumaryczny - nie odnosi się do poszczególnych jednostek, ale do całej zbiorowości (lub całej próby).
Dokonujemy tego za pomocą odpowiednich miar: średnie, odchylenie standardowe, współczynnik korelacji.
Opis statystyczny