1 Flashcards
Etape în evoluția statisticii
- Apariția primelor forme de evidență
- Delimitarea evidentei statistice de evidența contabilă
- Faza descriptivă (trecerea de la ‘simple consemnari de fapte’ la analiza comparativa a datelor
- Faza aritmeticii politice (Anglia)
- Faza probabilistică (marcata de introducerea calculelor probabilistice)
- Faza statisticii moderne (reviste, congrese internaționale)
- Etapa actuală
Definiție STATISTICĂ
- Disciplina științifică cvasiindependenta care are însușirea de a fi în același timp și Știința și metodă
SAU - Știință care, folosind calculul probabilităților, studiază fenomenele și procesele de tip colectiv în vederea descrierii acestora și descoperirii legilor care guvernează manifestarea lor
Contribuții românești
- Nicolae Șutu cu lucrarea lui deosebit de complexă în care culege, sistematizeaza și interpretează științific informații statistice veridice cu scopul de a obține o descriere statistica a Moldovei și României
- > jn cadrul lucrării se regăsesc concepții teoretice importante referitoare la caracterul științific al statisticii și la rolul important al acesteia în conducerea statelor, considerând-o ca fiind cel mai puternic instrument de cunoaștere a situației economico-sociale ale statului. - Ion Ionescu de la Brad considerat unul dintre întemeietorii statisticii moderne românești
- > își exprima prima oara concepțiile ref la statistice într-una din lucrările sale publicate in 1859
- > in prima parte a lucrării (‘elemente de statistică’) se constituie primul manual de statistica elaborat de un roman în care expune: obiectul și sarcinile statisticii, metodele, activitatea practica a statisticii, rolul ei în cunoașterea realității economico-sociale ale statului
Etape în orice cercetare științifică concreta și corectă
- Pregătirea cercetării
- Observarea statistica (culegerea datelor)
- Prelucrarea statistica
- Analiza statistica
Etapa 1: pregătirea cercetării
Presupune definirea, a:
Obiectele cercetarii
Scopul cercetarii
Indicatorii prin care se poate îndeplini obiectivul stabilit
Variabilele ca date individuale necesare derulării cercetării
Unitățile utilizate pe parcursul desf cercetarii
Modalitățile de obținere a datelor
Etapa 2: observarea statistica
Vizează înregistrarea, după reguli unitare, a caracteristicilor unităților colectivității
-> se concretizează în material faptic
Etapa 3: Prelucrarea statistica
Urmărește derularea procesului de
- > sistematizare a datelor individuale
- > prezentare a datelor sub forma de serii, tabele, grafice
- > calculare a indicatorilor derivați (care permit o caracterizare a tendinței centrale, a variației valorilor, a intensității corelație și a tendindeti de evoluție
Etapa 4: analiza statistică
- confruntarea și compararea datelor
- formularea și prezentarea concluziilor
Statistica DESCRIPTIVĂ =
Acea parte a statisticii care analizează date mari(exhaustive) în cele mai mici detalii
Statistica INFERENȚIALĂ
Acea parte a statisticii in care sunt extrapolate, la nivelul întregii colectivități studiate, rezultatele obținute pe seama eșantioanelor
Colectivitate statistica (populație statistica) =
Sistem alcătuit din unități de observare (unități statistice) pe seama cărora se realizează un studiu statistic
Unitate de observare/ unitate statistica =
element constitutiv al unei colectivități statistice/populații statistice
Variabila statistică / caracteristica statistică =
O însușire, o proprietate măsurabilă a unei unități statistice, întâlnită la toate unitățile care aparțin aceleiași colectivități și care variază ca nivel de la o unitate la alta
Obiectul statisticii =
Faptul ca studiază fenomenele și procesele de masa sub forma de mulțimi sau colectivități
Semnificațiile actuale ale termenului ‘statistica’
- Date numerice (cu privire la unui sau mai multe fenomene din natura sau societate, culese, sistematizate, centralizate și uneori publicate
- Activitate de culegere, prelucrare și valorificare a informațiilor statistice (organizata de stat sau de cercetători)
Domenii de utilizare a statisticii
- Economic
- Industrial
- Medical
- Farmaceutic
- Al afacerilor
- Sociologic etc
Colectivitate statistica statica =
Exprima o stare și are o anumita întindere în spațiu LA UN MOMENT DAT
Ex: nr de țigări fumate de x în ultima ora
Colectivitate statistica dinamica =
Cuprinde elemente componente observate și înregistrate într-un INTERVAL DE TIMP
Ex: țigările fumate de același x în intervalul orar 08:00 - 15:00
Unitate statistica simpla
-Alc dintr-un singur element
Ex: angajat, persoana, medicament
Unitate statistica complexă =
Structurata pe baza a doua sau mai multe unități simple
Ex: pluton de militari, secție de producție, echipa de football
Unitate statistica activă =
Acea unitate care transmite informații necesare atât despre ele cât și despre cele pe care le prezintă
Ex curs: in cazul unui recensământ, reprezentantul familiei transmite date atât despre el cât și despre membrii familiei
Ex meu: in cazul unei anchete a politiei, un hot de buzunare oferă informații despre el cât și despre ceilalți parteneri în infracțiuni
Unitate statistica pasiva
Elemente despre care se comunica date
Ex: orice
Variabile cantitative
= exprimate numeric
= rezultatul înregistrat ca urmare a procesului de numărare, măsurare sau determinare prin calcul
Ex: venit, vârstă, profit, înălțime, cifra de afaceri
Variabile calitative
=exprimate prin cuvinte corespunzătoare clasificările sau prin coduri și simboluri ale diferitelor categorii analizate
Ex: sexul, localitatea de proveniență, profesia
Variabile alternative
= 2 variante de răspuns
= reprezentate de acele unități care nu pot avea decât 2 variante de răspuns
Ex: sex (m/v), rezultat examen (admis/respins)
Variabile nealternative
=acele unități care au o valoare dintr-o mulțime de posibilități
Ex: vârstă, localitate, înălțime
Variabile discrete
=au o variație discontinua, reprezentate de valori nr întregi, pozitive
Ex: nr copii, nr animale de companie
-> nu poți spune ca ai 2,3 copii
Variabile continue
=au o variație continua redata prin valori numărabile, diviziile la infinit
Ex: profit, greutate, înălțime, câștig salariat
->putem spune ca avem 75,4 kg
Frecventa absoluta (ni) =
De câte ori a fost înregistrată o varianta distincta
Frecventa relativa (fi)
Ponderea, greutatea sau cota parte în totalul elementelor unei colectivități (fi=ni/sumă ni)
Tipuri de scale de măsurare utilizate pt variabile cantitative (exprimate numeric)
- Scala de raport (proporțională)
2. Scala de interval (cardinală)
Tipuri de scale de măsurare utilizate pt variabile calitative (exprimate prin cuvinte)
- Scala ordinală
2. Scala nominală
Scala nominală =
- > cel mai scăzut nivel de precizie
- > utilizata pentru a atribui variantelor caracteristicii măsurate “însușiri”
- > rolul scalei = a încadra unitățile statistice, în grupe/clase/categorii diferite după un anumit criteriu
- > nu indica dacă o categorie este mai buna ca cealaltă
Ex: într-un meci de fotbal sportivii sunt numerotați, dar asta un nr mai mare pe tricou nu înseamnă că sportivul e mai bun
Scala ordinală
- > plus de precizie în măsurare f de Scala nominală
- > nu numai că împarte unitățile colectivității în grupe/clase omogene în f de diferite caracteristici, DAR permite și stabilirea unei relații de ordine între grupe.
Ex: calificativele obținute de școlarii claselor 1-4 (I, B, FB)
Scala de interval (cardinală)
- > permite, pe lângă stabilirea unei relații de ordine ȘI determinarea și interpretarea diferențelor dintre unități
- > este permisă însumarea/scăderea lor
- > punctul de origine (O) nu este fix
- > unitatea de măsură poate fi aleasa arbitrar
Ex: la o competiție sportiva de pescuit, un pescar prinde 50 de kg de peste, altul 25. Nu putem spune ca primul e de doua ori mai bun ca celalalt (ar fi ilogic), dar putem spune ca a făcut cu 25 de kg mai mult decât al doilea.
-> nu este permisa multiplicarea/divizarea (nu au sens)
Scala de raport (proporțională)
-> cel mai înalt nivel de precizie
Două valori măsurate pe aceasta scara se afla în același raport una fata de alta
-> sunt permise și operațiile de multiplicare și divizare
-> pct O = fix, rigid, 0 absolut = absenta caracteristicii
-> u.m aleasa arbitrar
Ex: o persoana are 90 de kg, alta 30. Putem spune ca a doua are de 3 ori mai puțin ca prima.
Înregistrarea totală (exhaustivă)
= consemnarea tuturor unităților componente ale unei colectivități statistice cu caract lor, care interesează o anumita cercetare
Ex: înregistrarea tuturor mașinilor vândute de firma Merțan
Înregistrare parțială =
-> consemnarea unei părți reprezentative din unitățile care compun colectivitatea studiata
Ex: înregistrarea elevilor cu bursa de merit din totalitatea de elevi ai scolii x
Înregistrare curenta =
= se efectuează cu caracter continuu, asupra faptelor și fenomenelor, în timpul, la locul și pe măsură apariției lor
Ex: înregistrarea deceselor cauzate de covid
Înregistrarea periodica (la un moment dat) =
-se face la anumite perioade de timp, dinainte stabilite
Ex: recensamintele populației
Înregistrarea directă =
Consemnarea in documente se realizează prin contactul direct intre cercetător și fiecare unitate a colectivității studiate
Ex: recensamintele populației
Înregistrare pe baza de documente
- se face pe baza unor înscrisuri oficiale în care au fost deja consemnate anumite evenimente și fenomene
- la fel de exacta ca înregistrarea directă, dar mai puțin costisitoare
Ex: întocmirea evidentei populației pe baza evidentei primare
Înregistrare prin interogare
- se face pe baza chestionării de către cercetător a unităților colectivității supuse cercetării
Ex: sondaj de opinie referitor la un anumit produs (cu condiția sa fie realizat în prezenta cercetătorului care pune întrebările ‘direct’)
Autoinregistrare
- particularitate a înregistrării prin interogare
- înregistrarea propriu-zisă se efectuează de către persoana cercetata pe baza unor formulare speciale trimise de către cercetător
Ex: anchete statistice trimise prin poștă
Eroarea de înregistrare =
Rezultatul consemnarii nejuste sau neprecise a variantelor unei anumite caracteristici, cu ocazia diferitelor unități de colectivități cercetate
Posibile cauze ale producerii erorilor
- Lipsa de experienta a personalului care efectuează înregistrarea
- Neflijenta
- Insuficienta precizie a formularelor de înregistrare
- Erorile măsurate
Eroarea de înregistrare PERMEDITATĂ/INTENȚIONATĂ
- se datorează intenției de denaturarea a realității, de exagerare sau diminuare a proporțiilor unui fenomen de către persoanele înregistrate sau de către ambele părți
- pot fi prevenite/ se pot înlătură prin convingerea persoanelor supuse înregistrării asupra caracterului ei științific
Eroarea de înregistrare NEPREMEDITATA/NEINTENTIONATA
- din cauza neatenției, lipsei de memorie, înțelegerii greșite a formularelor, și instrucțiunilor de completare a lor
Ex: înregistrarea unor evenimente greu de înțeles sau despre care informațiile sunt incomplete (revoluția din 89)
Erori întâmplătoare
- nu influențează în mod esențial rezultatele medii, deoarece acțiunile lor într-un sens sunt egal probabile cu acțiunile în sens contrar
Ex: măsurarea înălțimii este afectata mereu de schimbările mici ale posturii
Erori sistematice
- acționează într-o direcție bine determinata
- denaturează întotdeauna realitatea
Ex: măsurarea lungimii unui obiect de fier la o temperatura de -8°C va da un rezultat diferit fata de măsurarea aceluiași obiect la 23°C
Erori de reprezentativitate
= diferențe între mărimea unui indicator sintetic obținut pe baza eșantionului și mărimea aceluiași indicator determinat pe baza unei înregistrări totale
Ex: in cazul unui sondaj de opinie nerespectarea sticta a principiului de selecție întâmplătoare generează erori de reprezentativitate
Modalități de prevenire a producerii erorilor de înregistrare
- Alegerea judicioasa a personalului de înregistrare
- Efectuarea unui control riguros asupra activității personalului de înregistrare
- Instruirea personalului care face înregistrarea
- Testarea formularelor de înregistrare
Controlul datelor statistice
= acțiune ulterioara înregistrării
- se efectuează cu scopul de a asigura volumul complet și calitatea datelor inregistrate
Ex: controlul datelor statistice efectuat de Institutul Național de Statistica și Studii Economice
Gruparea statistica
= organizarea colectivității studiate in grupe omogene de unități după una sau mai multe caracteristici comune populației cercetate
Ex: gruparea după orice
Gruparea simpla
= se elaborează în f de o caracteristica
Ex: grupare în funcție de înălțime
Gruparea pe variante numerice
- când avem un nr restrâns de valori ale caracteristicilor de grupare
Ex: gruparea in funcție de salariu a 8 angajați
Grupare pe intervale de variație
- număr foarte mare de valori ale caracteristicilor de grupare in cadrul colectivității cercetate
Ex: gruparea in funcție de capacitatea de stocare a 7322 de laptopuri
Gruparea combinată
Presupune necesitatea de a avea nevoie de două sau mai multe caracteristici de grupare
Ex: gruparea unor ferește din PVC în f de preț, calitate și gradul de izolare termina și fonica
Condiții de îndeplinit în procesul grupării datelor statistice pe intervale de variație
- Completitudinea datelor (presupune ca toate unitățile statistice sa fie incluse în grupe/clase; nicio unitate sa nu fie exclusa din operația de sistematizare)
- Omogenitatea grupelor și subgrupelor
- Unicitatea includerii unităților
- Continuitatea variației grupelor
Tabelul statistic =
Prezentare ordonata a datelor unei colectivități
!!! Se recomandă dacă producătorul de date statistice deține informații conform cărora reies ca utilizatorii intenționează sa efectueze calcule pt obținerea indicatorilor derivați
Reguli în procesul de construcție a unui tabel statistic
- Sa aibă un titlu clar și concis
- Sa indice unitatea de masura
- Sa se menționeze sursa datelor (sub tabel)
- Toate rubricile tabelului sa fie completate cu cifre/simboluri
- Dacă datele necesită o scurta explicație metodologica privind conținutul/compatibilitatea acestora, se recomanda utilizarea unor NOTE EXPLICATIVE care apar fie sub tabel fie în subsolul paginii
Graficul statistic =
Modalitate de prezentare a datelor care permite sesizare a a ceea ce este esențial în cazul fenomenului studiat, prin intermediul unor imagini spatiale cu caracter convențional
-forma mai simpla dar mai sugestiva de prezentare a datelor
!!! Se recomandă dacă producătorul de date statistice deține informația conform căreia sa reiasă ca utilizatorii NU INTENȚIONEAZĂ sa efectueze calcule pt obținerea indicatorilor derivați
Reguli în procesul de construcție a unui GRAFIC statistic
- Sa aibă titlu clar și concis
- Sa se menționeze sursa datelor (sub grafic)
- Sa se menționeze legenda graficului (unde sunt menționate semnele convenționale, liniile, culorile și hașurile utilizate)
- Prezenta axei/axelor graficului (în cazul sistemului de coordonate rectangulare)
Indicator statistic =
Expresie numerica, stabilita printr-o cercetare statistica, aferenta însușirilor cantitative și calitative
Ex: indicatori absoluți, indicatori relativ
Funcțiile indicatorilor statistici
M.C.S.E.Vi.Ts
- De Măsurare (se realizează prin observarea directa la nivelul fiecărei unități, operație în urma căreia se obțin indicatori exprimați cantitativ sau valoric)
- De Comparare (comparația pe baza de raport se face atât pt indicatorii cu conținut diferit, dar dependenți dpdv economico-social, cât și pentru indicatorii cu același conținut)
- De Sinteză (prin indicatorii statistici se evidențiază ceea ce este esențial pt întreaga colectivitate)
- De Estimare
- De Verificare a Ipotezelor și Testare a Semnificației parametrilor statistici utilizați
Mărimi relative =
Indicatorii relativ = mărimi relative, ca indicatori derivați ce sintetizează rezultatele comparații datelor statistice în interiorul aceleiași colectivități, de la o grupa la alta, într-o expresie numerica sub forma de raport
Tipuri de mărimi relative + exemplu
MRS, MRC, MRI, MRD
- Mărimi relative de structură (MRS)
EX: cercetare statistica asupra salariului angajaților unei firme - Mărimi relative de coordonare (MRC)
Ex: distribuția salariaților unui hotel după sexul acestora - Mărimi relative de intensitate (MRI)
EX: calculul densității populației (ca raport între populație și suprafață) - Mărimi relative de dinamica (MRD)
Ex: cercetare statistica asupra prețului carburanților în 2018 și în 2021
Specific MRS, MRC, MRI, MRD
MRS - stabilirea raportului in care se afla fiecare grupa f se total (colectivitate
MRC - se folosesc cel mai des în studiul variației în profil teritorial, când se compara același indicator din doua unități teritoriale
Ex: se compara nr salariaților unei firme din jud Bt cu una din Sv
MRI - stabilirea unui raport între două fenomene care se afla în relație de interdependenta
!!!! Se reprezinta prin diagrame (de structură) cum ar fi: dreptunghi, pătrat, cerc etc
Ex: calculul densității populației (ca raport între populație și suprafață)
MRD - raportarea aceluiași indicator înregistrat, dar pt unități de timp diferite
Ex: studiu statistic asupra evoluției prețului carburanților în 2018 și 2021
Indicatori derivați
- Mărimi relative
- Mărimi medii
- Indicatorii variației
- Indicatorii asimetriei
- Indicatorii corelației
Când este o medie reprezentativa?
Când valorile individuale din care se calculează sunt mai omogene, mai apropiate ca mărimi între ele
Când o medie este nereprezentativa?
Când valorile individuale din care se calculează nu sunt omogene nici apropiate ca mărimi între ele
Ce indicatori de cuprind în categoria mediilor propriu-zise (de calcul)?
Indicatori propriu-ziși ai tendinței centrale sau medii propriu-zise:
Media aritmetică, media geometrică, media armonică, media cronologică, media pătrarică, etc
Ce indicatori se cuprind în categoria mediilor de poziție (indicatori ai localizării)?
Indicatori ai localizării: mediana, modul, mediala și alte mărimi medii înrudite cu acestea
Media simplă/neponderată =
(în cazul seriilor simple)
Mediile simple se calculează atunci când se utilizează toate variantele înregistrate
SAU
atunci când valorile individuale prezintă, în urma operației de sistematizare, aceleași frecvențe
Ex: media aritmetică
Media ponderată =
(în cazul seriilor cu frecvență)
În cazul în care în urma sistematizării/grupării datelor, valorile prezintă frecvențe diferite de apariție, nivelul mediu se calculează ca medie ponderată
EX: media aritmetică ponderată
Diferență media simplă de media ponderată
→media simplă se folosește în cazul seriilor simple
→media ponderată se folosește în cazul seriilor cu frecvență
Media aritmetică =
măsura valorii centrale a setului de date în jurul căruia fluctuează datele setului
Câte medii aritmetice se pot determina pt o serie de date statistice?
2 medii, respectiv ponderată și neponderată
→în cazul unei serii simple se utilizează media aritmetică simplă/neponderată
→în cazul unei serii cu frecvență se utilizează media aritmetică ponderată
Ce tip de medie se poate aplica la nivelul unei variabile cantitative?
→niciun tip deoarece în calcularea mediilor sunt esențiale expresiile numerice pe baza cărora se realizează calculul
→lipsesc în cazul variabilelor cantitative (care sunt exprimate prin cuvinte)
Media aritmetică este o valoare internă a unei serii
este cuprinsă între valorile minime și maxime
Când se recomandă utilizarea mediei pătratice?
Se recomandă a fi folosită atunci când:
→ în colectivitate predomină valorile mari
SAU
→termenii au atât valori pozitive, cât și negative
media aritmetică vs media geometrică (???)
Se deosebesc prin modificarea valorilor individuale
De ex:
→în cazul mediei aritmetice, dacă se înlocuiește valoarea individuală, media s-ar modifica
→în cazul mediei geometrice, ar rămâne aceeași
Când se recomandă utilizarea mediei cronologice?
Se utilizează la calculul mediei termenilor unei serii cronologice de momente
Ex: pentru a estima vânzarea medie zilnică de batoane de ciocolată Bounty de cocos
Medii propriu-zise (de calcul) VS medii de poziție (indicatori ai localizării)
se diferențiază în funcție de modul lor de determinare
Ex: în cazul mediilor propriu-zise: media aritmetică
→în cazul mediilor de poziție (mediana)
Modul/valoarea modală =
acea valoare a caracteristicii care corespunde celui mai mare număr de unități sau aceea care are cea mai mare frecvență de apariție
Ex: lansarea în producție de serie a unui tip de papuci de o anumită mărime
Cunoscând timpii cronometrați pt rezolvarea unui test, la nivelul unei colectivități de studenți, ce valoare sintetică ar trebui determinată pentru a stabili obiectiv intervalul de timp necesar respectivului test?
Modul deoarece acesta repr acea valoare a caracteristicii care corespunde celui mai mare număr de unități sau aceea care are cea mai mare frecvență de apariție
→cu alte cuvinte, dacă majoritatea studenților rezolvă testul într-un anumit timp, acest timp poate fi considerat timpul necesar rezolvării testului
Valoarea antimodală
acea valoare a caracteristicii care corespunde celui mai mic număr de unități sau aceea care are cea mai mică frecvență de apariție
Ex: studiu pe comportamentul de piață (unde valoarea antimodală este dată de comportamentul cel mai mic dpdv al frecvenței de apariție)
Cuantila =
valori ale caracteristicii
care împart seria în “n” părți egale.
Mediana =
acel nivel al caracteristicii unei serii ordonate crescător sau
descrescător care împarte o distribuție în 2 părți egale
Ce indicator se recomandă pentru analiza tendinței centrale a seriei (2,4,4,7,8, 1000)?
Mediana - este mai semnificativă decât media aritmetică (afectată de valoarea 1000)
De ce este necesară măsurarea variabilității?
Cu cât fenomenele au un grad mai mare de complexitate (determinată de multitudinea de factori de influență) cu atât variația valorilor individuale este mai mare
→utilizarea corectă a indicatorilor tendinței centrale în fundamentarea deciziilor necesită verificarea stabilității și reprezentativității valorilor înregistrate de aceștia
Ce tipuri de indicatori pot fi utilizati pt caracterizarea variabilitatii?
→ Indicatori simpli,
→ indicatori sintetici,
→ indicatori ai variației calculați pentru serii de distribuție unidimensionale,
→ indicatori ai variației calculați pentru serii multidimensionale,
→ indicatori ai variației calculați ca mărimi absolute
→ și ca mărimi relative
De ce amplitudinea variației nu este un indicator care să permită caracterizarea completă a variabilității unei serii date?
Amplitudinea variației depinde numai de valorile extreme ale unei variabile și poate să
dea o imagine eronată a intervalului de variație, atunci când cel puțin una dintre valorile extreme
se abate în mare măsură de la celelalte niveluri individuale ale caracteristicii.
Avantaje și dezavantaje calculul abaterii intercuantilice față de calcului amplitudinii variației
Calcului abaterii intercuantilice, spre deosebire de cel al amplitudinii, prezintă avantajul că evită valorile individuale extreme sau aberante
Amplitudinea prezintă avantajul că nu ține seama de toate observațiile și este sensibilă la prezența valorilor aberante.
→poate să ofere o imagine eronată a intervalului de variație, atunci când cel puțin una dintre valorile extreme se abate în mare măsură de la celelalte niveluri individuale ale caracteristicii
Abaterea individuală ca indicator de caracterizare a variabilității
exprimă cu câte uități de măsură sau de câte ori (cât %) valoarea caracteristicii urmărită la fiecare unitate a colectivității se abate de la mărimea unui indicator al tendinței centrale
Abaterea individuală VS abaterea medie liniară (absolută)
→abaterea medie liniară (absolută) nu face nici o distincție între abaterile pozitive și cele negative ale variantelor unei
caracteristici, deși în practică acestea au semnificații cu totul deosebite.
Abaterea medie pătratică VS abaterea medie liniară (absolută)
Abaterea medie pătratică, spre deosebire de cea medie liniară sau celelalte abateri, este un parametru al legii normale
Abaterea medie pătratică VS deviația standard
Sunt identice, abaterea medie pătratică mai este numită și abatere standard sau abatere tip
Coericientul variației < 35% =
→colectivitate omogenă și medie reprezentativă dpdv statistic
Coeficientul de variației > 35% =
→colectivitate eterogenă
→medie nereprezentativă dpdv statistic
Asimetria =
Gradul de asimetrie se stabilește în raport cu poziția și valorile pe care le au cei trei indicatori ai tendinței centrale: media, mediana și modul
Asimetria de dreapta =
dacă mediana sau modul se află plasate în partea dreaptă față de medie pe grafic = asimetrie de dreapta
Asimetrie de stânga =
dacă mediana sau modul se află plasate în partea stângă față de medie pe grafic = asimetrie de stânga
Valoare calculată pozitivă a coeficientului de asimetrie Person =
valorile pozitive indică asimetrii la
dreapta
Valoarea calculată negativă a coeficientului de asimetrie Person
valorile negative indică asimetrii de stânga
Valoare calculată pozitivă a coeficientului de boltire Fisher
cazul repartiției leptocurtică: variație mare a frecvenței distribuției empirice comparativ
cu cea a curbei normale
Valoare calculată negativă a coeficientului de boltire Fisher
cazul repartiției platicurtică: variație redusă a frecvenței distribuției empirice comparativ
cu cea a curbei normale
Valoare calculată egală cu 0 a coeficientului de boltire Fisher
cazul repartiției mezocurtice: curba normală coincide cu cea a distribuției empirice
Ce reprezintă o concentrare maximă a volumului unei caracteristici între unitățile statistice ale unei colectivități?
când curba de concentrare se confundă cu laturile pătratului,
concentrarea este maximă.
→Ex: 99% dintre
muncitori realizează o producție egală cu zero și un singur procent dintre muncitori realizează
întreaga producție 100%.
Ce reprezintă o repartiție egalitară (absența concentrării) a volumului unei caracteristici între unitățile statistice ale unei colectivități?
→în cazul în care curba de concentrare se confundă cu
diagonala pătratului, nu există nici un fel de concentrare, iar abaterea dintre mediană și medială
este nulă
→Absența concentrării înseamnă, în cazul unei întreprinderi după producția zilnică
obținută, că m% dintre muncitori realizează m% din producția totală.
→Există deci o concordanță
perfectă între numărul de muncitori și producția obținută. Acest tip de distribuție poartă
denumirea de distribuție egalitară sau de echirepartiție, căreia îi corespunde o concentrare nulă.
La ce se folosește descompunerea dispersiei la nivelul unei colectivități împărțite pe grupe?
Se folosește la analiza interdependențelor, în sensul că nu de puține ori este necesar să se cuantifice cât din variația valorilor unei variabile efect(rezultat) se poate explica pe seama altei variabile considerate cauză
Ex: cât % din variația cifrei de afaceri pt 200 de agenți economici se poate explica prin variația numărului de angajați
Avantajele cercetării selective:
? Sondajul statistic poate fi folosit la verificarea datelor culese printr-o observare totală de mare amploare în care s-au folosit și nespecialiști precum și la prelucrarea selectivă a unor date
EX: datele culese de recensăminte pot fi prelucrate într-o primă faza selectiv și mai târziu total
Scopul unei cercetări parțiale
= ca, pe baza rezultatelor prelucrării datelor obținute, să se estimeze, folosind principiile teoriei probabilităților, parametrii corespunzători ai colectivității totale
În ce condiții este considerat un eșantion reprezentativ?
Teoria și practica statistică demonstrează că asigurarea reprezentativității eșantionului
presupune respectarea cu strictețe a următoarelor condiții:
1. selecția unităților să se facă în mod obiectiv, fără preferințe, după principiul
hazardului, cu o probabilitate calculată anticipat și diferită de zero;
2. eșantionul trebuie să fie suficient de mare pentru a reda trăsăturile esențiale ale
colectivității generale;
3. includerea unităților în eșantion să se facă independent de alte unități.
Ce este un eșantion reprezentativ?
Un eșantion este considerat reprezentativ atunci când
structura colectivității de selecție este identică cu structura colectivității generale sau
diferă foarte puțin de aceasta
Eșantion =
subgrupă a unei colectivități generale, prin studierea căreia trebuie să se caracterizeze colectivitatea generală sub aspectul diferitelor caracteristici
Selecția aleatoare (întâmplătoare)
→constituie modelul de bază utilizat pentru
asigurarea reprezentativității
→se bazează pe principiul tragerii la sorți și exclud orice
element subiectiv în formarea eșantionului.
Ex: tragerea la sorț la loto 6/49
Selecția tipică (stratificată) =
Selecția tipică se aplică cel mai frecvent în studiul fenomenelor social-economice care,
în prealabil, au fost împărțite în grupe omogene (straturi sau tipuri de unități) - după o
caracteristică esențială
→Stratificarea presupune divizarea populației (colectivității generale) în “straturi” cât mai
omogene, cu caracteristici cât mai asemănătoare, astfel încât unitățile statistice din interiorul
fiecărui strat să prezinte, cel puțin din punct de vedere teoretic, caracteristici comune.
Când se folosește selecția de serii?
Se folosește când colectivitatea generală este formată din unități complexe numite și
serii
Ipoteza statistică =
afirmație despre parametrul unei populații sau despre repartiția unei caracteristici a populației, afirmație a cărei adevăr se testează pe baza unui eșantion aleator