Statistiques Flashcards

1
Q

Qu’est-ce qu’une variable ?

A

Valeur se mesurant avec instrument mesure

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’une variable quantitative et quelles sont ses caractéristiques ?

A

Valeur numérique
Discrète : valeurs variables = qté isolées
Continue : infinité valeurs possibles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce qu’une variable qualitative et quelles sont ses caractéristiques ?

A

Attributs pas soumis aux lois arithmétiques

Nominales : attributs ne se prêtant pas à mise en rang
Ordinales : ordre naturel entre attribut

Dichotomique : seulement 2 catégories
Polychotomique : pls catégories

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’une statistique descriptive ?

A
  • Ensemble observations de façon concise, extraire faits saillants et exprimé sous forme synthèse
  • Décrire observations recueillies par indice numérique ou tableau/graphique
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

À quoi servent les variables qualitatives dans la statistique descriptive ?

A
  • Rapporter fréquences absolue et relative pr résumer distribution
  • Seulement qq valeurs différentes –> fréquences peuvent être rapportées ds un texte
  • Peut être représenté par diagramme en bâton
  • Peut calculer mode, mais pas moyenne ou médiane
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que la fréquence absolue ?

A

Nb observations de cette catégorie

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que la fréquence relative ?

A

% ou proportion obtenue par division fréquence absolue par nb total observation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

À quoi servent les différents types de variables quantitatives dans la statistique descriptive ?

A

Discrète : fréquence absolue et relative s’appliquent

Continue

  • Regrouper différentes valeurs en classes mutuellement exclusives et idéalement largeur égales
  • Tableau fréquence peut faciliter lecture puis présentation par histogramme (contiguïté rectangles pr refléter caractère continu variable)
  • Peut être aussi décrite par qq indices numériques donnant + info sur tendance centrale et dispersion
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qu’est-ce que des quartiles ?

A

Séparation en 4 parties égales quant au nb observations qu’elles contiennent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que la tendance centrale et quels sont ses types ?

A

Tendance à se concentrer
Moyenne arithmétique : centre gravité histogramme
Médiane : valeur sous laquelle on retrouve 50% observations
Mode : correspond au sommet histogramme (unimodale = un seul mode)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quels sont les distributions possibles d’un histogramme ?

A
  • Symétrique et unimodale –> moyenne = médiane = mode
    • distribution est asymétrique, + 3 mesures ont valeurs différentes
  • Utilise moyenne qd distribution symétrique et médiane si forte asymétrie
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelles sont les 3 façons de calculer la dispersion ?

A

Étendue : différence entre + grande et + petite valeur
Variance : écart données par rapport à moyenne
Écart type : indice de dispersion le + fréquemment utilisé

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Comment calcule-t-on la variance ?

A
                                             n-1
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment calcule-t-on l’écart-type ?

A

Racine carré variance (DESCRIPTIVE)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Comment représente-t-on graphiquement la relation entre deux variables quantitatives ?

A

Diagramme de dispersion (nuage de points) où chaque point correspond à paire résultat observé chez sujet particulier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qu’est-ce qu’un corrélation?

A
  • Indice numérique permettant quantifier relation linéaire entre 2 variables
  • Nb sans unité compris entre -1 et +1
  • Négatif si valeurs élevées d’un correspond valeurs basses autre
  • Positif si valeurs élevées d’un correspond valeurs élevées autre
  • Nulle si valeurs d’un associées à valeurs faibles ET élevées de l’autre
  • Reflète force association linéaire entre 2 variables
  • Permet pas établir sens association (lien de causalité)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Comment représente-t-on la relation entre deux variables qualitatives ?

A

Relation présentée à l’aide tableau de contingence

              X             Y  A              34             3 B               10            28 C                2            22
18
Q

Qu’est-ce que la statistique inférentielle ?

A
  • Émettre conclusion valable pr ensemble pop à partir échantillon représentatif pop
  • Repose sur théorie probabilité
19
Q

Quelles sont les lois de la probabilité ?

A

Probabilité = nb entre 0 et 1
Règle #1 : probabilité qu’un des 2 évènements mutuellement exclusifs (peuvent pas se produire simultanément) se produise = somme probabilité respectives
Règle #2 : évènement contraire est = 1 - probabilité évènement
Règle #3 : probabilité que 2 évènements indépendants se produisent = produit probabilité respective

20
Q

Qu’est-ce que la distribution normale ?

A
  • Décrit grand nb phénomène naturel
  • Seulement variables quantitatives et continues
  • Représentées à aide histogramme
  • Variable X suit distribution normale avec moyenne x et ET y (X ~ N (x, y)
  • Transformer distributions normales en centrée réduite –> Z = (X- x)/y
21
Q

Quelle est la forme caractéristique de la distribution normale ?

A

Symétrique et unimodale
Moyenne, médiane et mode identiques
Aire sous courbe = 1

22
Q

Qu’est-ce que la distribution normale centrée réduite ?

A

Moyenne est 0 et ET = 1 –> Z ~ N (0, 1)

23
Q

Quel est le lien entre la moyenne et l’écart type ?

A

Moyenne +/- 1ET : comprend 68% aire totale
Moyenne +/- 2ET : comprend 95% aire totale
Moyenne +/- 3ET : comprend 99,8% aire totale

24
Q

Est-ce qu’une estimation avec un échantillon représentatif donne toujours la valeur réelle ?

A

Non parce que c’est rare que estimation = valeur réelle paramètre inconnu mm si échantillon représentatif

25
Q

Qu’est-ce qu’un paramètre ?

A

Qté qui décrit caractéristique pop

26
Q

Qu’est-ce qu’une statistique ?

A

Qté calculée à partir observations sur échantillons pr estimer paramètre

27
Q

Qu’est-ce qu’une estimation ponctuelle ?

A

Estimation à partir échantillon que l’on applique à toute pop pr paramètre inconnu (doit tjrs être accompagnée d’un intervalle de confiance)

28
Q

Qu’est-ce qu’un intervalle de confiance ?

A

Donne % de certitude donnée mesurée (moyenne, mode, médiane..) à aide erreurs-types (souvent 95%) –> compromis entre niveau confiance et précision

29
Q

Qu’est-ce que la distribution échantillonale de la moyenne ?

A

Distribution ensemble moyennes que l’on obtient à partir grand nb échantillons tirés pop à étude

30
Q

Qu’est-ce que le théorème de la limite centrale ?

A
  • Moyenne distribution échantillonale = moyenne variation ds pop
  • ET (erreur-type) donné par moyenne/ racine carré du nb
  • Valeur moyenne rarement connue alors si taille échantillon assez grand –> substituer ET avec valeurs échantillons
  • Si variable suit courbe N ds pop, elle suit aussi courbe N ds échantillon –> + échantillon est grand, + distribution tend devenir N peu importe distribution variable pop
31
Q

Qu’est-ce que le test de l’hypothèse ?

A
  • Tout paramètre (moyenne, proportion, messure association) peut devenir objet test hypothèse
  • Part postulat que Ho est vraie tant qu’il n’est pas démontré statistiquement qu’elle est peu probable
  • Si estimation échantillon et statu quo = faible différence (attribuée au hasard donc statistiquement non significatif)
  • Si Ho vraie, quelle est probabilité qu’échantillon pris au hasard soit aussi loin ? Si probabilité petite = rejet hypothèse nulle (statistiquement significatif)
  • Décision rejeter ou non Ho après avoir déterminer ds quelle mesure échantillon observé est en conflit avec Ho
  • Un mauvais choix test statistique peut invalider conclusions chercheur
32
Q

Qu’est-ce que l’hypothèse nulle (Ho) ?

A

Statut quo (absence changement) tjrs défini par une égalité

33
Q

Qu’est-ce que l’hypothèse alternative (H1) ?

A

Hypothèse qu’on souhaite démontrer, signe définit selon connaissance chercheur et ce qu’il veut démontrer

34
Q

Quel est le lien entre le niveau de test et la puissance de l’étude ?

A
  • Si a élevée, B doit être bas pr échantillon de taille donnée
35
Q

Quels sont les types possibles d’hypothèse alternative ?

A

Bilatéral : se définit avec signe ‘’ n’égale pas ‘’

Unilatéral : autres cas ( …)

36
Q

Qu’est-ce que la valeur p ?

A

Probabilité qu’on peut attribuer au hasard

Si faible –> Ho jugée invraisemblable = rejetée

37
Q

Qu’est-ce que l’erreur de type 1 ?

A

Rejet Ho alors qu’elle est vraie

38
Q

Qu’est-ce que le niveau de test (a) ?

A

Rejetter Ho si probabilité résultat + extrême que celui observé est <5% (fixer avant de savoir résultat) –> probabilité consenti de commettre erreur type 1

39
Q

Qu’est-ce que l’erreur de type 2 ?

A

Ne rejette pas Ho alors qu’elle est fausse (donnée par 1-B)

40
Q

Qu’est-ce que la puissance de l’étude (B) ?

A
  • Probabilité rejeter Ho quand elle est fausse (acceptable si elle est ~ 80%)
  • Puissance étude affectée par taille échantillon (+ grand, + possible rejeter Ho quand elle est fausse = prend bonne décision)
41
Q

Quand utilise-t-on le théorème de la limite centrale ?

A

Quand inférentielle –> normalisation courbe –> erreur-type