Analyse statistique des données Flashcards

1
Q

Que signifie “Statistique”?

A

Une discipline qui s’intéresse à l’analyse quantitative de la réalité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Que signifie “paramètre”?

A

Un calcul effectué auprès de la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Que signifie “indice statistique”?

A

Calcul sur l’échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’est-ce qu’une analyse inférentielle?

A

Tests statistiques permettant d’estimer les caractéristiques de la population telles qu’elles sont mesurées à partir d’échantillions
**Tjrs avec échantillon car impossible de demander à toute la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quels sont les objectifs des statistiques?

A
  1. Représenter un grand nombre de données sous forme d’un ou quelques nombre (ex: la moyenne)
  2. Généraliser aux populations les caractéristiques mesurées à partir d’échantillons
  3. Prendre des décisions (confirmer ou rejeter l’hypothèse)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quelles sont les différents types d’échelle de mesure?

A
  1. Nominale: numéro pas important, qu’on ne calcule pas (ex: postes TV)
  2. Ordinale: Likert (Tout à fait en accord)
  3. Intervalle: Chiffres
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

En quoi consiste une analyse descriptive?

A

Faire ressortir comment les données se distribuent pour pouvoir synthétiser l’ensemble des données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quels sont les principaux indices statistiques (calcul sur l’échantillon) qui nous intéressent dans l’analyse descriptive?

A
  • Indices de tendances centrales (moyenne, médiane
  • Indices de dispersion (étendue, variance, écart-type)
  • Indices de distribution (fréquences, asymétrie, aplatissement)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont les indices de tendance centrale?

A
  1. Moyenne
  2. Médiane
  3. Mode
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce que la moyenne?

A

Additionner tous les éléments d’un ensemble et diviser par le nombre d’éléments additionnés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce que la médiane? Quand est-elle utile?

A

C’est le point milieu d’un ensemble ordonné de données.
Utile lorsqu’il y a des valeurs extrêmes (ex: étude sur la situation économique des étudiants et un participant a gagné à la loterie)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qu’est-ce que le mode?

A

La valeur qui a la fréquence la plus élevée est celle qui est endossée par le plus de participants (ex: majorité des étudiants ont 80%)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quels sont les indices de dispersion?

A
  1. l’étendue
  2. la variance
  3. l’écart-type
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que l’étendue?

A

Écart entre la valeur la plus petite et la valeur la plus grande

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qu’est-ce que l’étendue?

A

Écart entre la valeur la plus petite et la valeur la plus grande

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Qu’est-ce que la variance?

A

La variabilité de la distribution des données: (somme des écarts à la moyenne)2/ N-1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

En quoi consiste la distribution de fréquences?

A

Comptabilise le nbr d’unités d’observation se trouvant dans chaque catégorie (nominale) ou pour chaque valeur ou classe (ordinale ou continue)
(Diagramme à bâton, histogramme, courbe normale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Qu’est-ce que la courbe normale?

A

Un modèle probabiliste pour comparer ???

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Qu’est-ce que l’asymétrie de la distribution?

A
  • Lorsque beaucoup de gens ont des résultats + ou - (aux extrêmes)
  • Bimodale
18
Q

Qu’est-ce que l’asymétrie de la distribution?

A
  • Lorsque beaucoup de gens ont des résultats + ou - (aux extrêmes)
  • Bimodale
19
Q

Pourquoi est-il important de savoir s’il y a aplatissement de la distribution ou asymétrie de la distribution?

A

Parce qu’on n’utilisera pas la loi normale!

20
Q

Qu’est-ce que la Courbe T?

A

C’est la loi de student avec des petits échantillons mais se rapproche de la loi normale

21
Q

Qu’est-ce que l’erreur de type 1?

A

C’est le rejet de hypothèse nulle (absence de différence entre GE et GT) alors que H0 est vraie = on déclare qu’il y a différence entre GE et GT, donc que les résultats sont significatifs

22
Q

Qu’est ce que l’erreur de type 2?

A

On ne rejette pas H0 alors que c’est faux donc on ne déclare pas les résultats significatifs alors qu’ils le sont

23
Q

Quelle erreur est la pire: erreur de type 1 ou de type 2?

A

L’erreur de type 1 est plus grave, car plus de conséquences à dire que quelque chose est significatif alors que non

24
Q

Qu’est-ce que la puissance d’un test?

A

La capacité d’un test à détecter un résultat significatif

  • (1 - erreur de type II)
  • Acceptable à partir 80%
  • Comment l’augmenter? Avec le plus de participants possibles
25
Q

Pourquoi on vient à accepter H1, mais nous ne pouvons pas prouver H1?

A

Parce qu’on ne trouve jamais H1 parfaitement: il y a % d’erreur

26
Q

Quelle est la démarche du test d’hypothèse?

A
  1. Pour une hypothèse donnée, formuler H0 et H1
  2. Identifier échelles de mesure des variables (nominales, ordinales, intervalles)
  3. Choisir le test statistique approprié (dépendant de l’échelle)
  4. Effectuer le calcul statistique approprié
  5. En fonction du résultat, prendre la décision de rejeter ou non H0
  6. Interpréter la signification de cette décision (p > ou < 0.05)
  7. Dire si votre hypothèse de recherche est confirmée
27
Q

Donnez un exemple d’hypothèses pour une corrélation.

A

H0: Il n’y a pas de lien ou il y a un lien négatif entre X et Y
H1: Il y a un lien positif entre X et Y

28
Q

À quoi sert le Test T (non-pairé)?

A

Lorsqu’on veut comparer 2 groupes sur une variable continue (1 variable nominale dichotomique et 1 variable intervalle/rapport)
= Il y a deux groupes différents évalués (ex: homme vs femme)

29
Q

À quoi sert le Test t pour échantillons appariés (t-pairé)?

A

Lorsqu’un seul groupe est observés à deux reprises sur une variable continue (prétest et posttest).
Permet d’observer les différences de moyenne

30
Q

Qu’est-ce que l’analyse de variance (ANOVA)?

A

C’est un test statistique qu’on utilise lorsqu’on veut comparer 3 groupes et + sur une variable continue. Elle nous permet de déterminer s’il y a des différences entre les groupe.

31
Q

Quel est le désavantage de l’ANOVA?

A

L’analyse dit seulement s’il y a une différence, mais pas entre quels groupes = doit parfois faire d’autres tests

32
Q

Pourquoi utilisons-nous l’ANOVA pour comparer 3 groupes à une variable continue plutôt que de faire plusieurs test t?

A

Parce que chaque fois que l’on effectue une analyse, cela entraîne un pourcentage d’erreur possible, alors cela diminue la fiabilité?

32
Q

Pourquoi utilisons-nous l’ANOVA pour comparer 3 groupes à une variable continue plutôt que de faire plusieurs test t?

A

Parce que chaque fois que l’on effectue une analyse, cela entraîne un pourcentage d’erreur possible, alors cela diminue la fiabilité?

33
Q

Qu’est-ce que l’analyse de variance à deux facteurs (ANOVA factorielle)?

A

Lorsqu’on a un plan factoriel à deux facteurs (ou +) et une variable continue

34
Q

Il y a un effet d’interaction entre les groupes expérimentaux et le sexe sur l’anxiété. Quel test statistique dois-je utiliser?

A

L’ANOVA factorielle

35
Q

Qu’est que le Khi-carré?

A

Lorsque nous voulons comparer ou mettre en relation 2 variables NOMINALES (= utilise juste des proportions %)

36
Q

Combien de tests statistiques y-a-t-il?

A

6!

  1. Corrélation
  2. Test t
  3. Test t apparié
  4. Analyse de variance
  5. ANOVA à deux facteurs
  6. Khi-deux
37
Q

Pourquoi devons-nous mentionner si nous croyons que c’est one-tail ou two-tail AVANT de manipuler?

A

Par soucis d’honnêteté

38
Q

Que signifie two-tail (bilatéral)?

A
  • C’est lorsqu’on ne se questionne pas sur la nature de la différence (dire qui est le meilleur)
  • L’hypothèse est moins bonne s’il n’y a pas de direction, MAIS bon lorsque les études sont contradictoires
  • On divise le 5% de chaque côté (2,5%)
39
Q

Que signifie one-tail (unilatéral)?

A
  • Lorsqu’on prédit le meilleur

- 5% d’un seul côté alors plus de chance de détecter un effet!

40
Q

Si j’ai un one-tail à p<0.05, quelle est la valeur de Z que nous recherchons?

A

Z = 1,65

41
Q

Si j’ai un two-tail à p<0.01, quelle est la valeur de Z que nous recherchons?

A

Z = 2,58

42
Q

Si j’ai un two-tail à p<0.05, quelle est la valeur de Z que nous recherchons?

A

Z = 1.96