3) Concepts statistiques Flashcards

1
Q

Quelles sont les mesures de position ? (3)

A
  • Quartiles
  • Rang centile
  • Distribution normale et score standard
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

L’écart-type est sensible aux _______________.

A

Données extrêmes (outliers)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q
  1. Les quartiles c’est une des mesures de position, c’est quoi ?
  2. Ça mesure quoi ?
A
  1. Les quartiles sont des valeurs qui partagent les données d’une distribution en quatre parties ayant chacune 25 % des données. L’écart interquartile (l’intervalle ou l’étendue interquartile)
  2. Ça mesure la dispersion des données en regardant l’étalement autour de la médiane.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

L’écart-type est sensible aux données extrêmes. Comment ça se fait que l’intervalle interquartile enlève l’effet des valeurs extrêmes ?

A

Parce que cet intervalle regarde les 50% des données qui se situent au centre de la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Le rang centile est une des mesures de position.

  1. C’est quoi des centiles ?
  2. C’est quoi un rang centile ? Ça indique quoi ?
  3. Ça permet quoi ?
A
  1. Les centiles sont 99 délimitations qui divisent un ensemble de données en 100 intervalles contenant chacun environ 1% des données.
  2. C’est le rang qu’aurait la valeur s’il y avait 100 données. Ça indique le pourcentage des données qui sont inférieures ou égalées à une donnée précise.
  3. Permettent d’effectuer des comparaisons entre des variables différentes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

La distribution normale et le score standard sont une des mesures de position.

  1. Quelles sont les caractéristiques d’une variable qui suit une distribution normale ?
  2. Un peu plus de 99% des données normales se situent entre _____ et ______ écart-types de la moyenne.
A
    • Distribution symétrique
    • La moyenne, le mode et la médiane sont identiques
    • 68% des observations sont à plu ou moins un écart-type de la moyenne
  1. Un peu plus de 99% des données normales se situent entre -3 et +3 écart-types de la moyenne.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Il est possible de déterminer la position relative de chaque observation en calculant ce qui s’appelle le __________________, qui correspond à ….

A

Score standardisé (ou le score Z)

Correspond à : (valeur - moyenne)/écart-type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Lorsque nous essayons de généraliser les résultats obtenus par un échantillon vers un plus grand nombre d’individus (population), on fait quel genre de statistiques ?

A

Des statistiques inférentielles (inductive)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Ça permet quoi les statistiques inférentielles ?

A

Permet de généraliser les résultats obtenus par un échantillon vers un plus grand nombre d’individus (population)

Permet aussi d’essayer de tirer des conclusion à propos d’une population en se basant sur les résultats observés auprès d’un échantillon.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Il existe beaucoup de techniques d’analyses statistiques pour répondre à des questions de recherche différentes, comme :

  • Voir des différences entre des groupes
  • Voir des différences entre des variables

Que faut-t’il faite pour comparer les moyennes de deux (ou plusieurs) groupes ?

A

Il fait mesurer l’effet d’une variable indépendante (de «catégories») sur une variable dépendante (continue).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Quel test faut-t’il faire pour comparer le groupe échantillon avec la population ? (Différence entre des groupes)

A

Test-t pour échantillon unique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quel test faut-il faire pour comparer l’échantillon pré-test et l’échantillon post-test ? (Différence entre des groupes)

A

Test-t pour échantillons appariés

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Quel test faut-il utiliser pour comparer un groupe A avec un groupe B? (Différence entre des groupes)

A

Test-t pour échantillons indépendant

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quel test faut-il faire pour comparer 3 groupes ou plus ? (Permet de faire des permutations) [différence entre des groupes]

A

Une analyse de variance (ANOVA) ou MANOVA (si plusieurs VD)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quel test faut-il faire pour comparer 3 groupes ou plus avec une covariable ? (Différence entre des groupes)

A

Analyse de covariance (ANCOVA)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Les statistiques inférentielles permettent aussi de voir des relations entre des variables !

  1. Ça permet de déterminer quoi ?
  2. Pour évaluer la relation entre deux variables de «catégories», qu’est-ce qu’on utilise ?
  3. Pour évaluer la relation entre deux variables «continues», qu’est-ce qu’on utilise ?
A
  1. Permet de déterminer le degré d’association (lien) qui peut exister entre deux ou plusieurs variables.
  2. Test de Chi-2 (compare les occurrences observées avec les occurrences attendues)
  3. – Corrélation de Pearson
    – Régression linéaire simple
17
Q

À quoi correspond la notion de corrélation ? Ça sert à étudier quoi ?

A

La corrélation vérifie s’il existe une relation linéaire entre deux variables (vont toujours dans le même sens), mais ne permet PAS d’établir un lien de cause à effet (on ne sait pas quelle variable est la cause de l’autre).

Il peut avoir des corrélations hyper significatives mais qui n’ont aucun sens, donc ne valent rien (ex: manger du fromage diminuent les chance de mourir dans notre sommeil).

18
Q

Qu’est-ce qu’on fait pour voir la relation entre des variables nominales ?

A

Un Chi-carré

19
Q

Qu’est-ce qu’on fait pour voir la relation entre des variables ordinales ?

A

Une corrélation de Spearman

20
Q

Qu’est-ce qu’on fait pour voir la relation entre des variables à intervalle ?

A

Une corrélation de Pearson

21
Q
  1. C’est quoi un coefficient de corrélation ?

2. Comment peut-on déterminer si on a une bonne ou une mauvaise corrélation ?

A
  1. C’est la relation pour l’échantillon de l’étude qui a une force allant de 0 à 1.
  2. Corrélation …
    - Faible : 0 à 0,3
    - Bonne : 0,3 à 0,6
    - Très bonne : 0,6 à 0,8
    - Trop élevée : +0,8 (on a pt mesusé la meme affaire deux fois)
22
Q

La corrélation c’est la relation pour l’échantillon de l’étude qui a une force allant de 0 à 1.

  1. Comment fait-on pour savoir si le test-retest a une bonne fidélité ?
  2. Ça veut dire quoi une corrélation + VS une corrélation - ?
A
    • Acceptable : 0,7 à 0,8
    • Bonne : 0,8 à 0,9
    • Excellent : 0,9 et +
    • Positif = même sens
    • Négatif = sens inverse
23
Q

Quels seuils de signification utilise-t-on habituellement pour comparer l’échantillon avec la population ?

A

p<0.05, p<0,01. p<0,001

24
Q

Comment fait-on pour savoir si la proportion de variabilité de y est attribuable à x ?

Ça correspond au coefficient de ……

Ça représente quoi ?

A

En prenant le coefficient de corrélation au carré (r^2).

Ça correspond au coefficient de détermination !

Le “coefficient de détermination” représente la fraction de la
variance d’une variable “expliquée” par la corrélation avec une autre variable

25
Q

Comment interpréter un coefficient de détermination de 0,64 ?

A

Ça veut dire que 64% de la variance de y est expliquée par sa corrélation avec x.

26
Q

Quand on collecte nos données et qu’on les rentre dans notre fichier pour faire un graphique, on se ramasse avec un nuage de points.

  1. C’est quoi la différence entre une corrélation et une régression ?
A

• La corrélation: relation entre variable X et variable Y (2
VD)

• La droite de régression: variation de la variable X sur la variable Y (VI sur VD)

- Régression simple = Prédiction de VD par VI
- Régression multiple = si plusieurs prédicteurs
27
Q

Quels sont les propriétés psychométriques des tests (métrologiques) ? (3)

A
  1. Sensibilité (capacité discriminante)
  2. Validité
  3. Fidélité (répétabilité et reproductibilité)
    — Cohérence interne (homogénéité)
    — Test-retest
28
Q

La validité est une propriété (qualité) psychométrique. Il y a plusieurs types de validité qu’on regarde… Lesquels ?

A

Validité :
– D’apparence (ou manifeste)
– De contenu
– De construit (convergente et discriminante)
– De critère (ou empirique) : prédictive et concomitante

29
Q

La sensibilité permet de déterminer quoi ?

A

La sensibilité permet de déterminer :
— si le test différencie suffisamment les participants.
— la capacité du test à classer les performances des participants en les différenciant nettement les uns des autres (c’est le pouvoir discriminant des tests)
— Là capacité d’un test à détecter une variation du score vrai sur le trait mesuré

30
Q

La _______________________ permet normalement de s’assurer de la sensibilité des tests.

A

Méthode de sélection des items

31
Q

Lorsque la mesure a pour but de mesurer une caractéristique particulière, l’instrument doit avoir le meilleur pouvoir “séparateur” possible mais doit aussi avoir une forte “spécificité”

C’est quoi la différence entre la sensibilité et la spécificité ?

A

SENSIBILITÉ :
— Capacité de l’instrument à identifier correctement les personnes présentant les caractéristiques que l’on souhaite étudier.
— Mesure la proportion de personnes présentant les caractéristiques étudiées qui est identifiée par le test

SPÉCIFICITÉ :
— Capacité de l’instrument à identifier correctement les personnes ne portant PAS cette caractéristique
— Le coefficient de spécificité correspond à la probabilité d’identifier correctement une personne ne présentant pas la caractéristique étudiée

32
Q

Quel est l’effet du nombre d’items d’un test sur la sensibilité (dans la construction d’un test) ?

A

Plus le nombre d’items est grand (si relativement homogènes) et plus c’est possible d’établir des différences entre individus (augmentation de la variable totale du test)

33
Q

Quel est l’effet du niveau de difficulté des items sur la sensibilité ?

A

Le test doit être adapté à la population : les items doivent être de difficultés différentes afin de discriminer les sujets afin :

1. Éviter l'effet plafond (tendance d’un ensemble de données à se stabiliser à un maximum) 
2. Éviter l’effet plancher (à un minimum)
34
Q

Que faut-il faire pour étudier la sensibilité d’un test ?

A

Établir la distribution des résultats et d’examiner sa forme (si normale ou non) via le calcul d’incises de dispersion (écart-type ou autre), d’asymétrie ou d’aplatissement.

35
Q

Une distribution qui n’est pas une distribution normale indique quoi ? (Sensibilité)

A

Si la distribution n’est pas une distribution normale, la sélection des questions étaient probablement incorrecte et le choix des questions doit être revue et/ou les questions remaniées (en supposant qu’on a fait un bon échantillonnage) -