Examen 1 (séance 1-5) Flashcards

1
Q

Qu’est-ce qu’une population?

A

L’ensemble de tous les événements ou objets qui possèdent une ou plusieurs caractéristiques communes sur lesquelles l’étude porte son intérêt.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qu’est-ce qu’un échantillon?

A

Un sous-ensemble d’une population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Qu’est-ce que la validité externe?

A

La capacité de généralisation à d’autres événements ou objets.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qu’arrive-t-il lorsque l’échantillon est non représentatif?

A

La validité externe diminue.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qu’est-ce que l’assignation?

A

La répartition des participants à l’intérieur des groupes dans un expérience; aléatoire quand c’est possible.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qu’est-ce que la statistique descriptive?

A

Vise à résumer l’information d’un ensemble de données à l’aide d’indices numériques et graphiques (échantillons).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que la statistique inférentielle?

A

Vise à tirer des conclusions sur l’ensemble de la population à l’étude à partir des statistiques calculées sur un ou plusieurs échantillons.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Associez paramètre et statistique avec population et échantillon.

A

Paramètre - Population

Statistique (estimation) - Échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quelles sont les deux niveau de mesure d’une variable?

A

Discrète : Nombre limité de valeurs

Continue : Peut prendre n’importe quelle valeur entre le minimum et le maximum de l’échelle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quelles sont les quatre échelles de mesure d’une variable?

A

Nominale : Étiquette sans ordre particulier (division en catégories);

Ordinale : Objets classés suivant un continuum ordonné (rang); gradation d’intensité entre les «catégories»;

Intervalle : La distance entre deux points a toujours la même signification sur l’échelle; le zéro est fixé arbitrairement et ne correspond pas à l’absence de l’élément mesuré;

Rapport : Possède les caractéristiques de l’échelle d’intervalle avec en plus un zéro absolu.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Qu’est-ce qu’une variable? Quels sont les types de variables?

A

Propriété d’un événement ou d’un objet qui peut prendre différentes valeurs.

VI : Ce qui est manipulé ou contrôlé par le chercheur;
VD : Ce qui est mesuré.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Avantages et inconvénients : Distribution de fréquences.

A

Avantages :

  • Voir les données extrêmes;
  • Données réelles.

Inconvénients:
- Difficulté à voir la forme de la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Avantages et inconvénients : Histogramme

A

Avantages :

  • Éviter les trous et la fluctuation (masquer le désordre);
  • Voir les données extrêmes;
  • Forme de la distribution.
  • Intervalles égaux

Inconvénients:
- Pas possible de voir les valeurs numériques réelles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Avantages et inconvénients : Diagramme en tiges et feuilles

A

Avantages :

  • Forme de la distribution;
  • Données réelles.
  • Utile pour comparer deux distributions différentes (dos-à-dos)

Inconvénients :
- Aucun

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quelle est la représentation graphique la plus informative?

A

Le diagramme en boite-et-moustaches.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Quel quartile est aussi la médiane?

A

Q2.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quelles sont les deux caractéristiques (visuelles) d’une distribution?

A

Le degré de symétrie et le degré de voussure (degré d’aplatissement).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quelles sont les trois degré de voussure?

A
  • Mésokurtique (normale);
  • Leptokurtique (moins aplatie);
  • Platikurtique (plus aplatie).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Les lettres minuscules et majuscules sont utilisées pour quels concepts statistiques?

A

Majuscules : variables

Minuscules : unité d’observation de cette variable (donnée).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Quelles sont les trois règles de sommation?

A
  1. La sommation d’une constante pour i de 1 jusqu’à n est égale à n fois la constante;
  2. La sommation d’une constante multiplié par une variable est égale à la constante multipliée par la sommation de la variable;
  3. La sommation d’une somme de plusieurs quantités est égale à la somme des sommations.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Qu’est-ce qu’une mesure de tendance centrale? Et quelles sont-elles?

A

Mesure indiquant l’endroit où est centrée la distribution sur l’échelle de la variable.

Le mode, la médiane et la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Qu’est-ce que le mode? Quels sont ses avantages et

ses inconvénients? Quels sont les deux modes?

A

Le résultat le plus fréquent.

(+) : Non influencé par les données extrêmes.
(-) : Peu représentatif de la distribution.

Unimodale et bimodale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Qu’est-ce que la médiane? Comment fait-on pour la localiser? Quelles sont ses propriétés?

A

Le point de l’échelle des données ordonnées numériquement au-dessus duquel se situent 50% des cas.

( n+1 ) / 2 (donne la position et non la médiane)

  • Pas affectée par les données extrêmes;
  • Donné la plus proche des autres scores de la distribution.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Qu’est-ce que la moyenne? Quelles sont les ses propriétés?

A

La somme des données d’une distribution pondérée par le nombre de données.

  1. La somme de toutes les données est égale au nombre de données multiplié par la moyenne.
  2. La somme des distances entre chaque score et la moyenne est égale à 0.
  3. L’addition d’une constante à chaque donnée de la distribution produit une nouvelle moyenne égale à la moyenne originale additionnée par cette constante.
  4. La multiplication d’une constante à chaque donnée de la distribution produit une nouvelle moyenne égale à la moyenne originale multipliée par cette constante.
  5. La moyenne est affectée par les données extrêmes contrairement à la médiane et au mode qui ne le sont pas.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

À quoi servent les indices de dispersion? Quels sont-ils?

A

À savoir le degré de déviation des données individuelles par rapport à la tendance centrale.

L’étendue, la variance et l’écart-type.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

Qu’est-ce qu’un étendue? Comment est-il calculé? Quelles sont ses propriétés?

A

Distance entre la donnée la plus élevée et la donnée la moins élevé d’une distribution.

Étendue = Xmax - Xmin

  • Ignore presque toute la distribution;
  • Calculé à partir des données extrêmes;
  • Utilisé en complément à d’autres mesures.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

Qu’est-ce que le coefficient de variation? Comment est-il calculé?

A

Indice de dispersion qui permet de comparer la variabilité entre des échantillons dont les moyennes ou les échelles de mesure diffèrent.

CV = ( Écart-type / Moyenne ) * 100

28
Q

Qu’est-ce qu’une distribution linéaire?

A

Opération consistant à modifier l’unité de mesure d’une distribution de données et qui permet d’exprimer autrement une même réalité.

29
Q

Quelle est l’équation de la distribution linéaire? Que représente les différentes lettres?

A

Y = bX + a

Y : variable transformée
X : variable originale
b : pente
a : ordonnée à l’origine (Y lorsque X = 0)

30
Q

Quels sont les deux indices permettant de déceler la présence d’une transformation linéaire?

A
  1. L’équation peut être représentée par une droite;

2. La variable X doit être de 1er degré.

31
Q

Quelles sont les propriétés des transformations linéaires?

A
  1. Une transformation linéaire ne modifie par la forme de la distribution;
  2. Les distances entre les données demeurent proportionnelles après une transformation linéaire;
  3. La moyenne des données transformées (moyenne de Y) est égale à la transformation linéaire de la moyenne originale (moyenne de X)
  4. La variance des données transformées (S2y) est égale à la variance des données originales (S2x) multipliée par le carré de la pente.
32
Q

Qu’est-ce qu’un score de déviation?

A

Chaque transformation représente le degré de déviation d’une donnée par rapport à la moyenne de la distribution.

Y = Xi - Moyenne de X

Si le score de déviation est … :
Positif : donnée > à la moyenne
Négatif : donnée < à la moyenne

33
Q

Qu’est-ce qu’un score Z?

A

Un score Z est le score de déviation pondéré selon l’écart-type de la distribution.

Z = (Xi - moyenne de X) / Sx

34
Q

Quelles sont les propriétés du score Z?

A
  • Distribution des Z: Z (0;1) (moyenne ; variance)
  • S’exprime en unité d’écart type par rapport à la moyenne;
  • Utile pour la comparaison entre groupe;
  • Ne permet pas de « normaliser » une distribution, car elle n’affecte pas la forme de la distribution.
35
Q

Qu’est-ce que les scores T?

A

Basés sur score Z, on effectue une 2e transformation linéaire

T = 10z + 50 T (50;100)

Avantageux par rapport au Z dû à l’absence de scores négatifs

36
Q

Quelles sont les principales applications de la transformation linéaire?

A
  • Inversion des scores;
  • Scores Z
  • Scores T.
37
Q

Quelles sont les propriétés de la distribution normale?

A
  1. Plusieurs phénomènes étudiés en psychologie sont normalement distribués dans la POPULATION;
  2. Le fait d’assumer qu’une variable se distribue normalement permet de faire certaines inférences sur la probabilité d’occurence de chaque donnée (lorsque la moyenne et l’écart-type sont connus);
  3. La distribution d’échantillonnage, soit la distribution théorique des moyennes tirées d’une infinité d’échantillons provenant d’une même population s’approche d’une distribution normale (théorème de la limite centrale);
  4. Un grand nombre de tests statistique inférentiels employés en psychologie reposent sur la distribution normale.
38
Q

Pourquoi utilise-t-on une distribution dite « centrée réduite »?

A

Car il existe une infinité de distribution normales dû à l’infinité de moyennes et d’écart-types; ainsi la distribution dite « centrée réduite » est utilisée pour éviter cette complexité.

39
Q

Comment arrive-t-on à une distribution « centrée réduite »?

A

En transformant chaque donnée de la distribution en score Z.

40
Q

Quelles sont les propriétés de la distribution normale centrée réduite?

A
  • Symétrique;
  • Mésokurtique;
  • Asympotique ( Y toujours > 0);
  • Unimodale (Mode = Médiane = Moyenne).

Plus X s’éloigne de la moyenne, plus la probabilité d’occurence de X diminue.

41
Q

Quels indices sont disponible pour chaque Z dans la table de distribution normale Z?

A
  • De la moyenne à Z;
  • Plus grande portion;
  • Plus petite portion.
42
Q

Quels sont les avantages de la table des scores Z?

A
  • Identifier des résultats extrêmes dans une étude;
  • Comparer des individus entre eux et avec la moyenne du groupe;
  • Très facile à interpréter, car on peut exprimer les probabilités en pourcentage ou en percentile.
43
Q

Une probabilité se situe entre ___ et ___ où ___ est certain que l’événement va se produire et ___ est certain que l’événement ne va pas se produire.

A

Une probabilité se situe entre 0 et 11 est certain que l’événement va se produire et 0 est certain que l’événement ne va pas se produire.

44
Q

Quelle est la formule générale d’une probabilité? Et quelle sont les conditions?

A

p(A) = A / (A+B)

Les événements A et B doivent être mutuellement exclusifs et former la totalité des alternatives possibles.

45
Q

Qu’est-ce qu’un événement indépendant?

A

L’occurence (ou non-occurence) d’un événement n’affecte pas l’occurence (ou non-occurence) de l’autre.

46
Q

Qu’est-ce qu’un événement dépendant?

A

L’occurence (ou non-occurence) d’un événement affecte l’occurence (ou non-occurence) de l’autre.

47
Q

Qu’est-ce que la loi additive?

A

Si 2 événement (A et B) sont mutuellement exclusifs, la probabilité d’observer A OU B est égale à la somme de leurs probabilités séparées.

p(A ou B) = p(A) + p(B)

48
Q

Qu’est-ce que la loi multiplicative?

A

La probabilité d’observer conjointement plusieurs événements indépendants est égale à la multiplication de leurs probabilités.

p(A, B) = p(A) x p(B)

49
Q

Qu’est-ce qu’une probabilité conditionnelle?

A

La probabilité qu’un événement survienne si un autre événement s’est produit.

p(A|B)

(Ces événements sont donc dépendants)

50
Q

Q’est-ce que sont les permutations? Quel est l’équation?

A

Tous les arrangements possibles (ordre) des éléments d’un ensemble, si chaque élément est choisi au hasard, sans remise.

P = N! / (N-r)!

51
Q

Q’est-ce que sont les combinaisons? Quel est l’équation?

A

Tous les arrangements possibles, sans tenir compte de l’ordre des éléments, si chaque élément est choisi au hasard, sans remise.

C = N! / r! (N - r)!

52
Q

L’hypothèse élaborée doit être opérationnalisée de deux façons. Quels sont-elles?

A
  • Opérationnalisée en concept mesurable

- Opérationnalisée sous forme statistique

53
Q

Quelles sont les deux types d’hypothèses?

A

Hypothèse nulle (H0) : stipule une absence de différence ou un effet inverse de la VI;

Hypothèse alternative (H1) : correspond à ce que le chercheur veut démontrer.

54
Q

Quelles sont les deux directions pouvant être prises par les hypothèses?

A

Unilatéral: plus petit ou plus grand …

Bilatéral : identique ou différent …

55
Q

Sur quelle hypothèse réalise-t-on le test et quel en est le but?

A

Le test est effectué sur H0 et l’objectif est de rejeté H0.

56
Q

Pourquoi la taille de l’échantillon est important dans une distribution d’échantillonage?

A
  • Plus l’échantillon (n) est grand, plus l’écart-type de la distribution est petit σ / √n
  • Plus l’échantillon (n) est grand, plus l’estimation du paramètre est précise et donc la conclusion inférentielle sûre.
57
Q

Lequel des tests (unilatéral ou bilatéral) est le plus puissant?

A

Le test unilatéral puisqu’il est plus facile de détecter une différence significative.

58
Q

Quels sont les deux types d’erreurs possibles?

A

Erreur de type I ( erreur α)

  • Probabilité de rejeter H0 lorsque H0 est vraie;
  • Conclure qu’il y a un effet alors qu’il n’y en a pas;
  • Le niveau α est généralement fixé entre 1% et 5%.

Erreur de type II ( erreur β)

  • Probabilité de ne pas rejeter H0 lorsque H0 est fausse;
  • Conclure l’absence d’effet alors qu’il y en a un;
  • Le niveau β souhaité est généralement 20%.
59
Q

Qu’est-ce que la sensibilité d’un test statistique?

A

Capacité à donner un résultat positif lorsque l’individu possède réellement l’élément évalué.

Reliée au concept de puissance en statistiques.

60
Q

Qu’est-ce que la spécificité d’un test statistique?

A

Capacité à donner un résultat négatif lorsque l’individu ne possède pas l’élément évalué.

Reliée au non-rejet correct de H0.

61
Q

Quelles sont les cinq étapes de la démarche inférentielle?

A
  1. Identifier les hypothèses statistiques (H0 et H1);
  2. Spécifier le seuil de signification alpha (α);
  3. Préciser le modèle statistique utilisé et effectuer l’analyse;
  4. Décision statistique (rejet ou non-rejet de H0);
  5. Conclusion selon le contexte.
62
Q

Quels sont les quatre points de la troisième étape de la démarche inférentielle?

A

a) Choix du test statistique;
b) Conditions d’utilisation du test;
c) Distribution d’échantillonnage utilisée;
d) Effectuer le test.

63
Q

Quel est le but du test inférentiel sur une moyenne

A

Vérifier si la moyenne observée sur un échantillon est :

  • Plus petite ou plus grande que la moyenne connue ou supposée de la population (Hypothèse unilatérale)
  • Identique ou différente de la moyenne connue ou supposée de la population (Hypothèse bilatérale)
64
Q

Comment choisit-on si on doit utiliser le Test Z ou le Test t sur un échantillon?

A

On utilise le Test Z lorsque l’écart-type de la population est connu alors que le Test t sur un échantillon est utilisé lorsque l’écart-type de la population est inconnu.

65
Q

Quelles sont les conditions d’utilisation de l’étape 3 de la démarche inférentielle pour un Test Z et pour un Test t sur un échantillon?

A

Test Z

  • On a un échantillon;
  • σ est connu
  • Normalité de la distribution d’échantillonnage (n ≥ 30)
  • VD sur une échelle intervalle ou ration

Test t sur un échantillon

  • On a un échantillon;
  • σ est inconnu
  • Normalité de la distribution d’échantillonnage (n ≥ 30)
  • VD sur une échelle intervalle ou ration
66
Q

Qu’est-ce qu’un degré de liberté (dl) ? Comment est-il calculé?

A

Le nombre de valeurs qui peuvent varier sans contrainte dans l’estimation d’un paramètre.

Pour un test t sur un échantillon : dl = n-1