COURS 9 Flashcards

1
Q

Quand pouvons-calculer un paramètre?

A
  • Lorsque nous avons les données d’une mesure dépendante particulière (ex: le score à une échelle) pour une population entière, nous pouvons calculer ce qu’on appelle un paramètre (ex: le score moyen d’une certaine population
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Définition d’une statistique?

A

Cependant, si nous collectons des données seulement à partir d’un sous-ensemble de la population (c.a.d., un échantillon), nous visons à inférer quelque chose à propos de cette population, et cela est appelé une statistique (ex : les statistiques inférentielles)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Quel est le but de l’analyse statistique inférielle?

A
  • Le but de l’analyse statistique inférentielle est d’estimer ou de connaître(même si cela peut être imparfait) les caractéristiques des populations, en se basant sur les caractéristiques des échantillons de ces populations
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle est la première étape de l’analyse quantitative?

A

la première étape de l’analyse quantitative est toujours de
synthétiser les données dans des nombres qui décrivent les caractéristiques de l’échantillon ou de la population – cela s’appelle l’analyse descriptive.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quelles sont les 3 caractéristiques auxquelles l’analyse descriptive s’intéresse?

A

la tendance centrale, la variabilité et la distribution.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

À quoi nous sert les tendances centrales?

A

Cette mesure de la tendance centrale nous dit comment l’échantillon est caractérisé en tant qu’ensemble

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

existe-il plusieurs mesures de tendance centrale? si oui lesquelles?

A

la moyenne et la mediane.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Comment se calcule la moyenne?

A

La moyenne arithmétique est calculée en additionnant tous les éléments de l’ensemble concerné, et en divisant cette somme par le nombre d’éléments additionnés
* Elle est représentée par Xbarre ou M dans les rapports scientifiques

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

La moyenne représente le centre de quoi?

A
  • la moyenne est décrite comme représentant le centre
    de gravité de l’ensemble de données
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Est-ce que la moyenne est affectée par les valeurs extrêmes?

A
  • Lorsque des valeurs extrêmes sont présentes dans l’ensemble de données, elles influencent le calcul de la moyenne, ce qui peut parfois masquer certaines réalités.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Définition de la médiane?

A

La médiane est le score qui divise l’échantillon en deux (50% des scores se trouvent sous la médiane, et 50% des scores se trouvent au-dessus).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Est-ce que la médiane est affectée par les valeurs exrêmes?

A

non.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Définition de la variabilité?

A
  • Les scores des participants d’un ensemble de données ne sont pas tous pareils, et cela crée ce qu’on appelle de la variabilité dans l’ensemble de données.
  • La variabilité d’un ensemble de données peut être décrite comme la dispersion des données autour de la moyenne.
  • Les données peuvent être proches de la moyenne ou plus largement dispersées autour de la moyenne – il s’agit donc d’une distance.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Comment on peut décrire avec une mesure la variabilité d’une distribution?

A

avec l’écart-type (erreur standard).
* En termes simples, l’écart-type d’une population / l’erreur standard d’un échantillon est la moyenne de l’écart de
chaque donnée individuelle par rapport à la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quel est le symbole de l’écart type (EN METHO PAS ANALYSE)

A

SD ou sigma.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

un SD plus élevé représente quoi?

A

un haut niveau de variabilité dans les données (la distance entre les scores individuels est en moyenne plus élevée)
vice versa.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Est-ce que le SD affecte la forme de la distribution?

A

oui

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Est-ce que le test t nécessite des données normalement distribuées?

A

Les tests t nécessitent que la distribution des données respecte la loi normale.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Comment fait-on pour avoir une vue d’ensemble sur la distribution?

A

construire une distribution de fréquence des données (histogramme, diagramme à batons)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

comment fait-on pour calculer un intervalle de confiance de 95%?

A

Moyenne + ou - 2 *SD

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Que stipule le théorème central limite?

A

il stipule que lorsque de nombreux échantillons d’une population sont tirés, la distribution de l’échantillonnage qui en résulte devient de plus en plus normale lorsque la taille globale de l’échantillon augmente — peu importe la forme de la distribution de la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

Nomme différentes formes de distribution (4)

A

normale, uniforme (————), exponentielle, asymétrique vers la droite/gauche)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

pouvons-nous trouver u (mu) à partir des échantillons d’une population?

A

oui, si nous prenions la moyenne de tous les échantillons de la distribution, elle serait égale à la moyenne de la population - si la taille de l’échantillon global est suffisamment grande.

De manière similaire, si l’on calculait l’erreur standard de tous les échantillons et si l’on mesurait leur moyenne, elle correspondrait à l’écart type de la population.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

Dans quelle situation pouvons-nous obtenir une estimation normalement distribuée de la moyenne et de la variance d’une population?

A
  • Cela signifie que nous pouvons obtenir une estimation normalement distribuée de la moyenne et de la variance d’une population avec un échantillon suffisamment grand !
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Les statistiques inférentielles utilisent-elles un échantillon ou une population?

A

Les statistiques inférentielles utilisent un échantillon de la population pour caractériser quelque chose qui est vrai à propos de cette population.
Les statistiques inférentielles créent des énoncés sur la probabilité qu’un résultat basé sur un échantillon, en fait, soit également observé dans la population.

26
Q

vrai ou faux, la différence entre 2 moyennes est presque toujours zéro?

A

faux, La différence entre deux moyennes ne sera presque jamais zéro. C’est parce qu’il y a toujours une certaine quantité d’erreur d’échantillonnage dans nos observations

27
Q

définition de l’erreur d’échantillonage?

A

L’erreur d’échantillonnage est la différence entre la statistique de l’échantillon utilisée pour estimer un paramètre de la population et la vraie valeur du paramètre, qui nous est inconnue.

Cela signifie que même si nous avions suivi tous les conseils vus dans le cours à la lettre jusqu’à maintenant et que nous avions conduit l’expérience parfaite, nous pourrions quand même observer une différence entre les groupes qui n’est pas réelle, à cause de l’erreur d’échantillonnage – nous pouvons également appeler cela la chance aléatoire.
* La moyenne de l’échantillon observée pourrait refléter la vraie mesure trouvée dans la population, ou une erreur d’échantillonnage, ou une combinaison des deux.

28
Q

Pourquoi les statistiques inférentielles sont-elles une solution aux erreurs d’échantillonnage?

A
  • Les statistiques inférentielles sont donc utilisées pour calculer la probabilité qu’une différence observée entre les moyennes dans une étude reflète l’erreur plutôt que la différence réelle.
  • Parce qu’on assume que les échantillons sont distribués normalement, nous pouvons utiliser la moyenne de l’échantillon et sa mesure de variance, appelée l’erreur standard (ES), pour estimer les paramètres de la population
29
Q

Suite au calcul de l’erreur standard, comment faisons-nous une conclusion concernant les différences des échantillons?

A
  • Lorsque cela est fait, nous pouvons prendre une décision par rapport à si deux moyennes d’échantillons sont suffisamment différentes pour que la différence soit acceptée comme vraie, et non due à l’erreur d’échantillonnage.
30
Q

Quelle est la première étape des statistiques inférentielles?

A
  • Les statistiques inférentielles commencent par un énoncé de l’hypothèse nulle et de l’hypothèse alternative (ou de recherche)
  • H0 (hypothèse nulle) est simplement que les moyennes de la population sont égales et que la différence observée est due à une erreur.
  • H1 (hypothèse de recherche) est que les moyennes de population ne sont en fait pas égales.
31
Q

Dans quelle situation (hypothèse) y a-t-il un chevauchement complet entre les distributions de 2 population?

A

lorsque H0 est vrai.

32
Q

Dans quelle situation (hypothèse) y a-t-il très peu de chevauchement entre les distributions de 2 populations?

A

lorsque H1 est vraie.

33
Q

Définition du test t indépendant? il estime quoi?

A
  • Le test t indépendant estime s’il existe une différence réelle entre les moyennes de deux groupes, en utilisant la différence des moyennes des groupes par rapport à l’erreur standard combinée des deux groupes
  • Lorsque les échantillons sont évalués en utilisant un test t, une distribution t est utilisée
  • La distribution t est utilisée à la place de la distribution normale parce que les vraies moyenne et variance des populations sont inconnues, et on utilise donc une estimation par échantillonnage - mais un échantillon est distribué normalement seulement si la taille d’échantillon est suffisante - la distribution t tient donc compte de la taille de l’échantillon.
  • Toutefois, la distribution t se rapproche de la forme de la distribution normale lorsque la taille d’échantillon augmente, reflétant ce que nous savons à propos du théorème central
    limite : un échantillon devient distribué normalement avec une taille d’échantillon assez grande.
34
Q

Est-ce que la distribution t tient compte de la taille de l’échantillon?

A

oui.
La forme de la distribution t est donc dépendante de la taille d’échantillon, qui estcaractérisée par le nombre de degrés de liberté (df).

35
Q

Comment se calcule le nombre de degrés de liberté?

A

il est calculé en utilisant les tailles d’échantillons des deux groupes: N1 + N2 – 2 (ou le nombre total de participants moins le nombre total de groupes)

36
Q

La distribution t est arrangée en assumant que ___ est vraie

A

hypothèse nulle (H0).
C’est pourquoi il y a une valeur t de 0 au centre de la distribution t– cela reflète une absence de différence entre les moyennes des populations.

37
Q

Quelles est la formule pour un test t indépendant?

A

t = différence intergroupe / variabilité d’échantillonnage
* La différence intergroupe est simplement la différence entre les deux moyennes.
*La variabilité d’échantillonnage est la quantité de variabilité combinée des scores qui entourent les moyennes.
* Le dénominateur est essentiellement une estimation de la quantité d’erreur d’échantillonnage dans les échantillons.

38
Q

Dans quelle situation la valeur de t augmente-elle?

A
  • La valeur de t augmente lorsque la différence entre les moyennes d’échantillon obtenues augmente.
    (mais seulement quand la variabilité d’échantillonnage est
    suffisamment faible.)
39
Q

formule de la variabilité d’chantionnage?

A

racine carrée ( SD1^2/N1 + DS2^2/N2)

40
Q

pouvons-nous évaluer la probabilité que la différence entre les moyennes de 2 groupes soit due à une erreur ou non avec la distribution t?

A

Oui, tout comme lorsque nous avons utilisé la distribution normale pour calculer l’intervalle de confiance d’une population, nous pouvons utiliser la distribution t pour évaluer la probabilité que la différence entre la moyenne de deux groupes soit due à l’erreur, ou non.
* Parce que la distribution t est symétrique, tout comme la
distribution normale, 95% des valeurs t possibles tombent de
chaque côté de la courbe de manière égale
* Cela signifie qu’une valeur t calculée devrait se situer dans la zone de 95% sous la courbe, 95% du temps.
* Une valeur t plus élevée représente une plus grande
différence entre les deux moyennes avec un niveau suffisamment faible de variance combinée estimée –rappelez-vous, cette statistique est une estimation de si les deux populations sont différentes ou non
* Cela signifie qu’une valeur t doit être suffisamment grande pour se trouver en dehors de la zone de 95% sous la courbe
* À cause de cela, si une valeur t calculée tombe sous cette région 95% de la courbe, elle est considérée comme une valeur probable observée si l’hypothèse nulle est vraie – la valeur t n’a donc pas été suffisamment grande pour convaincre que les deux populations sont différentes –dans ce cas, nous acceptons l’hypothèse nulle.
*Toutefois, si la valeur t est assez grande pour tomber en-dehors du 95% sous la courbe, la probabilité que l’hypothèse nulle soit vraie est maintenant assez faible pour que nous puissions affirmer avec confiance que les deux populations sont différentes – dans ce cas, nous rejetons l’hypothèse nulle et acceptons
l’hypothèse de recherche.

41
Q

Dans quelle situation on dit que les résultats sont statistiquement significatif?

A

lorsqu’on accepte l’hypothèse de recherche. (H1)

42
Q

Définition du seuil critique du test t?

A
  • Pour qu’une valeur t indique que le résultat est statistiquement significatif, elle doit être assez grande pour tomber à l’extérieur de
    la région 95% sous la courbe– lorsque c’est le cas, on dit qu’elle dépasse un seuil critique.
43
Q

Est-ce que la distribution t contient toutes les valeurs de t possibles?

A

oui.

44
Q

complétez : Les degrés de liberté augmentent avec ____

A

la taille de l’échantillon.

45
Q

Qu’est-ce que le niveau alpha?

A

Lorsqu’une valeur t tombe à l’extérieur de la région % sous la courbe, et nous rejetons l’hypothèse nulle, nous disons que la valeur t dépasse un seuil critique.
Le % restant est le seuil alpha.
* Cela signifie que le niveau alpha sélectionné est lié à la
probabilité d’erreur dans un test statistique que le chercheur est prêt à tolérer

46
Q

Avec un niveau alpha de 5%, il faut s’attendre à quoi?

A

Avec un niveau alpha de % sélectionné, il faut s’attendre à ce
que 5 fois sur 100, nous allons obtenir, par chance, une valeur t
qui dépasse le seuil, alors qu’en réalité il n’y a pas de différence
entre les deux populations.

Un alpha de 5% est un choix standard, mais il peut être ajusté
pour être plus conservateur (ex: 1%).

47
Q

En quoi consiste la direction de notre hypothèse?

A
  • Avant d’utiliser la distribution t, nous devons également déterminer la direction de notre hypothèse
  • Si notre hypothèse est directionnelle (ex:, Groupe 1 > Groupe 2), nous pourrions utiliser un test t unilatéral
  • Si notre hypothèse est simplement que les deux groupes sont différents (ex:, Groupe ≠ Groupe ), nous utiliserons un test t bilatéral
48
Q

que doit-on faire lorsque nous avons un test bilatéral pour ajuster notre niveau alpha?

A
  • Lorsque nous utilisons un test t bilatéral, nous divisons le niveau alpha en deux et le plaçons de chaque côté de la distribution t - pour un niveau alpha standard de 0.05, cela signifie que 0.025 est placé de chaque côté de la courbe
  • C’est parce que la différence entre les groupes pourrait aller dans les deux sens (ex:, Groupe 1 > Groupe 2 OU Groupe 1 < Groupe 2) - et donc la valeur t pourrait être située à gauche ou à droite de la courbe, selon le groupe qui a la moyenne la plus élevée.
  • Pour les tests bilatéral et unilatéral, le niveau alpha global est le même - cela signifie qu’il y a la même probabilité d’erreur (ex: 5% pour un niveau alpha standard)
  • Un test unilatéral place simplement la probabilité totale d’erreur d’un côté de la courbe, tandis qu’un test bilatéral divise la probabilité et la place des deux côtés de la courbe.
49
Q

Quel est l’avantage majeur d’un test unilatéral?

A
  • L’utilisation d’un test unilatéral présente un avantage majeur : en plaçant l’ensemble du niveau alpha d’un côté de la courbe, le seuil pour obtenir une valeur t suffisamment grande pour rejeter l’hypothèse nulle est diminué - vous voyez que cela reflète une plus grande zone sous la courbe qui représente le niveau alpha
  • Cependant, un test t unilatéral ne peut être utilisé que s’il y a vraiment une direction spécifique présumée avant l’expérience (ex: Groupe 1 > Groupe 2).
50
Q

définition du T critique?

A
  • La valeur t que nous devons dépasser pour que notre résultat soit considéré comme significatif est appelée le « t critique »
  • Nous pouvons utiliser le tableau de t critiques pour trouver la valeur que nous devons dépasser
  • Pour trouver le « t critique » dans cette exemple, vous avez besoin des informations suivantes :
    1) Les degrés de liberté (ex: 18)
    2) L’alpha (ex:, test bilatéral; seuil = 0,05 / 2 = 0,025)
  • Essentiellement, la valeur du t critique prend en compte les degrés de liberté et le niveau alpha choisi et ajuste la distribution t
    en conséquence - créer un seuil critique
  • C’est cette distribution t spécifique qui sera utilisé pour déterminer exactement quelle région sous la courbe contient 95% des valeurs t possibles, et quelles valeurs t vont tomber dans les 5% restants qui correspondent au niveau alpha.
51
Q

Quelle est la valeur-p?

A
  • Nous pouvons également caractériser ce résultat en utilisant la valeur-p
  • La valeur-p est la probabilité que l’hypothèse nulle soit vraie – et se situe entre 1 et 0
  • Par exemple, si la valeur-p vaut 0.25, alors il y a 25% de probabilité qu’il n’y a aucune différence réelle entre les populations
  • Si la valeur-p dépasse un seuil sélectionné, elle indique alors que le résultat est significatif
  • Parce que notre valeur t a dépassé le seuil fixé par notre alpha de 5%, nous pouvons dire que ce résultat a un p < 0.05 (un risque
    d’erreur inférieur à 5%).
52
Q

Définition de l’ANOVA (concernant les hypothèses)?

A

Lorsque l’hypothèse nulle (H0) est vraie, il y a un chevauchement
complet entre les trois (ou plus) distributions des populations.

Lorsque l’hypothèse de recherche (H1) est vraie, il y a très peu de
chevauchement entre les trois (ou plus) distributions des populations.

53
Q

Définition de la taille de l’effet?

A
  • Maintenant que nous savons comment déterminer si un effet est significatif, nous devons ensuite considérer un autre aspect très important d’un résultat : la taille d’effet
  • Une fois que nous sommes confiants qu’un effet est significatif, tel que déterminé par la valeur-p – nous devons ensuite considérer si la différence significative veut vraiment dire quelque chose
  • Par exemple, la différence entre deux moyennes pourrait être significative et forte (Groupe 1 = 67; Groupe 2 = 21) ou la différence pourrait être significative, mais très faible (Groupe 1 = 55; Groupe 2 = 53)
  • Dans le deuxième cas, le test statistique nous a dit qu’il est improbable que les deux moyennes proviennent de la même population, mais l’ampleur de l’effet est très petit –nous dirions donc que cet effet a une faible taille d’effet
  • Les chercheurs doivent donc considérer et le niveau de significativité (valeur-p) et le taille d’effet d’un résultat, afin de faire une interprétation adéquate.
54
Q

Quelle est la méthode pour calculer la taille de l’effet?

A
  • Une méthode commune pour calculer une taille d’effet pour deux moyennes d’échantillons est d’utiliser le d de Cohen.
    M2 - M1 / racine carrée ( (SD1^2 + SD2^2) / 2 )
    SD1 = erreur standard groupe 1
    SD2 = erreur standard groupe 2
    M1 = moyenne grp 1
    M2 = moyenne grp 2.
55
Q

Comment est considéré la taille de l’effet (échelle lorsque considéré faible, moyenne…)?

A
  • Un d de Cohen de 0,2 est considéré comme une taille d’effet «petite »,
  • Un d de Cohen de 0,5 représente une taille d’effet « moyenne »,
  • Un d de Cohen de 0,8 représente une « grande » taille d’effet.
  • Un résultat qui est significatif et a une grande taille d’effet veut vraiment dire quelque chose, comparé à un résultat qui est significatif mais a une petite taille d’effet.
  • Parfois, la taille d’effet est plus importante que la valeur-p d’un résultat
  • Cela est vrai lorsque les échantillons à l’étude ont une immense taille
56
Q

Quel est le problème avec les échantillons d’immense taille?

A
  • Le problème avec un échantillon aussi grand, c’est que n’importe quel minuscule résultat aura une valeur-p qui permettra de rejeter l’hypothèse nulle.
  • Toutefois, si un résultat significatif a une très petite taille d’effet (ex: Groupe 1 : 67%; Groupe 2: 67.5%), cela ne veut rien dire.
  • Dans ces types d’études, c’est la taille d’effet qui est utilisée pour déterminer si un résultat représente une réelle différence entre les moyennes des échantillons.
  • Dans cette étude, nous avons demandé aux participants de jouer à un « jeu » de labyrinthe sur leur téléphone cellulaire qui est similaire à la tâche du labyrinthe virtuel 4 sur 8 que nous utilisons au laboratoire.
57
Q

la probabilité d’une erreur de type I est déterminée par ____.

A

La probabilité d’une erreur de type I est déterminée par le choix du seuil de signification ou alpha (ex: 0,05

58
Q

La probabilité de commettre une erreur de type II est déterminée par trois facteurs, lesquels?

A

1) L’alpha que nous choisissons : si nous fixons un alpha très faible (ex: 0,000005) pour éviter de faire une erreur de type I, nous augmentons nos chances de faire une erreur de Type II !

2) La taille de l’échantillon : les différences réelles sont plus susceptibles d’être détectées lorsque la taille de l’échantillon est plus grande

3) La taille de l’effet: si la taille de l’effet est grande, une erreur de type II est peu probable - cependant, des tailles d’effet plus petites peuvent produire un résultat insignifiant même lorsque l’effet est réel.

59
Q

Un chercheur pourrait obtenir un résultat non significatif pour de nombreuses raisons, lesquelles?

A
  • Le résultat d’une seule étude peut être non significatif même si la relation existe réellement dans le monde (erreur de type II)
  • Un chercheur pourrait obtenir un résultat non significatif pour de nombreuses raisons dont nous avons discuté dans ce cours, y compris :
    ▪ Des instructions expérimentales incompréhensibles données au participant
    ▪ Une manipulation inadéquate de la variable indépendante
    ▪ L’utilisation d’une mesure dépendante peu fiable
  • Dans ces situations, au lieu de conclure que l’hypothèse nulle est correcte, il peut être plus approprié d’exécuter une étude plus soigneusement menée
  • Si une expérience est répétée plusieurs fois utilisant des méthodes bien conçues et l’hypothèse nulle continue d’être soutenue, nous pouvons être plus confiants que c’est la bonne décision.
60
Q

Qu’arrive-t-il lorsque nous effectuons trois tests statistiques dans une même étude?

A
  • Si nous avions trois groupes que nous voulions comparer, nous devrions effectuer trois tests t (groupe 1: groupe 2; groupe 1: groupe 3; groupe 2: groupe 3).
  • Chaque nouveau test t ajoute à notre probabilité de faire une erreur de type I !
  • Nous devons donc corriger notre niveau ou “seuil” alpha pour les comparaisons multiples
  • Une façon commune de faire cela est d’utiliser une correction de Bonferroni.
61
Q

comment se calcule le niveau alpha corrigé avec la correction de Bonferroni?

A

alpha corrigé = seuil alpha original / qte de test statistique effectués