1 - Introduction et Notions de base Flashcards

1
Q

2.Révision des principes de base en statistiques

Les statistiques sont un ____ qui nous permet de répondre à ces questions en utilisant des ____ , c’est-à-dire en rassemblant plusieurs ____ ensemble pour faire émerger des ____

A

Les statistiques sont un outil qui nous permet de répondre à ces questions en utilisant des données, c’est-à-dire en rassemblant plusieurs observations ensemble pour faire émerger des tendances

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

3.Qualitatif vs Quantitatif

Méthodes quantitatives
- Utilisent des ____ ____ pour ____ et ____ des évènements.
- On se base sur les ____ pour arriver à nos conclusions

A

○ Utilisent des données numériques pour décrire et analyser des évènements.
On se base sur les mathématiques pour arriver à nos conclusions

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

3.Qualitatif vs Quantitatif

Méthodes qualitatives
- Utilisent habituellement le ____ pour tester et créer des ____
- Elles visent habituellement plus à faire quoi ? (2)

A

○ Utilisent habituellement le langage pour tester et créer des théories.
Elles visent habituellement plus à décrire un phénomène et l’approfondir davantage pour le comprendre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

3.Qualitatif vs Quantitatif

vrai ou faux
Les méthodes quantitatives sont meilleures que les méthodes qualitatives

A

Les méthodes sont complémentaires, l’une n’est pas meilleure que l’autre.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

4.Processus de recherche

Nomme les 6 étapes du processus de recherche

A
  • Observation d’un événement et création d’une question de recherche
    • Proposition d’une théorie pour expliquer l’événement
    • Construction d’une hypothèse basée sur la théorie
    • Prédictions sur ce qui devrait être observé si la théorie est vraie
    • Collecte de données
    • Analyse des données
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

7.Variables

  • nomme les 2 Types de variables, quelle varie en fonction de quelle
  • Prévalence de troubles narcissiques dans OD : dans cette exemple, nomme quelle variable est quelle
A

○ Dépendantes (VD) : varient en fonction des variables indépendantes (VI)
Ex. Prévalence de troubles narcissiques (VD) dans un contexte donné (VI)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

7.Variables

Les variables peuvent être modélisées de différentes façons, nommes en 2

A

○ Discrètes (catégoriques)
○ Continues

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

8.Devis expérimentaux

  • Nomme les 2 types de devis et explique leur différence (definition + causalité)
A

○ Corrélationnel : établir un lien entre des variables
§ Pas de causalité : il n’a pas de manipulation, c’est plus des observations
○ Expérimental : observer l’effet de la manipulation d’une variable sur une autre
§ Il a de la causalité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

8.Devis expérimentaux

vrai ou faux
Seulement les devis expérimental sont valides

A

f
Les deux sont valides, c’est juste les conclusions qui diffèrent

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

8.Devis expérimentaux

  • Nomme et défini les 3 desings
A
  • Between-subjects / devis indépendant : participants différents entre les conditions (Ex : étude concernant une lésion au cerveau qui est pas réversible)
  • Within-subjects / devis à mesures-répétées : mêmes participants entre les conditions
  • Mixtes : combinaison des deux
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

8.Devis expérimentaux

Quel est le meilleur et plus puissant design ? Explique pk

A

§ Devis plus puissant et meilleur, donc si possible l’utiliser
Raison : pas de variations entre les participants dû au hasard

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

9.Devis expérimentaux et causalité

Vrai ou faux
Le test statistique (ex : corrélation, régression) détermine si on peut établir un lien causal

A

F
C’est le devis de recherche qui détermine si on peut établir un lien causal, PAS le test statistique / équation mathématique (ex : corrélation, régression).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

9.Devis expérimentaux et causalité

C’est le devis de recherche qui détermine si on peut établir un lien causal, PAS le test statistique / équation mathématique (ex : corrélation, régression).
* Les devis corrélationnels permettent de se prononcer uniquement sur quoi?
* Les devis expérimentaux permettent d’établir quoi?
*Différents modèles statistiques sont appropriés pour différents ____

A
  • Les devis corrélationnels permettent de se prononcer uniquement sur la co occurrence.
    • Les devis expérimentaux permettent d’établir la causalité lorsqu’on compare à une condition contrôle.
      *Différents modèles statistiques sont appropriés pour différents devis.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

10.Variation systématique vs non-systématique

Nomme, pour la variance systématique vs non-systématique :
- Causée par quoi
- Un exemple

A
  • Systématique : causée par une manipulation (signal)
    ○ Ex : Je recois un test à répondre = ça va affecter mon stress
    • Non-systématique : causée par des facteurs aléatoires (bruit)
      ○ Ex : Certains sont plus anxieux que d’autres
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

10.Variation systématique vs non-systématique

On veut maximiser le ____ et minimiser le ____
- Lorsqu’on fait des stats, on veut ça: ____ / ____ > 1

A

On veut maximiser le signal et minimiser le bruit :
Lorsqu’on fait des stats, on veut ça: Signal / Bruit > 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

10.Variation systématique vs non-systématique

Signal / Bruit > 1
- Qu’est ce qui doit être plus grand? Pourqoi?
- Qu’est ce qui doit être plus petit? Donne 2 exemples et ça varie selon quoi

A

○ Signal doit être plus grand = on veut une une plus grande moyenne/effet pour avoir une plus grande significativité
§ Le maximiser, c’est ce qu’on va mesurer

	○ Bruit doit être plus petit 
		§ On veut minimiser écart type, variation intra groupe, etc selon le test
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

10.Variation systématique vs non-systématique

Signal / Bruit > 1
Autrement dit, on veut qu’un plus grande part de la variance soit causée par des ____ que par des ____ ____

A

Autrement dit, on veut qu’un plus grande part de la variance soit causée par des manipulations que par des facteurs aléatoires.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

11.Analyse des données

*La plupart des tests vont se baser sur une ____ de ____, qu’on peut représenter par un ____
*Plusieurs phénomènes naturels décrivent une ____ ____
*Sa forme varie en fonction de quels 2 éléments?

A

*La plupart des tests vont se baser sur une distribution de fréquences, qu’on peut représenter par un histogramme.
*Plusieurs phénomènes naturels décrivent une courbe normale.
*La forme de la courbe normale varie en fonction de la moyenne et l’écart-type.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

11.Analyse des données

Moyenne influence ____ de la courbe (fait une ligne ____ )
Écart type influence l’ ____ de la courbe (fait une ligne ____ )

A
  • Moyenne influence positionnement de la courbe (fait une ligne horizontale)
    Écart type influence l’aplatissement de la courbe (fait une ligne verticale)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

11.Analyse des données

  • nomme le Modèle de stats le plus utilisé
  • quel est l’impact Si pas distribué normalement (on assume)
A

Modèle de stats le plus utilisé : modèle linéaire général
- Si pas distribué normalement (on assume), les résultats seront pas utilisés pour décrire de manière valide un phénomène

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

12.Mesures utiles pour l’interprétation de la courbe normale

  • Nomme les 3 mesures de tendance centrale
  • Nomme les 3 mesures de dispersion
A
  • Tendance centrale :
    ○ Moyenne, mode, médiane
    • Dispersion :
      ○ Déviation, variance, écart-type
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

12.Mesures utiles pour l’interprétation de la courbe normale

  • explique dans un graphique a quoi ressemble la symétrie négative, symétrie positive, la mésokurtique et la platykurtique
A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

12.Mesures utiles pour l’interprétation de la courbe normale

  • La moyenne vs l’écart type influencent quoi?
  • Nomme qui est le plus influencé par les données abérrantes : moyenne, mode ou médiane?
A
  • Moyenne influence le positionnement de la courbe normale vs Écart type influence la dispersion
  • Moyenne très sensible a des problèmes d’asymétrie et les données aberrantes, Médiane et mode seront moins influencés par l’asymétrie et les données aberrantes
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

13.Analyses sur la courbe normale

  • À partir de notre distribution de fréquences, on peut calculer quoi?. À l’aide de ça, on peut calculer quoi?
  • On va utiliser ce genre de statistiques pour calculer quoi?
A

*À partir de notre distribution de fréquences, on peut calculer la fonction de densité de la probabilité (probabilitydensity function). À l’aide de ça, on peut calculer quelles sont les chances d’obtenir une valeur par hasard.
*On va utiliser ce genre de statistiques pour calculer si les différences entre des échantillons ou des modèles statistiques sont significatives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

13.Analyses sur la courbe normale

  • quel est le seuil identifié pour déterminer la significativité ?
  • Explique pourquoi ce seuil est un chiffre imparfait
A

Probabilité d’obtenir est en haut de 5% (0,05) : résultats pas significatifs
Garder en tête : c’est un chiffre arbitraire créé par Fisher, importance de prendre en compte le contexte

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

14.Présentation des résultats

  • Lorsque les analyses ont été faites, on doit rédiger un ____ (ex. un ____ ) dans lequel on présente nos résultats.
  • En psychologie, on suit quelles recommendations (de qui) pour la présentation des résultats? Les journaux aussi?
A

*Lorsque les analyses ont été faites, on doit rédiger un rapport(ex. un article) dans lequel on présente nos résultats.
*En psychologie, on suit les recommandations de l’APA pour la présentation des résultats. Les journaux ont parfois des exigences spécifiques aussi.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

14.Présentation des résultats

  • Nomme et explique 3 aspects importants de la présentation des résultats
A
  • Soyez clairs et brefs.
    - Être clairs et concis, pas trop s’éterniser dans les résultats, ne pas s’éterniser, plus court = meilleur
  • Utilisez la meilleure modalité entre une phrase, un tableauou un graphique.
  • Soyez constants dans votre façon de présenter les résultats (ex. utilisez toujours les mêmes symboles).
    - Permet de pas être mêlé en lisant
28
Q

14.Présentation des résultats

vrai ou faux
Toujours rapporter la taille d’effet

A

v

29
Q

Bases de l’analyse statistique

Modèles statistiques
- En statistique, on se base sur des ____ pour générer des modèles statistiques.
- Ces modèles nous permettent quoi? (2)
- Il faut donc que notre modèle soit ____ de nos données.
- En statistiques, on applique nos modèles à des ____ , mais on les construit à partir de données ____ .

A

En statistique, on se base sur des données pour générer des modèles statistiques.
Ces modèles nous permettent de représenter le monde réel et de faire des inférences sur son fonctionnement.
Il faut donc que notre modèle soit représentatif de nos données.
En statistiques, on applique nos modèles à des populations, mais on les construit à partir de données d’échantillons.

30
Q

Bases de l’analyse statistique

Modèles statistiques
- explique le fit des modèles stats

A

Faut que le modèle fit :
Si je veux faire un modèle / maquette du pont champlain, je peux pas appliquer la maquette du pont george pour le vrai pont champlain. On va essayer de faire une prédiction de l’application du modèle aux situation de la vraie vie

31
Q

Bases de l’analyse statistique

Le modèle linéaire
- - Le modèle le plus utilisé en statistiques est lequel?

A

le modèle linéaire général.

32
Q

Bases de l’analyse statistique

Le modèle linéaire
- Il s’agit de modèles basés sur quoi?
- Explique sa popularité

A

Il s’agit de modèles basés sur des variations linéaires entre les variables.
La majorité des statistiques rapportées dans les articles utilisent le modèle linéaire.

33
Q

Bases de l’analyse statistique

Le modèle linéaire
V ou F
Si pas linéaire, vaut pas la peine d’essayer
V ou F
Si un petit peu courbé, pas possible d’utiliser régression linéaire pour avoir un fit, mais le garder en tête

A

V
Si pas linéaire, vaut pas la peine d’essayer
F
Si un petit peu courbé, possible d’utiliser régression linéaire pour avoir un fit modérer, mais le garder en tête

34
Q

Bases de l’analyse statistique

Modèles statistiques - Fonctionnement
Les modèles statistiques ont des noms compliqués (test T, ANOVA, régression, modération/médiation, modèle linéaire multiniveau, régression logistique, etc.).
Tous les modèles se résument par une équation, nomme la

A

Résultats = Modèle + Erreur
Modèle ( équation choisie qui donne prédiction )

35
Q

Bases de l’analyse statistique

Modèles statistiques - Paramètres
- Les paramètres d’un modèle statistique permettent de décrire quoi

A

comment une variable influence les résultats.

36
Q

Bases de l’analyse statistique

Modèles statistiques - Paramètres
- Une variable indépendante (X) pourrait varier en fonction d’un paramètre (b). L’équation pourrait alors être représentée comment?
- Si on ajoute une autre variable (X2), elle aussi pourrait s’expliquer par un paramètre (b2), comment l’équation pourrait alors être représentée?

A

Une variable indépendante (X) pourrait varier en fonction d’un paramètre (b). L’équation pourrait alors être représentée ainsi :
Résultats = bX + Erreur
Si on ajoute une autre variable (X2), elle aussi pourrait s’expliquer par un paramètre (b2) :
Résultats = bX + bX2 + Erreur

37
Q

Bases de l’analyse statistique

Modèles statistiques
- Lorsqu’on construit un modèle statistique optimal, on veut minimiser quoi

A

l’erreur

38
Q

Bases de l’analyse statistique

Modèles statistiques – L’erreur
- Une valeur souvent utilisée pour calculer l’erreur est quoi?
- Explique les 3 étapes pour faire cela
- Comment interpréter le résultat final?

A

Une valeur souvent utilisée pour calculer l’erreur est la somme des carrés
.
Exemple: Si notre modèle correspond à la moyenne, on pourrait calculer la somme des écarts au carré
- ∑(Valeur - Moyenne)²
Si on divise cette valeur par le nombre de degrés de liberté, on obtient la variance.
En prenant la racine carrée de la variance, on obtient l’écart-type.
.
Plus la somme des écarts au carré est élevée, moins le modèle est bon car les erreurs de prédiction sont pas minimisées

39
Q

Bases de l’analyse statistique

Modèles statistiques – Le « fit »
- Explique ce que signifie le fit aux modèles statistiques
- explique le fit de la moyenne vs écart type et ce que cela signifie

A

Lorsqu’on calcule un modèle, on veut minimiser l’erreur.
- Par exemple, l’équation de la moyenne donne une valeur pour laquelle l’erreur est minimisée.
Cela ne signifie pas nécessairement que le modèle s’applique bien aux données, mais plutôt que c’est celui qui s’applique le mieux aux données
Si l’écart-type est élevé, la moyenne peut être un mauvais modèle pour prédire une donnée.
.
Moyenne toujours le meilleur fit de tendance centrale possible, mais ÉT permet de dire si c’est bonne ou mauvaise facon de décrire échantillon (ÉT petit = tout le monde se trouve près de la moyenne)
Le meilleur fit peut être le meilleur mais tout de même être mauvais

40
Q

Bases de l’analyse statistique

Distribution d’échantillonnage
- Si on calcule les mêmes paramètres dans différents échantillons, on observe quoi?
- Explique en quoi ça consiste
- Avec 100 échantillons, on obtient quoi? Qui visualise quoi?

A

Si on calcule les mêmes paramètres dans différents échantillons, on observe des variations aléatoires (du bruit).
Les échantillons se rapprochent de la moyenne de la population sans atteindre la valeur exacte.
Avec 100 échantillons, on obtient une distribution d’échantillonnage qui visualise les moyennes d’échantillons.

41
Q

Bases de l’analyse statistique

Distribution d’échantillonnage
- Qu’est ce qu’on veux approximé? (nom + c quoi)
- Comment ça peut être approximé? (calcul)

A

L’écart-type de cette distribution, appelé erreur standard, peut être approximé comme suit :
SE = s / √N

42
Q

Bases de l’analyse statistique

Distribution d’échantillonnage
- Si on veut trouver la distribution des échantillons, quel outil j’utilise? Et ce pour trouver quel score?
- Quel est le calcul?
- Ça veut dire quoi si ce score est plus élevé?
- Décrit ce score la représente quoi

A
  • Utiliser la table z pour trouver le score z
  • Valeur - moyenne / ÉT
    • Score z plus élevé = moins de probabilité qu’on obtient cette valeur
  • Score z ; nombre d’ÉT par rapport à la moyenne ( ex : z= 3 = à 3 écarts types de la moyenne qui est centrée à 0)
43
Q

Bases de l’analyse statistique

Intervalles de confiance
- explique en quoi ça consiste et on utilise quoi pour le trouver

A

On utilise l’erreur standard pour estimer les bornes entre lesquelles la moyenne de population se trouve probablement : donne une mesure de l’incertitude

44
Q

Bases de l’analyse statistique

Intervalles de confiance
- Pour l’intervalle de confiance, l’idée est de définir un intervalle qui possède quelle caractéristique?
- Avec un échantillon suffisamment ____, la distribution d’échantillonnage suit une forme ____ . On peut donc utiliser les propriétés de la ____ ____ pour définir un intervalle de confiance avec la ____ que nous désirons
- Typiquement, une probabilité de ____ % est utilisée

A
  • L’idée est de définir un intervalle pour lequel nous connaissons la probabilité que la moyenne de population s’y trouve.
  • Avec un échantillon suffisamment grand, la distribution d’échantillonnage suit une forme normale. On peut donc utiliser les propriétés de la courbe normale pour définir un intervalle de confiance avec la probabilité que nous désirons.
  • Typiquement, une probabilité de 95% est utilisée
45
Q

Bases de l’analyse statistique

Intervalles de confiance
- Comment calculer la probabilité de 95% pour la borne inférieure vs supérieure? (formules)
- Et pour une autre probabilité, quelle est la formule?

A

Pour une probabilité de 95 % :
Borne inférieure = X - (1.96 × SE)
Borne supérieure = X + (1.96 × SE)
Pour une autre probabilité, on utilise Z au lieu de 1.96 :

46
Q

Bases de l’analyse statistique

Tests d’hypothèse
Lors d’un test d’hypothèse :
- Nomme les 4 étapes

A
  1. On assume que l’hypothèse nulle (H₀, absence d’effet) est vraie.
  2. On ajuste un modèle représentant l’hypothèse alternative et on vérifie son ajustement.
  3. On calcule la probabilité (p) d’obtenir ce modèle si H₀ est vraie.
  4. Si cette probabilité est petite (p < 0.05), on conclut que le modèle s’ajuste bien aux données, soutenant l’hypothèse alternative et non-rejet de l’hypothèse nulle
47
Q

Bases de l’analyse statistique

Tests statistiques
- Pour savoir si un modèle s’ajuste bien aux données, Test statistique = ____ / ____ = ____ / ____ = ____ / ____
- En d’autres mots, on veut voir si quoi? Donne 2 exemples
- Quel est l’impact si ces valeurs sont plus grandes? Dit le en d’autres mots

A
  • Test statistique = Signal / Bruit =(même chose que) Variance expliquée / Variance non expliquée =(même chose que) effet / erreur
  • En d’autres mots, on veut voir si la part de variation causée par l’effet est suffisamment plus importante que celle causée par l’erreur. Exemples: t, F
  • Plus ces valeurs sont grandes, moins elles sont probables. Autrement dit, plus le signal est grand par rapport au bruit, moins il y a de chance que l’hypothèse nulle soit vraie.
48
Q

Bases de l’analyse statistique

Tests statistiques
- La probabilité établie pour rejeter l’hypothèse nulle est typiquement quoi?

A

p< 0.05

49
Q

Bases de l’analyse statistique

Test unilatéral vs. Bilatéral
- Le type de test que nous ferons changera selon quoi?

A

*Selon le type d’hypothèse que nous avons (directionnelle ou non-directionnelle), le type de test que nous ferons changera.

50
Q

Bases de l’analyse statistique

Test unilatéral vs. Bilatéral
- On doit décider le type de test qu’on fera avant de faire quoi? Pour quelle raison?

A
  • Important ***: On doit décider avant de collecter les données le type de test que l’on fera.
  • Sinon, augmentation des chances de faire l’erreur alpha (i.e. de rejeter l’hypothèse nulle alors qu’elle est vraie).
51
Q

Bases de l’analyse statistique

Test unilatéral vs. Bilatéral
*Discussion: Certains proposent de toujours faire le test ____
* A posteriori, trop facile de trouver une ____ à un résultat que nous n’avions pas ____ au départ

A

*Discussion: Certains proposent de toujours faire le test bilatéral.
* A posteriori, trop facile de trouver une explication à un résultat que nous n’avions pas prévu au départ

52
Q

Bases de l’analyse statistique

Test unilatéral vs. Bilatéral
- Doonne un exemple d’hypothèse directionnelle vs non-directionnelle, et représente le sur la courbe normal

A
53
Q

Bases de l’analyse statistique

Erreurs de type I et II
Nomme, pour les erreurs de type I et II :
- Autre nom d’erreur
- On conclut quoi (erreure commise)
- Exemple

A
  • Type 1 (erreur alpha) : On conclut qu’il y a un effet dans notre population, alors qu’il n’y en a pas.
    • Exemple: Je teste l’efficacité d’un médicament, et je conclus qu’il réduit les symptômes négatifs alors que c’est faux.
  • Type 2 (erreur bêta) : On conclut qu’il n’y a pas d’effet dans notre population, alors qu’en réalité il y en a un.
    • Exemple: Je teste l’efficacité d’un médicament, et je conclus qu’il ne réduit pas les symptômes négatifs alors qu’en réalité il les réduit.
54
Q

Bases de l’analyse statistique

Erreurs de type I et II
- La probabilité de faire une erreur de Type I correspond a quoi? Et il s’agit de quoi en numéro?

A

La probabilité de faire une erreur de Type I correspond au seuil de rejet. Il s’agit donc souvent de .05.
Le seuil de .05 est le maximum acceptable pour la probabilité de faire une erreur de Type I; vous allez faire rire de vous si votre seuil est moins sévère

55
Q

Bases de l’analyse statistique

Erreurs de type I et II
- La probabilité de faire une erreur de Type II dépend de quoi?
- Explique l’impact de la grosseur du seuil sur la probabilité
- Elle est calculée à l’aide de quoi? Formule
- Cela dépend de quels 3 éléments?

A

*La probabilité de faire une erreur de Type II dépend aussi du seuil de rejet.
*Plus le seuil est strict (petit), plus la probabilité est élevée.
*Elle est calculée à l’aide de la puissance statistique. (Type II = 1 -Puissance)
* La puissance statistique dépend de la taille de l’effet, la taille de l’échantillon et du seuil de rejet.

56
Q

Bases de l’analyse statistique

G Power
- Habituellement, on fixe notre puissance statistique visée à un minimum de ____ . Ceci fixe la probabilité de faire une erreur de type II à ____ % ( ____ )

A

Habituellement, on fixe notre puissance statistique visée à un minimum de .8. Ceci fixe la probabilité de faire une erreur de type II à 20% (.2)

57
Q

Bases de l’analyse statistique

G Power
- Le logiciel libre G Power permet de faire quoi?

A
  • En estimant notre taille d’effet et en choisissant notre seuil de rejet, on peut calculer la taille d’échantillon nécessaire pour détecter l’effet s’il est présent.
  • On peut utiliser le logiciel libre G Power pour le faire.
58
Q

Bases de l’analyse statistique

G Power
En estimant notre taille d’effet et en choisissant notre seuil de rejet, on peut calculer la taille d’échantillon nécessaire pour détecter l’effet s’il est présent
- Il est de plus en plus nécessaire de faire ce calcul quand? Pourquoi?
- Cela permet de contrer quel problème?

A
  • Il est de plus en plus nécessaire de faire ce calcul à priori de la collecte de données pour justifier votre taille d’échantillon.
    • Pour contrer le problème des chercheurs qui testent un échantillon jusqu’à ce que ça soit significatif (tester de plus en plus de participants jusqu’à ce que ça donne qqchose par pression d’obtenir des résultats significatifs)
59
Q

Bases de l’analyse statistique

Test d’hypothèse –Impact de la taille d’échantillon
- Pour exactement le même type de différence (même moyenne et même écart-type dans les deux échantillons), on a une différence significative dans l’échantillon de 100, mais pas dans l’échantillon de 10. Pourquoi?
- Quel est le calcul de cela?
- Explique sur un graphique

A

Pourquoi? Parce que plus la taille d’échantillon augmente, plus l’erreur standard diminue.

60
Q

Bases de l’analyse statistique

Taille d’effet
- La taille d’effet permet de répondre à quelle question?
- DOnne la def de taille d’effet, et la def d’un mot de la def

A

*Ainsi, si on teste des échantillons suffisamment grands, même une minuscule différence deviendra statistiquement significative. Mais est-elle vraiment intéressante?
*Taille d’effet: Mesure standardisée de la taille de l’effet que nous avons mesuré.
* Standardisé, donc comparable entre les études, peu importe l’unité.

61
Q

Bases de l’analyse statistique

Taille d’effet
- De nombreuse méthodes existent pour calculer des tailles d’effet. L’une des plus populaires est laquelle?
- Nomme et décrit les 3 étapes pour faire cette méthode

A
62
Q

Bases de l’analyse statistique

Taille d’effet
d de Cohen
- Par contre, attention: on ne doit pas utiliser ces étiquettes ____ . La taille d’effet doit être interprétée en prenant en compte quoi?
- Pourquoi la taille d’effet est intéressante?

A

*Par contre, attention: on ne doit pas utiliser ces étiquettes aveuglément. La taille d’effet doit être interprétée en prenant en compte le contexte de l’étude.
*La taille d’effet est intéressante parce qu’elle ne varie pas en fonction de la taille d’échantillon

63
Q

Bases de l’analyse statistique

Problèmes avec les tests d’hypothèse
- Nomme les 2 problèmes

A

Problème # 1: Il faut être très prudents dans nos conclusions
Problème # 2: Favorise un mode de pensée «tout-ou-rien».

64
Q

Bases de l’analyse statistique

Problèmes avec les tests d’hypothèse
Problème # 1: Il faut être très prudents dans nos conclusions
- Nomme les 3 raisons de pourquoi faut être prudents dans nos conclusions

A
  1. Un effet significatif n’est pas pour autant un effet important.
    1. Un résultat non-significatif ne nous permet pas de dire que l’hypothèse nulle est vraie.
      • L’effet pourrait simplement avoir été trop petit pour être détecté, ou la taille d’échantillon insuffisante.
    2. Un résultat significatif ne nous permet pas d’affirmer que l’hypothèse nulle est fausse.
      • On peut seulement affirmer qu’elle est peu probable. Mais elle pourrait être vraie malgré tout.
65
Q

Bases de l’analyse statistique

Problèmes avec les tests d’hypothèse
Problème # 2: Favorise un mode de pensée «tout-ou-rien».
- Explique ce problème avec la situation selon lquelle j’ai réellement mesuré le nombre de fois où chacun de vous a bâillé durant les cinq premières minutes du cours, et durant les cinq minutes précédant la présente diapositive.

A
  • Disons que j’ai réellement mesuré le nombre de fois où chacun de vous a bâillé durant les cinq premières minutes du cours, et durant les cinq minutes précédant la présente diapositive.
    • Disons que je calcule que votre nombre de bâillements moyen est passé de 1.2 à 3.4, et que la probabilité d’observer un tel changement est de 0.051.
    • Cette probabilité est supérieure à mon seuil de 0.05, donc théoriquement je devrais conclure que je ne rejette pas l’hypothèse nulle (donc je ne peux pas affirmer que votre nombre de bâillement a augmenté).
      *Mais en fait elle est tout près!! Et si on obtient, au contraire, que la probabilité d’un tel changement est de 0.049, on fait la conclusion inverse!
66
Q

Bases de l’analyse statistique

Recommandations de l’APA
Disons que je répète l’expérience pour les 10 premiers cours de la session, et que j’obtiens ces résultats. Je conclus quoi?
*Pour compenser les deux problèmes présentés précédemment, l’APA a fait certaines recommandations. Il est maintenant recommandé, en plus de rapporter le résultat du test statistique, de rapporter quels 2 éléments?

A
  1. L’intervalle de confiance
  2. La taille d’effet