cours 10: introduction aux analyses statistiques Flashcards

1
Q

pourquoi des stats en psychologie

A
  • Pour répondre à nos questions de recherche.
  • Permettent de résumer les données.
  • Les méthodes statistiques sont nécessaires afin d’assurer que les relations que l’on observe sont significatives et non seulement dues à la chance.
  • Permettent de mettre à l’épreuve nos préjugées, nos croyances.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Particularités de la psychologie comme domaine de recherche

A
  • Les sujets qui intéressent les psychologues (états et processus mentaux) peuvent être difficile a observés et mesurés directement .
  • Les humains sont complexes et diffèrent des uns des autres de façon arbitraire.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

données qualitatives

A

données textuelles, non structuré, provenant de question ouverte
- analyse de contenue etc

objectifs :
- identification principales des caractéristiques
- vérifications des liens
- élaborations de sens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

données quantitatives

A

données provenant d’indicateurs nominaux, ordinaux ou numériques
- analyses statistiques

objectifs :
- identification principales des caractéristiques
- vérifications des liens
- élaborations de sens

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Les statistiques descriptives ou exploratoires

A

Décrire les caractéristiques de l’échantillon
- Permettent de procéder à des réductions statistiques faciles à interpréter (p.ex., valeurs centrales, valeurs
de dispersion, histogrammes).

  • Vérifier la validité et la fiabilité des données
  • Valider des mesures (p.ex., alpha de cronbach, fidélité test-retest, analyse factorielle).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Les statistiques inférentielles

A
  • Permettent de «démontrer» un résultat général à partir d’un échantillon. Dans cette démarche, le statisticien se fixe une hypothèse et détermine ensuite si celle-ci s’accorde avec les faits (c.-à-d., tests d’hypothèses; p.ex., tests du khi2, test t).
  • Niveau explicatif: Explorer et vérifier des liens
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

les analyses descriptives

A

Dans la plupart des études, le nombre de sujets est trop important pour que l’on puisse présenter les données réelles de chaque individu. C’est pourquoi, il est nécessaire de trouver un moyen qui donne le maximum d’informations possible sous le format le plus utile.

Deux mesures sont indispensables pour décrire une variable quantitative : la mesure de la position centrale des observations et la mesure de leur dispersion.

Mesures de tendance centrale (similaire)
* Moyenne * Médiane * Mode

Mesures de dispersion (différence)
* Étendue
* Variance et écart type * Erreur type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

la moyenne

A

Mesure de tendance centrale la plus courante
- La moyenne est la valeur moyenne de toutes les données incluses dans l’ensemble.

Moyenne = Somme de toutes les valeurs d’observation ÷ nombre d’observations

La moyenne est influencée par les valeurs extrêmes.
 C’est pour ça que dans certains cas, elle ne reflète pas bien toute la réalité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

la médiane

A

La médiane correspond à l’observation du milieu; la valeur de part et d’autre de laquelle se situe 50% des observations.

Médiane = la valeur intermédiaire d’un ensemble de données une fois les données ordonnées par valeur (en ordre croissant ou décroissant)

impair :
(n+1)e observation / 2

pair
n/2 et n + 1/2 e observation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

le mode

A

Le mode est la valeur la plus souvent observée dans un ensemble de données.

Notes :
* Possible qu’il n’y ait aucun mode si aucune des observations n’y apparaît plus qu’une autre.
* Possible qu’il y ait dans le même ensemble deux (bimodal), trois (trimodal) ou quatre modes ou plus (multimodal).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

les mesures de dispersion

A

Définition: l’indice de dispersion indique la manière dont les individus du groupe se répartissent autour de l’indice de tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

l’utilités des mesures de dispersion

A

permets de tenir compte de l’ampleur des variations au sein d’un groupe, et éventuellement de comparer cet indice avec celui d’autres groupes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

l’étendue

A

L’étendue se définit comme étant la différence entre la plus grande et la plus petite des valeurs observées

Étendue = Maximum - Minimum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

la variance

A

La variance et l’écart-type indiquent la distance moyenne qui existe entre les observations et la moyenne.

La variance correspond à la moyenne arithmétique des carrés des écarts à la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

l’écart-type

A

L’écart-type correspond à la racine carrée de la variance.
- L’écart-type est l’indice de dispersion le plus utilisé dans le cas des échelles continues

La variance et l’écart-type indiquent la distance moyenne qui existe entre les observations et la moyenne.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

plus la valeur de l’écart-type est petit plus l’échantillon est homogène : vrai ou faux

A

vrai; La valeur de chaque individu est proche de la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

la visualisations des données

A

tableaux :
* Table des fréquences
* Table de contingence
*…
graphiques;
* Box-plots
* Diagramme en bâtons * Histogrammes
* Diagramme en secteur *…

les affaires extrême ne vont pas suivre une courbe normale
- si les valeurs ne bougent pas trop c’est parce qu’elle sont autour de la moyenne

18
Q

Diagramme en bâtonnets

A

Variable quantitative discrète ou catégorielle (c.-à- d., aucune valeur intermédiaire possible)

19
Q

histogramme

A

Variable quantitative continue; les données sont réparties en classes.

20
Q

l’inférence statistique

A

Le but de la statistique inférentielle est d’estimer les paramètres de la population (inconnues) en utilisant les statistiques de l’échantillon (connues

Si l’échantillon est représentatif de la population =Conclusions à partir de l’échantillon

21
Q

qu’elle est l’objectif de l’inférence statistique

A

L’objectif de l’inférence statistique est de rejeter l’hypothèse nulle

  1. Formulation des Hypothèses statistiques
  2. Identification du test statistique
  3. Choisir un seuil de signification
  4. procéder aux analyses
  5. Prendre une décision
    - rejet H0 : Conclure que H1 est vraie
    ou
    - maintien H0: Conclure que H0 n’est pas fausse
22
Q

les hypothèses statistiques

A
  • hypothèse nulle
  • hypothèse alternative
23
Q

hypothèse nulle

A

Cette hypothèse est formulée dans le but d’être rejetée. Elle consiste à dire qu’il n’y a pas de différence ou que la différence observée est due au hasard.

24
Q

hypothèse alternatives

A

C’est l’hypothèse qu’on aimerait démontrer. Elle est équivalente à dire « H est fausse ». Son
acceptation est conditionnelle au rejet de l’hypothèse nulle.

25
Q

formulation de l’hypothèse nulle

A

Il n’y a aucune différence au niveau des de symptômes de dépression entre les femmes ayant dévoilé une agression sexuelle et celles n’ayant pas subi d’agression.

26
Q

formulation de l’hypothèse alternative

A

Il y a une différence au niveau des de symptômes de dépression entre les femmes ayant dévoilé une agression sexuelle et celles n’ayant pas subi d’agression.

27
Q

erreur A type 1

A

Faux positifs
- Lorsque l’hypothèse nulle est rejetée alors qu’elle était vraie.  L’erreur de type I est contrôlée par le chercheur
- p.ex., si le chercheur choisi un seuil alpha de .05 il y a seulement 5% des chances qu’il rejette l’hypothèse nulle alors qu’elle était vraie.
- Le choix du seuil alpha ne doit jamais être automatique!
- Ex. conclure qu’un traitement est efficace alors qu’il ne l’est pas.

Seuil de signification
- Seuil de rejet ou seuil de signification de l’hypothèse H0
 Noté par la lettre α
- Les seuils de signification les plus utilisés sont α = 0,05 ou α = 0,01

28
Q

Erreur B type 2

A

Faux négatifs.
- Lorsque l’hypothèse nulle est acceptée alors qu’elle était fausse.
- Ex. conclure qu’un traitement n’est pas efficace alors qu’il l’est.  Le risque ‘acceptable’ de faire une erreur de type II est
souvent fixé à 0,20.
- Comment contrôler l’erreur de type II?
- La meilleure façon est d’augmenter la puissance
statistique d’un test.

29
Q

la puissance statistique

A

La chance de pouvoir détecter un effet (p.ex., une différence) significatif à un seuil a donné; capacité du test à identifier une différence réelle.

Puissance = 1 – β (probabilité de faire une erreur de type II)

30
Q

Comment rendre une test plus puissant

A

La variance:
Plus la variance (s2) est petite, plus la puissance est haute

  • Le seuil alpha choisi:
    Moins le seuil est sévère (0.10 ou 0.05 au lieu de 0.01), plus la puissance est haute
  • La taille d’effet:
    Plus l’effet dans la population (d) est grand, plus la puissance est haute
  • La taille d’échantillon:
    Plus la taille du n est grande (avec seuil α, s2 et d constant) plus la puissance haute
31
Q

Pourquoi ne pas choisir un α de 0.0000000001 pour limiter les erreurs de type I?

A
  • Plus α est petit plus il est difficile de rejeter H0
  • Donc, plus on a de chance d’accepter H0 alors qu’elle est fausse et de faire une Erreur β
32
Q

vrai ou faux: l’erreur de type A est plus sévère que type B

A

vrai , c’est plus grave de dire qu’il a un effet quand il en a pas

L’erreur de type I doit être contrôlé plus sérieusement que celle de type II, car dès qu’un résultat est trouvé → Publié!
- L’erreur de type II est souvent moins grave, car si le chercheur a la conviction d’avoir raison → Peut refaire l’expérience avec un échantillon différent.

33
Q

Ce qu’on doit déterminer dans un test statistiques

A
  • Nombre de variables dépendantes
  • types de variables dépendantes
  • Nombre de variables indépendantes
  • Types de variables indépendantes
    Si catégorielle, nombre de catégories?
    Si catégorielle, inter ou intra sujets?
  • Les données respectent-elles les postulats des analyses paramétriques?
    • Ex: distribution normale?
34
Q

Le nombre de variable dépendante

A

Une VD—-< une ou + = Univarié

Plusieurs VD —–< une ou += multivarié

35
Q

nombre de variables indépendantes: plan unifactoriel

A

plan ne contenant qu’une VI (un seul facteur)

36
Q

nombre de variables indépendantes: plan factoriel

A

plan contenant plusieurs VI (plusieurs facteurs)
* Permet l’estimation des effets principaux et des effets d’interactions

37
Q

les variables dépendantes

A
  • Nominale(s)
  • Ordinale(s)
  • Continue(s)
38
Q

Les variables indépendantes

A
  • Catégorielle(s)
  • Continue(s)
39
Q

Plan à groupes indépendants

A

plan ne contenant que des VI intersujets

40
Q

Plan à mesures répétées

A

plan ne contenant que des VI intrasujets

41
Q

Plan combiné (mixte)

A

plan contenant à la fois au moins une VI inter
et une VI intra

42
Q

test non-paramétrique

A