cours 10 : introduction aux analyses statistiques Flashcards

1
Q

Pourquoi des statistiques en psychologie ?

A
  • Pour répondre à nos questions de recherche.
  • Permettent de résumer les données.
  • Les méthodes statistiques sont nécessaires afin d’assurer que les relations que l’on observe sont significatives et non seulement dues à la chance.
  • Permettent de mettre à l’épreuve nos préjugées, nos croyances
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Particularités de la psychologie comme domaine de recherche :

A
  • Les sujets qui intéressent les psychologues (états et processus mentaux) peuvent être difficile a observés et mesurés directement .
  • Les humains sont complexes et diffèrent des uns des autres de façon arbitraire.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

analyse de données : données qualitatives :

A

données textuelles, non-structurés provenant de questions ouvertes,

analyse du contenu etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

analyse de données : données quantitatives :

A

donnée provenant d’indicateurs nominaux, ordinaux et numériques,

analyse statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

l’objectif de l’analyse de données :

A
  • identifications des principales caractéristiques
  • vérification de liens
  • élaboration de sens
  • synthèse et généralisation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

C’est quoi l’objectif des statistiques descriptives ou exploratoires:

A
  • Décrire les caractéristiques de l’échantillon
  • Permettent de procéder à des réductions statistiques faciles à interpréter (p.ex., valeurs centrales, valeurs
    de dispersion, histogrammes).
  • Vérifier la validité et la fiabilité des données
  • Valider des mesures (p.ex., alpha de cronbach, fidélité test-retest, analyse factorielle).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quels sont les objectifs des statistiques inférentielles :

A
  • Permettent de «démontrer» un résultat général à partir d’un échantillon. Dans cette démarche, le statisticien se fixe une hypothèse et détermine ensuite si celle-ci s’accorde avec les faits (c.-à-d., tests d’hypothèses; p.ex., tests du khi2, test t).
  • Niveau explicatif: Explorer et vérifier des liens
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

vrai ou faux : Dans la plupart des études, le nombre de sujets est trop important pour que l’on puisse présenter les données réelles de chaque individu. C’est pourquoi, il est nécessaire de trouver un moyen qui donne le maximum d’informations possible sous le format le plus utile.

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Deux mesures sont indispensables pour décrire une variable quantitative :

A

la mesure de la position centrale des observations et la mesure de leur dispersion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les mesures de tendance centrale

A

Moyenne
Médiane
Mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que est la valeur typique:
« comment les individus sont-ils similaires »

A

mesure de tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les mesures de dispersion ?

A

Étendue
Variance et écart type
Erreur type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Le taux de dispersion autour de la valeur typique: « comment les individus diffèrent- ils »

A

mesure de dispersion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

description de la moyenne :

A
  • Mesure de tendance centrale la plus courante
  • La moyenne est la valeur moyenne de toutes les données incluses dans l’ensemble.

Moyenne = Somme de toutes les valeurs d’observation ÷ nombre d’observations

VOIR FORMULE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Description de la médiane :

A

La médiane correspond à l’observation du milieu; la valeur de part et d’autre de laquelle se situe 50% des observations.

Médiane = la valeur intermédiaire d’un ensemble de données une fois les données ordonnées par valeur (en ordre croissant ou décroissant)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

la médiane : Si n est impair

A

Médiane = nbr situé à la position médiane

VOIR FORMULE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

la médiane : Si n est pair

A

Médiane = moyenne des deux nbr adjacents à la position médiane

VOIR FORMULE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

description du mode :

A
  • Le mode est la valeur la plus souvent observée dans un ensemble de données.
  • Possible qu’il n’y ait aucun mode si aucune des observations n’y apparaît plus qu’une autre.
  • Possible qu’il y ait dans le même ensemble deux (bimodal), trois (trimodal) ou quatre modes ou plus (multimodal).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quelle mesure de tendance centrale choisir

A

distribution bimodale ou multimodale : mode

distribution unimodale avec donnée continue symétrique : moyenne

distribution unimodale avec des données asymétriques : médiane

distribution unimodale avec des données ordinale : médiane

distribution unimodale avec des données nominales : mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

la définition et l’utilité des mesures de dispersion

A

Définition: l’indice de dispersion indique la manière dont les individus du groupe se répartissent autour de l’indice de tendance centrale

Utilité: permets de tenir compte de l’ampleur des variations au sein d’un groupe, et éventuellement de comparer cet indice avec celui d’autres groupes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

description de l’étendu :

A

L’étendue se définit comme étant la différence entre la plus grande et la plus petite des valeurs observées.

Étendue = Maximum - Minimum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

description de la variance et de l’écart-type :

A

La variance et l’écart-type indiquent la distance moyenne qui existe entre les observations et la moyenne.

indique de combien d’unités chaque donnée s’écarte de façon type de la valeur de la moyenne

  • La variance correspond à la moyenne arithmétique des carrés des écarts à la moyenne.
  • L’écart-type correspond à la racine carrée de la variance.
  • L’écart-type est l’indice de dispersion le plus utilisé dans le cas des échelles continues

VOIR FORMULE

23
Q

VRAI OU FAUX : Plus la valeur de l’écart-type est grande, plus l’échantillon est homogène

La valeur de chaque individu ne doit pas être proche de la moyenne

A

faux et faux

24
Q

types de tableaux :

A

Table des fréquences
Table de contingence

25
types de graphiques :
Box-plots Diagramme en bâtons Histogrammes Diagramme en secteur
26
différence entre diagramme à bâtonnet et histogramme :
Diagramme en bâtonnets : Variable quantitative discrète ou catégorielle (c.-à- d., aucune valeur intermédiaire possible) Histogramme : Variable quantitative continue; les données sont réparties en classes.
27
VRAI OU FAUX : La moyenne est influencée par les valeurs extrêmes. C’est pour ça que dans certains cas, elle ne reflète pas bien toute la réalité. Ainsi la médiane est plus fiable.
vrai
28
propriétés des distributions de fréquences : mode
distribution bimodale : 2 courbes distribution inumodale : 1 courbe
29
symétrie : différence entre courbe symétrique et asymétrique gauche / droite
courbe symétrique : mode = médiane = moyenne courbe asymétrique gauche : mode » médiane » moyenne courbe asymétrique droite : mode « médiane « moyenne
30
aplatissement 3 :
Leptocurtique (kurtosis positif) Mésocurtique (kurtosis nul) *Normale* Platycurtique (kurtosis négatif)
31
Le but de la statistique inférentielle est :
d’estimer les paramètres de la population (inconnues) en utilisant les statistiques de l’échantillon (connues).
32
L’objectif de l’inférence statistique est :
de rejeter l’hypothèse nulle
33
étape de l'inférence statistique
1. formulation d'hypothèse statistique 2. identification du test statistique 3. choisir un seuil de signification 4. procéder aux analyses 5. prendre une décision (rejet de H0 : H1 est vrai ou non rejet de H0 : H1 est faux)
34
Les hypothèses sont _____ _______ possibles et exclusives dérivées de la ______ ___ _______
deux réponses, question de recherche
35
H0 - L’hypothèse nulle
Cette hypothèse est formulée dans le but d’être rejetée. Elle consiste à dire qu’il n’y a pas de différence ou que la différence observée est due au hasard
36
Ha - L’hypothèse alternative
C'est l'hypothèse qu'on aimerait démontrer. Elle est équivalente à dire « H est fausse ». Son acceptation est conditionnelle au rejet de l'hypothèse nulle.
37
VRAI OU FAUX : L’acceptation de l’hypothèse nulle n’est pas l’équivalent de dire « H0 est vraie et Ha est fausse » Toutefois, si l’hypothèse nulle est réfutée, la seule option est d’accepter l’hypothèse alternative!
vrai
38
hypothèse nulle : ____ à réfuter hypothèse alternative : ____ à prouver
facile, difficile VOIR TABLEAU DE DÉCISION
39
erreur a (type 1) : faux positif :
- Lorsque l’hypothèse nulle est rejetée alors qu’elle était vraie. - L’erreur de type I est contrôlée par le chercheur p.ex., si le chercheur choisi un seuil alpha de .05 il y a seulement 5% des chances qu’il rejette l’hypothèse nulle alors qu’elle était vraie. - Le choix du seuil alpha ne doit jamais être automatique! Ex. conclure qu’un traitement est efficace alors qu’il ne l’est pas
40
seuil de signification :
-Seuil de rejet ou seuil de signification de l’hypothèse H0 - Noté par la lettre α - Les seuils de signification les plus utilisés sont α = 0,05 ou α = 0,01
41
erreur B (type 2) : faux négatif :
- Lorsque l’hypothèse nulle est acceptée alors qu’elle était fausse. Ex. conclure qu’un traitement n’est pas efficace alors qu’il l’est.  Le risque ‘acceptable’ de faire une erreur de type II est souvent fixé à 0,20. Comment contrôler l’erreur de type II? - La meilleure façon est d’augmenter la puissance statistique d’un test.
42
Que signifie la puissance statistique :
La chance de pouvoir détecter un effet (p.ex., une différence) significatif à un seuil a donné; capacité du test à identifier une différence réelle. Puissance = 1 – β (probabilité de faire une erreur de type II)
43
comment rendre un test plus puissant :
- La variance : Plus la variance (s2) est petite, plus la puissance augmente - Le seuil alpha choisi : Moins le seuil est sévère (0.10 ou 0.05 au lieu de 0.01), plus la puissance augmente La taille d’effet : Plus l’effet dans la population (d) est grand, plus la puissance augmente La taille d’échantillon : Plus la taille du n est grande (avec seuil α, s2 et d constant) plus la puissance augmente
44
Relation entre α et β
- Plus α est petit plus il est difficile de rejeter H0 - Donc, plus on a de chance d’accepter H0 alors qu’elle est fausse et de faire une Erreur β
45
L’erreur de type I doit être ______ plus sérieusement que celle de type II, car dès qu’un résultat est trouvé → _______ L’erreur de type II est souvent moins ____, car si le chercheur a la conviction d’avoir raison → Peut _____ l’expérience avec un échantillon différent.
contrôlée, publiée, grave, refaire
46
comment déterminer le test statistique à employer :
- Nombre de variables dépendantes - Types de variables dépendantes - Nombre de variables indépendantes - Types de variables indépendantes - Si catégorielle, nombre de catégories? - Si catégorielle, inter ou intra sujets? - Les données respectent-elles les postulats des analyses paramétriques? Ex: distribution normale?
47
VRAI OU FAUX :
Seul le multivarié permet de tenir compte des intercorrélations entre les VD
48
nombre de variables dépendantes : univarié ou mutlivarié
une VD avec un VI ou plus : univarié Plusieurs VD avec une VI ou plus : mutlivairé
49
différence entre plan uni factoriel et factoriel :
- Plan unifactoriel = plan ne contenant qu’une VI (un seul facteur) - Plan factoriel = plan contenant plusieurs VI (plusieurs facteurs) * Permet l’estimation des effets principaux et des effets d’interactions
50
Nos deux types de variables :
Variable(s) dépendante(s) : * Nominale(s) * Ordinale(s) * Continue(s) Variables indépendantes * Catégorielle(s) * Continue(s)
51
Si la variable est indépendante catégorielle, on peut utiliser quel plan :
- Plan à groupes indépendants = plan ne contenant que des VI intersujets - Plan à mesures répétées = plan ne contenant que des VI intrasujets - Plan combiné (mixte) = plan contenant à la fois au moins une VI inter et une VI intra
52
VOIR PARTIE TEST STATISTIQUES
GO
53
la distribution :
- synthétise les données - distribution des fréquences : regrouper les données en classe