cours 10 : introduction aux analyses statistiques Flashcards

1
Q

Pourquoi des statistiques en psychologie ?

A
  • Pour répondre à nos questions de recherche.
  • Permettent de résumer les données.
  • Les méthodes statistiques sont nécessaires afin d’assurer que les relations que l’on observe sont significatives et non seulement dues à la chance.
  • Permettent de mettre à l’épreuve nos préjugées, nos croyances
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Particularités de la psychologie comme domaine de recherche :

A
  • Les sujets qui intéressent les psychologues (états et processus mentaux) peuvent être difficile a observés et mesurés directement .
  • Les humains sont complexes et diffèrent des uns des autres de façon arbitraire.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

analyse de données : données qualitatives :

A

données textuelles, non-structurés provenant de questions ouvertes,

analyse du contenu etc.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

analyse de données : données quantitatives :

A

donnée provenant d’indicateurs nominaux, ordinaux et numériques,

analyse statistique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

l’objectif de l’analyse de données :

A
  • identifications des principales caractéristiques
  • vérification de liens
  • élaboration de sens
  • synthèse et généralisation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

C’est quoi l’objectif des statistiques descriptives ou exploratoires:

A
  • Décrire les caractéristiques de l’échantillon
  • Permettent de procéder à des réductions statistiques faciles à interpréter (p.ex., valeurs centrales, valeurs
    de dispersion, histogrammes).
  • Vérifier la validité et la fiabilité des données
  • Valider des mesures (p.ex., alpha de cronbach, fidélité test-retest, analyse factorielle).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quels sont les objectifs des statistiques inférentielles :

A
  • Permettent de «démontrer» un résultat général à partir d’un échantillon. Dans cette démarche, le statisticien se fixe une hypothèse et détermine ensuite si celle-ci s’accorde avec les faits (c.-à-d., tests d’hypothèses; p.ex., tests du khi2, test t).
  • Niveau explicatif: Explorer et vérifier des liens
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

vrai ou faux : Dans la plupart des études, le nombre de sujets est trop important pour que l’on puisse présenter les données réelles de chaque individu. C’est pourquoi, il est nécessaire de trouver un moyen qui donne le maximum d’informations possible sous le format le plus utile.

A

vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Deux mesures sont indispensables pour décrire une variable quantitative :

A

la mesure de la position centrale des observations et la mesure de leur dispersion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quels sont les mesures de tendance centrale

A

Moyenne
Médiane
Mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Que est la valeur typique:
« comment les individus sont-ils similaires »

A

mesure de tendance centrale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quels sont les mesures de dispersion ?

A

Étendue
Variance et écart type
Erreur type

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Le taux de dispersion autour de la valeur typique: « comment les individus diffèrent- ils »

A

mesure de dispersion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

description de la moyenne :

A
  • Mesure de tendance centrale la plus courante
  • La moyenne est la valeur moyenne de toutes les données incluses dans l’ensemble.

Moyenne = Somme de toutes les valeurs d’observation ÷ nombre d’observations

VOIR FORMULE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Description de la médiane :

A

La médiane correspond à l’observation du milieu; la valeur de part et d’autre de laquelle se situe 50% des observations.

Médiane = la valeur intermédiaire d’un ensemble de données une fois les données ordonnées par valeur (en ordre croissant ou décroissant)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

la médiane : Si n est impair

A

Médiane = nbr situé à la position médiane

VOIR FORMULE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

la médiane : Si n est pair

A

Médiane = moyenne des deux nbr adjacents à la position médiane

VOIR FORMULE

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

description du mode :

A
  • Le mode est la valeur la plus souvent observée dans un ensemble de données.
  • Possible qu’il n’y ait aucun mode si aucune des observations n’y apparaît plus qu’une autre.
  • Possible qu’il y ait dans le même ensemble deux (bimodal), trois (trimodal) ou quatre modes ou plus (multimodal).
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Quelle mesure de tendance centrale choisir

A

distribution bimodale ou multimodale : mode

distribution unimodale avec donnée continue symétrique : moyenne

distribution unimodale avec des données asymétriques : médiane

distribution unimodale avec des données ordinale : médiane

distribution unimodale avec des données nominales : mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

la définition et l’utilité des mesures de dispersion

A

Définition: l’indice de dispersion indique la manière dont les individus du groupe se répartissent autour de l’indice de tendance centrale

Utilité: permets de tenir compte de l’ampleur des variations au sein d’un groupe, et éventuellement de comparer cet indice avec celui d’autres groupes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

description de l’étendu :

A

L’étendue se définit comme étant la différence entre la plus grande et la plus petite des valeurs observées.

Étendue = Maximum - Minimum

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

description de la variance et de l’écart-type :

A

La variance et l’écart-type indiquent la distance moyenne qui existe entre les observations et la moyenne.

indique de combien d’unités chaque donnée s’écarte de façon type de la valeur de la moyenne

  • La variance correspond à la moyenne arithmétique des carrés des écarts à la moyenne.
  • L’écart-type correspond à la racine carrée de la variance.
  • L’écart-type est l’indice de dispersion le plus utilisé dans le cas des échelles continues

VOIR FORMULE

23
Q

VRAI OU FAUX : Plus la valeur de l’écart-type est grande, plus l’échantillon est homogène

La valeur de chaque individu ne doit pas être proche de la moyenne

A

faux et faux

24
Q

types de tableaux :

A

Table des fréquences
Table de contingence

25
Q

types de graphiques :

A

Box-plots
Diagramme en bâtons
Histogrammes
Diagramme en secteur

26
Q

différence entre diagramme à bâtonnet et histogramme :

A

Diagramme en bâtonnets :
Variable quantitative discrète ou catégorielle (c.-à- d., aucune valeur intermédiaire possible)

Histogramme : Variable quantitative continue; les données sont réparties en classes.

27
Q

VRAI OU FAUX : La moyenne est influencée par les valeurs extrêmes.
C’est pour ça que dans certains cas, elle ne reflète pas bien toute la réalité. Ainsi la médiane est plus fiable.

A

vrai

28
Q

propriétés des distributions de fréquences : mode

A

distribution bimodale : 2 courbes
distribution inumodale : 1 courbe

29
Q

symétrie : différence entre courbe symétrique et asymétrique gauche / droite

A

courbe symétrique : mode = médiane = moyenne

courbe asymétrique gauche : mode » médiane » moyenne

courbe asymétrique droite : mode « médiane « moyenne

30
Q

aplatissement 3 :

A

Leptocurtique (kurtosis positif)

Mésocurtique (kurtosis nul) Normale

Platycurtique (kurtosis négatif)

31
Q

Le but de la statistique inférentielle est :

A

d’estimer les paramètres de la population (inconnues) en utilisant les statistiques de l’échantillon (connues).

32
Q

L’objectif de l’inférence statistique est :

A

de rejeter l’hypothèse nulle

33
Q

étape de l’inférence statistique

A
  1. formulation d’hypothèse statistique
  2. identification du test statistique
  3. choisir un seuil de signification
  4. procéder aux analyses
  5. prendre une décision (rejet de H0 : H1 est vrai ou non rejet de H0 : H1 est faux)
34
Q

Les hypothèses sont _____ _______ possibles et exclusives dérivées de la ______ ___ _______

A

deux réponses, question de recherche

35
Q

H0 - L’hypothèse nulle

A

Cette hypothèse est formulée dans le but d’être rejetée. Elle consiste à dire qu’il n’y a pas de différence ou que la différence observée est due au hasard

36
Q

Ha - L’hypothèse alternative

A

C’est l’hypothèse qu’on aimerait démontrer. Elle est équivalente à dire « H est fausse ». Son
acceptation est conditionnelle au rejet de l’hypothèse nulle.

37
Q

VRAI OU FAUX : L’acceptation de l’hypothèse nulle n’est pas l’équivalent de dire « H0 est vraie et Ha est fausse » Toutefois, si l’hypothèse nulle est réfutée, la seule option est d’accepter l’hypothèse alternative!

A

vrai

38
Q

hypothèse nulle : ____ à réfuter
hypothèse alternative : ____ à prouver

A

facile, difficile

VOIR TABLEAU DE DÉCISION

39
Q

erreur a (type 1) : faux positif :

A
  • Lorsque l’hypothèse nulle est rejetée alors qu’elle était vraie.
  • L’erreur de type I est contrôlée par le chercheur

p.ex., si le chercheur choisi un seuil alpha de .05 il y a seulement 5% des chances qu’il rejette l’hypothèse nulle alors qu’elle était vraie.

  • Le choix du seuil alpha ne doit jamais être automatique!

Ex. conclure qu’un traitement est efficace alors qu’il ne l’est pas

40
Q

seuil de signification :

A

-Seuil de rejet ou seuil de signification de l’hypothèse H0

  • Noté par la lettre α
  • Les seuils de signification les plus utilisés sont α = 0,05 ou α = 0,01
41
Q

erreur B (type 2) : faux négatif :

A
  • Lorsque l’hypothèse nulle est acceptée alors qu’elle était fausse.

Ex. conclure qu’un traitement n’est pas efficace alors qu’il l’est.  Le risque ‘acceptable’ de faire une erreur de type II est
souvent fixé à 0,20.

Comment contrôler l’erreur de type II?

  • La meilleure façon est d’augmenter la puissance statistique d’un test.
42
Q

Que signifie la puissance statistique :

A

La chance de pouvoir détecter un effet (p.ex., une différence) significatif à un seuil a donné; capacité du test à identifier une différence réelle.

Puissance = 1 – β (probabilité de faire une erreur de type II)

43
Q

comment rendre un test plus puissant :

A
  • La variance : Plus la variance (s2) est petite, plus la puissance augmente
  • Le seuil alpha choisi : Moins le seuil est sévère (0.10 ou 0.05 au lieu de 0.01), plus la puissance augmente

La taille d’effet : Plus l’effet dans la population (d) est grand, plus la puissance augmente

La taille d’échantillon : Plus la taille du n est grande (avec seuil α, s2 et d constant) plus la puissance augmente

44
Q

Relation entre α et β

A
  • Plus α est petit plus il est difficile de rejeter H0
  • Donc, plus on a de chance d’accepter H0 alors qu’elle est fausse et de faire une Erreur β
45
Q

L’erreur de type I doit être ______ plus sérieusement que celle de type II, car dès qu’un résultat est trouvé → _______

L’erreur de type II est souvent moins ____, car si le chercheur a la conviction d’avoir raison → Peut _____ l’expérience avec un échantillon différent.

A

contrôlée, publiée, grave, refaire

46
Q

comment déterminer le test statistique à employer :

A
  • Nombre de variables dépendantes
  • Types de variables dépendantes
  • Nombre de variables indépendantes
  • Types de variables indépendantes
  • Si catégorielle, nombre de catégories?
  • Si catégorielle, inter ou intra sujets?
  • Les données respectent-elles les postulats des analyses paramétriques?

Ex: distribution normale?

47
Q

VRAI OU FAUX :

A

Seul le multivarié permet de tenir compte des intercorrélations entre les VD

48
Q

nombre de variables dépendantes : univarié ou mutlivarié

A

une VD avec un VI ou plus : univarié

Plusieurs VD avec une VI ou plus : mutlivairé

49
Q

différence entre plan uni factoriel et factoriel :

A
  • Plan unifactoriel = plan ne contenant qu’une VI (un seul facteur)
  • Plan factoriel = plan contenant plusieurs VI (plusieurs facteurs)
  • Permet l’estimation des effets principaux et des effets d’interactions
50
Q

Nos deux types de variables :

A

Variable(s) dépendante(s) :
* Nominale(s) * Ordinale(s) * Continue(s)

Variables indépendantes
* Catégorielle(s) * Continue(s)

51
Q

Si la variable est indépendante catégorielle, on peut utiliser quel plan :

A
  • Plan à groupes indépendants = plan ne contenant que des VI intersujets
  • Plan à mesures répétées = plan ne contenant que des VI intrasujets
  • Plan combiné (mixte) = plan contenant à la fois au moins une VI inter
    et une VI intra
52
Q

VOIR PARTIE TEST STATISTIQUES

A

GO

53
Q

la distribution :

A
  • synthétise les données
  • distribution des fréquences : regrouper les données en classe