Analyse statistique des données Flashcards
Que signifie “Statistique”?
Une discipline qui s’intéresse à l’analyse quantitative de la réalité
Que signifie “paramètre”?
Un calcul effectué auprès de la population
Que signifie “indice statistique”?
Calcul sur l’échantillon
Qu’est-ce qu’une analyse inférentielle?
Tests statistiques permettant d’estimer les caractéristiques de la population telles qu’elles sont mesurées à partir d’échantillions
**Tjrs avec échantillon car impossible de demander à toute la population
Quels sont les objectifs des statistiques?
- Représenter un grand nombre de données sous forme d’un ou quelques nombre (ex: la moyenne)
- Généraliser aux populations les caractéristiques mesurées à partir d’échantillons
- Prendre des décisions (confirmer ou rejeter l’hypothèse)
Quelles sont les différents types d’échelle de mesure?
- Nominale: numéro pas important, qu’on ne calcule pas (ex: postes TV)
- Ordinale: Likert (Tout à fait en accord)
- Intervalle: Chiffres
En quoi consiste une analyse descriptive?
Faire ressortir comment les données se distribuent pour pouvoir synthétiser l’ensemble des données
Quels sont les principaux indices statistiques (calcul sur l’échantillon) qui nous intéressent dans l’analyse descriptive?
- Indices de tendances centrales (moyenne, médiane
- Indices de dispersion (étendue, variance, écart-type)
- Indices de distribution (fréquences, asymétrie, aplatissement)
Quels sont les indices de tendance centrale?
- Moyenne
- Médiane
- Mode
Qu’est-ce que la moyenne?
Additionner tous les éléments d’un ensemble et diviser par le nombre d’éléments additionnés
Qu’est-ce que la médiane? Quand est-elle utile?
C’est le point milieu d’un ensemble ordonné de données.
Utile lorsqu’il y a des valeurs extrêmes (ex: étude sur la situation économique des étudiants et un participant a gagné à la loterie)
Qu’est-ce que le mode?
La valeur qui a la fréquence la plus élevée est celle qui est endossée par le plus de participants (ex: majorité des étudiants ont 80%)
Quels sont les indices de dispersion?
- l’étendue
- la variance
- l’écart-type
Qu’est-ce que l’étendue?
Écart entre la valeur la plus petite et la valeur la plus grande
Qu’est-ce que l’étendue?
Écart entre la valeur la plus petite et la valeur la plus grande
Qu’est-ce que la variance?
La variabilité de la distribution des données: (somme des écarts à la moyenne)2/ N-1
En quoi consiste la distribution de fréquences?
Comptabilise le nbr d’unités d’observation se trouvant dans chaque catégorie (nominale) ou pour chaque valeur ou classe (ordinale ou continue)
(Diagramme à bâton, histogramme, courbe normale)
Qu’est-ce que la courbe normale?
Un modèle probabiliste pour comparer ???
Qu’est-ce que l’asymétrie de la distribution?
- Lorsque beaucoup de gens ont des résultats + ou - (aux extrêmes)
- Bimodale
Qu’est-ce que l’asymétrie de la distribution?
- Lorsque beaucoup de gens ont des résultats + ou - (aux extrêmes)
- Bimodale
Pourquoi est-il important de savoir s’il y a aplatissement de la distribution ou asymétrie de la distribution?
Parce qu’on n’utilisera pas la loi normale!
Qu’est-ce que la Courbe T?
C’est la loi de student avec des petits échantillons mais se rapproche de la loi normale
Qu’est-ce que l’erreur de type 1?
C’est le rejet de hypothèse nulle (absence de différence entre GE et GT) alors que H0 est vraie = on déclare qu’il y a différence entre GE et GT, donc que les résultats sont significatifs
Qu’est ce que l’erreur de type 2?
On ne rejette pas H0 alors que c’est faux donc on ne déclare pas les résultats significatifs alors qu’ils le sont
Quelle erreur est la pire: erreur de type 1 ou de type 2?
L’erreur de type 1 est plus grave, car plus de conséquences à dire que quelque chose est significatif alors que non
Qu’est-ce que la puissance d’un test?
La capacité d’un test à détecter un résultat significatif
- (1 - erreur de type II)
- Acceptable à partir 80%
- Comment l’augmenter? Avec le plus de participants possibles
Pourquoi on vient à accepter H1, mais nous ne pouvons pas prouver H1?
Parce qu’on ne trouve jamais H1 parfaitement: il y a % d’erreur
Quelle est la démarche du test d’hypothèse?
- Pour une hypothèse donnée, formuler H0 et H1
- Identifier échelles de mesure des variables (nominales, ordinales, intervalles)
- Choisir le test statistique approprié (dépendant de l’échelle)
- Effectuer le calcul statistique approprié
- En fonction du résultat, prendre la décision de rejeter ou non H0
- Interpréter la signification de cette décision (p > ou < 0.05)
- Dire si votre hypothèse de recherche est confirmée
Donnez un exemple d’hypothèses pour une corrélation.
H0: Il n’y a pas de lien ou il y a un lien négatif entre X et Y
H1: Il y a un lien positif entre X et Y
À quoi sert le Test T (non-pairé)?
Lorsqu’on veut comparer 2 groupes sur une variable continue (1 variable nominale dichotomique et 1 variable intervalle/rapport)
= Il y a deux groupes différents évalués (ex: homme vs femme)
À quoi sert le Test t pour échantillons appariés (t-pairé)?
Lorsqu’un seul groupe est observés à deux reprises sur une variable continue (prétest et posttest).
Permet d’observer les différences de moyenne
Qu’est-ce que l’analyse de variance (ANOVA)?
C’est un test statistique qu’on utilise lorsqu’on veut comparer 3 groupes et + sur une variable continue. Elle nous permet de déterminer s’il y a des différences entre les groupe.
Quel est le désavantage de l’ANOVA?
L’analyse dit seulement s’il y a une différence, mais pas entre quels groupes = doit parfois faire d’autres tests
Pourquoi utilisons-nous l’ANOVA pour comparer 3 groupes à une variable continue plutôt que de faire plusieurs test t?
Parce que chaque fois que l’on effectue une analyse, cela entraîne un pourcentage d’erreur possible, alors cela diminue la fiabilité?
Pourquoi utilisons-nous l’ANOVA pour comparer 3 groupes à une variable continue plutôt que de faire plusieurs test t?
Parce que chaque fois que l’on effectue une analyse, cela entraîne un pourcentage d’erreur possible, alors cela diminue la fiabilité?
Qu’est-ce que l’analyse de variance à deux facteurs (ANOVA factorielle)?
Lorsqu’on a un plan factoriel à deux facteurs (ou +) et une variable continue
Il y a un effet d’interaction entre les groupes expérimentaux et le sexe sur l’anxiété. Quel test statistique dois-je utiliser?
L’ANOVA factorielle
Qu’est que le Khi-carré?
Lorsque nous voulons comparer ou mettre en relation 2 variables NOMINALES (= utilise juste des proportions %)
Combien de tests statistiques y-a-t-il?
6!
- Corrélation
- Test t
- Test t apparié
- Analyse de variance
- ANOVA à deux facteurs
- Khi-deux
Pourquoi devons-nous mentionner si nous croyons que c’est one-tail ou two-tail AVANT de manipuler?
Par soucis d’honnêteté
Que signifie two-tail (bilatéral)?
- C’est lorsqu’on ne se questionne pas sur la nature de la différence (dire qui est le meilleur)
- L’hypothèse est moins bonne s’il n’y a pas de direction, MAIS bon lorsque les études sont contradictoires
- On divise le 5% de chaque côté (2,5%)
Que signifie one-tail (unilatéral)?
- Lorsqu’on prédit le meilleur
- 5% d’un seul côté alors plus de chance de détecter un effet!
Si j’ai un one-tail à p<0.05, quelle est la valeur de Z que nous recherchons?
Z = 1,65
Si j’ai un two-tail à p<0.01, quelle est la valeur de Z que nous recherchons?
Z = 2,58
Si j’ai un two-tail à p<0.05, quelle est la valeur de Z que nous recherchons?
Z = 1.96