Analyse statistique des données Flashcards by Anne-Sophie Laforest

Que signifie “Statistique”?

Une discipline qui s’intéresse à l’analyse quantitative de la réalité

How well did you know this?

Not at all

Perfectly

Que signifie “paramètre”?

Un calcul effectué auprès de la population

How well did you know this?

Not at all

Perfectly

Que signifie “indice statistique”?

Calcul sur l’échantillon

How well did you know this?

Not at all

Perfectly

Qu’est-ce qu’une analyse inférentielle?

Tests statistiques permettant d’estimer les caractéristiques de la population telles qu’elles sont mesurées à partir d’échantillions
**Tjrs avec échantillon car impossible de demander à toute la population

How well did you know this?

Not at all

Perfectly

Quels sont les objectifs des statistiques?

Représenter un grand nombre de données sous forme d’un ou quelques nombre (ex: la moyenne)
Généraliser aux populations les caractéristiques mesurées à partir d’échantillons
Prendre des décisions (confirmer ou rejeter l’hypothèse)

How well did you know this?

Not at all

Perfectly

Quelles sont les différents types d’échelle de mesure?

Nominale: numéro pas important, qu’on ne calcule pas (ex: postes TV)
Ordinale: Likert (Tout à fait en accord)
Intervalle: Chiffres

How well did you know this?

Not at all

Perfectly

En quoi consiste une analyse descriptive?

Faire ressortir comment les données se distribuent pour pouvoir synthétiser l’ensemble des données

How well did you know this?

Not at all

Perfectly

Quels sont les principaux indices statistiques (calcul sur l’échantillon) qui nous intéressent dans l’analyse descriptive?

Indices de tendances centrales (moyenne, médiane
Indices de dispersion (étendue, variance, écart-type)
Indices de distribution (fréquences, asymétrie, aplatissement)

How well did you know this?

Not at all

Perfectly

Quels sont les indices de tendance centrale?

Moyenne
Médiane
Mode

How well did you know this?

Not at all

Perfectly

Qu’est-ce que la moyenne?

Additionner tous les éléments d’un ensemble et diviser par le nombre d’éléments additionnés

How well did you know this?

Not at all

Perfectly

Qu’est-ce que la médiane? Quand est-elle utile?

C’est le point milieu d’un ensemble ordonné de données.
Utile lorsqu’il y a des valeurs extrêmes (ex: étude sur la situation économique des étudiants et un participant a gagné à la loterie)

How well did you know this?

Not at all

Perfectly

Qu’est-ce que le mode?

La valeur qui a la fréquence la plus élevée est celle qui est endossée par le plus de participants (ex: majorité des étudiants ont 80%)

How well did you know this?

Not at all

Perfectly

Quels sont les indices de dispersion?

l’étendue
la variance
l’écart-type

How well did you know this?

Not at all

Perfectly

Qu’est-ce que l’étendue?

Écart entre la valeur la plus petite et la valeur la plus grande

How well did you know this?

Not at all

Perfectly

Qu’est-ce que l’étendue?

Écart entre la valeur la plus petite et la valeur la plus grande

How well did you know this?

Not at all

Perfectly

Qu’est-ce que la variance?

La variabilité de la distribution des données: (somme des écarts à la moyenne)2/ N-1

How well did you know this?

Not at all

Perfectly

En quoi consiste la distribution de fréquences?

Comptabilise le nbr d’unités d’observation se trouvant dans chaque catégorie (nominale) ou pour chaque valeur ou classe (ordinale ou continue)
(Diagramme à bâton, histogramme, courbe normale)

How well did you know this?

Not at all

Perfectly

Qu’est-ce que la courbe normale?

Un modèle probabiliste pour comparer ???

How well did you know this?

Not at all

Perfectly

Qu’est-ce que l’asymétrie de la distribution?

Lorsque beaucoup de gens ont des résultats + ou - (aux extrêmes)
Bimodale

Qu’est-ce que l’asymétrie de la distribution?

Lorsque beaucoup de gens ont des résultats + ou - (aux extrêmes)
Bimodale

Pourquoi est-il important de savoir s’il y a aplatissement de la distribution ou asymétrie de la distribution?

Parce qu’on n’utilisera pas la loi normale!

Qu’est-ce que la Courbe T?

C’est la loi de student avec des petits échantillons mais se rapproche de la loi normale

Qu’est-ce que l’erreur de type 1?

C’est le rejet de hypothèse nulle (absence de différence entre GE et GT) alors que H0 est vraie = on déclare qu’il y a différence entre GE et GT, donc que les résultats sont significatifs

Qu’est ce que l’erreur de type 2?

On ne rejette pas H0 alors que c’est faux donc on ne déclare pas les résultats significatifs alors qu’ils le sont

Quelle erreur est la pire: erreur de type 1 ou de type 2?

L'erreur de type 1 est plus grave, car plus de conséquences à dire que quelque chose est significatif alors que non

Qu'est-ce que la puissance d'un test?

La capacité d'un test à détecter un résultat significatif - (1 - erreur de type II) - Acceptable à partir 80% - Comment l'augmenter? Avec le plus de participants possibles

Pourquoi on vient à accepter H1, mais nous ne pouvons pas prouver H1?

Parce qu'on ne trouve jamais H1 parfaitement: il y a % d'erreur

Quelle est la démarche du test d'hypothèse?

1. Pour une hypothèse donnée, formuler H0 et H1 2. Identifier échelles de mesure des variables (nominales, ordinales, intervalles) 3. Choisir le test statistique approprié (dépendant de l'échelle) 4. Effectuer le calcul statistique approprié 5. En fonction du résultat, prendre la décision de rejeter ou non H0 6. Interpréter la signification de cette décision (p > ou < 0.05) 7. Dire si votre hypothèse de recherche est confirmée

Donnez un exemple d'hypothèses pour une corrélation.

H0: Il n'y a pas de lien ou il y a un lien négatif entre X et Y H1: Il y a un lien positif entre X et Y

À quoi sert le Test T (non-pairé)?

Lorsqu'on veut comparer 2 groupes sur une variable continue (1 variable nominale dichotomique et 1 variable intervalle/rapport) = Il y a deux groupes différents évalués (ex: homme vs femme)

À quoi sert le Test t pour échantillons appariés (t-pairé)?

Lorsqu'un seul groupe est observés à deux reprises sur une variable continue (prétest et posttest). Permet d'observer les différences de moyenne

Qu'est-ce que l'analyse de variance (ANOVA)?

C'est un test statistique qu'on utilise lorsqu'on veut comparer 3 groupes et + sur une variable continue. Elle nous permet de déterminer s'il y a des différences entre les groupe.

Quel est le désavantage de l'ANOVA?

L'analyse dit seulement s'il y a une différence, mais pas entre quels groupes = doit parfois faire d'autres tests

Pourquoi utilisons-nous l'ANOVA pour comparer 3 groupes à une variable continue plutôt que de faire plusieurs test t?

Parce que chaque fois que l'on effectue une analyse, cela entraîne un pourcentage d'erreur possible, alors cela diminue la fiabilité?

Pourquoi utilisons-nous l'ANOVA pour comparer 3 groupes à une variable continue plutôt que de faire plusieurs test t?

Parce que chaque fois que l'on effectue une analyse, cela entraîne un pourcentage d'erreur possible, alors cela diminue la fiabilité?

Qu'est-ce que l'analyse de variance à deux facteurs (ANOVA factorielle)?

Lorsqu'on a un plan factoriel à deux facteurs (ou +) et une variable continue

Il y a un effet d'interaction entre les groupes expérimentaux et le sexe sur l'anxiété. Quel test statistique dois-je utiliser?

L'ANOVA factorielle

Qu'est que le Khi-carré?

Lorsque nous voulons comparer ou mettre en relation 2 variables NOMINALES (= utilise juste des proportions %)

Combien de tests statistiques y-a-t-il?

6! 1. Corrélation 2. Test t 3. Test t apparié 4. Analyse de variance 5. ANOVA à deux facteurs 6. Khi-deux

Pourquoi devons-nous mentionner si nous croyons que c'est one-tail ou two-tail AVANT de manipuler?

Par soucis d'honnêteté

Que signifie two-tail (bilatéral)?

- C'est lorsqu'on ne se questionne pas sur la nature de la différence (dire qui est le meilleur) - L'hypothèse est moins bonne s'il n'y a pas de direction, MAIS bon lorsque les études sont contradictoires - On divise le 5% de chaque côté (2,5%)

Que signifie one-tail (unilatéral)?

- Lorsqu'on prédit le meilleur | - 5% d'un seul côté alors plus de chance de détecter un effet!

Si j'ai un one-tail à p<0.05, quelle est la valeur de Z que nous recherchons?

Z = 1,65

Si j'ai un two-tail à p<0.01, quelle est la valeur de Z que nous recherchons?

Z = 2,58

Si j'ai un two-tail à p<0.05, quelle est la valeur de Z que nous recherchons?

Z = 1.96