Analyse statistique de données Flashcards
Qu’est-ce que les statistiques ?
- Discipline qui s’intéresse à l’analyse quantitative de la réalité.
Qu’est-ce qu’un paramètre ?
- Calcul effectué sur la population (vraie valeur dans la population ; presque toujours inconnu).
Qu’est-ce qu’un indice statistique ?
- Calcul sur l’échantillon pour estimer le paramètre.
Qu’est-ce qu’une analyse inférentielle ?
- Tests statistiques permettant d’estimer les caractéristiques de la population telles qu’elles sont mesurées à partir de sous-ensembles (échantillons).
- S/√n : écart type divisé par la racine du nombre de personne de l’échantillon.
Qu’est-ce qu’une statistique descriptive ?
- On ne fait que décrire les résultats.
Quelle est l’objectif des statistiques ?
- Représenter un grand nombre de données sous forme d’un ou de quelques nombres (ex. : moyenne).
- Généraliser aux populations les caractéristiques mesurées à partir d’échantillons.
- Prendre des décisions (ex. : faire une thérapie avec 1 groupe témoin et vérifier s’il y a une différence).
Qu’est-ce qu’une stratégie d’analyse ?
- Avant de procéder à la cueillette de données on doit décider du ou des tests statistiques à utiliser.
- Nécessite que la question de recherche et les hypothèses soient clairement définies
- Un critère fondamental qui guide le choix du test est l’échelle de mesure des variables impliquées
- Il faut également bien déterminer le nombre de groupes à l’étude et tenir compte du plan de recherche.
Qu’est-ce qu’une analyse descriptive et quelles sont les principaux indices statistiques qui nous intéressent?
- Permet de synthétiser les données en faisant ressortir comment les données se distribuent.
- Indices de tendances centrales (moyenne, médiane, mode)
- Indices de dispersion (étendue, variance, écart-type)
- Indices de distribution (fréquences, asymétrie, aplatissement)
Quelles sont les indices de tendance centrale ?
- Moyenne : Additionner tous les éléments d’un ensemble et diviser par le nbre d’éléments additionnés.
- Médiane : Point milieu d’un ensemble ordonné de données.
- Mode : Valeur qui a la fréquence la plus élevée, celle qui est endossée par le plus de participants.
Quelles sont les indices de dispersion ?
Étendu :
- Écart entre la valeur la plus petite et la valeur la plus grande.
Variance :
- Variabilité de la distribution de donné. Somme (écarts à la moyenne)*2 / N-1.
Écart-type :
- Distance entre chaque donnée et la moyenne dans un ensemble de données (conserve unité de la variable car √variance)
Quelles sont les types d’étude de la distribution ?
- Distribution de fréquence.
- Aplatissement de la distribution (kurose)
- Asymétrie de la distribution.
Qu’est-ce qu’une analyse inférentielle ?
- Presque toujours avec des échantillons.
- À l’aide de la statistique inférentielle, il est possible d’inférer la valeur d’une variable dans la population à partir de la mesure de cette variable prise dans l’échantillon.
- Par convention, on fixe à 5% le risque toléré que ce soit due au hasard.
Qu’est-ce qu’un test one-tail (unilatéral) ?
- Avec une direction (ex. : tel groupe sera meilleur que l’autre).
- Avantage : on a déjà donné une direction donc on peut tester pour 5% d’un seul côté de la courbe (plus facile d’obtenir une différence statistiquement significative).
Qu’est-ce qu’un test two-tail ?
- Sans direction (ex. : il y aura une différence significative entre tel groupe et tel groupe).
- On doit diviser le 5% de chaque côté de la courbe (2,5% de chaque côté)
- Faire lorsqu’on a une recension des écrits très contradictoire (étude qui penche de chaque côté).
Quand est-ce qu’on utilise la table t ?
- Utiliser pour les petits échantillons (en bas de 30).
Qu’est-ce qu’une erreur de type 1 et de type 2 et laquelle est la plus grave ?
- Type 1 : Rejet de H0 alors que H0 est vraie.
- Type 2 : Non rejet de H0 alors que c’est faux.
- Erreur de type 1 est la plus grave parce qu’elle envoie des chercheurs et intervenant dans une mauvaise direction.
Qu’est-ce que Ho et H1 ?
- H0 = hypothèse nulle ;
- H1 = hypothèse alternative
Qu’est-ce que la puissance d’un test ?
- 1 - erreur de type 2.
Qu’est-ce que la démarche du test d’hypothèse ?
- Pour une hypothèse donnée, formuler H0 et H1.
- Identifier échelles de mesure des variables.
- Choisir le test statistique à effectuer.
- Effectuer le calcul statistique approprié.
- En fonction du résultat, prendre la décision de rejeter ou non H0.
- Interpréter la signification de cette décision.
- Dire si votre hypothèse de recherche est confirmée.
Quelles sont les différents test statistiques ?
- Corrélation: 2 variables continues
- Test t: 2 groupes et une variable continue
- Test t apparié: une variable continue mesurée deux fois
- Analyse de variance: 3 (et +) groupes et une variable continue
- ANOVA à deux facteurs: deux variables nominales (facteurs) ou + et une variable continue
- Khi-deux: deux variables nominales
Qu’est-ce que la corrélation de pearson ?
- Lorsqu’on veut mettre en relation 2 variables continues
- On s’intéresse au sens (+ ou -) ainsi qu’à à la force du lien (faible, modéré, fort).
Exemple d’hypothèse de corrélation ?
Il y a un lien positif entre le nbre d’heure d’activité physique et le score de bien-être physiologique.
- H0: Il n’y a pas de lien ou un lien négatif entre heures d’activité physique et score de bien-être psychologique
- H1: Il y a un lien positif entre nombre d’heures d’activité physique et score de bien-être psychologique
- Si on rejette H0, on accepte H1 = test significatif.
Qu’est-ce que le test-t non pairé ?
- Lorsqu’on veut comparer 2 groupes sur une variable continue (1 variable nominale dichotomique et 1 variable intervalle/rapport).
- Important de présenter les moyennes de chaque groupe pour interpréter le résultat le groupe expérimental (M = 13,1) présente un score de dépression inférieur à celui du groupe témoin (M = 24,5).
Exemple d’hypothèse test-t non pairé ?
Ex. d’hypothèse : Le groupe expérimental a un score de dépression inférieur à celui du groupe témoin.
- H0: Le groupe expérimental a un score de dépression semblable ou supérieur à celui du groupe témoin
- H1: Le groupe expérimental a un score de dépression inférieur à celui du groupe témoin.
Qu’est-ce qu’un test-t pairé ?
- Lorsqu’on a un seul groupe avec deux observations répétées sur une variable continue (1 variable intervalle/rapport mesurée au prétest et posttest).
- Le test tient compte du fait que les résultats proviennent des mêmes personnes (mesures répétées) et non de groupes indépendants.
- On présente également les moyennes pour expliquer le résultat.
- Avantage : moins de participants ; inconvénient : passe 2 fois le même test.
Exemple de test-t pairé ?
- Ex. d’hypothèse : Le score de dépression au posttest sera inférieur à celui du prétest
- H0: Le score de dépression au posttest sera égal ou supérieur à celui du prétest
- H1: Le score de dépression au posttest sera inférieur à celui du prétest
Qu’est-ce que l’analyse de variance (anova) ?
- Lorsqu’on veut comparer 3 groupes et + sur une variable continue (1 variable nominale discrète et 1 variable intervalle/rapport)
- L’analyse vous dit seulement si une différence existe (si rejet de H0), mais pas entre quels groupes
- Analyse de la variance : compare la variance inter-groupe vs. Intra-groupe.
Exemple d’analyse de variance (anova) ?
- Ex. d’hypothèse : Il y a une différence entre les individus visuels, auditifs et kinesthésiques sur la capacité à mémoriser les noms des gens
- H0: Il n’y a pas de différence entre les 3 groupes sur la capacité à mémoriser les noms des gens
- H1: Il y a au moins une différence entre les individus visuels, auditifs et kinesthésiques sur la capacité à mémoriser les noms des gens
Qu’est-ce que l’analyse de variance à 2 facteur (anova à 2 facteurs)?
- Lorsqu’on a un plan factoriel à deux facteurs (ou +) et une variable continue (2 variables nominales et 1 variable intervalle/rapport)
- Si un effet d’interaction est significatif, d’autres analyses sont requises et les effets principaux deviennent moins important.
Exemple d’anova a 2 facteurs ?
Ex. d’hypothèse: Il y a un effet d’interaction entre le groupe (expérimental, témoin) et le sexe sur le niveau d’anxiété.
Il faut alors formuler H0 et H1 pour chaque effet:
- Effet principal du groupe (1er facteur)
- Effet principal du sexe (2e facteur)
- Effet d’interaction groupe X sexe
Qu’est-ce le Khi-carré ?
- Lorsqu’on veut comparer ou mettre en relation 2 variables nominales
- Test d’indépendance permet de tester les différences
- Test d’ajustement d’une distribution permet de comparer une distribution à la distribution théorique
Exemple de khi-carré ?
Ex. d’hypothèse: Il y a une plus grande proportion de femmes étudiant en psychologie qu’en génie.
- H0: Il n’y a pas de différence entre le nombre d’homme et de femme dans les concentrations génie et psychologie
- H1: La proportion de femme dans la concentration psychologie est plus élevée qu’en génie
Qu’est-ce que l’analyse qualitative ?
- Approche qui ne quantifie pas les phénomènes
- Complémentaire à l’approche quantitative
- Ne vise pas nécessairement la vérification d’hypothèses
- Unités élémentaires de sens (mot, phrase)
- Très compliqué, bcp d’entrevue avec synthèse des propos des participants et analyse des mots que se répètent
- De plus en plus on se tourne vers des études mixtes (quanti et quali).