Cours 1 : Intro aux statistiques Flashcards
33sur64
Méthodes quantitatives
Tester les théories en utilisant des nombres
Méthodes qualitatives
Tester les théories en utilisant le langage.
Articles, magasines, journaux
Le processus de recherche
À partir des données, on génère une ( ).
À partir de celle-ci on génère une ( )
À partir des données, on génère une question de recherche.
À partir de celle-ci on génère une théorie.
Le processus de recherche
Après avoir généré une théorie, on formule des ( ) en identifiant les ( ).
Après avoir généré une théorie, on formle des hypothèses en identifiant les variables
Le processus de recherche
À partir des hypothèses, on peut faire la ( ) pour tester la théorie.
À partir des hypothèses, on peut faire la collecte de données pour tester la théorie.
Le processus de recherche
Après avoir collecter les données, on peut ( ) les données.
Après avoir collecter les données, on peut analyser les données.
Question de recherche (observation initiale)
La question de recherche permet de…
trouver quelque chose qui a besoin d’être expliqué.
Question de recherche (observation initiale)
Pour tester le concept, on fait la collecte de données. Cela implique de faire 2 choses ;
1- recueillir des données pour voir si notre intuition est bonne
2- définir les variables.
Génération et vérification de la théorie
Théorie
Un principe hypothétisé ou un ensemble de principes qui expliquent les résultats connus sur un sujet à partir duquel de nouvelles hypothèses peuvent être générées.
Génération et vérification de la théorie
Hypothèse
C’est une prédiction à partir d’une théorie. Elle tente d’expliquer un phénomène plus précis que la théorie.
Ex: Le nombre de personnes se présentant pour une audition de tv réalité qui présente un trouble de la personnalité narcissique sera plus élevé que le niveau général de la population (1%).
Génération et vérification de la théorie
Comment arrivons-nous à opérationnaliser une hypothèse?
On opérationnalise une hypothèse en faisant une prédiction ; La prédiction nous permet de passer du domaine conceptuel de la théorie au domaine plutôt observable.
Génération et vérification de la théorie
Falsification
L’acte de réfuter une théorie ou une hypothèse en allant récolter des données.
Collecte de données
Variable indépendante
C’est la variable manipulée dans les expériences ; la cause proposée.
Elle prédit le résultat (variable prédictrice)
Ex: le coca-cola dans l’hypothèse : Le coca-cola tue le sperme
Collecte de données
Variable dépendante
C’est l’effet proposée.
Elle est donc le résultat (variable de résultat).
C’est la variable que l’on mesure.
Ex: le sperme dans l’hypothèse : Le coca cola tue le sperme.
Collecte de données
Laquelle entre les 2 variables ci-dessous est celle que l’on mesure dans le processus de recherche?
a) variable dépendante
b) variable indépendante
a) variable dépendante
Collecte de données
Laquelle entre les 2 variables ci-dessous est celle qui permet de prédire une variable de résultat (un résultat).
a) variable dépendante
b) variable indépendante
b) variable indépendante
Les méthodes de collecte de données
La méthode inter-groupes / à groupes indépendants
donne un exemple
Plan de collecte de données dans lequel différentes entités (groupes) prennent part dans toutes les conditions expérimentales.
Ici les groupes sont différents, mais ils sont soumis à toutes les conditions.
Ex: Au sein d’une entreprise, l’équipe d’informatique et l’équipe de marketing remplissent tous les mêmes 3 questionnaires mais ce sont des groupes différents.
Les méthodes de collecte de données
La méthode intra-sujets / à groupes dépendants / mesures répétées
donne un exemple
Plan de collecte de données dans lequel les mêmes entités prennent part dans toutes les conditions expérimentales.
Ici il y a un seul groupe qui est soumis à tous les conditions.
Ex: Question de recherche : Le sommeil affecte-t-il la capacité de mémorisation? Un groupe de 20 participants qui auront un sommeil normal (condition 1) pour une nuit et une nuit blanche (condition 2)
Les méthodes de collecte de données
Quelles sont les 2 désavantages dans un plan à mesures répétées (à groupes dépendants)
1- L’effet de la pratique: Les participants peuvent performer différemment à la 2e condition après avoir été soumis à la 1ère condition.
2- L’effet de la fatigue: Les participants peuvent performer différemment à la 2e condition après la 1ère condition car ils sont fatigués / ennuyés.
L’analyse de données
Les distributions de fréquence (histogrammes)
Que nous dit l’axe des x et l’axe des y?
Graphique représentant la répartition des données par rapport à la moyenne.
L’axe des x: Le score
L’axe des y : La fréquence
Les histogrammes de fréquence
Qu’est-ce que les histogrammes de fréquences nous permettent d’identifier visuellement? (4)
1- L’asymétrie (positive ou négative)
2- La kurtose
3- La variation dans les scores
4- Les scores inhabituels (erreurs dans l’entrée de données SPSS ou valeurs aberrantes)
La distribution normale
La distribution normale est en forme de ( ).
On dit qu’elle est ( ) au centre car…
La distribution normale est en forme de cloche.
On dit qu’elle est symétrique au centre car la majorité des scores sont distribués autour du centre.
Vrai ou faux : Si certains scores se retrouvent autour de la moyenne (le centre) il s’agit d’une distribution normale.
Faux. Dans une distribution normale, la majorité des scores se trouvent autour du centre.
La plupart des phénomènes humains suivent la ( )
courbe normale
Lorsque la distribution des données dévie de la courbe normale, on parle d’ ( ) ou de ( )
asymétrie
ou
kurtose / voussure
Histogramme de fréquence
Asymétrie positive vs négative
Asymétrie positive: Les scores sont groupés à des faibles valeurs et peu de scores groupés à des hautes valeurs.
Asymétrie négative : Les scores sont groupés autour de valeurs élevées.
Histogramme de fréquence
Kurtose / voussure
définition + 2 types
Déf: C’est le degré auquel les scores se regroupent à la fin de la distribution.
Leptocurtique : Les données sont moins répandues, courbe pointue. Peu de variation dans les données.
Platycurtique: Les données sont plus répandues, courbe applatie. Bcp de variation dans les données.
Tendance centrale
Le mode
Bimodale et multimodale
C’est le score le plus fréquent dans une distribution.
Bimodale = 2 modes
Multimodale = plusieurs modes
Tendance centrale
La médiane
Avantage?
C’est le score se trouvant au milieu lorsque les scores sont triés en ordre croissant.
Avantage : Non affectée par les valeurs aberrantes.
Tendance centrale
La moyenne
Désavantage
C’est la somme des scores divisée par le nombre de scores.
Influencé par les valeurs aberrantes.
Dispersion
L’étendue
Désavantage
C’est le plus grand score soustrait du plus petit score.
Influencé par les valeurs aberrantes.
Dispersion
L’étendue interquartile
Quartiles
Ce sont les 3 valeurs qui divisent les données triées en 4 parties égales.
1er quartile = 25% (médiane de la portion inférieure des données)
2e quartile = 50% (médiane)
3e quartile = 75% (médiane de la portion supérieure des données)
Que fait un score Z?
Avantage?
Permet de standardiser un score par rapport aux autres scores dans le groupe.
Permet d’exprimer le score en terme de : à combien d’ÉT il se trouve de la moyenne.
Avantage : Non affecté par les unités de mesure (ex: examen sur 30, 40 ,78)
Question de compréhension
Si j’ai un score Z de 0, je suis au percentile ( ) et sur la ( )
Si j’ai un score Z de 0, je suis au percentile 50 et sur la médiane.
Calcul
Calcule le score Z suivant:
X= 96
M = 76
S = 10
z = X - M / s
z = 96 - 76 / 10
z = 2
Je suis à 2 ÉT au dessus de la moyenne.
Le score Z permet aussi de se ( ) par rapport à la ( ) ( )
Le score Z permet aussi de se situer par rapport à la courbe normale.
Questions pratique : Courbe normale
Si mon score à l’examen est 90% et que la moyenne de la classe est 70% et que l’ÉT est de 10.
Combien, en %, d’étudiants ont plus que 90% et moins que 90%?
z= x - M / ÉT
z = 90-70 / 10
z= 2
Je me situe à +2 ÉT de la moyenne avec ma note de 90%.
- Donc 2,27% de la classe ont plus que moi, et 97,73% ont moins que moi.
Questions pratique : Courbe normale
Quelle est la probabilité que je pige un étudiant dont la valeur Z est supérieure à 2 ÉT si…
X = 90%
M= 70%
ÉT = 10
Z = 2
2,27%
Si on veut voir la différence de moyenne entre 2 groupes (groupe expérimental et témoin) comment puis-je y arriver avec un score Z?
Pour comparer les moyennes de 2 groupes on doit avoir une hypothèse.
L’hypothèse peut soit être unilatérale ou bilatérale. En fonction de cela j’identifie ma valeur critique de Z pour être significatif ou non. (unilatéral : Z = 1,65) (bilatéral : Z= 1,96)
Je calcule ensuite mon Z
z = groupe exp - groupe témoin / ÉT
Enfin j’examine si mon Z atteint la valeur critique de Z en fonction de la direction de mon hypothèse!
Questions pratique : Courbe normale
Si ma valeur de Z est de 2, en one-tailed, quelle est la probabilité que la différence détectée entre les groupes ne soit que le fruit du hasard?
Est-ce que ce résultat est significatif?
Pour un test one-tailed (unilatéral), la valeur critique de Z est de 1,65.
Donc, si ma valeur de Z est 2, j’atteint la valeur critique de 1,65 ce qui explique que dans 5% des cas la différence pourrait être le fruit du hasard.
Ce résultat est significatif.
Dans un test unilatéral (one-tailed) la valeur critique de Z pour obtenir un résultat significatif est..
Quel est le % sur la courbe?
1,65
Un seul 5% d’un côté de la courbe (soit + ou -)
Dans un test bilatéral (two-tailed) la valeur critique de Z pour obtenir un résultat significatif est…
Quel est le % sur la courbe?
+1,96 ou - 1,96
2,5 % de chaque bord de la courbe
Quel % de la distribution normale se trouve entre -1,96 et + 1,96 de score z?
95%
Si j’ai 100 étudiants dans la classe et que les notes suivent parfaitement la courbe normale, quelle est la probabilité que je pige un étudiant à 2ÉT et à -2ÉT?
Rép : 5%
Solution :
- Additionne 2,5% pour 2 ÉT de chaque bord.
Calcul
Groupe exp = 90
Groupe témoin = 70
ÉT = 10
Quelle est la probabilité d’avoir obtenu une valeur Z plus grande que 2 ou -2 de score Z?
z= 2.
2,5% + 2,5% = 5%
Donc la probabilité que ce soit le fruit du hasard est dans moins de 5% des cas, donc je déclare mon résultat significatif (p plus petit que 0,05)
Calcul
Groupe exp = 80
Groupe témoin = 70
ÉT = 10
Est-ce que je déclare mon résultat significatif?
Z = 1
Ici la différence entre les groupes est le hasard dans 16% des cas donc je suis non significatif car p est plus grand que 0,05.
Si p est plus petit que 0,05 =
statistiquement significatif.
Si p est plus petit que 0,01 =
encore plus significatif que 0,05
Si p est plus grand que 0,05 =
non significatif
Calcul
Quelle est la probabilité d’avoir un score plus grand que 3 ou plus petit que -3
Rép : 0,16%
solution : 3 ÉT = 0,13% donc 0,13 + 0,13 = 0,16%
Plus la valeur de Z est élevée plus le p est ( )
petit!
Car plus mon Z est grand, plus je me déplace vers les bouts de la courbe normale et donc plus je suis significative.
Si z = 3 je déclare mon résultat significatif à
a) p plus petit que 0,01
b) p est plus petit que 0,05
a)
0,01 est plus puissant statistiquement que 0,05
Types d’hypothèses
Hypothèse nulle
Type d’hypothèse qui soutient qu’il n’y a pas d’effet ou de différence entre les groupes.
H0
Types d’hypothèses
Pourquoi est-ce que l’on ne teste pas d’hypothèse nulle en recherche?
Car en recherche, on doit faire une rescension des écrits.
Donc si mon hypothèse de recherche ne propose pas d’effet je n’ai clairement pas fait une bonne rescension des écrits.
La réscension des écrits doit nous donner une direction à notre hypothèse de recherche..
Types d’hypothèses
Hypothèse alternative
C’est l’hypothèse expérimentale; c’est l’hypotèse que l’on veut tester.
Elle suggère un effet présent permettant de confirmer ou rejeter nos prédictions.
H1
Types d’hypothèses
De quelle type d’hypothèse s’agit-il ?
Le nouveau médicament n’a aucun effet sur la pression artérielle.
Hypothèse nulle
Types d’hypothèses
De quelle type d’hypothèse s’agit-il ?
Les hommes auront un score différent des femmes en terme de consommation d’alcool
Hypothèse alternative
Si j’accepte l’hypothèse alternative, je ( ) l’hypothèse ( )
Si j’accepte l’hypothèse alternative, je rejette l’hypothèse nulle.
J’accepte qu’il y a un effet détecté.
La direction des hypothèses
Unilatéral / one-tailed
Valeur critique de Z pour être significatif?
Hypothèse ayant une direction.
Valeur critique : z = 1,65
La direction des hypothèses
Bilatéral / two-tailed
Valeur critique de Z pour être significatif?
Hypothèse qui n’a pas de direction.
ne dicte pas la direction que prendra l’effet.
Valeur critique : z = 1,96
Unilatéral ou bilatéral?
Les hommes boiront d’avantage que les femmes en terme de consommation d’alcool.
unilatéral
Unilatéral ou bilatéral?
Les fumeurs de cannabis prendront un temps différent pour se lever le matin en comparaison aux non-fumeurs de cannabis
bilatéral
Dans ma prédiction one tailed je peux orienter mon hypothèse de 2 manière, quelles sont-elles?
En one-tailed, je peux orienter mon hypothèse de manière positive ou négative.
Ex positive: Le score moyen après l’entraînement est supérieur à 50.
Ex négative : Le taux d’échec scolaire avec la nouvelle méthode est inférieur à 30 %.