Cours 1 - Introduction Flashcards
Fonction
Les méthodes quantitatives
Tester les théories en utilisant des nombres
Fonction
Méthodes qualitatives
Testes les théories en utilisant le langage
Processus de recherche
Les ____ conduisent à la collecte et l’analyse des données et à leur tour informe les ____.
Le même mot pour les deux
Théories
Observation initiale
Pour trouver quelque chose qui a besoin d’être expliqué, nous devons ?
Observer le monde réel
Observation initiale
Nous devons faire la ____ des ____ pour recueillir des données. Ensuite, nous devons définir des ____.
Ne devons faire la collecte des données. Ensuite, nous devons définir des variables
Définition
Théories
Un principe générale hypothétisé ou un ensemble de principes qui expliquent les résultats connus sur un sujet et à partir duqeul de nouvelles hypothèses peuvent être générées.
Hypothèse
Une prédiction à partir d’une théorie
Nous devons ____ l’hypothèse pour pouvoir faire la collecte des donneés
L’opérationnalisation
Falsification
L’acte de réfuter une théorie ou une hypothèse en récoltant des données
Collecte de données
La variable indépendante
- Cause proposée
- Une variable prédictrice
- Une variable manipulée
Collecte de données
La variable dépendante
- L’effet proposé
- Une variable de résultat
- La variable mesurée
Trouve le mot
Sa valeur dépend de la cause
La VD
Trouve le mot
C’est ce qu’on pense qui est la cause d’un effet
La variable indépendante
Cause et effet
Pour parler d’une relation de cause et effet, les causes et effets doivent être ultérieurement ____ dans le temps, donc on parle de ____.
Pour parler d’une relation de cause et effet, les causes et effets doivent être ultérieurement rapprochés dans le temps, donc on parle de contiguité.
Cause et effet
La cause doit se produire ____ qu’un effet ne se produise.
La cause doit se produire avant qu’un effet ne se produise.
Cause et effet
L’effet ne devrait jamais se produire en l’____ de la cause.
L’effet ne devrait jamais se produire en l’absence de la cause.
Complète le mot
C’est une variable autre que les variables prédictrives, qui affecte potentiellement une variable de résultat. C’est appelé ____.
Variable de confusion
tertium quid
Vrai ou faux : un effet devrait être présent lorsque la cause est présente et quand la cause est absente, l’effet devrait être absent aussi.
Vrai
Comment appel-t-on les devis dans lesquels différentes entités sont présentent dans des conditions expérimentales ?
Devis inter-groupes/inter-sujet/indépendant
Comment appel-t-on les devis dans lesquels les mêmes entités prennet part à toutes les conditions expériementales ?
Devis à mesures répétées/groupes dépendants
Plus économique, pratique pour l’effet de pratique
Qu’est-ce qui réduit la variance non-systématique ?
L’assignation aléatoire
Les histogrammes sont la représentation visuelles d’une ____ de ____.
Distribution de fréquence
Sur un histogramme, l’axe horizontal représente les ____ (x) et l’axe vertical représente les ____ (y).
L’axe horizontal : Les valeurs
L’axe vertical : Les fréquences
Décrit une distribution normal visuellement
La distribution est en forme de cloche, il y a une symétrie autour du centre.
Vrai ou faux : La moyenne, le mode et la médiane se retrouvent au centre d’une distribution normale ?
Vrai
Distributions des fréquences
L’asymétrie
Les scores fréquent sont à une extrémité.
- Représente la symétrie d’une distribution
L’asymétrie positive
Donne un exemple
Les scores sont regroupés à gauche de la distribution, donc à de faibles valeurs
Les notes d’un test avec une moyenne très basse
L’asymétrie négative
Les scores sont regroupés vers la droite, donc à des valeurs élevées
La moyenne d’âge dans une maison de retraite
Kurtose
La lourdeur des queues ; représente les variations
Kurtose
Leptocurtique
Lorsqu’il y a peu de variation, donc la courbe est pointue et les queues sont lourdes
Kurtose
Platycurtique
La courbe s’aplatit et les queues sont légères, il y a beaucoup de variation
Vrai ou faux : il est problématique d’utiliser un modèle basé sur la courbe normal si l’échantillon n’est pas distribué normalement
Vrai
Tendance centrale
Le mode
Le score le plus fréquent
Une distribution bimodale
Distribution qui contient 2 modes
Une distribution multimodale
Contient plusieurs modes
La médiane
Le score se trouvant au milieu lorsque les scores sont triés en ordre croissant.
Vrai ou faux : La médiane n’est pas affectée par les scores extrêmes
Vrai
Vrai ou faux : La médiane n’est pas affectée par les asymétries
Vrai
La moyenne est-elle influencée par les scores extrêmes et les asymétries ?
Oui beaucoup !
L’étendue
Le plus petit score soustrait du plus grand, donc la distance entre le score le moins élevé et le plus élevé
Vrai ou faux : L’étendue n’est pas biaisée par les valeurs aberrantes
Faux ! L’étendue est affectée par les valeurs aberrantes
L’étendue interquartile
La distance entre le 3e quartile et le 1er quartile
Quartiles
Ce sont les trois valeurs qui divisent les données tirées en quatre parties égales.
Quartile inférieur
2e quartile
Quartile supérieur
Quartile inférieur : médiane de la moitié inférieur des données
2e quartile : la médiane
Quartile supérieur : médiane de la moitié supérieur des données
Vrai ou faux : les quartiles sont affectés par les valeurs extrêmes
Vrai !
Vrai ou faux : l’étendue interquartile est influencé par les données extrêmes
Faux
Les scores Z nous permettent de ____ un score par rapport aux autres scores dans le groupe.
Les scores Z nous permettent de standardiser un score par rapport aux autres scores dans le groupe.
Les scores Z nous informe sur la position d’un score en rapport à quoi ?
Les scores Z nous inquiquent à combien d’écart-type de la moyenne le score se trouve.
La distribution des scores Z a une moyenne de ____ et un écart-type de ____
M = 0
S = 1
Sous la courbe entière des scores Z, la valeur est de ____.
1
Compréhension
Si Z = 0, à quel percentil est-ce qu’on se trouve ?
Percentil 50
Propriétés des scores z
____ (z) coupe la partie supérieure de 2.5% de la distribution et ____ la partie inférieure.
Donc, 95 % des scores z se situent entre ____ et ____.
Donc, 99 % des scores z se situent entre ____ et ____.
Donc, 99.9 % des scores z se situent entre ____ et ____.
1.96 (z) coupe la partie supérieure de 2.5% de la distribution et -1.96 la partie inférieure.
Donc, 95 % des scores z se situent entre -1.96 et 1.96.
Donc, 99 % des scores z se situent entre -2.58 et 2.58.
Donc, 99.9 % des scores z se situent entre -3.29 et 3.29.
Questions pratiques
Ma note = 80
M = 70
s = 10
À combien d’écart-type suis-je de la moyenne ?
Je suis à 1 écart-type de la moyenne
Questions pratiques
Si je suis à 1 écart-type de la population, à quel percentil est-ce que je me trouve ?
84
(13.59+2.14+0.13)
Quel est le % de la classe ayant un résultat plus élevé que le miens ?
Notes = 90
M = 70
s = 10
Z = 2
À 2 écart-type, on additionne 2.14+0.13.
2.5% de la classe avec un résultat plus élevé que le miens
À -1 écart-type de la moyenne, quel est le % de la classe avec un résultat plus élevé que moi ?
84%
100 - 15.85
Si je pige un étudiant, quelle est la probabilité d’avoir un score supérieur à 2 écart-type par rapport à sa moyenne ?
2.27 %
Quelle est la probabilité que la valeur de quelqu’un soit plus grande que 1 écart-type ?
16 %
Quelle est la probabilité de piger quelqu’un dont la valeur de z est inférieur à -2 écart-type ?
2.27%
Quelle est la probabilité que la valeur de quelqu’un soit plus grande que +2 ou -2 ?
4.5 %
Vrai ou faux : avec des écart-types égaux, on pourrait trouver la probabilité de piger quelqu’un d’une valeur d’écart-type entre les moyennes de deux groupes
Vrai
Lorsqu’il y a une différence entre nos moyennes, si la probabilité que ce soit le ____ du ____ n’est pas suffisament expliqué par le hasard, on pourrait l’attribuer à notre ____ ____.
Lorsqu’il y a une différence entre nos moyennes, si la probabilité que ce soit le fruit du hasard n’est pas suffisament expliqué par le hasard, on pourrait l’attribuer à notre manipulation expérimentale.
Vrai ou faux : tant qu’on a une moyenne et un écart-type, on peut standardiser le score
Vrai
Question de compréhension
Je teste une méthode d’apprentissage. Le groupe expérimental obtient 90 % et le groupe témoin 70 % avec un écart-type de 10 et un Z = 2. On peut donc dire qu’à 0.05 % la probabilité que la différence soit le fruit du hasard est à moins de 0.05%.
- Est-il possible que les plus fort ce soient retrouvé dans le groupe expérimental et que les plus faibles dans le groupe témoin ?
- Est-il probable que les plus fort ce soient retrouvé dans le groupe expérimental et que les plus faibles dans le groupe témoin ?
Oui, il est possible, mais ce n’est pas probable
Avec une valeur z de 3, quelle est la probabilité d’avoir un score plus grand que +3 ou plus petit que -3 ?
0.26%
Plus la valeur z est élevée/faible, plus le p est élevé/faible, donc plus le résultat est/n’est pas statistiquement significatif. Ainsi, plus la valeur de z est élevée/faible, moins/plus ça peut être le fruit du hasard.
Plus la valeur z est élevée, plus le p est faible, donc plus le résultat est statistiquement significatif. Ainsi, plus la valeur de z est élevée, moins ça peut être le fruit du hasard.
Hypothèse nulle (H0)
Il n’y a pas d’effet ou aucune différence entre les groupes
Hypothèse alternative (H1)
L’hypothèse expérimentale, présence de différence
Vrai ou faux : on ne peut pas accepter l’H1
Vrai, il faut rejetter H0
Lorsqu’il y a une direction à notre hypothèse, c’est une hypothèse ____
Unilatéral, donc µ1 < ou > µ2
Donc, z = 1.65
Lorsqu’il n’y a pas de direction à notre hypothèse, c’est une hypothèse ____
Bilatérale, donc, µ1 ≠ µ2
Donc, z = 1.96 ou -1.96
Quel est l’avantage de l’hypothèse unilatérale ?
Permet d’avoir plus de puissance statistique, puisque toute la région critique est concentrée d’un seul côté de la courbe (5%, plutôt que 2.5 % de chaque côté)
Quel serait le désavantage d’une hypothèse unilatérale ?
Si l’effet se manifeste dans la direction opposée, on ne pourra pas détecter l’effet, notre test sera donc non significatif, alors qu’il aurait pu l’être en bilatérale
Quelle est la valeur critique en unilatéral à 5% ?
z = 1.65