Cours 2 Flashcards
Quel est l’intérêt de connaître l’erreur-type ?
Si la distribution d’échantillonnage est distribuée normalement, connaître l’erreur type nous permet de cibler un intervalle de valeurs à l’intérieur duquel 95% des moyennes d’échantillons se trouveront!
Ex. SE = 0.55
95% des échantillons tirés se trouveront à une distance maximale de 1.10 de la moyenne de la population
Qu’est-ce que la distribution d’échantillonnage ?
La distribution des probabilités d’obtenir tous les échantillons possibles
Donc, la probabilité d’obtenir chaque moyenne d’échantillon possible
À quoi ressemble la distribution d’échantillonnage des moyennes ?
Une courbe symétrique en forme de cloche (Distribution normale)
Qu’est-ce que la théorie des erreurs ?
Elle explique pourquoi on obtient une courbe normale
Quelles sont les 3 conditions de la théorie des erreurs ?
- Le nombre de causes qui contribuent à la mesure est très grand (infinité de facteurs qui influence notre note à l’examen)
- Chacune de ces causes peut réussir ou échouer
- La probabilité d’un succès (ou d’un échec) n’est pas extrême
Qu’est-ce que la distribution normale ?
Distribution des probabilités d’obtenir les différentes valeurs possibles sur la variable
V ou F. La distribution normale correspond toujours à une courbe symétrique et en forme de cloche
VRAI
Que stipule le théorème central limite ?
- Même si notre échantillon ne suit pas une distribution normale, sa distribution d’échantillonnage suit bel et bien une distribution normale
- La distribution d’échantillonnage est centrée sur la moyenne de la population
À combien d’écarts types de la moyenne se situe 95% des données dans une distribution normale ?
+/- 2
À combien d’erreurs types de la moyenne de la population se situe 95% des données dans une distribution normale ?
+/- 2
Comment déterminer les frontières de l’intervalle de confiance ?
À partir de notre échantillon, nous estimons que la moyenne de la population se trouve entre (mu - 2SE) et (mu + 2SE)
V ou F. L’intervalle de confiance est à la base du test d’hypothèse.
VRAI
Quelle conclusion peut-on tirer à partir de l’intervalle de confiance ? (EXAMEN)
95% des échantillons dans lequel l’intervalle de confiance va inclure la vraie moyenne de la population
Qu’est-ce que l’erreur d’échantillonnage ?
L’erreur type nous démontrent qu’en tirant plusieurs échantillons d’une même population, nous trouverons différentes moyennes
Qu’est-ce qu’on utilise pour surmonter le phénomène de l’erreur d’échantillonnage ? Pourquoi ?
Statistiques inférentielles (inductives)
Pour obtenir des conclusions valides sur notre population
Quel est l’objectif des statistiques inférentielles ?
Déterminer quelle était la probabilité d’obtenir l’échantillon obtenu si l’on suppose certaines caractéristiques de la population
Si les probabilités sont très faibles, qu’est-ce qu’on conclut ?
La population à laquelle appartient l’échantillon ne possède pas les caractéristiques que nous avions supposées
V ou F. Seule la conclusion des statistiques est inférentielle
VRAI. Toute la méthode qui précède la récolte des données en est une déductive utilisant les probabilités
Qu’est-ce que l’hypothèse nulle ?
On pose certaines hypothèses sur une population
Qu’est-ce que l’hypothèse nulle ?
On pose certaines hypothèses sur une population
Quelles sont les étapes du test d’hypothèse ?
- On établit l’hypothèse nulle, puis on en déduit les probabilités d’obtenir n’importe quel échantillon
- On vérifie ensuite quelle était la probabilité d’obtenir notre échantillon (si la probabilité était faible, on induit que la population n’est pas celle que nous avions supposée)
Expliquer la loi générale (EXAMEN)
- En statistique inférentielles, toute l’analyse est conduite dans un univers gouverné par une certaine loi générale
- Cette loi générale correspond à une distribution d’échantillonnage
- Cette distribution d’échantillonnage correspond à la probabilité d’obtenir chaque échantillon possible, si et seulement si ces échantillons suivie la loi générale
- Cette loi générale (correspond à l’hypothèse nulle) qui correspond à une distribution d’échantillon
- Une foie cette loi générale établie, la méthode des statistiques inférentielles procède à travers un raisonnement déductif
Quelle est la méthode complète en statistiques inférentielles classiques ? (À REFORMULER)
- On pose une question de recherche visant à comprendre un phénomène.
- On pose une hypothèse nulle : une description de la loi générale dans lequel existe l’analyse.
On établit les valeurs critiques qui permettraient de rejeter 𝐻0 avec une faible probabilité de se tromper si 𝐻0 est vrai. Cette «faible probabilité» correspond à l’erreur de type 1. - On pose une hypothèse alternative (𝐻𝐴) : l’hypothèse du chercheur. Le chercheur construit un modèle du phénomène qu’il tente de comprendre. Le modèle inclut généralement une ou plusieurs variables indépendantes (i.e. unidimensionnel ou de faible dimensionnalité).
- On récolte un échantillon : un groupe d’observations. Le chercheur vérifie les postulats permettant de valider la loi générale. Le chercheur utilise ce groupe d’observations pour estimer les valeurs des paramètres du modèle du chercheur (i.e. l’importance des différentes variables du modèle du chercheur).
- On conclut. Le chercheur vérifie quelle était la probabilité d’obtenir des valeurs de paramètres qui soient au moins aussi éloignés de H0 que ceux estimés à l’aide de notre échantillon (i.e. la valeur p). Si cette probabilité est plus faible que la probabilité d’erreur de type 1* maximale établie au début, on rejette* 𝐻0.
Sinon, on conserve* 𝐻0.
Comment déterminer si on rejette ou non l’hypothèse nulle ?
Si la valeur de l’estimateur est à l’intérieur de l’intervalle de confiance, on conserve l’hypothèse nulle
Si non, on la rejette
Quelles sont les conséquences si nous rejetons l’hypothèse nulle?
- Probabilité de faire une erreur de type 1 supérieure à 5% (trop grand risque)
- Risque de faire une erreur de type 2, soit de ne pas rejeter l’hypothèse nulle alors qu’elle est fausse
Comment formulé un test statistique en fonction du signal et du bruit ?
Statistique testée = signal/bruit
V ou F. Plus le bruit (erreur) est faible, plus la statistique testée sera grande et risquera d’être statistiquement significative
VRAI
V ou F. Plus le signal (effet) est faible, plus la statistique testée sera grande et risquera d’être statistiquement significative.
FAUX
Plus le signal (effet) est GRAND, plus la statistique testée sera grande et risquera d’être statistiquement significative.