Cours 2 Flashcards
Qu’est-ce que la distribution gaussienne?
Distribution normale
VRAI ou faux
À peu près tous les phénomènes suivent la distribution normale, mais on ne sait pas pourquoi
VRAI
VRAI ou FAUX.
Les données doivent se distribuer sur la distribution normale pour faire les calculs statistiques habituels.
FAUX
Les données ne doivent pas se distribuer parfaitement sur la distribution normale pour faire les calculs statistiques habituels.
Lorsque la moyenne et l’écart-type sont connus, on peut calculer la probabilité […]
Lorsque la moyenne et l’écart-type sont connus, on peut calculer la probabilité d’observer une valeur dans une étendue déterminé
Les distribution d’échantillonnage suivent, normalement, la distribution […] ce qui en fait un élément central des principes d’analyses statistiques
Les distribution d’échantillonnage suivent, normalement, la distribution normale ce qui en fait un élément central des principes d’analyses statistiques
Qu’est-ce que le “coeur de la statistique”?
La variabilité interéchantillonnage
-> Nous permet de faire des inférences statistiques
Qu’est-ce que la distribution normale
Les distributions de probabilité rapportent la densité en fonction des valeurs prises
- > C’est l’aire sous la courbe qui correspond à la probabilité
- > La distribution normale joue un rôle très important dans la statistique inférentielle
VRAI ou FAUX
Il est généralement possible d’assumer la distribution normale
VRAI
Qu’est-ce qu’une distribution d’échantillonnage?
La distribution des valeurs résultant du calcul d’une statistique sur un grand nombre d’échantillons d’une grandeur (N) donnée
-> La plupart des tests statistiques assument que cette distribution suit une courbe normale - c’est la base de la statistique inférentielle
-> Le plus souvent, les paramètres de cette distribution sont inconnus, mais peuvent être estimés à partir d’un échantillon
Qu’est-ce que la variabilité interéchantillonnale?
Les différences d’un échantillon à l’autre
L’écart-type de la population d’échantillonnage est toujours connu.
- > Plus notre échantillon est grand, plus la variabilité autour du paramètre va être […].
- > Plus l’unité d’observation est grand, plus la courbe va être […] et la probabilité va être […].
L’écart-type de la population d’échantillonnage est toujours connu.
- > Plus notre échantillon est grand, plus la variabilité autour du paramètre va être réduite.
- > Plus l’unité d’observation est grand, plus la courbe va être normal et la probabilité va être réduite.
La question à la base de la statistique inférentielle:
Est-ce que les résultats que j’observe sont dû à notre manipulation ou la […]?
La question à la base de la statistique inférentielle:
Est-ce que les résultats que j’observe sont dû à notre manipulation ou la variabilité interéchantillonnale?
-> Si la variabilité est au-dessus de la variabilité interéchantionnale, elle est dû à notre manipulation alors il y a un effet
Plus l’échantillon (N) est grand, plus la variance de la distribution d’échantillonnage est […]
Plus l’échantillon (N) est grand, plus la variance de la distribution d’échantillonnage est petite
-> Si on avait un échantillon de la grandeur de la population, on aurait aucune variabilité
VRAI ou FAUX
L’écart-type de la distribution d’échantillonnage est lié directement à l’écart-type de la population et la grandeur de l’échantillon
VRAI
Quoi faire si on ne connait pas l’écart-type de la population?
Utiliser l’écart-type de l’échantillon
VRAI ou FAUX
L’écart-type de l’échantillon est un informateur biaisé de la population alors on ne peut pas l’utiliser dans nos tests
FAUX
L’écart-type de l’échantillon est un informateur non biaisé de la population alors on peut l’utiliser dans nos tests
Qu’est-ce que l’erreur-type?
Écart-type de la distribution d’échantillonnage
- > C’est la base de tous les tests statistiques. On l’estime à partir de l’écart-type de notre échantillon
- > C’est la variabilité de l’échantillon quantifiée
Qui est le créateur de l’écart-type?
Gausset et sa bière
Le théorème de la limite centrale dit: plus N est grand et plus la distribution d’échantillonnage s’approche d’une […] et plus les tests inférentiels sont […] et […].
Le théorème de la limite centrale dit: plus N est grand et plus la distribution d’échantillonnage s’approche d’une courbe normale et plus les tests inférentiels sont valides et puissants
Plus N est grand et plus l’estimation est […]
Plus N est grand et plus l’estimation est précise
VRAI ou FAUX
La distribution d’échantillonnage peut être normale même si les données ne suivent pas une distribution normale
VRAI
La distribution d’échantillonnage peut être normale même si les données ne suivent pas une distribution normale
Pour faire les tests statistiques, on a besoin d’un […]
Pour faire les tests statistiques, on a besoin d’un estimateur normal
L’erreur-type permet de quantifier la variabilité […], c’est-à-dire la variabilité naturelle observée entre les échantillons
L’erreur-type permet de quantifier la variabilité interéchantillonnale, c’est-à-dire la variabilité naturelle observée entre les échantillons
Lorsque nous faisons un test d’hypothèse, nous nous demandons si cette variabilité naturelle (due au […]) permet d’expliquer nos résultats où si autre chose que le … a eu un effet sur nos données
Lorsque nous faisons un test d’hypothèse, nous nous demandons si cette variabilité naturelle (due au hasard) permet d’expliquer nos résultats où si autre chose que le hasard (un traitement, par exemple) a eu un effet sur nos données
L’hypothèse de recherche doit être opérationnalisée en hypothèses […]
L’hypothèse de recherche doit être opérationnalisée en hypothèses statistiques
Les hypothèses statistiques viennent en […]
Les hypothèses statistiques viennent en pair
- > Le test statistique permet d’estimer la probabilité d’avoir nos résultats si l’hypothèse nulle est vraie
- > H0 : hypothèse nulle et H1ou Ha: hypothèse alternative
- > H0 : u1 = u2
- > H2: u1 =/= u2
u = moyenne de la population
VRAI ou FAUX
L’hypothèse alternative est conservée jusqu’à ce qu’on ait de bonnes raisons statistiques de la rejeter
FAUX
L’hypothèse nulle est conservée jusqu’à ce qu’on ait de bonnes raisons statistiques de la rejeter
-> L’hypothèse nulle est rejetée lorsque le test statistique prend une valeur (trop) improbable
VRAI ou FAUX
L’hypothèse nulle correspond à ce que le chercheur veut démontrer
FAUX
L’hypothèse alternative correspond à ce que le chercheur veut démontrer
Les calculs sont faits sur un échantillon, mais les conclusions du test portent sur la […] (paramètres)
Les calculs sont faits sur un échantillon, mais les conclusions du test portent sur la population (paramètres)
Lorsque la valeur de l’hypothèse statistique est […] au niveau alpha (a) déterminé par le chercheur, on rejette l’hypothèse nulle et on adopte l’hypothèse alternative
Lorsque la valeur de l’hypothèse statistique est inférieur au niveau alpha (a) déterminé par le chercheur, on rejette l’hypothèse nulle et on adopte l’hypothèse alternative
-> Par tradition, le niveau a est fixé à une petite valeur comme a = 0,05 (5%) ou a = 0,01 (1%).
VRAI ou FAUX
Le test statistique donne la probabilité que H0 soit vraie.
FAUX
Le test ne donne pas la probabilité que Ho soit vraie, le test donne la probabilité d’avoir nos résultats si Ho est vraie
Qu’est-ce que l’erreur alpha (a)?
Erreur de type 1
- > Chance que le chercheur se donne de se tromper.
- > Généralement 5%. Fixé par le chercheur.
“J’aurais dû conclure qu’il n’y avait pas d’effet. J’ai 5% des chances de ne pas retenir H0, et conclure pour H1. Donc de conclure d’un effet significatif lorsqu’il y en ait pas”
Qu’est-ce que l’erreur bêta (B)?
Erreur de type II
Je conclut à l’absence d’effet (H0) même si en réalité il y en a (H1).
-> La probabilité est généralement non connue puisqu’en général le chercheur va faire un erreur de type 1.
Quelle est la probabilité de choisir l’hypothèse alternative alors que l’hypothèse alternative est la bonne?
1 - B
- > 1 - Erreur de type II
- > C’est la puissance statistique
Quelle est la probabilité de choisir l’hypothèse nulle alors que l’hypothèse nulle est la bonne?
1 - a
-> 1 - Erreur de type I
Qu’est-ce que la puissance statistique?
Probabilité de démontrer ce que je veux démontrer, de rejeter H0 si elle est effectivement fausse
- > 1 - B
- > 1 - Erreur de type II
Quelle est la façon la plus simple d’augmenter la puissance?
Augmenter la grandeur échantillonnale
-> PLus de gens = moins de variabilité = moins de chance de faire des erreurs
Quelle est la différence principale entre les statistiques baysiennes et les statistiques inférentielles?
Les statistiques baysiennes visent à estimer directement la puissance statistique
VRAI ou FAUX
Un test significatif ne veut pas dire un effet significatif
VRAI
VRAI ou FAUX
Une différence peut être statistiquement significative, mais insignifiante
VRAI
Ex: Comparer deux diètes qui ont une différence de quelques grammes
Lorsqu’une différence statistiquement significative est trouvée, il est souhaitable de quantifier la […] ou la […]
Lorsqu’une différence statistiquement significative est trouvée, il est souhaitable de quantifier la grandeur ou la taille de l’effet
Quels sont les principes derrière la convergence scientifique? (2)
1) Étant donné qu’un pourcentage de tests statistiques donnent des résultats erronés (erreur a), des chercheurs arrivent à des conclusions fausses dans leurs études
2) Certains résultats scientifiques publiés sont erronés
Qu’est-ce que la convergence scientifique?
Réplication des résultats afin d’arriver à des conclusions scientifiques sûres
-> Les résultats erronés ou dus au hasard ne devraient pas être répliqués ou confirmés.
Décrivez les probabilités d’un point de vue analytique
Ex: Un sac de caramels mous (15) et durs (85), nous pouvons déterminer analytiquement les probabilités
-> P(dur) = 15/100 = 0.15 = 15%
Décrivez les probabilité d’un point de vue fréquentiste
Établissement des probabilités par essais répétés
ex: Je tire un caramel, je note le type et je répète
Qu’est-ce qu’un évènement?
Concept central des probabilités
“Quelque chose qui se produit”
Qu’est-ce qu’un évènement indépendant?
L’occurrence d’un évènement qui n’affecte pas la probabilité d’un autre évènement
Qu’est-ce qu’un ensemble exhaustif des évènements?
Tous les résultats possibles à une action
Ex: Lancer un dé : {1, 2, 3, 4, 5, 6}
Qu’est-ce qu’un évènement mutuellement exclusif?
L’occurrence d’un événement exclut l’autre événement
Quelles sont les lois fondamentales des probabilités? (4)
1) Loi additive
2) Loi multiplicative
3) Tirage avec remise
4) Probabilité conditionnelle
Qu’est-ce que la loi additive?
Si deux événements sont mutuellement exclusifs, la probabilité de l’un ou de l’autre est la somme des probabilité
-> P (A ou B) = P (A) + P (B)
Qu’est-ce que la loi multiplicative?
La probabilité d’occurrence conjointe de deux événements est la multiplication des probabilités
-> P (A et B) = P (A) * P (B)
Qu’est-ce qu’un tirage avec remise?
À chaque essai, je remets l’item dans le sac
-> Le fait de faire un essai ne change pas la probabilité d’occurrence des autres événements - les événements demeurent indépendants
Qu’est-ce qu’une probabilité conditionnelle?
La probabilité d’un événement étant donné un autre
-> P (A|B) : Probabilité de A étant donné B
Qu’est-ce qu’une permutation?
Tous les arrangements possibles du nombre d’éléments choisis dans l’ensemble, étant donné que chaque élément est choisi au hasard, sans remise
Ex: choisir trois éléments de {A, B, C}, (r = 3, N =3):
ABC ACB BAC BCA CAB CBA -> Il y a 6 permutations
-> C’est l’équation avec !
Qu’est-ce qu’une combinaison?
Tous les arrangements possibles, sans tenir compte de l’ordre des éléments, étant donné que chaque élément de l’ensemble est choisi au hasard, sans remise
Ex: choisir deux éléments parmi {A, B, C} (r = 2, N = 3)
AB AC BC -> Il y a 3 combinaisons
Pourquoi l’approche bayésienne gagne en popularité? (2)
1) Elle ne présuppose pas la distribution normale
2) Elle permet d’estimer des probabilités qui sont inconnues avec l’approche inférentielle - notamment la probabilité que H0 soit vraie (permet de trouver la puissance d’effet)
3) Avec le théorème de Bayes, on part avec une mesure d’estimation. Lorsqu’on arrive à un bon estimé, on peut arrêter de collecter de nouvelles données -> Donc pas besoin de décider la grandeur d’échantillon
-> Elle est toutefois beaucoup plus complexe d’un point de vue computationnel et mathématique
VRAI ou FAUX
L’approche fréquentiste demeure dominante
VRAI
Le théorème de Bayes nous indique comment modifier les probabilités à mesure que l’on accumule de […]
-> p.e. changer l’estimation de la probabilité que […] soit vrai à mesure que l’on obtient de nouvelles données
Le théorème de Bayes nous indique comment modifier les probabilités à mesure que l’on accumule de l’information
-> p.e. changer l’estimation de la probabilité que Ho soit vrai à mesure que l’on obtient de nouvelles données
Avec le théorème de Bayes, il faut d’abord définir une probabilité à […]– cette probabilité peut être subjective, soit analytique – p.e. la probabilité que […] soit vraie : p(A), puis étant donné un N résultats empiriques, le théorème permet d’estimer la probabilité […] p(A|N), c’est dire la probabilité que Ho soit vraie étant donné les N résultats empiriques
Avec le théorème de Bayes, il faut d’abord définir une probabilité à priori – cette probabilité peut être subjective, soit analytique – p.e. la probabilité que Ho soit vraie : p(A), puis étant donné un N résultats empiriques, le théorème permet d’estimer la probabilité conditionnelle p(A|N), c’est dire la probabilité que Ho soit vraie étant donné les N résultats empiriques
Dans le théorème de Bayes, P(N|A) est la probabilité de “non […]”, c’est-à-dire la probabilité de l’hypothèse […]. Or, cette probabilité est généralement inconnue et difficile à estimer
Dans le théorème de Bayes, P(N|A) est la probabilité de “non A”, c’est-à-dire la probabilité de l’hypothèse alternative. Or, cette probabilité est généralement inconnue et difficile à estimer
La distribution binomiale traite des situations où des essais donnent un résultat
parmi deux résultats mutuellement […] (p.e. lancer une pièce: pile ou face) - découle du schéma de Bernoulli
La distribution binomiale traite des situations où des essais donnent un résultat
parmi deux résultats mutuellement indépendants (p.e. lancer une pièce: pile ou face) - découle du schéma de Bernoulli
La distribution binomiale est une distribution […] et non […].
La distribution binomiale est une distribution discrète et non continue.
Le forme de la distribution binomiale change en fonction de N ([…]) et de p ([…]) , pour les grands N, la binomiale tend vers une distribution […]
Le forme de la distribution binomiale change en fonction de N (nombre d’essais) et de p (prob. de succès) , pour les grands N, la binomiale tend vers une distribution normale
La distribution binomiale utilise le test du […]
La distribution binomiale utilise le test du signe
Le test du signe est très pratique, car il ne postule pas que les données suivent la […]
Le test du signe est très pratique, car il ne postule pas que les données suivent la distribution normale…
-> La distribution binomiale peut être généralisée au cas où l’on désire calculer la probabilité d’obtenir plusieurs événements simultanés, c’est la distribution multinomiale