Cours 2 Distribution normale et probabilités Flashcards
Dans la distribution normale, la hauteur de la courbe représente la … et l’aire sous la courbe représente la …
Dans la distribution normale, la hauteur de la courbe représente la densité et l’aire sous la courbe représente la probabilité
Vrai ou Faux
La distribution de Bayes joue un rôle très important dans la statistique inférentielle
Faux
C’est la distribution normale
Qui suis-je?
Un grande nombre de phénomènes naturels se distribuent suivant cette fonction de probabilité?
La distribution normale/gaussienne
Avec la distribution normale, qu’est-il possible de calculé si l’on possède la moyenne de la pop et l’é-t de la pop?
Lorsque ces paramètres sont connus, il est possible de calculer la probabilité d’observer une valeur dans un étendue déterminé
Nommez un principe central de la statistique inférentielle.
Les distributions d’échantillonnage suivent une distribution normale
Vrai ou faux
Il est possible d’assumer la distribution normale dans la plus part des situations
Vrai
Que sont les distributions d’échantillonnages?
C’est la distribution des valeurs résultant du calcul d’une statistiques sur un grand nombre d’échantillons d’une grandeur N donnée
Est-ce que les paramètres de la distributions d’échantillonnage sont connus?
Non, mais il peuvent être estimés à partir d’un échantillon?
Comment appelle-t-on l’é-t d’une distribution d’échantillonnage?
L’erreur-type
Qu’est-ce qui permet d’avoir un é-t petit et une distribution normale?
Un grand échantillon –> Permet donc d’avoir une estimation plus précise
Que stipule le théorème de la limite centrale?
Plus N est grand et plus la distribution d’échantillonnage s’approche d’une courbe normale et plus les tests inférentiels sont valides et puissants
Vrai ou faux
La distribution d’échantillonnage peut être normale, même si les données ne suivent pas une distribution normale
Vrai
À quoi sert l’erreur-type?
Elle permet de quantifier la variabilité interéchantillonnale, c’est à dire la variabilité naturelle observée entre les échantillons
Ex :
Sample 1 = moyenne de 81
Sample 2 = moyenne de 85
La différence entre les moyennes est apellées l’erreur-type
Pourquoi faire un test d’hypothèse?
Pour savoir si la différence trouvé entre nos échantillons relève du hasard ou si notre manipulation à eu un effet sur nos données. Est-ce une variation naturelle des données où est-ce dû à autre chose?
Les calculs sont faits sur un …, mais les conclusions portent sur la …
Les calculs sont faits sur un échantillon, mais les conclusions portent sur la population
Que signifie la valeur/probabilité qu’on a quand on a fait le test statistique? Que signifie p?
C’est la probabilité d’avoir nos résultats si l’hypothèse nulle est vraie
Probabilité d’observer les données si Ho est vraie
Que signifie 1-B?
La puissance statistique
Dessinez le tableau dde décisions et erreur statistiques.
En haut à gauche : 1-a
En bas à gauche : a (erreur de type 1)
En haut à droite : B (erreur de type 2)
En bas à droite : 1-B (puissance)
Qu’est-ce qu’une erreur de type 1 ?
Refuser Ho alors que Ho est vraie. Conclure qu’il y a un effet alors qu’il n’y en a pas
Qu’est-ce qu’une erreur de type 2?
Rejeter H1 alors que H1 est vrai. Conclure qu’il n’y a pas d’effet alors qu’il y en a un
Qu’est-ce qui permet d’augmenter la puissance statistique?
- Avoir un bon test
2. Avoir un échantillon plus grand –> moins grande variabilité interéchantillonnale –> plus grande puissance
Qu’est-ce que la puissance statistique?
C’est la probabilité d’accepter H1 alors que H1 est vrai.
C’est la probabilité de démontrer ce que l’on veut démontrer
Qu’elle est la valeur de 1-B?
Sa valeur est généralement inconnue et difficile à estimer
Vrai ou faux
Un test significatif signifie qu’il a un effet signifiant
Faux
Un test significatif ne veut pas dire un effet signifiant
Ex
Des chercheur retrouvent une différence statistiquement significative
dans la perte de poids associée à deux diètes, mais
qui serait de quelques grammes, donc c’est un effet insignifiant.
Comment a-t-on pus trouver un test significatif?
GRand échantillon –> la valeur de p tend à être petite. Donc oui il y a une différence, mais pas tant. Donc important de voir la taille d’effet
Vrai ou faux
La valeur p associé à un test n’indique pas la taille d’effet
Vrai
Expliquer le concept de convergence scientifique
Étant donné qu’un pourcentage de tests statistiques donnent des résultats positifs erronées (erreur a), des chercheurs arrivent à des conclusions fausses. Certains résultats publiés sont donc erronés
Ça fait partie du cycle de la recherche scientifiques, c’est la convergence scientifique qui nous assure de développer une connaissance juste.
La convergence scientifique repose sur la RÉPLICATION DES RÉSULTATS.
Donc, les résultats erronés ou dus au hasard ne devraient pas être répliqués ou confirmés
Que sont les probabilités analytiques?
Faire une formule pour savoir combien de probabilité j’ai de piger un caramel mou parmi tous les caramels
Que sont les probabilités fréquentistes?
Établir des probabilités par essais répétés et en faisant le décompte
Plus le nombre d’essais est grand, plus l’estimation des probabilité est précise
Que sont les probabilités subjectives?
C’est la croyance d’un individu dans la probabilité d’occurrence d’un événement
Cependant, les êtres humains ne sont vraiment pas bons pour estimer les probabilités
Qu’est-ce qu’un événement?
C’est le concept central des probabilités. C’est quelque chose qui se produit
Qui suis-je?
Mon occurrence n’affecte pas l’occurrence d’un autre événement
Un événement indépendant
Que signifie ensemble exhaustif?
C’est l’ensemble des résultats possibles à une action (mise en accolade)
Ex: Lancer un dé (1,2,3,4,5,6)
Que signifie le fait que mes événements soient mutuellement exclusifs?
L,occurrence d’un événement exclut l’autre événement
Ex: Si je lance une pièce, le résultat pile exclut le résultat face
Qu’est-ce que le loi additive?
Si deux événements sont mutuellement exclusifs, la probabilité de l’un OU l’autre est à la somme des probabilités
P(A ou B) = P(A) + P(B)
Qu’est-ce que la loi multiplicative?
La probabilité d’occurrence conjointe de deux événements est la multiplication des porbabilités
P(A et B) = P(A) * P(B)
La probabilité conditionnelle est la probabilité d’un événement … … un autre
P(…)
La probabilité conditionnelle est la probabilité d’un événement étant donné un autre
P(A/B)
Quelle est la différence entre une permutation et une combinaison?
Dans la permutation, on s’intéresse à l’ordre des événements.
Dans la combinaison, on ne s’intéresse pas à l’ordre des événements
Dans les formules de permutation et de combinaison, que signifie le N et le r?
N = Nombre d’éléments
r = nombre d’éléments choisis
Pourquoi le théorème de Bayes gagne en popularité?
- Ne présuppose pas la distribution normale
2. Permet d’estimer des probabilités qui sont inconnues avex l’approche inférentielle
Quels sont les désavantages du théorème de Bayes?
- Beaucoup plus complexe d’un point de vue computationnel et mathématique.
- Quand on comprend le théorème de la limite centrale, nous n’avons pas d’intérêt d’intérêt à utiliser le théorème de Bayes
- La distribution normale est partout
Quelle approche est dominante en probabilité? Pourquoi?
L’approche fréquentiste. , car même si elle postule l’existence de distribution normale, plusieurs phénomènes, voir la plupart, étudié en psychologie sont distribués normalement
Décrivez le théorème de Bayes.
Ce théorème nous indique comment modifier les probabilités à mesure que l’on accumule de l’information
Il permet d’estimer la probabilité conditionnelle, c’est à dire la probabilité que Ho soit vraie étant donné les N résultats empiriques
Qu’est-ce que la distribution binomiale?
Cette distribution traite des situations où des essais donnent un résultat parmi deux résultats mutuellement indépendants. On parle notament du Schémas de Bernouilli.
Ex: Quelle est la probabilité d’obtenir 3x pile en 5 essais
Que permet de calculer la distribution binomiale?
Permet de calculer la probabilité d’un certains nb de succès sur un certains nombre d’essais
Qu’est-ce qui influence la forme de la distribution binomiale?
La forme change en fonction du N (nb d’essais) et p (prob. de succès). Pour les grands N, la binomiale tend vers une distribution normale.
Comment s’écrit la moyenne et la variance de la distribution binomiale?
Moyenne = Np Variance = Npq
À quoi sert le test du signe?
Tester l’hypothèse que nos résultats sont attribuable à autre chose que le hasard
Si ce n’est que le hasard, il devrait y avoir autant de signe positif que de signe négatif
Quels sont les avantages du test du signe?
Il ne postule pas que les données suivent la distribution normale
La distribution binomiale peut-être généralisée au cas où l’on désire calculer la probabilité d’obtenir … … …, c’est la distribution …
La distribution binomiale peut-être généralisée au cas où l’on désire calculer la probabilité d’obtenir plusieurs événements simultanés, c’est la distribution multinomiale
Les distributions de … rapportent la … en fonction des valeurs prises
Les distributions de probabilité rapportent la densité en fonction des valeurs prises
Qui suis-je?
Je joue un rôle très important dans la statistique inférentielle
La distribution normale
On retrouve … de nos résultats à plus ou moins 1 écart-type de la moyenne avec la distribution normale
On retrouve 68.3% de nos résultats à plus ou moins 1 écart-type de la moyenne avec la distribution normale
Exemple du test du signe : Un chercheur croit que les gens qui se connaissent acceptent mieux les différences individuelles. Au début de l’étude, il demande à 12 participant de s’évaluer entre eux. Il refait la même chose 3 mois plus tard lorsque les sujets se connaissent
Dans l’évaluation avant et après, on remarque qu’il y a 10 gains positifs sur 12. Donc, nous on se demande : Quelle est la probabilité d’observer ces résultats s’il n’y a que le hasard qui joue?
Nous trouvons que p = 0.0192
Avec un alpha de 0.05
H1 : Les gens qui se connaissent acceptent mieux les différences individuelles
Ho : Le fait de connaître les personnes n’influence pas l’évaluation
p = 0.0192 < 0.05 (alpha) –> significatif –> rejet de Ho.
L’effet observé n’est pas dû au hasard
Qui suis-je?
Je suis l’une des distribution de probabilité les plus courante.
Distribution binomiale