cours 3: LES FUCKING PROBA Flashcards
quel est le calcul des probabilités
on divise le nombre de cas/évènement se produit par le nombre total de possibilités
qu’est-ce que l’équiprobabilité
hypothèse implicite que toutes les possibilités ont la même chance de se produire
qu’est-ce qu’une probabilité conditionnelle
probabilité qu’un évènement se produise sachant qu’un évènement est advenu
qu’est-ce que les statistiques inférentielles
déduire les résultats à la population
sur quoi faut-il faire attention avec la généralisation des résultats
faire attention à la généralisation des données incomplètes qui peuvent donner à des théories erronées- C’est le but des statistiques inférentielles
qu’est-ce qui caractérise la distribution normale standardisée
la moyenne est à 0 et l’écart type 1
-on inclue une supposition par défaut d’une distribution normale
que permet la distribution normale standardisée
-rend la distribution utile pour comparer les scores obtenus dans différents groupes(ou scores sur les mêmes groupes)
-permet d’utiliser la loi normale standardisée à des fins d’analyses - transformer les résultats
comment standardiser les scores/score Z
soustraire la moyenne générale des scores et divisé par l’écart type
que permet le score Z
il dit de combien d’écart type chaque score s’écarte de la moyenne
-positif- au dessus de la moyenne
=devient une densité de probabilité
qu’est-ce que la densité de probabilité
courbe qui permet de connaître la probabilité pour la variable de tomber entre deux valeurs données
qu’est-ce que la densité
manière de représenter la distribution de la variable
-permet d’associer chaque valeur à une probabilité de tomber entre deux valeurs en particulier
-détermine la probabilité associée à n’importe quelle intervalle
-permet de déterminer la proportion d’individus qui donnerait la pop totale (élevée ou faible à un seuil fixe)
-comparaison entre population/situation
quel est l’autre nom de la densité de probabilité
distribution N(01)
que permet les probabilités appliquées à la recherche
-estimer les paramètres sur la population
-déterminer les intervalles de confiance
que fait la distribution d’échantillonnage de moyenne
faire des moyennes d’une infinité d’échantillons- moyennes
-quand c’est assez grand= distribution normale
=mène au théorème central limite
que permet l’intervalle de confiance
de déterminer la qualité de l’échantillon
quelle est la différence entre la moyenne d’échantillon et L’intervalle de confiance
moyenne: estimation ponctuelle: valeur unique- on ne sait pas à quel point elle est loin du vrai paramètre d’échantillon
VS
intervalle de confiance: une estimation par intervalle (donne deux valeurs entre lesquelles on sait à 100% que la moyenne se situe
(normalité de la distribution à prendre en compte)
quelle est la différence entre l’erreur standard et l’erreur standard de moyenne
erreur standard : ecart-type d’une distribution d’échantillonnage (dépend de la taille des échantillons)
VS
Erreur standard de moyenne: écart-type de toutes les moyennes d’échantillons possibles
quel est le problème de l’erreur standard de moyenne
on se sert de l,erreur standard pour calculer la vraie moyenne mais pour cela il nous faut les moyennes de beaucoup d’échantillons ce qui est impossible si on fait ça on a plus besoin de l’erreur standard
calculer l’erreur standard de moyenne
écart-type divisé par la racine carrée de la taille de l’échantillon
qu’est-ce que le diagramme de variation
une représentation graphique qui donne les intervalles de confiances pour les moyennes
que permet l’intervalle de confiance se chevauchant
permet de savoir si deux moyennes de population diffèrent
comment rapporter les intervalles de confiances se chevauchant
on est certains à 95% que les moyennes de population se trouvent dans les intervalles définis par les barres d’erreur
(si elles se chevauchent): les barres d’erreur se recoupent ainsi nous ne pouvons pas réellement savoir si les moyennes sont réellement différentes car elles peuvent se trouver n’importe ou.
(si elle ne se recoupent pas): les barres d’erreur sont disjoints, ainsi nous pouvons voir une différence réelle
comment savoir si la valeur de p est assez petite pour rejeter H0 (en vérité nous n’avons pas de réponse définitive)
la probabilité que l’hypothèse se produise sous H0 est inférieure à 5% (si - de 5% = significatif)
quelle est la critique le mettre la valeur de p à 5%
-plus facile de publier un article avec une signification en dessous de 5% qu’un non significatif - biais de publication qui mène à des faux positifs
-éloigne de la taille d’effet- l’importance des différences ou des liens observés
-en gros si p est plus petit que 0,05 = les resultats sont généralisables)
qu’est-ce que l’erreur de 1ere espèce
se produit lorsque nous décidons de rejeter l’hypothèse nulle alors qu’elle est vérifiée: on conclue à tord qu’il y a un effet
-si le seuil de signification esr à 5% et H0 est vrai on a une chance sur 20 de se tromper
-si alfa est faible = peu de chance qu’on ai pu obtenir ce que l’on a eu (en se souvenant qu’aucune n’est sure à 100%)
pourquoi fixer alfa à 0,05
ex: si on le fixe à 2% - si H0 est vérifié=
-erreur de 1ere espèce 1 fois sur 5: résultat souvent faux
- moins d’erreur de 2nd espèce
donc trop permissif
si fixée à 0,001=
-moins de risque d’erreur de 1ere espèce
-augmentation du risque d’erreur de 2ème
trop conservateur
5% est le juste milieu
Mais il y a des paramètres à prendre en compte
les paramètres à prendre en compte pour alfa à 5%
-L’étude (si les tests pharmaceutiques choisir plus conservateur car une erreur peut être fatale
-si on fait tout un tas d’analyses stats en même temps