Module 5 Flashcards
Que représente un histogramme?
La distribution d’une variable pour un groupe de participants
Comment s’obtient l’amplitude de la réponse?
En comparant les mesures de tendance centrale
moyenne, médiane ou proportion
Vrai ou faux? Une simulation d’un même ECR donne des réponses identiques.
Faux
Formule de la différence d’incidence cumulée?
Ce - Cp
Est-ce que les centiles se voient bien à l’histogramme?
Non
Vrai ou Faux? La distribution d’un histogramme est approximativement symétrique?
Vrai
Si on a 1000 simulations, que représente le 97,5% centile?
La valeur de X pour laquelle il y a 2,5% de simulations qui sont plus grande
- Pour 1000 simulations, ça vaut dire que 25 simulations sont supérieurs
Est-ce qu’il est possible de calculer les centiles et l’histogramme avec un seul ECR?
Non
besoin d’avoir les résultats de 1000 simulations
Pourquoi, en pratique, on ne peut pas obtenir d’histogramme?
parce qu’on ne fait l’ECR qu’une seule fois
Si la différence des incidences est de 40%, est-ce qu’on peut conclure hors de tout doute que le traitement fonctionne?
Non, car c’est peut-être un résultat inhabituel
Quel principe permet d’estimer la distribution de l’histogramme de “Ce - Cp” à partir d’un seul ECR?
TCL: théorème central limite
Que permettent les lois/formules?
Permettent d’approximer les probabilités d’observer des valeurs sous une hypothèse et d’approximer les distributions des différences entre les groupes
Si l’hypothèse est une différence cumulés égales à 20% et que la probabilité d’obtenir une différence de 20% entre Ce et Cp est de 1/10000, quelle est la conclusion?
Ce n’égale pas Cp
Qu’est-ce que la probabilité conditionnelle?
La probabilité d’observer un événement sous une condition
Aire sous la courbe d’une distribution?
(loi)
1 (ou 100%)
P(X = x) dans une loi normale?
0, il y a une infinité de valeur, donc la probabilité d’avoir une valeur spécifique est de 0
Que représente l’aire sous la courbe d’une loi normale?
La probabilité
Quelle est la probabilité de l’aire sous la courbe de la distribution normale?
P(-∞ ≤ X ≤ +∞) = 1
Est-ce que l’histogramme est une distribution de probabilité?
Non
Avec quoi est définie la loi normale?
N(μ, σ^2)
μ?
moyenne
σ^2?
Variance = écart-type au carré
Forme de la loi normale centrée réduite?
N(0,1)
moyenne = 0 et variance = 1
Transformation pour une variable X qui suit la loi normale centrée réduite?
Z = (X−μ)/σ = (xi - x̄ / s)
x̄ = moyenne et s = écart-type estimer à partir de données de l’étude
Nomme les 3 centiles les plus important d’une loi normale.
- environ 68% des observations sont situées entre: μ − σ et μ + σ (1 écart-type de différence)
- environ 95% des observations sont situées entre: μ − 2σ et μ + 2σ (2 écarts-type de différence)
- environ 99% des observations sont situées entre: μ − 3σ et μ + 3σ (3 écarts-type de différence)
P(X > μ) = ___
0.5
Nomme 3 autres distributions (autre que normale).
- Loi Chi-Carré
- Loi Student
- Loi Fisher
Comment est obtenu le Chi-Carré?
Cette distribution s’obtient par l’addition de carré de variables suivant la loi normale
À quoi sert le Chi-Carré?
L’analyse des tableaux de contingence
Quand utilise-t-on la loi de Student?
Surtout quand n < 30, où n = nombre de participants
Quand n > ________, la loi Student est très similaire à la loi normal?
30
Comment s’obtient la loi de Fisher?
Cette loi s’obtient en divisant deux variables suivant la loi du Chi-carré
Quand est utilisée la loi de Fisher?
Dans la comparaison de plusieurs moyennes (> 2 groupes)
Qu’est-ce qu’un théorème?
Un théorème est un énoncé mathématique dont on peut démontrer l’exactitude où la démonstration utilise les présupposés du théorème
Vrai ou faux? Les théorèmes ne représentent pas des lois universelles.
Vrai
Quelle est la formule si on mesure une variable X sur chacun des n participants d’un ECR selon TCL?
Z = (x̄ - μ) / (σ / √n)
Nomme les 3 présupposés pour que le TCL s’applique.
- Indépendance
- Identiquement distribué
- n grand
Décrit l’indépendance.
Le résultat sur un participant ne donne aucune information sur le résultat d’un autre participant.
Décrit identiquement distribué.
La variable X a la même distribution pour tous les participants de l’étude.
Décrit le n grand.
Selon la distribution de X, l’approximation est bonne pour des n aussi petits que 12. La distribution de X est très loin d’une loi normale alors ≥ 100 est nécessaire
Le TCL concerne seulement la distribution de la _____________.
moyenne
Distribution de (X1-X2), sachant que X1 et X2 suivent une loi normale.
N (μ1 − μ2, σ1^2 + σ2^2)
Quelle est la force de TCL?
On peut approximer la distribution de la moyenne par une loi normale peut importe la distribution de X
Par quoi est défini la loi binomiale?
p = probabilité d’observer l’évènement
- 1 si on l’observe
- 0 si on l’observe pas
Formule de l’écart type?
de la loi binomiale
√p1(1 − p1)
C’est sur la feuille de formule
Variance de “Ce - Cp”?
[p1(1 − p1) / n1] + [p2(1 − p2) / n2]
Nom de l’écart type d’une moyenne?
Erreur type
Calcul de l’erreur type?
en général
σ/√n
sur la feuille de formule
Quel est le facteur de correction ajouté par la formule de l’erreur-type?
σ/√n x √(N-n)/(N-1)
- N = taille de la population
- n = taille de l’échantillon
Si N = n, erreur type est nule
Notation de l’erreur type?
SE
μ1 et μ2 sont les paramètres inconnus et __________ sont leurs estimés.
X¯1 et X¯2
Qu’est-ce que le ré-échantillonage?
Le ré-échantillonnage est semblable à la simulation des 1000 ECRs sauf qu’on utilise les données observées de l’ECR pour créer la simulation
Exemple de ré-échantillonage?
Bootstrap
Décrit le paradigme fréquentiste.
Selon le paradigme fréquentiste, la distribution de la réponse possède des paramètres inconnus mais fixes. Lorsqu’on réalise un ECR, on obtient des estimations de ces paramètres. Ce paradigme est celui qui domine à présent en recherche.
Qu’est-ce que le paradigme bayésien?
Selon le paradigme bayésien, les paramètres ne sont pas fixes et ont eux-mêmes une distribution inconnue.
Fréquentiste ou bayésien? La probabilité d’un événement est sa fréquence relative d’occurrence en répétant l’expérience un grand nombre de fois (à l’infini)
Fréquentiste
Fréquentiste ou bayésien? on doit assigner a priori une mesure du degré de croyance (ou d’incertitude) à un événement. Cette mesure est basée sur l’information que nous avons sur le phénomène étudié.
Bayésien
Le paradigme _________ plaît à bon nombre de statisticiens et chercheurs, car il semble plus représentatif du monde réel.
bayésien
Est-ce que les résultats des deux paradigmes sont identiques?
Non, mais les conclusions sont simillaires
Comment calculerais la probabilité que ma pièce soit honnête selon les deux paradigmes?
A : la pièce est honnête
B : sur 10 lancés j’observe 3 faces
- Le fréquentiste calcule la probabilité conditionnelle de B étant donné A : P(B|A).
- Le bayésien calcule la probabilité conditionnelle de A étant donné B : P(A|B).
Pourquoi faut-il confirmer les résultats d’un ECR?
Car la réponse est une approximation
Je simule le lancé d’une pièce de monnaie honnête avec une probabilité de 0.5 d’obtenir un pile. Si on lance cette pièce de monnaie 100 fois, est-ce que nous allons obtenir 50 faces et 50 piles?
Probablement pas
D’où vient l’erreur aléatoire?
De la variation du CRP
Comment s’obtient l’amplitude de la réponse?
En comparant les mesures de tendance centrale
Quelle est la réponse à 1000 simulations?
Un histogramme