Stats 9 Flashcards
Pourquoi doit-on calculer une taille d’échantillon ?
- Impact sur le budget de l’étude
- Balance entre les considérations cliniques et statistiques
- Principes éthiques
Balance considérations cliniques et statistiques
Effet cliniquement pertinent
Stats :
significatif : parfait
non significatif : n trop petit
quand le n est trop petit, on peut ne pas pouvoir détecter un effet existant important
Balance considérations cliniques et statistiques
Effet cliniquement non pertinent
Stats :
significatif : n trop grand
non significatif : parfait
quand le n est trop grand, on peut arriver à stat. significatif.
Problèmes si la taille d’échantillon est trop faible pour détecter un effet qui existe ?
exposition des participants inutilement à un traitement ou à une intervention
perte de temps, ressources et argent
Problèmes si la taille d’échantillon est trop grande et détecte un effet existant non pertinent ?
Perte de temps, ressources et argent car une étude avec un plus petit n aurait donné la même conclusion
problème éthique potentiel si trop de patients ont été exposés inutilement à un traitement ou à une intervention
Quelles sont les 2 types d’erreur quand on fait un test d’hypothèses ?
Erreurs de type I et II
Qu’est-ce qu’une erreur de type 1
Rejeter l’hypothèse nulle H0 quand, en fait, H0 est vraie
Trouver un effet significatif alors qu’il ne l’est pas réellement
La probabilité de commettre une erreur de type I est α, le seuil de signification choisit (souvent limité à 5%)
Qu’est-ce qu’une erreur de type 2?
Ne pas rejeter l’hypothèse nulle H0 quand, en fait, H0 est fausse
Trouver un effet non significatif alors qu’il l’est réellement
La probabilité de commettre une erreur de type II est β
Quelle erreur peut-on faire quand le n est trop grand ?
Erreur de type I (on rejette H0 alors qu’elle est vraie)
Quelle erreur peut-on faire si le n est trop petit ?
Erreur de type II (ne pas rejeter H0 alors qu’elle est fausse)
Qu’est-ce que la puissance ?
La capacité à détecter une différence significative quand une telle différence existe, c.-à-d. la capacité de rejeter H0 si H0 est fausse
Quelle est la formule de la puissance ?
1 - B
Plus la puissance est élevée,
plus on s’assure que les résultats non statistiquement significatifs le sont réellement.
Qu’est-ce qui se passe quand on diminue le seuil alpha à la puissance ?
si alpha diminue, alors bêta augmente et la puissance diminue.
Qu’arrive-t-il si on augmente la taille de l’échantillon à la puissance ?
Quand on augmente la taille de l’échantillon, le B diminue donc la puissance augmente.
Qu’arrive-t-il si on augmente la différence des moyennes ?
L’effet est plus facile à détecter.
Entre un test bilatéral vs unilatéral, lequel a la puissance la plus élevée ?
Test unilatéral tant que la direction hypothétique H1 est bien spécifiée
Si un test bilatéral a un niveau de signification alpha de 0,05, quel est le seuil du test unilatéral pour la même puissance ?
0,10
Plus la variance est grande plus il est _____ de détecter un effet significatif et _____ la puissance sera grande.
Plus la variance est grande plus il est difficile de détecter un effet significatif et moins la puissance sera grande.
Quelles sont les 2 façons de déterminer la taille d’échantillon requise ?
On désire détecter une certaine différence entre deux moyennes. On cherche donc la taille de l’échantillon requise pour la détecter avec une bonne puissance.
2. On a une capacité de recrutement fixé. On cherche donc à déterminer si la différence que l’on peut détecter avec une bonne puissance est pertinente d’un point de vue clinique. (mais on n’écrit jamais ça comme ça dans une étude)
Qu’est-ce que la correction de Bonferroni ?
alpha/nombre de test
permet de déterminer quel est la vrai erreur alpha de l’étude
Quand le nombre de test augmente, qu’est-ce qui se passe avec la puissance ?
Puissance diminue
Quand le nombre de test augmente, que doit-on faire pour ne pas affecter la puissance ?
Augmenter la taille de l’échantillon
Quel est l’objectif d’avoir des issues secondaires ?
Permet de faire des tests sans affecter l’erreur de type I (alpha)
Les issues secondaires = exploratoires
Dans quel contexte le calcul de puissance peut être faussé ?
Si l’analyse réalisée ne correspond pas au modèle statistique utilisé pour le calcul de puissance.
Le calcul de puissance doit idéalement reposer sur l’approche statistique prévue pour l’analyse des données.
Que faire si le calcul de puissance devient trop complexe ?
On fait une modélisation statistique moins puissance pour déterminer la taille d’échantillon.
Méthode conservatrice car la puissance sera au moins celle nécessaire (ex. Anova à 5 facteurs –> 5 t-tests avec correction de Bonferroni)
5 informations requises pour déterminer une taille d’échantillon
Capacité de recrutement
Budget
Pourcentage de perte au suivi
Déterminer la taille d’effet cliniquement pertinente
Trouver les informations requises pour le calcul de puissance (spécifiques au test que l’on fait)
Facile de trouver l’info : perte au suivi, capacité de recrutement, budget
Difficile de trouver : taille d’effet cliniquement pertinente
Informations spécifiques pour calculer taille d’échantillon pour une comparaison de 2 moyennes
Différence cliniquement signifiante
Variance de la mesure (si inconnue : on prend celle du placébo et on assume qu’elle est la même pour le groupe Tx ou que celle dans le groupe Tx est plus grande (+ conservateur))
Attention: ne pas confondre erreur type et écart-type
Que faire si on ne connait pas la variance ?
On prend celle du placébo et on assume qu’elle est la même pour le groupe Tx ou que celle dans le groupe Tx est plus grande (+ conservateur)
Qu’est-ce que l’erreur type ?
Erreur sur la moyenne (standard error of the mean)
Sigma/racine carré de n
plus petit vs écart-type. attention de pas l’utiliser car va diminuer notre n requis.
Informations spécifiques pour une comparaison de 2 proportions
Différence cliniquement signifiante
Proportion dans le groupe contrôle (définis la variance) La proportion de 0,5 correspond au scénario le plus conservateur (valeur maximale à p=0,5) pour n fixé.
Que faire quand on ne connait pas la proportion dans le groupe contrôle ?
On prend une proportion de 0,5 = plus conservatrice. (équivaut à 50%)
Informations spécifiques pour une comparaison de l’évolution de 2 groupes dépendants (étude pré-post)
Variance de la différence (pas la variance de la mesure)
Quand exprime-t-on un résultat sous forme d’IC ?
Quand l’objectif est d’estimer et non tester.
Pas de test statistique dans ce cas, donc pas d’erreur de type II ni de notion de puissance statistique. On calcule quand même une taille d’échantillon.
La largeur de l’intervalle de confiance dépend de ?
Du nombre d’observations. Plus n augmente, plus la taille de l’intervalle va diminuer (augmente la précision)
Information spécifique si on veut estimer un paramètre
Variance de la mesure.
Moyenne : écart-type
Proportion : de quel ordre (0,5 à 0,7)
Vrai ou faux : il est difficile d’établir une taille d’échantillon pour une régression linéaire
Faux, car dépend de plusieurs paramètres.
Encore plus complexe pour la régression logistique.
Quelles sont les conditions pour faire une régression linéaire
Au moins 10 participants par variable dans le modèle
Pour des effets de moyens (Ex. psychologie) :
100 participants + 1 supplémentaire par variable dans le modèle pour estimer un coefficient
Environ 50 + 1 supplémentaire par variable pour estimer une corrélation ou R^2
–> le risque d’erreur de mesure est grand donc on veut un grand n.