10. Plans expérimental et d'échantillonnage Flashcards
2 types étude en biologie/écologie
Études expérimentales
- Chercheur assigne traitement unités échantillonnage -> compare réponse respective
- Ex : médicament dans étude clinique
Études observationnelles
- «Nature» assigne traitement -> chercheur pas influence quelle unité recoit quoi
- Ex : taux cancer foie alcooliue vs non-alcoolique
Étude expérimentale
Peut identifier cause association entre traitements et réponses -> causalité
- Si étude bien planifier
Généralement généralisable (par induction) -> moins spécifique
- Donc possède portée plus grande que observationnelle
Bonne expériementation permet contourner problème variable de confusion/confondante
- Assigne aléatoirement traitements (randomisation) -> brise possible association
individu/variable non mesuré
Reste soumise biais expérimental -> artéfact mesure systématique
- Introduit par procédé expériemental (manière récolte mesures)
- Besoin conditions plus naturelles possible pour éviter -> pris en compte lors planifie
Étude observationnelle
Peut identifier association entre traitements et réponse -> corrélation
Variable de confusion/confondante
Déf : variable non mesurée varie avec variables étudié
- Peut donner fausse impression causalité
- Ex : #télé et espérance de vie, surpoids et consommation brocoli
Peut s’agir variable Z qui explique X et Y
Plan statistique
Essentiel planifier analyses nécessaire confirmer/infirmer hypothèse avant expérience
- Permet récolter bonne informations/mesures
- Permet simplifier analyse suite mesures
Chercher toujours maximiser chance succès, soit obtenir résultats valides
Pour expérimetale;
- Planifie pour réduire biais/influence erreur mesures
- Choisit taille échantillons à l’avance
Pour observationnelle;
- Incopre plus bonne pratique expérimentale possible
Étapes élaboration plan statistique
- Développer question recherche claire
- Hypothèse scientifique? Intéressante? Déjà abordée? Objectifs clairs = expériences clairs - Lister résultats possible expériences
- Veut obtenir/risque obtenir, Conclusion claire atteignable? Donne réponse question? - Développer plan expérimental
- Écrire, faire schémas, réviser -> Souvent - Garder simple/simplifier expérience
- Pour pas perdre objectifs de vue/éviter erreur/généraliser résulatas
- Évite traitements incompréhensible -> peut jeter doute sur étude - Vérifier problème design courant
- Assez réplicas? Échantillons indépendants? Évite seudoréplication? Identifie variables confondantes - Taille échantillon suffisante?
- Taille effet détectable dépend #observation, Assez intervalle permet conlcuer effet? - Discuter design
Réduire biais estimations
Biais réfère exactitude -> inexact = biaisé
3 techniques pour minimiser;
- Groupes contrôle/témoins
- Randomisation
- Test aveugle
Groupes contrôle/témoins
Déf : goupe sujets expériementaux traité comme autres mais subit aucun traitement
- Permet mieux estimer taille effet étudié
Préférable avoir plusieurs témoins
- Si contraites logistiques, coupes traitements avant témoins
Randomisation
Implique fait assigner aléatoirement traitements
- Absence traitement = témoins
Permet;
- Briser possibles associations entre individus et variables confondantes/non mesurées
- Supprimer biais associé variables confondantes/non mesurées
Doit être fait façon systématique -> ex : liste nombre aléatoire
Test à l’aveugle
Implique fait cacher infos sur traitements aux humains
Simple aveugle : sujets connaissent pas traitements
Double aveugle : sujets + expériementateus connaissent pas traitements
- Important pour limiter possibilité partilité -> veut expérience fonctionne
- Surtout utilié contexte biomédical/psychologie -> quand sujet doit décrire effet traitement
- Utiles plusieurs individus impliqués recherche
- Demande 1 personne prépare traitement, 1 autre fait
Réduire erreur d’échantillonnage/de mesure
Erreur d’échantillonnage réfère précision -> imprécis = erreur
- Précision important capable détecter possible effet
Possède impact direct/important analyses statistiques
Veut réduire erreurs/impact erreurs pour laisser que variabilité naturelle entre mesures
4 techniques pour minimiser;
- Réplication
- Équilibrage
- Blocking
- Traitements extrêmes
Réplication
Simplement application traitement plusieurs unités échantilonage et nombre suffisant
- Limite pas multiplication mesure -> doit fair eattention pseudoréplication
Unité : individu ou collection individus
- Collection mesure plus chance semblable -> considère comme une mesure (moyenne)
Plus réplicas/ = moins erreur
- Rappel : SE inversement proportionnelle racine carré n (SE = S/√n)
Donc augmentation effectif = réduit erreur/intervalle confiance, augmente puissance, …
- Mais coute : $$$, temps ressource, … -> possible optimser à avance
Pseudoréplication
Problème plus répandu design expériementaux/observationnels
Apparait quand mesure individuelles pas indépendantes mais analysées comme
- Ex : compare effet fertilisateur mais triatement regroupé dans incubateurs distincts
Unité échantilonnage = incubateur
Solutions : mélange traiatement dans incubateur
- Assure variables confondantes affecte 2 traitements également
Équilibrage
Simplement prévoir même n pour chaque traitement/contrôle (n1 = n2)
- Permet minimiser 1/n1 + 1/n2 tests 2 variable de t
Blocking
But : répartir unités expérimentales dans blocs varie pour raison hors contrôle
- Permet répartir aléatoirement impacts potentiels variables confondantes
- Ressemble randomisation, mais exerce à niveau supérieur unité échantilonnage
Solution efficace pseudoréplication si répatir traitement alétoirement dans blocs
- Ex : plates dans incubateurs
Designe blocs randomisés = extension design apparié mais pour >2 traitements
- Effet traitements mesuré par différence entre traitement dans bloc (utilise ANOVA)
Très utiles si;
- Unités dans homogènes (excepté traitements)
- Varie dû raisons naturelles/environementalles
Traitements extrêmes
Petits effets traitement difficile à détecter
Besoin N élevé et grande précision mesure
Façon détecter si traitement a effet sur système -> inclu traitements extrèmes
- Ex : besoin utilise échelle log
Expérience > 1 facteur
Intéressant répondre plusieurs question à partir 1 expérience;
- Raisons logistiques ($, temps, matériel)
- Facteurs peuvent intéragir
Ex : étude effet ↑ [CO2 atmo] sur écosystèmes marins
- Facteur 1 : cause effet sere donc ↑ T°
- Facteur 2 : cause acidification océeans (cycle carbonates)
- Intéractions et effet sur expèces marines intéressants
Implique plan expérience factoriel -> desgin factoriel
- Étudie toutes conbinaiosn possible traitements (2 facteur + 2 traitemesnt -> 4 expériences)
- Permet détecter éventuelles interactions
Si expériences pas possibles …
Doit faire études observationnelles
Meilleur incorpore tous éléments expériementales pour réduire
- Biais (contrôles, test aveugle)
- Influence erreur mesure (réplication, équilibrage, blocking)
Plusieurs approche pour assurer répond 1ère condition application
- Soit échantilonnage aléatoire/indépendant/représentatif
Échantillonnage aléatoire simple
Échantillone simplement n dans N
Avantage : simple, efficace
Désavantages ;
- Doit avoir accès tout population
- Pas autant représentatif que échantillonnage stratifié
Échantillonnage stratifié
Divise population en strates/blocs -> échantilonne n invidu aléatoirement bloc
- Toujours même nombre n dans tous blocs
- Utile diviser population selon classe social, densité, …
Avantages : représentatif
Désavantages : besoin connaissance préalable sur population
Échanitllonnage par grappe
Divise population en grappes/blocs -> sélectionne alétoirement blocs échantillone tous individus
- Ex : famille
Avantages : peu couteux, facile
Désavantages : difficle jugé représentativité (oui ou non?)
Échantillonnage systèmatique
Échantillonne population manière régulière -> tous x ième individu
- Ex : pose question coin rue à chaque 5 personnes
Avantages : facile expliquer/appliquer
Désavantages : problèmes représentativité
- Si présence patrons répéte dans population avec certaine fréquence
Échantillonnage hiérarchique
Sélection aléatoirement n grappes et k individus dans chacune grappe
Avantages : coût, représentativité
Désavanatges : besoin connaissance préalable sur population
- Fait quand connait existe structure dans population
Souvent associé ANOVA, blocking,
Échantillonnnage de convenance
Sélectionne individus accessible
- Ex : dans intersections à Shinjuku
Avantages : coût, facile
Désavanatges : mauvais représentativité possible
Associer et ajuster (match and adjust)
Utilise pour minimiser influence possible variable confusion -> observationnelle
- Ex : taulle cochon (petit vs moyen vs gros)
Association : associe unité «semblables» et distribue aléatoirement traitements
- Pas toujours possible -> utilise ajustement
Ajustement : liste variables confondantes et choisit groupes partage distributions vairable valeur similaire
- Ou au moins mesure variables confondantes
Utilise ANCOVA
Taille échantillons
Élément clé expérience : détermination # unité échantillonnage à inclure
- Trop peu -> intervalle confiance trop grand, pas possible détecter effet
- Trop grand -> directeur haït car dépenser tous fonds recherche
Doit trouvé bon compromis entre : faisabilité, puissance et précision
3 types de plans;
- Plan pour précision
- Plan pour puissance
- Plan pour perte de donner
Plan pour précision
Calcul nombre optimal individus à échanitllonner pour obtenir ME voulue
- Donc veut estimer taille effet avec max précision
Si compare 2 moyennes (considère conditions correctes et plan équilibré)
- Estime intervale 95% μ1-μ2 avec Y1-Y2 ± ME -> ME = 1/2 intervalle
- Peut utiliser règle pouce : intervale confiance = 2ME ≈ 2SE où S : écart-type échantillon
Formule pour n : n = 8*( S / ME )^2 -> n dépend ME
- Plus S grande et ME voulue petite -> plus n grand
Difficulté : estimation S et décision ME à avance
- Base sur connaissance existante (litérature)/expériences préliminaires
- Intervale = S/2
Relation précision intervalle 95% et n augemente vite premier petit n
Plan pour puissance
Planifie n pour obtenir certain probabilité/puissance pour rejeter H0 fausse
Utilise souvent puissance 80% -> si H0 fausse veut n permet prouver fausse 8/10
Formule : n = 16*(S / D)^2
- Pour puissance 80% et α = 0,05
- D : seuil différence (|μ1-μ2|) sous quel rejet H0 intéresse pas -> équivaut intervale précision
Plan pour perte de données
Plan pour précision/puissance valable pour données à fin expériences
Si soupçonne perte unité possible/mortalité -> doit compenser en conséquences
- Augemente n dès début