4. Hypothèse de recherche, hypothèse statistique et tests d’hypothèses Flashcards
Hypothèse?
Pas spéculation
Permet formuler façon logique explication pour phénomène
Peut être falsifié/infirmer si fausse par démarche scientifique
Ex : héliocentrisme et géocentrisme
Nécessite analyse approfondie et accumulations observations pour réfuter/supporter
Loi
Énoncé sur mécanisme universelle supporté par assez observations considère comme base savoir scientifique
Nombreux physique/chimie/génétique, mais pas biologie
Processus bioloigque produit combinaiosn autres lois
Théorie évolution (Darwin) plus proche loi biologie/écologie
Principe
Affrimation à porté universel acceptée parce qu’équivaut application lois physico-chimique à écologie
Paradigme
Vision du monde repose bases acceptées par majorité
Donc, façon approcher problème veut résoudre
Nombreux exite et certain oppose
Théorie
Ensemble hiérarchique/ordonné d’hypothèse empiriques explique portion important des observations
Ex : biogéographie insulaire, théorie évolution
Hypothèse de recherche
Proposition à portée universelle
Suggère explication pour situation observée
“Briques” des théories
Modèle
Formulation conceptuelle/mathémathique/informatique d’une hypothèse
Utilise pour tester hypothèse
Expérience
Façon de tester hypothèse de recherche
Observe/perturbe système controlé/naturel
Faits
Vérités naturelles/mesurables
Mesure reproductible
Établissement hypothèse de recherche
Raisonnement propose mécanisme pour expliquer patron dans observations
Explication généralement pas unique/seule étudiée -> impacte variable
Étape
- Observation phénomène
- Intérrogation mécanisme cause
- Établit hypothèse(s)
- Invalide/valide hypothèse(s) avec expérience(s)
Recommandations formulation hypothèse de recherche
- Hypothèse claire + précisions associées
- Plusieurs hypothèses pour chaque processus étudié
Si résultats négatif, aternatives facilitent publication - Traduire hypothèse en modèle
Permet quantifier effets rechercher/étudier - Reconnaitre paradigme
Démarche/expériences/interprétations influencées par biais - Concentrer prédictions court terme (résoudre problèmes locaux)
- Attaquer problèmes importants
Corrélation
Faire attention
Corrélation forte ≠ conclusion logique
Faire attention conclusions hâtives
Ex : consommation gluten vs hausse consommation alimentaire générale
Problèmes complexes pas explicable avec une variable
Test d’hypothèse
Permet utiliser données échantillonnage faire inférence sur population
Vérifie juste si parmètre diffère valeur attendue (y a-t-il un effet)
Étapes processus test d’hypothèse
- Définir résultat attendu
- Formuler H0 et H1
- Calculer statistique de test
- Fixer seuil de rejet α
- Calculer p-value à partir statistique de test
- Conclure -> rejet H0 (ou non) selonj compariaosn p-value et α
Hypothèse nulle (H0)
Suppose différence entre observation et attendu dû hasard
Nulle -> différence entre 2 = nulle
Cherche à réfuter avec test
Hypothèse alternative (H1/HA)
Implique 1 ou + effets responsables d’une différence assez forte avec résultats attendu
Statistique du test
Calcul à partir distribution échantillon/probabilité connue
Ex : données suivent Normale -> calcul à partir Normale,
Spécifique chaque test
Pour distribution probabilité binomiale, correspond nombre de succès choisi (Xobs)
Permet savoir si données compatible avec H0 ou H1
Distribution probabilité dépend test
Inclu : N (effectif) et p (probabilité selon H0)
Tests statistiques
Permet vérifier probabilité fair erreur en rejetant H0
Donc, probabilité faire erreur lors décision que différence pas juste dû hasard
Utilise seuil α pour que probabilité rejetter H0 si vrai soit inférieure
ℙ[Rejeter H0 lorsqu’elle est vraie] ≤ α
α arbitraire mais fixer avant test
α commun : 1%, 5%, 0,1%
p-value
Calculer à partir:
- Distribution échantillonnage
- Valeur statistique observée
Correspond probabilité observer dans nouvel échanitllon même valeur ou valeur encore plus extrême si H0 vraie
Soit, probabilité de se tromper en rejetant H0
Calcul : p-value = ℙ[X ≥ Xobs]
Si bilatéral : p-value = 2 x ℙ[X ≥ Xobs]
Où, X : variable aléatoir étudié
Xobs : valeur statistique observée
Rejet/non-rejt de H0
Peut pas accepter hypothèse
Si p-value ≤ α, rejette H0
Si p-value > α, rejette pas H0
p-value ≤ α signifie probabilité observé même/plus extrême statistique de test juste à cause hasard sous seuil α
Donc, probabilité assez faible pour rejetter H0
Bilatérale vs unilatérale
Bilatérale : permet 2 possiblité, soit plus grande ou plus petit
Ex : H0 : pdroitier = pgaucher = 0.5
H1 : pdroitier ≠ pgaucher ≠ 0.5
Unilatérale : permet 1 possiblité soit juste plus grande ou juste plus petit,
Une des valeurs impossible
Ex : H0 : p1 = p2 = 0.5
H1 : p1 < 0.5
Seuil de rejet
Permet quantifier incertitude autour proportion succès attendue selon H0 Fixe seuil (ex : α = 5%) -> définit aire de rejet
Pour bilatérale doit répartir dans plus petites et plus grandes
Donc, 2.5% chaque côté
Significativité
Test d’hypothèse permet juste prise décision sur validité H0
Rejet permet pas quantifier important phénomène
Donc, rejet distingue significativité/importance
Doit estimer intervalle de confiance autour moyenne pour connaitre significativité
Calcul : p̂ − z(α/2) × √((p̂ x (1−p̂ )) / n) ≤ p ≤ p̂ + z(α/2) × √((p̂ x (1−p̂ )) / n)
Où, p̂ : moyenne
z(α/2) : valeur du seuil
Types d’erreur
Erreur de type 1 : faux positif
Erreur de type 2 : faux négatif
Minimiser un type = augmenter autre type
Importance chaque dépend situation
Augemente puissance test avec augmentation effectif
Préfrable cibler forte puissanc e-> bonne capacité rejeter correctement faux H0
Faux positif (type 1)
Rejette faussement H0
Donc, H0 vrai
Risque connu -> fixer par choix seuil α du test
Faux négatif (type 2)
Rejette faussement pas H0 Donc, H0 faux Plus difficile calculer -> correspond seuil β Dépend principalemetn taille échantillon Seuil β
Fixer seuils
Doit pouvoir fixer seuil α
Commun: 1%,5%,10%
Seuil β plus difficile modifier
Si besoin faible probabilité erreur de type II faire appelle statisticien
Existe outil pour α fixé avec plus petit β possible : théorème de Neyman-Pearson