5_Intro aux analyses stats Flashcards
Pourquoi faire des analyses statistiques ?
Déterminer :
- Fiabilité d’un appareil à mesurer…
- La valeur normale de…
- Traitement A est-il plus efficace que traitement B ?
- Prise régulière de… réduit risques de …. ?
= Pour faire confiance aux chiffres que nous voyons et seuil scientifique acceptable (Statistiquement significatif)
Comparer objectivement : valides ? fiables ? variabilité parmi données recueillies ?
Tester sur un nbr d’essais conséquent pour tirer conclusions, pas juste 1 individu (représentatif ensemble pop.)
Variabilité, ex: 0-5-10 et 4.9-5-5.1 = même moyenne mais pas même variabilité
Si t-test < 0,05…
différence est SIGNIFICATIVE
Qu’est-ce que la statistique ?
Définition : Branche des maths appliquées : étude des phénomènes mettant en jeu un grand nbr d’éléments
- Ensemble de données concernant l’état ou l’évolution d’un phénomène qu’on étudie au moyen de la statistique (au sens ci-dessus) OU
- Ensemble des méthodes permettant d’obtenir et d’analyser (traiter) des informations (données)
- Utilisent mathématiques et informatique pour leur mise en œuvre
- Données : observations collectées, on va faire une entrée de donner et en faire un nettoyage
En résumé
= Science de la variabilité
= Répondre à une question scientifique, en tirer des conclusions et la généraliser à la pop
Homogène ou disparate (ex : masse corporelle d’une population)
- Écart type, donc variabilité
- 2 moyennes identiques + 2 variabilités différentes = donne résultat et analyse différente !!
Biologie humaine ou anthropométrie
science non exacte
ex : Tous les étudiants n’ont pas la même masse corporelle
Variabilité
STATISTIQUES DESCRIPTIVES
STATISTIQUES INFÉRENTIELLES
MODÉLISATION STATISTIQUE
STATISTIQUES DESCRIPTIVES
La variabilité implique de la confusion. Quelle information concise et utile peut-on extraire de ces données ? Comment décrire la variabilité ?
STATISTIQUES INFÉRENTIELLES
La variabilité implique de l’incertitude. Sachant que les personnes d’un même programme ont des masses différentes, qu’est-ce qui nous permet d’affirmer que les personnes d’un autre programme d’étude auront des masses corporelles comparables? Jusqu’à quel point peut-on généraliser les résultats d’une expérience ? Comment inférer (tirer des conclusions) en présence de variabilité ?
MODÉLISATION STATISTIQUE
La variabilité implique des questions scientifiques. L’un des buts de toute science est d’identifier les sources de variabilité afin d’être en mesure de prédire (voire même de modifier) les phénomènes étudiés. Pourquoi certaines personnes sont plus massives que d’autres ? Quelle masse atteindra une personne dans de telles conditions? Comment prédire la variabilité ?
Inférence statistique
Méthodes permettant de généraliser à une population les conclusions tirées des résultats obtenus à partir d’un échantillon. Utilise le calcul des probabilités
*utiliser info prélevée sur un échantillon pour tirer des conclusions sur un paramètre de la population
Se fait sur la base de divers tests statistiques
Si info provient d’un échantillon
faire inférences + tirer conclusions sur paramètres de la population
*on ne possède qu’un échantillon de la population sans connaître nécessairement la population et on s’intéresse à la population (à un paramètre de la population) = inférence statistique = info prélevée pour tirer des conclusions sur paramètre d’une population
Si info NE provient PAS d’un échantillon
utiliser données de recensement et analyser données en main
Paramètre VS statistique
Paramètre :
- décrit population
- entités réelles
- fixe (mais souvent inconnue)
- Ex: La moyenne (µ) dans une population est un paramètre
Statistique :
- mesure à partir échantillon
- estimation d’un paramètre
- varie d’un échantillon à l’autre
- Ex: La moyenne ( x ) dans un échantillon est une statistique
Population
Ensemble des individus d’intérêt d’une étude (patients, plantes, insectes) avant d’entreprendre une étude ou une expérience
Définir autant précisément que possible QUI nous intéresse
Individu
Unité statistique, élément
Membre de la population étudiée
Variable
Caractéristique d’intérêt mesurable sur les individus de la population (âge d’un patient, hauteur après une culture de six mois d’un Onobrychis, pile ou face, résultat du lancer d’une pièce de monnaie)
Définir QUOI nous intéresse
Taille
Effectif total, nbr d’individus (éléments) concernés par l’étude
Données
Ensemble de mesures/observations concernant l’état/évolution d’un phénomène.
Valeurs prises par une ou plusieurs variables sur un certain nbr d’individus
Échantillon + ses types
Partie ou sous-ensemble prélevé d’une population
• Échantillon représentatif
Contient toutes les caractéristiques de la population (population-mère).
• Échantillon biaisé
Ne renferme pas toutes les caractéristiques de la population
• Échantillon aléatoire
Ses éléments ont été choisis au hasard.
• Échantillon aléatoire simple (EAS)
Chaque unité a une chance égale d’être choisie.
But de l’échantillonnage
Recueillir de l’information en vue d’un jugement, appréciation ou décision :
inférence : on s’intéresse à une population, mais on ne dispose que d’un échantillon
Info sur l’échantillon soient pertinentes, fiables, représentatives et non biaisées !
Méthodes d’échantillonnage
- Scientifiques (probabiliste)
- Non-Scientifiques (non-probabiliste)
Non-Scientifiques (non-probabiliste)
- Échantillonnage accidentel (par convenance)
- Échantillonnage par quotas
- Échantillonnage intentionnel
- Échantillonnage par réseaux
Échantillonnage accidentel (par convenance)
o interview des clients, choisir des personnes selon leur accessibilité dans un lieu déterminé et à un moment précis
o couramment utilisé
Échantillonnage par quotas
o sélection de sous-groupes proportionnellement à leur nombre dans la population
o (ex : origine ethnique)
Échantillonnage intentionnel
o sélection des participants en fonction de caractéristiques typiques de la population à l’étude
Échantillonnage par réseaux
o aussi appelé échantillon en boule de neige
o réseau sociaux, amis partagent caractéristiques communes
o (ex : utilisateurs de fauteuil roulant)
Scientifiques (probabiliste)
- Échantillonnage aléatoire simple (EAS)
- Échantillonnage systématique
- Échantillonnage stratifié (ES)
- Échantillonnage par grappes/amas
Échantillonnage aléatoire simple (EAS)
Donne à chaque membre de la population une chance (probabilité non nulle) connu d’être choisi
Comment obtenir un EAS ?
- Générateur de nombres aléatoires
o Ordinateur : Excel; = ALEA.ENTRE.BORNES (1;189)
o Calculette : fonction RANDOM
- Autres mécanismes acceptables (piger dans un chapeau)
- Table de nombres aléatoires (random digits)
Étiquetage : On donne une étiquette à chaque individu de la population
Échantillonnage systématique
Déterminer de façon aléatoire le 1er élément d’une liste puis à choisir chaque nom suivant sur la liste selon intervalle
Ex : Population N = 1800 Échantillon n = 200 Intervalle de 9 pour constituer l’échantillon
Échantillonnage stratifié (ES)
- La population est divisée en groupes homogènes d’individus (groupe = strate)
Ex : Anglophones, francophones, allophones - EAS dans chaque strate = ce qui donne l’échantillon
Échantillonnage par grappes/amas
Grappe/amas : partie de la pop dans laquelle on retrouve caractéristiques de la population
Ex : échantillonner habitants d’une grande ville du Qc : quartiers = grappes
- EAS parmi les quartiers
- Prendre EAS parmi les habitants des quartiers sélectionnés
Taille de l’échantillon (puissance statistique)
Incidence directe sur la validité des conclusions d’une étude
• Règle : Obtenir un nbr suffisant de personnes pour fournir des résultats crédibles
• Limite : Temps ou budget nécessaire insuffisant
Analyse de puissance statistique (calcul complexe) détermine taille requise de l’échantillon pour études corrélationnelles et expérimentales
Variable
Caractère, attribut de la population sous étude
Données
Valeurs observées d’une variable
Variable dépendante
Mesures qui vont être faites (une ou plusieurs)
Ex: on mesure le temps au 100m, la FC à la fin d’un 200 m, le nbr max de tractions (push-ups)
- Quantitative (numérique) :
o Continues : Peuvent prendre n’importe quelle valeur ((ex : masse, taille, […])
o Discrètes : Chiffres entiers (ex : nb de personnes, nbr d’items défectueux) - Qualitative (catégorielle) :
Variable indépendante
Contrôlées par l’expérimentateur (1 ou plusieurs)
Ex: traitement pharmacologique, suppl. alimentaire, type d’exercice prescrit, sexe, pathologie
Exemple : Étudie l’effet la durée d’un étirement des ischiaux sur l’amplitude de mouvement
VD et VI?
VD : l’amplitude de mouvement
VI : la durée d’un étirement des ischiaux
Type de données (échelle de mesure)
Échelle nominale, ordinale, intervalle, rapport/ratio
Échelle nominale
Classer en catégories
Ex : Sexe (M/F), race (asiatique, caucasien, africain), allégeance politique (PQ, CAQ, Libéral)
Échelle ordinale
Ordre, classement sans écart entre les sujets
Ex : Tournoi pyramide : +haut +fort
Échelle de Likert de 1 à 5
Grade dans l’armée
Échelle intervalle
Ex : Température : 10oC n’est pas 5 fois plus chaud que 2oC
Pointage jugé : note de 9/10 n’est pas 2x meilleure que 4,5/10
Échelle de rapport/ratio
Ordre de grandeur, distance égale entre les unités et le « 0 » signifie l’absence de valeur
Poids: 50 kg est 2 fois plus lourd que 25kg. 0kg représente l’absence de masse.
Validité
Représentativité des énoncés d’un instrument afin de mesurer un concept ou un champ de contenu particulier
Mesure-t-on bien ce que l’on est censé mesurer ?
Fidélité
Constance des valeurs obtenues à l’aide d’un instrument de mesure
Reproductibilité (ex : pèse-personne)