Cours 1 - Introduction Flashcards
À quelle définition fait-on référence lorsqu’on parle de LA statistique en terme de domaine?
C’est l’ensemble des méthodes qui ont trait à :
- la collecte
- le traitement
- l’interprétation des données
grâce aux mathématiques appliquées
Quels sont les 3 thèmes qui décrivent la statistique?
- Domaine
- Données
- Variable
À quelle définition fait-on référence lorsqu’on parle de les statistiques en terme de données?
C’est l’ensemble des données concernant :
- catégorie de faits
- phénomène
- groupe d’individus
À quelle définition fait-on référence lorsqu’on parle d’une statistique en terme d’une variable?
C’est une variable aléatoire qui est fonction des observations (paramètre observé, mais non contrôlé) et construite à partir d’un échantillon
Qu’est-ce qu’une variabilité stochastique?
C’est une variabilité qui est de nature aléatoire. Comme faire tirer un prix.
Qu’est-ce qu’une variabilité déterministique?
C’est une variabilité qu’on est en mesure de prédire. Comme le fait que 10% de la salle obtiendra A+ à l’examen.
Comment peut-on étudier la variabilité d’un phénomène?
En répétant l’expérience dans les mêmes conditions
Comment peut on étudier la loi d’un phénomène (relation ou tendance)?
En faisant varier les conditions de l’expérience ou de l’observation pour éprouver la relation
Quelle est la suite logique est stat qui permet d’arriver à une décision en partant des données (6)?
- Données
- Informations
- Faits
- Connaissance
- Anticipation
- Décision
Qu’est-ce qu’un élément ou unité d’observation ?
C’est l’unité qui compose la population d’intérêt. Entité concrète, définie à priori, dénombrable sur laquelle on mesure ou observe plusieurs traits.
Donne des exemples d’élément ou d’unité d’observation
Individu, microorganisme, gène, protéine, patient, etc.
Comment se nomme le rassemblement de tous les éléments qu’on étudie?
La population cible
Comment emboîter et hiérarchiser les éléments?
En les identifiants comme éléments primaires, secondaires, tertiaires, etc.
Donne un exemple de hiérarchisation d’éléments.
Les médecins (unité primaire) qui recrutent les patients qui sont leurs clientèle (unité secondaire)
Définir ce qu’est une population statistique
- C’est la totalité des observations individuelles sur laquelle portent les inférences statistiques, existant aux limites spatiotemporelles clairement spécifiées.
- La collection d’éléments possède minimalement une caractéristique commune exclusive.
- Peut être finie ou infinie.
Donne un exemple de population statistique
Toute personne entre 18 et 65 ans
Que permettent de faire les critères d’inclusion ou d’exclusion?
De distinguer une population statistique d’une autre.
Donne un exemple de critères d’inclusion et exclusion
Toute personne entre 18 et 65 ans, non-fumeur, habite à Sherbrooke, etc
Qu’est-ce qu’une inférence statistique?
C’est une opération statistique qui consiste à porter un jugement sur la population statistique à partir d’un sous-ensemble (qui est l’échantillon) en tenant pour acquis la validation de lois et probabilités.
En quoi le processus de déduction diffère de l’inférence statistique?
La déduction est à l’inverse de l’inférence statistique. On part de prémisses qui peuvent êtres vraies ou fausses pour connaître les caractéristiques d’un échantillon.
Dessiner le schéma de méthodologie pour effectuer une inférence statistique
Population — (1) Échantillonnage —>
Échantillon — (2) —> Inférences <— (3) — Distribution des probabilités
(4) À partir des inférences on procède à l’extrapolation pour la population
Qu’est-ce que la population cible?
C’est l’ensemble sur lequel devraient porter les conclusions de l’étude en l’absence de toute contrainte (critère d’exclusion ou inclusion?)
À quel principe fait appel la généralisation de résultats de l’échantillon à la population statistique?
À l’inférence statistique
Est-ce qu’on peut d’emblée généraliser les résultats de l’échantillon à la population cible?
Non, ça dépend de la situation et ça fait appel au seul jugement du scientifique.
Exemple : étude qui se limite à l’université de sherbrooke sur le taux de réussite de 2024 ne peut pas nécessairement être extrapolé à la population cible qui inclut l’ensemble de étudiants du monde
Définir la notion d’échantillon
C’est un fragment d’un ensemble prélevé au sein de la population statistique pour juger de cet ensemble et tirer des conclusions.
Quelle est la formule de la fraction d’échantillonnage et définir les variables
fE = n/N
Effectif de la population statistique (N) : nb d’éléments total
Effectif de l’échantillon : nombre d’éléments d’échantillon (1 à N
Qu’est-ce qu’un tirage aléatoire et quelles sont les trois manières de procéder?
C’est quand on veut un échantillon qui comporte le moins de source de biais, reflète une certaine complexité.
- Mélange des éléments (brassage)
- Échantillonnage probabiliste
- Sélection par quota
À quoi sert le fait de procéder à un tirage aléatoire?
Permet de généraliser les résultats d’une étude à la population statistique, pour rendre l’échantillon représentatif
Qu’est-ce qu’un échantillonnage probabiliste?
C’est un échantillonnage qui attribue une probabilité connue et non-nulle d’appartenir à l’échantillon
Donne des exemples de type d’échantillonnage aléatoire et montrer une manière de l’illustrer
- Aléatoire simple
- Systématique
- À probabilité inégales
- Stratifié
- Par degré
Définir le processus d’échantillonnage aléatoire simple
L’action de prélever au hasard de façon indépendante n unités d’échantillonnage dans une populations de N éléments, chaque élément ayant la même probabilité d’être échantillonné
Définir ce que représente une variable aléatoire
C’est une variable dont la valeur est le résultat d’un processus aléatoire (stochastique).
Pour un élément, la valeur précise prise en compte par la variable aléatoire est inconnue d’entrée de jeux.
Qu’est-ce qu’une variable aléatoire discrète?
C’est une variable qui ne peut prendre qu’un nombre fini de valeurs (1, 2, 3 et non 1,5 ; 2,45)
Donne un exemple de variable aléatoire discrète
Le nombre d’UFC sur un pétri
Qu’est-ce qu’une variable aléatoire continue?
Elle peut prendre toutes les valeurs d’un intervalle fini ou non
Donne un exemple pour une variable aléatoire continue?
La durée d’un effet secondaire
Qu’est-ce qu’une échelle de variation?
C’est un système de classement de variable.
Quels sont les 4 types d’échelles de variation?
- Nominale
- Ordinale
- Par intervalle
- Relative
Qu’est-ce qu’une échelle de variation nominale?
C’est un classement en catégories qualitatives qui sont collectivement exhaustives et mutuellement exclusives.
Qu’est-ce qu’une échelle de variation ordinale?
C’est un classement en rang ou en catégories ordonnées, la distance entre les deux catégories n’est pas connue et peu varier.
Donne un exemple variation nominale?
Quel phénotype ? Dumpy , vortex, létal?
Donne un exemple de variation ordinale
Niveau d’amélioration de symptômes de nul à total
Qu’est-ce qu’une échelle de variation par intervalle?
Classement d’une variable quantitative dont la valeur nulle (le 0) est arbitraire parce qu’il a été déterminé. La distance qui sépare deux données est connue.
Donne un exemple d’échelle de variation par intervalle
Température en celsius, heure, date
Qu’est-ce qu’une échelle de variation relative?
Classement d’une variable dont le 0 n’occupe pas une position arbitraire et signifie la nullité ou l’absence. Peut prendre toutes les valeurs d’un intervalle fini ou non.
Donne un exemple d’échelle de variation relative
Température Kelvin, dénombrement d’entités, masse d’un objet
Qu’est-ce qu’une variable contrôlée?
Variable dont la valeur est déterminée par la personne expérimentatrice et connue de façon précise.
Donner un exemple de variable contrôlée
On fait varier la quantité de zinc précise ingéré par des animaux
Qu’est-ce qu’une variable aléatoire?
C’est une variable ou l’on dénote quelque chose de manière observationnelle, sans choisir explicitement
Donne un exemple de variable aléatoire
Quantités de zinc mesurées dans le sang
Qu’est-ce qu’une variable indépendante ou explicative?
C’est une variable qui peut expliquer en partie les variations du phénomène étudier, celle dont on recherche l’influence
Qu’est-ce qu’une variable dépendante ou réponse?
Variable qu’on veut comprendre ou prévoir les variations dans le plus de situations possibles
Pourquoi c’est important le plan d’échantillonnage?
Parce qu’on peut faire dire n’importe quoi aux chiffres si on n’a pas de connaissances statistiques
Qu’est-ce que le paradoxe de Simpson?
Lorsqu’une tendance est observable dans différents groupes de données, elle s’inverse ou disparaît lorsqu’on en combine plusieurs.
Quels sont les 3 choix de types d’étude?
- Exploratoire
- Confirmative
- Pilote
Quel est le but d’une étude exploratoire?
Pour but de générer des hypothèses de travail à vérifier plus tard.
Quel est le but d’une étude confirmative?
Confirmer une hypothèse ou un concept
Quel est le but d’une étude pilote?
C’est de vérifier si une idée nouvelle est appuyée par des éléments ou pour préparer le protocole d’une étude confirmative. Vérifier s’il y a validité
Quels sont les deux choix d’intervention d’une étude ?
- Expérimentale
- Observationnelle
Quels sont les deux choix d’intervention d’une étude ?
- Expérimentale
- Obervationnelle
Qu’est-ce qu’une étude expérimentale?
Fonctionne par expérimentation, travail sur un système sumplifié où on fait varier les niveaux d’une ou de quelques variables pour observer des effets.
Pour tenter d’établir une relation de cause à effet.
Qu’est-ce qu’une étude observationnelle?
C’est une étude où l’on veut mesurer un phénomène d’intérêt sur des unités d’échantillonnage aléatoires et sur un ensemble de variables qui décrivent la situation.
Rend difficile de vérifier les relations cause-effet
Quelle erreur peut-on faire à l’échantillonnage?
une erreur par biais
Qu’est-ce qu’un biais?
C’est une erreur systématique ou les différentes combinaisons d’unités d’échantillonnage peut sous ou sur estimer la valeur de la population statistique.
Quels sont les 4 types de biais?
- Biais de sélection
- Erreur de couverture
- Erreur de réponse
- Erreur de non-réponse
Qu’est-ce qu’un biais de sélection et donner un exemple
Le résultat d’une sélection non-aléatoire des unités d’échantillonnage.
Choisir un patient de manière subjective
Qu’est-ce qu’une erreur de couverture et donner un exemple
Proviseur d’une mauvaise définition de la population statistique.
Élément inclus qui ne devraient pas l’être
Qu’est-ce qu’une erreur de réponse et donner un exemple
Erreur causée par une mauvais mesure des éléments
Erreur de lecture, mauvaise calibration
Qu’est-ce qu’une erreur de non-réponse et donner un exemple
Résulte de la non-détection d’individus présents au sein d’une unité d’échantillonnage
Oubli de réponse à une question
Qu’est-ce qu’une erreur d’échantillonnage et donner des sources d’erreurs possibles
C’est une erreur aléatoire difficile à contrôler
Sources : temporelle, spatiale, mauvaise estimation d’un paramètre en combinaison avec des éléments échantillonnés
Qu’est-ce qui différencie précision, justesse et exactitude?
La précision va regarder le niveau de variation (erreur d’échantillonnage possible), la juste va adresser l’absence de bais et l’exactitude réunit les deux concepts.
Quelles sont les méthodes à mettre en place pour réduire les biais de précision et d’exactitude?
Randomisation : Assignation aléatoire
Réplication : répéter le traitement plusieurs fois sur différentes unités d’échantillonnage en conditions semblables
Quelles sont les deux techniques pour accroître la précision?
- Réplication : répète chacun des niveaux du traitement etc
- Contrôle de la variation par stratification et la mesure de covariances