Statistiques Flashcards
Qu’est-ce que la statistique descriptive? La statistique inférentielle?
Statistique descriptive : vise à produire une synthèse des données prélevées sur un échantillon.
Statistique inférentielle : partant des observations faites sur un échantillon, vise à énoncer une conclusion qui soit valable pour l’ensemble de la population.
Qu’est-ce qu’une variable quantitative? Une variable qualitative?
Variable quantitative : valeurs qu’elle emprunte sont numériques (par ex. nombre annuel de visites chez le médecin).
Variable qualitative : valeurs qu’elle emprunte décrivent des catégories (par ex. niveau socio-économique).
Qu’est-ce qu’une variable quantitative continue? Une variable quantitative discrète?
Variable quantitative continue : valeurs peuvent être aussi précises que l’instrument de mesure le permet (par ex. poids).
Variable quantitative discrète : quantités obtenues par dénombrement (par ex. nombre annuel de visites chez le dentiste).
Qu’est-ce qu’une variable qualitative nominale? Une variable qualitative ordinale?
Variable qualitative nominale : ses catégories ne peuvent être ordonnées selon un système établi (par ex. appartenance religieuse).
Variable qualitative ordinale : ses catégories peuvent être ordonnées de manière logique (par ex. niveau socio-économique).
Qu’est-ce qui est évalué par la corrélation (r)?
Le degré d’association linéaire entre deux variables continues, donc la force de la relation linéaire entre deux variables.
- 1 : association positive parfaite
- 1 : association négative parfaite
- 0 : absence de relation linéaire
*Ne permet pas d’établir un lien de causalité!
Qu’est-ce qui est évalué par le risque relatif et le rapport de cotes (au niveau des variables)?
Ils estiment le degré d’association entre deux variables qualitatives. Leur relation est souvent illustrée par un tableau de contingence.
Qu’est-ce qu’une distribution normale?
Distribution : répartition des différentes valeurs d’une variable dans la population.
Distribution normale :
- Continue
- En forme de cloche
- Symétrique par rapport à la moyenne
- Unimodale
*Il faut que ce soit spécifié dans le problème pour qu’on sache si une distribution est normale ou pas.
Un échantillon n’est parfois pas complètement représentatif de la population qu’il représente. Comment peut-on tenir compte de la variation échantillonnale?
On construit un intervalle de confiance autour de l’estimation généré par l’échantillon : il s’agit des valeurs entre lesquelles la caractéristique recherchée est susceptible de se trouver.
Qu’est-ce qui affecte la largeur d’un intervalle de confiance?
- Niveau de confiance désiré : plus il est élevé, plus l’intervalle est grand.
- Taille de l’échantillon : plus elle est élevée, plus l’intervalle est petit.
Comment fonctionne un test d’hypothèse?
Le chercheur l’effectue afin de déterminer l’hypothèse la plus vraisemblable lors d’une étude :
- Hypothèse nulle (H0) : absence de changement, de relation
- Hypothèse alternative (H1) : celle que le chercheur souhaite démontrer, présence de relation
*L’hypothèse nulle se définit toujours par une égalité.
Pour déterminer quelle hypothèse est vraie, le chercheur forme un échantillon à partir duquel il effectue une estimation du paramètre étudié. Il compare ensuite l’estimation à ses hypothèses.
Qu’est-ce que la valeur p? À quoi elle sert?
Valeur p : probabilité qu’un échantillon pris au hasard produise un résultat plus extrême que celui qui a été observé.
Elle permet de juger si l’estimation du paramètre est compatible ou non avec l’hypothèse nulle. Plus la valeur p est faible, plus l’hypothèse nulle est invraisemblable et on la rejette.
Habituellement, on rejette H0 si valeur p < 5% ou 1% (niveau du test).
Qu’est-ce qu’une erreur de première espèce? De deuxième espèce?
Erreur de première espèce (probabilité de la commettre est notée alpha) : si le chercheur rejette l’hypothèse nulle et qu’elle est vraie.
Erreur de deuxième espèce (probabilité de la commettre est notée ß) : si le chercheur accepte l’hypothèse nulle et qu’elle est fausse.
Probabilité de rejetter H0 quand elle est fausse (donc de prendre la bonne décision) est la puissance de l’étude (notée 1 - ß).
Qu’est-ce qu’on veut dire quand on parle de groupes indépendants dans une étude? De groupes dépendants?
Les groupes dépendants sont appariés ; à chaque sujet d’un groupe correspond un et un seul sujet de l’autre groupe.
Par ex. lorsqu’un groupe de sujets est mesuré avant et après avoir été soumis à une intervention expérimentale, il s’agit d’un groupe apparié (avec lui-même).
Les groupes indépendants ne sont pas appariés.
Qu’est-ce qu’une fréquence attendue et à quoi ça sert?
Fréquences attendues : correspondent aux fréquences (par ex. nombre de personnes atteintes d’une maladie) auxquelles on s’attend lorsque l’hypothèse nulle est vraie.
Plus les fréquences observées (les vrais résultats de l’étude) s’éloignent de celles qui sont attendues, plus on peut conclure que l’hypothèse nulle est fausse et la rejeter en conséquence.
Manière rapide de calculer une fréquence attendue (pour une case précise du tableau de contingence) : (total de la ligne X total de la colonne) / total des observations de l’étude.
Comment peut-on déterminer quel type de test est approprié au type d’étude mené?
Il faut utiliser correctement les organigrammes (voir dans le manuel de statistiques, ils vont être disponibles à l’examen).
- Premier organigramme : pour les variables continues, discrètes à plusieurs valeurs, ordinales à plusieurs catégories.
- Deuxième organigramme : pour les variables discrètes à peu de valeurs, ordinales à peu de catégories, nominales.