examen 2 Flashcards
pourquoi faire/comprendre les statistiques
- mieux aborder les articles scientifiques
- avoir un oeil critique sur les données et résultats obtenus
- mieux interpréter les résultats d’une etude
- devenir des consommateurs avertis de la recherche afin d’améliorer notre pratique professionnelle
quel est le rôle des statistique
- decrier et synthétiser une informations (données, résultats)
- obtenir une représentation des données quantitatives (distributions)
- tester une hypothèse ou vérifier le bien-fonde d’un objectif
quels sont les avantages des statistiques
- permet d’objectiver
- permet d’illustrer
- permet d’inferer (conclure)
quels sont les risques des statistiques
- notions probabilistes
- ne se fier qu’aux stats
- surinterpretation
qu’est-ce qu’une statistique descriptive
permettent de résumer les caractéristiques d’une population, échantillon ou série de données (notre population a l’étude)
qu’est-ce qu’une statistique inferentielle
celles grâce auxquelles on suppose les caractéristiques d’une population a partir d’un seul échantillon (our sample)
qu’est-ce que la fréquence absolue (le mode)
une mesure statistique qui nous donne des informations sur le nombre de fois qu’un événement est répété
qu’est-ce que la mediane
l’évènement qui divise un jeu de données en deux parties égales lorsqu’il est trie par ordre croissant
qu’est-ce que la moyenne
la somme de toutes les valeurs d’un jeu de données diviser par le nombre total d’évènement
quelle est la mesure de dispersion la plus fréquemment utilisée
l’ecart-type
nommez des exemples de mesure de position
quartiles, centiles, cote Z ou rang
qu’est-ce qu’une statistique inférentielle
elle utilise un échantillon aléatoire de données d’une population afin de décrire cette dernière et de faire des déductions à son sujet
a quel moment la statistique inférentielle est pertinente
lorsqu’il est difficile ou impossible d’examiner chaque membre d’une population entière
sur quoi sont basées les statistiques inférentielles
sur la notion de probabilité et d’erreur d’échantillonnage
que fait l’intervalle de confiance
il nous donne l’étendue des valeurs dans laquelle la moyenne ‘‘véritable’’ se situe
vrai ou faux: un intervalle de confiance de 85% (IC 85%) nous indique qu’il y a 85% des chances que la moyenne véritable se situe à l’intérieur des limites proposées
faux, un intervalle de confiance de 95% (IC 95%) nous indique qu’il y a 95% des chances que la moyenne véritable se situe à l’intérieur des limites proposées
quelle est la différence entre un grand et un petit intervalle de confiance
le petit intervalle de confiance indique que l’estimation est précise et que l’incertitude autour de cette estimation est faible tandis que le grand indique une grande incertitude autour de l’estimation
donner un exemple d’un grand intervalle de confiance
lors de la prise de la pression artérielle: 120 +/- 10 mmHg (IC 95% = 110 a 130 mmHg)
donner un exemple d’un petit intervalle de confiance
lors de la prise de la pression artérielle: 120 +/- 2 mmHg (IC 95% = 118 a 122 mmHg)
quel intervalle de confiance est meilleur, un grand ou un petit
un petit intervalle de confiance est généralement préférable, car il offre une estimation plus fiable, mais il dépend des conditions de l’étude, comme la taille de l’échantillon et la variabilité des données
quel hypothèse (nulle ou de recherche) fait l’objet d’une vérification statistique
l’hypothèse nulle (H0)
qu’est-ce que le seuil de significativité
est une valeur prédéterminée qui sert de critère pour décider si un résultat statistique est suffisamment extrême pour rejeter nulle
a quelle valeur est fixé le seuil de significativité (alpha - α )
α = 0.05 (parfois 0.01 ou 0.001)
vrai ou faux: moins on a des gens, moins a a la chance d’avoir un résultat qui est significatif
vra
quelle est la définition de l’hypothèse bidirectionnelle
on teste s une variable est différente d’une certaine valeur , sans spécifier dans quelle direction
qu’arrive t-il si la valeur p calculée est inférieur à 0.05 lors de l’hypothèse bidirectionnelle
on rejette l’hypothèse nulle, indiquant qu’il existe une différence statistiquement significative dans l’une ou l’autre direction
quelle est la définition de l’hypothèse unidirectionnelle
on teste si une variable est soit supérieur, soit inférieur à une certaine valeur, mais on spécifie la direction du test à l’avance
lors de l’hypothèse unidirectionnelle. dans quel contexte est-ce que l’hypothèse nulle est rejetée
si la valeur p est inférieur à 0.05 et dans la direction prévue, cela indique une différence statistiquement significative dans la direction spécifiée
quelle est l’erreur de type 1
rejet de l’hypothèse nulle alors qu’elle est vraie
(on conclut a tord qu’il existe une différence alors que celle-ci résulte du hasard)
quelle est l’erreur de type 2
non-rejet de l’hypothèse nulle alors qu’elle est fausse
(on conclut que les différences sont vraies alors qu’en réalité les échantillons représentent des populations différentes)
qu’est-ce que la puissance statistique
la probabilité que le résultat du test apparaisse significatif alors que l’hypothèse nulle est fausse
quels sont les facteurs qui déterminent la puissance statistique
- la différence réelle
- si la différence est minime, c’est le seuil alpha qui influence le plus la puissance
- la taille de l’échantillon
- la distribution des variables (variabilité)
- le choix du test statistique (type de distribution)
qu’est-ce qu’un test paramétrique
les données suivent la loi normale
qu’est-ce qu’un test non-paramétrique
les données ne suivent pas la loi normale
quel est le test t de student
il permet de comparer les moyennes une à une
vrai ou faux: si les variables se distribuent normalement et que les variances des deux groupes sont comparables, le test t de student peut être utilisé pour de petits échantillon (8 et +)
vrai
donnez une exemple d’autres tests auxquelles on peut avoir recours si il y a présence de plus de deux moyennes
ANOVA
quelle est la différence entre le test t de student pour échantillons indépendants vs échantillons dépendants
indépendants: permet de comparer les moyennes de deux groupes de sujet
dépendants: lorsque les mêmes sujets sont testés à deux reprises, crossover
quelle est la définition du test t de student sur une seule moyenne
utilisé pour comparer une seule moyenne expérimentale à une moyenne théorique déjà connue, mais dont on ne connait pas la variance
vrai ou faux: les corrélations permette de déterminer la relation (la force d’association) entre deux ou plusieurs variables
vrai
quelles sont les 3 types de corrélation
positive, négative et nulle
que permet de faire la diffusion à l’écrit
conserver une trace durable des recherches, qui peut être consultée, utilisée et citée par d’autres chercheurs dans le futur, contribuant ainsi à l’avancement global des connaissances
que permet de faire la distribution à l’oral
l’opportunité d’accroître la visibilité de ses recherches et de se faire connaître dans la communauté scientifique. elles facilitent également les échanges et les collaborations avec d’autres chercheurs