Métho II (examen 1) Flashcards
qu’est-ce qu’une population et un exemple
ensemble des individus ou événements qui nous intéressent
exemple = toutes les marmottes du Québec
qu’est-ce qu’un échantillon avec un exemple
sous ensemble de la population
exemple = marmottes sur le campus de l’UL
qu’est-ce qu’une unité d’observation ainsi qu’un exemple
un objet sur lequel on peut collecter des données
exemple = une marmotte du campus
différence entre échantillon probabiliste et non probabiliste
Probabiliste
- aléatoire
- toutes les unités ont autant de chances d’être sélectionnées
- représentatif de toutes la population
- plus économique qu’un recensement
Non probabiliste
- unités ne sont pas sélectionnées au hasard
- de convenance = un groupe de personnes faciles à recruter
pourquoi utilisé un échantillon
- permet tirer des conclusions sur une population = inférences
- estimer certaines caractéristiques d’une population
différence entre validité interne et externe
- interne = à quel point ai-je vraiment mesuré ce que je voulais mesuré
- externe = à quel point mes observations sur l’échantillon sont-elles généralisables à la pop
quel type d’échantillon a la plus grande validité externe
échantillon aléatoire car il est généralisable à l’ensemble de la pop
différences entre échantillonnage aléatoire et aléation (randomisation)
- échantillonnage aléatoire = constitué un échantillon par une méthode faisant en sorte que chaque unité a autant de chance d’être sélectionnée pour participer à l’étude = augmente validité externe
- aléation = répartition aléatoire des unités d’observation dans différents groupes = augmente validité interne
différences entres les trois concepts suivants: variable, variable discrète, variable continue
- variable = valeur représentant une caractéristique d’une unité d’observation
- variable discrète = variable prenant un nombre limité de valeurs, ne peut pas être autre chose entre les deux = Likert, niveau étude, binaire (oui ou non)
- variable continue = valeur numérique représentant la magnitude d’une caractéristique = âge, score motivation, résultats scolaire
différences entres les 4 concepts suivants: données qualitatives, données quantitatives, variable indépendante, variable dépendante
-données qualitatives = représente souvent une catégorie = catégorie emploi
- données quantitatives = données numériques
- variable dépendante = ce qui est mesuré ou prédit = intensité sx
- variable indépendante = ce qui est manipulé = traitement, dosage médic
différences entre les échelles de mesures suivantes: nominale, ordinale, intervalles, rapport
- nominale = étiquettes sans ordre particulier = couleur de cheveux, niveau étude
- ordinale = objets classés suivant un continuum ordonné = échelle Likert
- intervalles = différences fixes entre les points de l’échelle donc pas de rapport entre les données = échelle température car pas un zéro absolu
- rapport = présence zéro absolu = poids
exemple expliquant qu’il n’y a pas de rapport dans les échelles intervalles
si j’ai 20$ dans mes poches et qu’on m’en donne 20 de plus, je ne suis pas 2 fois plus riches, car j’ai 100$ dans mon compte de banque et non 0
pourquoi est-ce important de connaître nos types d’échelle
permet de savoir quel type de test statistique doit être utilisé pour répondre à la question de recherche
différence entres ces types de statistiques: descriptive, inférences statistiques, paramètre, estimateur d’un paramètre
- statistiques descriptives = description d’une caractéristiques d’un ensemble de données = moyenne, écart-type
- inférence statistique = tirer une conclusion sur la population à partir des résultats échantillonnaux
- paramètre = caractéristique d’une population = moyenne d’âge pop
- estimateur = caractéristique d’un échantillon visant à inférer une caractéristique de la population = moyenne âge échantillon
vrai ou faux, les statistiques inférentielle constitue la plus grandes partie des études statistiques
vrai
que représente X
un ensemble de données
X = (3,4,5,6,7,8)
qu’est-ce que des mesures de tendance central
comme des moyennes = permettre de décrire une distribution de données avec un seul chiffre
qu’est-ce qu’un mode
le score le plus fréquent dans une distribution, mais peut être bimodale, si deux scores sont autant fréquent
qu’est-ce que des mesures de variabilité
voir à quel point les scores varie autour de la moyenne, plus elle est grande plus les scores varient
qu’est-ce que la variance
à quel point les différentes variables s’écarte de la moyenne
qu’est-ce que l’écart-type
racine carrée de la variance
qu’est-ce que des degrés de liberté
Le nombre d’observations indépendantes sur lequel un estimé repose
degré de liberté pour un estimateur = nb total de valeurs - nb de paramètre estimé
comment savoir si des estimés sont dépendants de l’un l’autre
si la valeur de chacun des estimé en calculé en fonction d’une moyenne dont chacun contribue ils sont dépendants
pourquoi dans le calcul de la variance d’un échantillon il y a un n-1 au dénominateur
puisque l’on estime la moyenne on doit venir faire moins 1 pour enlevé le degré de liberté relié à la moyenne