Métho II (examen 1) Flashcards
qu’est-ce qu’une population et un exemple
ensemble des individus ou événements qui nous intéressent
exemple = toutes les marmottes du Québec
qu’est-ce qu’un échantillon avec un exemple
sous ensemble de la population
exemple = marmottes sur le campus de l’UL
qu’est-ce qu’une unité d’observation ainsi qu’un exemple
un objet sur lequel on peut collecter des données
exemple = une marmotte du campus
différence entre échantillon probabiliste et non probabiliste
Probabiliste
- aléatoire
- toutes les unités ont autant de chances d’être sélectionnées
- représentatif de toutes la population
- plus économique qu’un recensement
Non probabiliste
- unités ne sont pas sélectionnées au hasard
- de convenance = un groupe de personnes faciles à recruter
pourquoi utilisé un échantillon
- permet tirer des conclusions sur une population = inférences
- estimer certaines caractéristiques d’une population
différence entre validité interne et externe
- interne = à quel point ai-je vraiment mesuré ce que je voulais mesuré
- externe = à quel point mes observations sur l’échantillon sont-elles généralisables à la pop
quel type d’échantillon a la plus grande validité externe
échantillon aléatoire car il est généralisable à l’ensemble de la pop
différences entre échantillonnage aléatoire et aléation (randomisation)
- échantillonnage aléatoire = constitué un échantillon par une méthode faisant en sorte que chaque unité a autant de chance d’être sélectionnée pour participer à l’étude = augmente validité externe
- aléation = répartition aléatoire des unités d’observation dans différents groupes = augmente validité interne
différences entres les trois concepts suivants: variable, variable discrète, variable continue
- variable = valeur représentant une caractéristique d’une unité d’observation
- variable discrète = variable prenant un nombre limité de valeurs, ne peut pas être autre chose entre les deux = Likert, niveau étude, binaire (oui ou non)
- variable continue = valeur numérique représentant la magnitude d’une caractéristique = âge, score motivation, résultats scolaire
différences entres les 4 concepts suivants: données qualitatives, données quantitatives, variable indépendante, variable dépendante
-données qualitatives = représente souvent une catégorie = catégorie emploi
- données quantitatives = données numériques
- variable dépendante = ce qui est mesuré ou prédit = intensité sx
- variable indépendante = ce qui est manipulé = traitement, dosage médic
différences entre les échelles de mesures suivantes: nominale, ordinale, intervalles, rapport
- nominale = étiquettes sans ordre particulier = couleur de cheveux, niveau étude
- ordinale = objets classés suivant un continuum ordonné = échelle Likert
- intervalles = différences fixes entre les points de l’échelle donc pas de rapport entre les données = échelle température car pas un zéro absolu
- rapport = présence zéro absolu = poids
exemple expliquant qu’il n’y a pas de rapport dans les échelles intervalles
si j’ai 20$ dans mes poches et qu’on m’en donne 20 de plus, je ne suis pas 2 fois plus riches, car j’ai 100$ dans mon compte de banque et non 0
pourquoi est-ce important de connaître nos types d’échelle
permet de savoir quel type de test statistique doit être utilisé pour répondre à la question de recherche
différence entres ces types de statistiques: descriptive, inférences statistiques, paramètre, estimateur d’un paramètre
- statistiques descriptives = description d’une caractéristiques d’un ensemble de données = moyenne, écart-type
- inférence statistique = tirer une conclusion sur la population à partir des résultats échantillonnaux
- paramètre = caractéristique d’une population = moyenne d’âge pop
- estimateur = caractéristique d’un échantillon visant à inférer une caractéristique de la population = moyenne âge échantillon
vrai ou faux, les statistiques inférentielle constitue la plus grandes partie des études statistiques
vrai
que représente X
un ensemble de données
X = (3,4,5,6,7,8)
qu’est-ce que des mesures de tendance central
comme des moyennes = permettre de décrire une distribution de données avec un seul chiffre
qu’est-ce qu’un mode
le score le plus fréquent dans une distribution, mais peut être bimodale, si deux scores sont autant fréquent
qu’est-ce que des mesures de variabilité
voir à quel point les scores varie autour de la moyenne, plus elle est grande plus les scores varient
qu’est-ce que la variance
à quel point les différentes variables s’écarte de la moyenne
qu’est-ce que l’écart-type
racine carrée de la variance
qu’est-ce que des degrés de liberté
Le nombre d’observations indépendantes sur lequel un estimé repose
degré de liberté pour un estimateur = nb total de valeurs - nb de paramètre estimé
comment savoir si des estimés sont dépendants de l’un l’autre
si la valeur de chacun des estimé en calculé en fonction d’une moyenne dont chacun contribue ils sont dépendants
pourquoi dans le calcul de la variance d’un échantillon il y a un n-1 au dénominateur
puisque l’on estime la moyenne on doit venir faire moins 1 pour enlevé le degré de liberté relié à la moyenne
que représente l’air sous la courbe normale
la probabilité de se retrouver entre deux variables
qu’est-ce que la distribution échantillonnage
-le fait de prendre toutes les moyennes en faisant tous les échantillons possibles
-distribuer toutes ses moyennes sur un graphique (fréquence apparition de ma moyenne y et valeur de ma moyenne x)
vrai ou faux, la moyenne de la distribution d’échantillonnage et de la population est différente
faux, elles sont pareilles
vrai ou faux, plus la taille de l’échantillon dans la distribution d’échantillonnage est grand, plus la forme de la distribution sera normale et avec moins de variance
vrai
qu’est-ce que l’erreur échantillonnage
erreur type = écart-type de la distribution d’échantillonnage = plus le résultat de mon erreur-type est petit plus ma distribution est proche de la moyenne = bon
que permet de quantifier l’erreur-type
la variabilité interéchantillonnale = variabilité naturelle observée entre les échantillons = si mes données sont plus hautes qu’un seuil (o.o5) mes données ne sont pas dû au hasard
si la moyenne de notre échantillon est très _ de celle de la distribution échantillonnage, la donnée observée est _ ainsi plus je m’éloigne de la moyenne de la distribution échantillonnage plus ce que j’ai observé est _
- proche
- fréquente
- rare
vrai ou faux, la distribution échantillonnage porte seulement sur des moyennes
faux, elle peut être sur toutes sortes de statistiques
que représente Ho (hypothèse nulle)
il n’y a aucun changement
comment faire la décision ou non de rejet Ho
si ma valeur de t a une probabilité plus petite que o.o5 mes données sont rares et on rejette Ho
que représente p dans le test hypothèse
il ne s’agit pas d’une taille d’effet il s’agit de la probabilité que nos résultats soit vrai si Ho l’est
plus _ est _ plus on a des chances d’avoir une grande puissance statistique
plus échantillon est grand
pourquoi il ne faut pas se fier à seulement un test hypothèse et que faut-il utiliser en plus
- test hypothèse est dichotomique ce qui peut créer des erreurs de type 1 ou 2
- il faut aussi interpréter nos résultats avec la puissance statistique et la taille effet (différence petite, moyenne grande entre mes groupes)
qu’est-ce que la convergence scientifique
le fait de faire de plus en plus des études sur un sujet = moins il aura de résultats erronés avec des erreur de type 1 et 2 due au hasard
qu,est-ce que la point de vue analytique des statistiques
avoir un événement qui peut se produire de A manière mais pas de B manière et que chacune des manières sont autant probable = lancer de dé
point de vue fréquentiste des statistiques
- en ayant un grand nombre échantillons on peut estimer la probabilité d’un événement
- plus le nombre échantillon augmente plus la probabilité se rapproche de la vérité sans l’atteindre = limite
point de vue subjectif des statistiques
probabilité est la croyance subjective d’une personne à propos de la probabilité d’occurrence d’un événement
si je demande à mon amie de venir voir un film les probabilités est qu’elle dise oui
qu’est-ce qu’un événement
probabilité de l’événement X se produise
qu’est-ce que des événements indépendants
occurence ou non de l’événement 1 n’influence pas occurence ou pas du deuxième (pile ou face)
qu’est-ce que des événements mutuellement exclusifs
si événement 1 survient le 2 ne peut pas survenir en même temps (être inscrit en première et deuxième année)
qu’est-ce qu’un ensemble événements exhaustifs
inclut tous les événements possibles = si on lance un dé à 6 face non truqué mon ensemble exhaustif des résultats possibles = 1,2,3,4,5,6
différence entre probabilité simple, probabilité conjointe et probabilité conditionnelle
- simple = p(A)
- conjointe = probabilité de cooccurrence de 2+ événements = p (A,B)
- conditionnelle = probabilité événement survienne si l,autre est survenue (A si B) = p (A I B)
qu’est-ce que la loi additive
additionner les probabilités occurrence événements mutuellement exclusifs = événements ne peuvent pas survenir en même temps = probabilité que l’un ou l’autre survienne
probabilité de piger un caramel peut importe la sorte = additionne probabilité caramel mou + caramel dur
qu’est-ce que la loi multiplicative
multiplier la probabilité d’occurrence de deux événements indépendants (un n’influence pas l’autre) = permet avoir occurrence conjointe (avoir A et B)
piger caramel mou le remettre et piger un autre caramel mou = multiplier probabilité caramel mou par probabilité caramel mou
*si on ne remet pas cela n’est plus indépendant
peut-on faire des tests d’hypothèses avec la distribution binomiale
oui
est-ce que les données qualitatives peuvent aussi être des chiffres
oui mais plus souvent des mots
le test du khi-carré a un seul paramètre, lequel
k correspondant au degrés de liberté
comment noter les degrés de liberté avec le paramètre k
X2(k) = X2(3)
*2 est en exposant
*le chiffre entre parenthèse représente le nombre de degrés de liberté
la moyenne est (égale, supérieure, inférieure) au nombre de degrés de liberté
égale
moyenne = k
plus k augmente plus la variance (diminue, augmente, aucun effet) et quel est le calcul de la variance
augmente
variance = 2k
plus k augmente plus la courbe devient (asymétrique, symétrique)
symétrique
que permet de déterminer le test khi-carré d’ajustement
- déterminer si les valeurs que l’on observe sont assez différentes de celles qu’on obtiendrait par hasard
- pour que l’on rejette l’idée quelles ont été obtenues par hasard (Ho)