Intra Flashcards
Quels sont les deux types de méthodes d’échanonnage?
L’échantillonnage probabiliste et l’échantillonnage non probabiliste
Quelle est la différence entre les deux types de méthodes d’échantillonnage?
la différence entre les deux tient au fait que dans le cas de l’échantillonnage probabiliste chaque unité a une “chance” d’être sélectionnée et que cette chance peut être quantifiée, ce qui n’est pas vrai pour l’échantillonnage non probabiliste; dans ce cas, chaque unité incluse à l’intérieur d’une population n’a pas une chance égale d’être sélectionnée
Que représentent une population et un échantillon?
Population cible: ensemble complet des individus ou organismes que nous voulons étudier (ensembles es chômeurs au Qc)
Échantillon: partie d’une population cible à partir de laquelle on infère nos résultats à la population cible (800 chômeurs québécois)
Quelle est la différence entre paramètre et statistique?
Paramètre: mesure utilisée pour décrire la population: μ, σ, N, π
Statistique (indice statistique): mesure utilisée pour décrire un échantillon: ẋ, s, n, p
Je veux étudier la grandeur des nouveaux-nés de l’hôpital st-justine en 2017. je sélectionnerai au hasard 30 dossiers de nouveau-nés. quel type d’échantillonnage ai-je utilisé?
échantillons probabiliste
je veux vérifier s’il existe un lien entre la consommation de cannabis et les résultats scolaire. Quelle est ma variable indépendante?
consommation de cannabis
je veux vérifier s’il existe un lien entre la consommation de cannabis et les résultats scolaire. Quelle est ma variable dépendante?
Résultats scolaires
Mes résultats démontrent qu’il existe une corrélation entre la consommation de cannabis et les résultats scolaires. puis-je conclure que fumer conduit à de moins bon résultats scolaires?
NON. il se peut que fumer soit la cause de moins bons résultats, mais il se peut aussi qu’avoir de moins bon résultats conduise à fumer. ou encore que les gens plus sociables tendent à la fois à fumer du cannabis et à prendre leurs résultats moins au sérieux
quelle est la mesure de tendance centrale la plus utilise
la moyenne
quelle est la mesure de tendance centrale qui nous donne le résultat au centre de la distribution?
la médiane
quelle est la mesure de tendance centrale qui nous donne le résultat le plus fréquent?
le mode
quelle est la mesure du score individuel moins la moyenne, divisée par l’écart-type?
distribution normal
comment nomme-t-on une distribution où les trois mesures de tendance centrale sont égales?
Score Z
comment nomme-t-on une distribution que mode > médiane > moyenne?
Skewness (-)
Comment nomme-t-on une distribution que : moyenne > médiane > mode?
Skewness (+)
quelles sont les deux conditions pour qu’une distribution soit considérée normale?
elle doit être unimodale et symétrique (-1 à +1)
quel type de tests je devrai employer si ma distribution a une asymétrie plus petite que < -1?
test non paramétriques
pour tester la normalité de la distribution, puis-je employer le test de Shapiro-Wilk avec 80 participants?
NON. pour tester la normalité de la distribution, vous pouvez employer le test de Kolmogorov-Smirnov avec plus de 50 participants ou le test de Shapiro-Wilk avec 50 participants et moins
pour tester la normalité de la distribution, puis-je employer le teste de Kolmogorov-Smirnov avec 80 participants?
OUI. Pour tester la normalité de la distribution, vous pouvez employer le test de Kolmogorov-Smirnov avec plus de 50 participants ou le test de Shapiro-Wilk avec 50 participants et moins
quelle mesure me permettra de comparer les résultats d’un joueur de basketball avec un joueur de hockey?
Score Z. peuvent être utiles lorsque l’on compare des individus provenant de groupes différents qui n’ont ps nécessairement les mêmes moyennes et les mêmes distributions
quels sont les 4 types d’erreurs de mesure?
- l’erreur de l’instrument de mesure
- l’erreur du sujet
- l’erreur de l’expérimentateur ou interviewer
- l’erreur due au hasard
j’ai une population de 1000 individus. je sélectionne un échantillon de 100 participants pour effectuer une corrélation de Pearson. quel sera mon degré de liberté?
ddl = 98 : n de mon échantillon 100 - nombre de variables dans la corrélation 2
qu’est-ce que l’étendue d’une distribution?
soustraire le minimum du maximum
ex: dans la distribution suivante: 10, 12, 15, 18, 20; l’étendue de la distribution est 10, car on soustrait 10 (le minimum) de 20 (le maximum
quelle est la mesure de dispersion la plus utile
l’écart type
qu’est-ce que l’écart-type?
la racine carrée de la variance, qui elle consiste dans la sommation au carré des Xi moins la moyenne, divisée par n-1
à quoi sert le degré de liberté?
augmenter légèrement la variance
par exemple, lorsqu’il y a, dans la population, des données extrêmement élevées et qui ne sont pas pris en comptes dans l’échantillon
pour qu’un échantillon soit représentatif de la population, il doit être aléatoire et donc doit respecter deux prémisses. quelles sont-elles?
- chaque membre de la population a une chance égale d’être sélectionné
- les observations doivent être indépendantes les unes des autres
si la majorité des sujets ont des résultats faibles Skewness sera..
positif (+)
courbe vers la gauche
si la majorité des sujets ont des résultats potentiellement normaux Skewness sera..
=0
courbe en plein milieu
si la majorité des sujets ont des résultats élevés Skewness sera..
négatif (-)
courbe vers la droite
La kurtosis (kurtose ou aplatissement) nous renseigne sur quoi lorsqu’elle est négative?
si les sujets ont des résultats très étalés du plus faibles au plus élevé (kurtosis négative)
courbe très plate
La kurtosis (kurtose ou aplatissement) nous renseigne sur quoi lorsqu’elle est =0?
résultats potentiellement normaux (=0)
courbe normal
La kurtosis (kurtose ou aplatissement) nous renseigne sur quoi lorsqu’elle est positive?
résultats très concentrés aux alentours du mode (kurtosis positive)
courbe très pointue et haute
qu’est-ce qu’un test d’hypothèse statistique paramétrique?
c’est un test dont le modèle précise les conditions que doivent remplir les paramètres de la population dont a été extrait l’échantillon
peut-on utiliser des tests paramétriques comme des tests T lorsque, par exemple, la moyenne des salaires dans la population ne se distribue pas normalement?
NON. il faut se rabattre sur des tests non paramétriques correspondants
quels sont les résultats possibles au tests statistiques univariés?
- corrélation (r)
- Chi-carré (x2)
- Test T (T)
- ANOVA (F)
etc.
comment se calcul le degré de liberté pour le test T à échantillon unique?
nombre de participants -1
comment se calcul le degré de liberté pour le test T à groupes indépendants?
sommation des nombres de participants par groupe -1
comment se calcul le degré de liberté pour la corrélation de Pearson?
le nombre d’observations (participants) - le nombre de mesures corrélées (variables)
comment se calcul le degré de liberté pour le Chi-carré?
le produit du nombre de niveaux de la ou des variables -1
comment se calcul le degré de liberté pour l’ANOVA?
inter-groupes (between): se situe au numérateur et consiste dans le nombre de groupes -1
intra-groupes (within): se situe au dénominateur et consiste dans le nombre total de sujet - le nombre de groupes
qu’est-ce que le seuil de signification?
doit être plus petit ou égale à 0,05 pour que le test statistique soit significatif, donc que l’on puisse affirmer qu’il existe une relation entre des variables continues ou une différence de moyennes entre des groupes de participants
pour nos résultats, quand utilise-t-on les tableaux de fréquence (nombres et % de réponses)?
généralement pour décrire notre échantillon et plus particulièrement les variable socio-démographiques
les graphiques en forme de bâtons ou histogrammes sont utilisés quand?
pour les plans à groupe indépendants (beaucoup de données)
les graphiques en forme de lignes sont utilisés quand?
pour les plans à mesures répétées
la corrélation de pearson (bivariée) nous renseigne sur quoi par rapport à la relation (linéaire) entre deux variables?
- la magnitude de la relation: plus la corrélation est proche de +1 ou de -1, plus elle est forte
- la direction de la relation: une corrélation positive indique que plus les valeurs d’une variables sont grandes, plus les valeurs de l’autres variables seront grandes aussi. une corrélation négative indique que plus les valeurs d’une variable augmentent, plus elles se réduisent pour la deuxième variable