Cours 3 Flashcards

Question

Quoi faire avec les données manquantes ? (3)

Answer 1

1. Éliminer de l'échantillon les sujets ayant des données manquantes 2. Éliminer d'une analyse les sujets ayant des données manquantes 3. Remplacer les données manquantes par la moyenne de l'échantillon

Answer 2

Si le N augmente et que le bruit diminue, la somme reste inchangée L'écart type (s) diminue, erreur type diminue et la puissance du test augmente, ce qui diminue le bruit

Answer 3

1. Additivité et linéarité 2. Normalité 3. Homoscédasticité 4. Indépendance

Answer 4

D'utiliser un modèle non linéaire Si la vraie relation est non linéaire alors que votre modèle est linéaire, aucune méthode statistique ne viendra à votre secours

Answer 5

Si la distribution des fréquences dans l'échantillon est normale, alors la somme des carrés de l'erreur permettra d'estimer les valeurs des paramètres de manière optimale SINON d'autres méthodes peuvent s'avérer plus efficaces (Ex. Méthodes robustes)

Answer 6

La méthode bootstrap 1. On échantillonne un sous-ensemble de l'échantillon un grand nombre de fois (généralement plus de 1000) 2. On utilise la distribution sous-échantillonnage obtenue pour estimer les paramètres et l'erreur type

Answer 7

1. Graphique des fréquences 2. Graphique P-P (et Q-Q) 3. Mesures d'asymétrie et d'aplatissement 4. Tests de normalité

Answer 8

Évaluer par inspection visuelle la superposition entre la courbe gaullienne et la distribution des fréquences de l'échantillon

Answer 9

A. Parfaitement symétrique B. Asymétrie négative C. Asymétrie positive

Answer 10

A. Aplatissement normal (mésokurtique) B. Aplatissement négatif (platykurtique) = variance élevée C. Aplatissement positive (leptokurtique) = variance faible

Answer 11

H0 = Asymétrie = 0, Kurtosis = 0

Answer 12

Si la taille de l'échantillon est faible, ALORS le test est rarement assez puissant pour détecter la non-normalité Si la taille de l'échantillon est très grande, ALORS le test est trop sensible et rejette l'hypothèse nulle trop facilement OR, le théorème central limite suggère de toute façon qu'avec un grand échantillon, la distribution d'échantillonnage, elle, est normale SI l'échantillon comporte suffisamment de participants (règle du pouce N>30), ALORS le théorème central limite stipule que la distribution d'échantillonnage est normale même si la distribution des fréquences dans l'échantillon n'est pas normale SINON d'autres méthodes peuvent s'avérer plus efficaces, par exemple les méthodes dites "robustes" (Ex. Bootstrap)

Answer 13

1. On évalue la normalité ds fréquences de l'échantillon à l'aide des graphiques et des mesures 2. On évalue la normalité de la distribution d'échantillonnage selon les mêmes critères, mais on ne s'en fait généralement pas trop si N est grand

Answer 14

Homogénéité de la variance; | La variabilité de l'erreur est la même à tous les niveaux de la variable prédictive

Answer 15

Hétérogénéité de la variance; | La variabilité de l'erreur N'EST PAS la même à tous les niveaux de la variable prédictive

Answer 16

1. L'hétéroscédasticité biaise l'estimation de l'erreur type | 2. Ceci implique que l'hétéroscédatiscité risque de biaiser tout test statistique qui utilise l'erreur type

Answer 17

Test de Levene SI la taille de l'échantillon est faible, alors le test est rarement assez puissant pour détecter l'hétéroscédatiscité. SI la taille de l'échantillon est très grande, alors le test est trop sensible et rejette l'hypothèse trop facilement OR les tests statistiques peuvent être ajustés en fonction du niveau d'hétéroscédasticité présent, plutôt que de chercher à assumer que SI la taille de l'échantillon est faible, alors le test est rarement assez puissant pour détecter que l'hétéroscédatiscité est présente ou absente.

Answer 18

L'erreur type risque d'être biaisée SI les mesures se ressemblent trop ALORS l'écart type sera sous estimé et donc l'erreur type sera sous estimé On pourrait aussi observer l'effet contraire, qui entraînerait une surestimation de l'écart type et donc une sur-estimation de l'erreur type

Answer 19

VRAI, la mesure d'une donnée n'a pas été influencée par la mesure d'une autre donnée

Answer 20

Au niveau de la méthodologie de recherche (avant la récolte de donnée) Il existe des analyses que l'on peut utiliser si l'on s'attend à trouver une inter-dépendance au sein de certains groupes de données

Cours 3 Flashcards

(47 cards)