examen 2 Flashcards

1
Q

Quels sont les 4 tests que l’ont peut appliquer pour des lois normales (paramétriques) et quand peut-on les appliquer?

A

1-Test T: Pour faire une comparaison entre deux moyennes
2-ANOVA : comparaison entre plus de deux moyennes
3-Pearson : Corrélation, liaison entre deux variables quantitatives
4-Régression linéaire:décrire la relation entre une variable aléatoire dépendante (y) et un ensemble de variables indépendantes ou prédictives x. Pour prédire des données

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Que faut-il faire avant d’appliquer un test paramétrique ou non paramétrique et pourquoi faut-il faire ça?

A

Vérifier s’il s’agit d’une loi normale ou pas

Pour savoir quel test appliquer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Peut-on appliquer des tests non paramétriques sur des lois normales?

A

Oui mais ces tests sont moins performants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Est-il vrai de dire qu’on compare la même mesure quantitative sur deux groupes différents pour comparer deux moyennes?

A

Oui: H0 = Μ1 = Μ2

H1 = Μ1 ≠ Μ2 (bilatéral) ou Μ1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Est-il vrai de dire que les échantillons n’ont pas à avoir le même nombre d’éléments pour pouvoir comparer les moyennes?

A

Oui vrai.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Est-il vrai de dire que plus les variances sont différentes plus le ratio monte en valeurs?

A

Oui

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Comment s’écrit l’hypothèse statistique du test lorsqu’il y a égalité des variances des deux populations?

A

H0:Q2x1=Q2x2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Comment s’écrit l’hypothèse statistique du test lorsque les variances des deux populations sont différentes?

A

H1:Q2x1=/(égale pas)Q2x2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quoi faire lorsque les conditions d’applications ne sont pas respectées?

A

Lorsque les variances Q2 1 et Q2 2 ne sont pas homogènes mais la distribution est normale il faut faire le test de Weich T à appliquer après le test de T (SPSS) donne les 2 résultats.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Lorsqu’on utilise le test bilatérale on utiles quoi?

A

Le P du test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Lorsqu’on utilise le test unilatérale on utilise quoi?

A

Le P divisé par 2: P/2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

À quoi consiste le test ANOVA?

A

1-La méthode consiste à analyser la variance totale, intragroupe et intergroupe pour comparer les moyennes et tester l’hypothèse.
2-L’ANOVA va analyser la variabilité intra groupe et inter groupe pour donner une moyenne globale
3-Les groupes sont identifiés par une variable qualitative (nominale) qui représente le facteur de classification.
4-Un test ANOVA n’est pas une répétition de test.
5-On ne peu pas remplacer l’ANOVA par une série de tests t. car le risque de répéter le test plusieur fois augmente le risque d’erreurs.
ex: H0=Ma=mb=mk (mk:c’est l’adition de toute les autres moyenne après les deux première on écri mk pour représenter les autres)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Condition à respecter pour le test d’ANOVA?

A

1-Distribution normale pour chaque groupe
2-homogénéité des variances
a)Variance homogène (similaires): ANOVA
b)Variance hétérogène (différentes):Welch, ANOVA
3-Indépendance des données (important)
pas de données appariées.
4-On va utiliser le test de comparaison multiple seulement si on refuse Ho.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Que veut dire des séries statistiques doubles?

A

1-Qui analyse deux variable en même temps
2-Analyse simultanée de deux variables mesurés sur les mêmes éléments
Ex:Élément=un individu
-Variable1 :QI
-Variable2 : Largeur du crâne
-Variable 3 :Nombre d’années d’études

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Que veut dire Corrélation paramétrique, r de Peareson?10

A

1-C’est une mesure de la liaison linéaire entre deux variables c’est à dire la capacité de prédire une variable x par une autre y à l’aide d’un modèle linéaire.
2-C’ est un indice statistique qui exprime l’intensité et le sens (positif ou négatif) de la relation linéaire entre deux variables quantitatives.
3-Il permet de mesurer l’intensité de la liaison entre deux caractères quantitatifs.
4-Ce coefficient est nul (r = 0) lorsqu’il n’y a pas de relation linéaire entre les variables (ce qui n’exclut pas l’existence d’une relation autre que linéaire).
5-Ce coefficient est de signe positif si la relation est positive (directe, croissante) et de signe négatif
si la relation est négative (inverse, décroissante).
6-Ce coefficient varie entre -1 et +1
7-L’intensité de la relation linéaire sera donc plus
forte quand la valeur du coefficient est proche de +1 ou de - 1, et plus faible lorsqu’elle est proche de 0.
8-une valeur proche de +1 montre une forte liaison entre les deux caractères ( relation linéaire croissante c’est-à-dire que les variables varient dans le même sens)
9-une valeur proche de -1 montre également une forte liaison mais la relation linéaire entre les deux caractères est décroissante (les variables varient dans le sens contraire);
10-une valeur proche de 0 montre une absence de relation linéaire entre les deux caractères.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

À quoi sert le coefficient de corrélation? 5

A

1-Mesurer le degré d’association entre deux variables
2-Indiquer si les variations des valeurs d’une variable x sont associées aux variations d’une variable y
3-Ne donne aucune indication sur la forme de la relation car c’est une simple association
4-La Corrélation positive, c’est toute augmentation au niveau de X correspond à une augmentation au niveau de Y. Les deux variables varient dans le même sens et avec une intensité similaire. Exemple: la taille et le poids
5-La Corrélation négative, c’est toute augmentation au niveau de X qui correspond à une diminution au niveau de Y. Les deux variables varient dans deux sens opposés et avec une intensité similaire

17
Q

Que-est ce que une Régression?3

A

1-Résume la relation entre une variable dépendante y et une ou plusieurs variables indépendantes x
2-Décrit la forme de la relation (linéaire, non-linéaire)
3-Calcule des paramètres qui ont une signification (pente, taux, asymtote, etc

18
Q

Pour qu’il y ait série statistique double, il faut quoi?

A

1-Il faut qu’au moins l’une des deux variables soit aléatoire (aléatoire : qui veut dire variable non contrôlée)
-Exemple : Une variable aléatoire et une variable contrôlée (il y a au moins une variable que je ne connait pas)
Variable 1 : pression systolique (variable aléatoire) devient la variable dépendante
Variable 2 : dose du médicament (variable contrôlée) devient la variable indépendante

19
Q

Expliquez: Mesure de la liaison linéaire entre deux variables?3

A

1-Covariance : mesure de la dispersion conjointe de deux variable quantitatives (x et y) autour de leur moyenne
2-Corrélation : mesure de la liaison entre deux variable x et y
3-Corrélation linéaire de Pearson :mesure de la liaison linéaire entre deux variables quantitatives x et y

20
Q

Conditions d’application du test de signification du r de Pearson? 4

A

1-Les deux variables sont quantitatives
2-La distribution de la population est bi-modale
3-Indépendance des observations (pas d’autocorrélation) Je peux utiliser n’importe quel ordre,
4-Sont dépendantes : Série temporel (la température n’a pas d’ordre mais)et spatial(Chicoutimi et Québec on des température similaire, les observations proches on tandense à être plus similaire)

21
Q

Les résultats peuvent être faussés si?3

A

1-Trop de points.
2-Trop de valeurs exceptionnels.
3-Corrélation ne veux pas dire cause et effet

22
Q

Quand utilise t’on le Chi2?5

A

1-Pour comparer des groupes dans la quels j’ai regroupé des données quantitatives
2- Pour comparer plusieurs groupes indépendants décrits par une variable qualitative
3- Pour vérifier si les groupes proviennent de la même population statistique
4-Estimer la conformité entre une distribution observée et une distribution théorique
5-Penser à une tarte: la somme fait 100%

23
Q

À quoi sert le tableau de contingence?

A

À détecter soit la présence/abscence

24
Q

Pour visualiser le tableau de contingence on peut faire quoi?

A

UN graphique circulaire ou à barres

25
Q

Quel est l’objectif du test de conformité?

A

Déterminer qu’elle mesure les données observées sont conformes à une théorie ou à une loi prédisant la forme de la distribution de fréquence

26
Q

La répartition théorique est déduite à partir de quoi?

A

À partir d’hypothèse de travail ou d’autre considérations théoriques sur la population (test de la normalité)

27
Q

Qu’est-ce qu’un paramètre?

A

1-Quantité fixe dans une expression
2-Modèle mathématique
3-C’est ce qu’on cherche à estimer

28
Q

Qu’est-ce qu’une variable?

A

Quantité qui prend ou qui peut prendre plusieurs valeurs distinctes dans une expression mathématique (les variables dépendantes et indépendantes y et x)

29
Q

Qu’est-ce qu’un modèle mathématique?

A

Représentation simplifiée, à l’aide d’une équation, de relation simplifiée, à l’aide d’une équation, de relations empiriques ou posées par hypothèse. ex:pression systolique et concentration de sucre dans le sang.

30
Q

Comment faire une estimation en statistique?

A

1-Par le principe des moindres carrés (méthode OLS)
2-On désire faire passer la droite d’estimation, à travers le nuage de points, de façon à ce que les différences (y1-y1) soient les plus faibles possible pour l’ensemble des points
3-La somme de tout les E doivent être la plus petite. c’est elle qui est choisi
4-E1 Correspond à l’écart entre la ligne et le point (pour ce type de graphique elle est toujours verticale)
5- Plus les points sont éloignés de la ligne plus l’écart est grand
6-Plus les écarts sont petits plus on a une corrélation proche de 1 donc donne une bonne estimation.

31
Q

Qu’est-ce que le coefficient de détermination R2?

A

1-Mesure la proportion de la variance de Y expliquée par X (c’est pour dire qu’il y a plus d’erreur, plus d’écart un R2 plus grand)
2-C’est une analyse paramétrique donc vérifier la normalité et vérifier si c’est linéaire
3-La valeur de R2 est égale au carré du coefficient de corrélation de Pearson -1

32
Q

Qu’est-ce que le diagnostique du modèle?

A

1-Vérifier F et p - R2 et résidus

2-Si je dois décrire les résidus: Je dois tracer (redessiner) les écarts sur une droite horizontale.

33
Q

À quoi sert l’analyse de résidu?

A

Pour savoir si le modèle à été bien appliqué.

34
Q

Définition de la régression linéaire

A

But : décrire la relation entre une variable aléatoire dépendante (y) et un ensemble de variables indépendantes ou prédictives x.
1-Le modèle obtenu permet d’estimer la valeur de y à l’aide des variables prédictives x11 x21…,xm
2-Lorsque l’estimation est fondée sur plusieurs variable prédictives, le problème en est un de régression linéaire multiple
3-Si le problème n’implique qu’une seule variable prédictive, il s’agit de régression linéaire simple Par exemple dans la nature pour donner la température plusieurs choses peuvent influencer la température : Le vent, l’humidité etc., je peux estimer la température de demain avec les données de la température d’aujourd’hui.

35
Q

Définition de la régression linéaire

A

1-Forme de la relation : On parle de régression linéaire simple lorsqu’on désire calculer une fonction du premier degré liant la variables y à x.
2-C’est une droite dont l’équation est :Yi=B0+BIXi+Ei
Cette droite porte le nom de droite d’estimation ou droite de régression de y en x
Cette droite n’est pas garante d’une relation causale (cause à effet).
-Il faut savoir parcoeur cette formule , la comprendre et savoir l’appliquer.

36
Q

Objectifs de la régression

A

1-Trouver le meilleur modèle fonctionnel liant la variable dépendante à la variable indépendante x.
2-Estimer la valeur la plus probable de chacun des paramètres du modèle, ainsi que leur intervalle de confiance.

37
Q

Qu’est-ce que l’inférence?

A

Tester des hypothèses précises se rapportant aux paramètres du modèle dans la population statistique : ordonnée à l’origine, pente(s)

38
Q

Qu’est-ce que la prédiction?

A

Prévoir ou prédire les valeurs de la variable dépendante pour de nouvelles valeurs de la (des) variables(s) indépendante(s).