La Statistique Descriptive Flashcards
Valeur de la somme des fréquences relatives en pourcentage
100 %
Résultats bivariés
Deux variables décrites en même temps
Variables quantitatives (def)
Variables mesurables, avec une signification numérique
Possibilité de faire un calcul avec des variables quantitatives ?
Oui
2 types de variables quantitatives
Discrètes et continues
Quels sont les valeurs des variables quantitatives continues ?
Valeurs dans un intervalle
2 représentations adaptées des variables quantitatives continues
Histogramme
Box plot
Représentation adaptée des variables quantitatives discrètes
Diagramme en bâton
Variable qualitative, définition
Variable non mesurable
Est-il possible de faire des calculs avec des variables qualitatives ?
Non
Trois types de variables qualitatives et leurs spécificités
- Variables nominales:
Peuvent pas être ordonnées - Variables ordinales:
Peuvent être ordonnées - Variables binaires :
Que 2 catégories
Peuvent être nominales mais généralement non ordinales
Deux représentations adaptées des variables qualitatives
Diagramme sectoriel
Diagramme en barre
quantitative discrete différence avec qualitatif ordinal
Échelle de mesure avec un pas régulier qui n est pas le cas pour qualitatif ordinal
Moyenne
m = x1 + x2 + xn / n
Définition de médiane
Valeur telle que 50 % des valeurs sont inférieures ou égal et 50 % des valeurs sont supérieur ou égal
calcule de la médiane :
Si n impair : médiane = (n + 1)/2
Si n impair: médiane= (x (n/2) + x (n+1/2)) /2
Définition de mode
Valeur la plus fréquente parmi toutes les valeurs
Centiles définition
- Valeurs qui partagent une distribution en 100 valeurs sous ensemble.
Déciles
9 Valeurs qui partagent une distribution en 10 sous ensemble.
Quintiles
4 valeurs qui partagent une distribution en 5 sous ensemble.
Pourcentage du premier quartile Q1
25%
Pourcentage Deuxieme quartile
50% = médiane
Pourcentage 3ème quartile Q3
75%
Formule interquartile IQ
IQ= Q3 - Q1
Étendue définition
Différence entre la valeur maximale et la valeur minimale
Variance formules
S carré = somme des (xi - m) carré / n
Écart type, définition= formule
Racine carrée de la variance
Coefficient de variation Formule
Cv= écart type / moyenne
Condition pour utiliser la moyenne et la variance
La distribution est symétrique
Représentation graphique de la distribution normale
Courbe en cloche
Qu’est-ce que la distribution normale est toujours ? (2 adj)
Symétrique et unimodale
Comment sont les paramètres de position dans la distribution normale ?
La moyenne, le mode et la médiane sont confondues
Quelles sont les trois paramètres sensibles aux valeurs extrêmes ?
La moyenne, la variance et les types
Quelles sont les quatre paramètres peu sensibles aux valeurs extrêmes ?
La médiane, les quantiles, le mode et l’intervalle interquartile
En quoi sont découpées les valeurs de la variable dans un histogramme ?
En classe contiguës
Si l’intervalle de classe est constant, quelle valeur sont possibles en ordonnée ?
La densité proportionnelle à effectif et l’effectif
Si l’intervalle de classe est non constant, quelles valeurs peuvent être mise en ordonnée, et quelles valeurs ne peuvent pas être mise en ordonnée ?
Les valeurs en ordonnée non proportionnelle à effectif, mais l’effectif ne peut pas être indiqué en ordonnée
Qu’est-ce qu’un polygone de fréquence ?
Ligne qui relit le milieu des sommets de chaque rectangle
Comment est la représentation des boxplot ?
Représentation bi variée
Dans une boîte à moustache, qu’est-ce qui représentait en ordonnée ?
La variable quantitative continue
Qui définit les bornes de la boîte à moustache
Le premier et le troisième quartile
À quel pourcentage correspond le trait dans la boîte à moustache
50 %
Qu’est-ce qu’indique le trait dans la boîte à moustache ?
La médiane
Comment est la distribution si la médiane est au centre de la boîte ?
Distribution symétrique
Comment sont représentés les valeurs éloignées de la boîte à moustache ?
Par un petit rond au-dessus ou en dessous de la boîte
Quel est l’intérêt de la boîte à moustache ?
On peut représenter plusieurs distributions sur un même schéma pour les comparer car une différence significative ne peut être établie que par la réalisation d’un test statistique
Quelle est l’abscisse d’un diagramme en bâton et quel est son ordonnée ?
Abscisse : échelle de valeur discontinue entière ou non
Ordonnée : effectif ou fréquence
Y a-t-il une notion de surface dans le diagramme en bâton ?
Non
Quel est le problème des variables quantitatives mise en classe ?
Le calcul statistique est approximatif, mettre en classe, entraîne une perte d’information
Centre de la classe Formule
Ci= borne inf - ((borne sup - borne inf) /2)
Qu’est-ce qu’une classe médiane ?
Première classe dont la fréquence cumulée égale ou dépasse 50 %
À quelle variable n’est pas adapté la représentation en diagramme sectorielle
Aux variables quantitatives
Quels sont les deux autres noms du diagramme en barre ?
Tuyau d’orgue ou bar graph
Où sont placés les modalités dans un diagramme en barre
En abscisse, et éventuellement un ordonnée, si la variable qualitative est ordinale
Qu’est-ce qu’il n’y a pas dans un diagramme en barre ?
Une échelle sur l’acte des abscisses et la largeur des barres n’est pas significative
Quel est le but d’un test de conformité ?
Savoir si la distribution observée est conforme à une distribution théorique
Conditions de conformité de la distribution de la variable à une distribution théorique
La loi de probabilité et ses paramètres sont connus (contexte paramétrique, et les tests paramétrique pourront être utilisés)
Conditions de non-conformité, de la distribution de la variable à une distribution théorique
La loi de probabilité c’est paramètres sont inconnues (contexte, non paramétrique, et seul des tests non paramétrique pourront être réalisés)
À quoi est adapté le tableau de contingence
Adapté aux variables qualitative et quantitative mise en classe
Qu’est-ce que sont les effectifs marginaux ?
Totaux des lignes et des colonnes
Comment se construit un tableau de Contigences pour les tests diagnostiques ?
En ligne : test positif ou négatif
En colonne : malade ou sain
Notation : VP, vrai positif , VN Vrai négatif, FP faux positif, FN Faux Négatif
Quels sont les deux approches pour un nuage de points ?
Corrélation et régression
Étude de la dépendance entre deux variables quantitatives appariées avec un nuage de points :
Mesurer simultanément sur un ou plusieurs individus ou mesurer à deux temps différents sur les mêmes individus
Quelles valeurs peut prendre la covariance ?
Négatif positif ou nul
Formule de la covariance
Covariance (x,y): (somme des xi * yi)/ n - (somme des xi* somme des yi )/ n carré
Formule de la covariance
Covariance (x,y): (somme des xi * yi)/ n - (somme des xi* somme des yi )/ n carré
Quels sont les paramètres de position
Moyenne
Mode
Médiane
Quartile quantile
Quels sont les paramètres de dispersion
Variance
Écart type
Coefficient de variatiom