sem 2: Organiser, visualiser et décrire les données Flashcards
nomme les différentes échelles
nominale
ordinale
d’intervalle
de rapport (ratio)
décrit échelle nominale
classification selon catégories (categorical), sans rang (faible)
qualitatif
absence d’ordre
permet de comparer la taille des catégories
ex: secteur d’activités des entreprises, classement des fonds selon leur stratégie d’investissement
décrit échelle ordinale
-classification selon des catégories (categorical) hiérarchisées
-qualitatif
-présence d’ordre
ex: classement selon cote de crédit (A, B, C)
décrit échelle d’intervalle
-permet de calculer les écarts entre les données et les comparer
-quantitatif
-unité de mesure arbitraire, mais constante
-permet additions et soustractions
ex: température, aversion au risque d’un individu
décrit échelle de rapport/ratio
-permet de calculer le lien de proportionnalité entre 2 valeurs
-possède un zéro absolu; absence totale de la mesure
-quantitatif
ex: argent, rendement, échéance
décrit les données transversales (cross-sectional data)
observation de plusieurs variables individuelles captés à un point spécifique dans le temps
ex: données de plusieurs entreprise le 6 juin
décrit les séries temporelles (time series data)
observation d’une seule variation sur différentes périodes
ex: les rendement mensuels d’un indice boursier
décrit la distribution de fréquences
répartition des données en intervalles par ordre de grandeur
contient fréquence absolue
facilite l’analyse des données
peut etre utilisée avec tous types d’échelles de mesure
comment construire distribution de fréquences
- ordre croissant
- calculer amplitude (max - min)
- choisir le nombre d’intervalles (n)
- créer les intervalles (min + amplitude)
- construire tableau du plus petit au plus grand
décrit la fréquence relative
fréquence absolue divisé par nombre totale (%)
lien avec fonction de DENSITÉ de probabilité
décrit la fréquence relative cumulée
somme des fréquences relatives
lien avec fonction de PROBABILITÉ cumulative (0 à 1)
décrit l’histogramme
diagramme en batons
x = intervalles
y = fréquence absolue
décrit la courbe de fréquences
segments se reliant par des points
x = point milieu de l’intervalle
y = fréquence absolue
décrit la courbe de fréquence relatives cumulées
permet de déterminer le nombre d’observations inférieur à une valeur donnée
x = valeur maximale de l’intervalle
y = fréquence absolue
avantage moyenne arithmétique
affecté par la taille et amplitude des données
facile à utiliser
désavantage moyenne arithmétique
influencé par valeurs extrêmes
comment trouver la médiane
impair = n/2 + 1
pair = moyenne de n/2 et n/2 + 1
avantages médiane
pas affectée par valeurs extrêmes