sem 2: Organiser, visualiser et décrire les données Flashcards

1
Q

nomme les différentes échelles

A

nominale
ordinale
d’intervalle
de rapport (ratio)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
1
Q

décrit échelle nominale

A

classification selon catégories (categorical), sans rang (faible)
qualitatif
absence d’ordre
permet de comparer la taille des catégories

ex: secteur d’activités des entreprises, classement des fonds selon leur stratégie d’investissement

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

décrit échelle ordinale

A

-classification selon des catégories (categorical) hiérarchisées
-qualitatif
-présence d’ordre

ex: classement selon cote de crédit (A, B, C)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

décrit échelle d’intervalle

A

-permet de calculer les écarts entre les données et les comparer
-quantitatif
-unité de mesure arbitraire, mais constante
-permet additions et soustractions

ex: température, aversion au risque d’un individu

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

décrit échelle de rapport/ratio

A

-permet de calculer le lien de proportionnalité entre 2 valeurs
-possède un zéro absolu; absence totale de la mesure
-quantitatif

ex: argent, rendement, échéance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

décrit les données transversales (cross-sectional data)

A

observation de plusieurs variables individuelles captés à un point spécifique dans le temps

ex: données de plusieurs entreprise le 6 juin

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

décrit les séries temporelles (time series data)

A

observation d’une seule variation sur différentes périodes

ex: les rendement mensuels d’un indice boursier

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

décrit la distribution de fréquences

A

répartition des données en intervalles par ordre de grandeur

contient fréquence absolue

facilite l’analyse des données

peut etre utilisée avec tous types d’échelles de mesure

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

comment construire distribution de fréquences

A
  1. ordre croissant
  2. calculer amplitude (max - min)
  3. choisir le nombre d’intervalles (n)
  4. créer les intervalles (min + amplitude)
  5. construire tableau du plus petit au plus grand
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

décrit la fréquence relative

A

fréquence absolue divisé par nombre totale (%)

lien avec fonction de DENSITÉ de probabilité

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

décrit la fréquence relative cumulée

A

somme des fréquences relatives

lien avec fonction de PROBABILITÉ cumulative (0 à 1)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

décrit l’histogramme

A

diagramme en batons

x = intervalles
y = fréquence absolue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

décrit la courbe de fréquences

A

segments se reliant par des points

x = point milieu de l’intervalle
y = fréquence absolue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

décrit la courbe de fréquence relatives cumulées

A

permet de déterminer le nombre d’observations inférieur à une valeur donnée

x = valeur maximale de l’intervalle
y = fréquence absolue

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

avantage moyenne arithmétique

A

affecté par la taille et amplitude des données

facile à utiliser

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

désavantage moyenne arithmétique

A

influencé par valeurs extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

comment trouver la médiane

A

impair = n/2 + 1

pair = moyenne de n/2 et n/2 + 1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

avantages médiane

A

pas affectée par valeurs extrêmes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

désavantages médiane

A

se concentre uniquement sur la position relative des données triées

aucune info sur la taille ou l’amplitude

19
Q

avantages mode

A

peut etre utiliser avec échelles nominales donc qualitatives

20
Q

désavantages mode

A

pass applicable aux données continues donc peu utilisé en finance

21
Q

décrit la moyenne pondéré (weighted mean)

A

beaucoup utilisé en finance

poids positif = position longue
poids négatif = position courte
x = rendement de l’actif

22
Q

décrit la moyenne géométrique (geometric mean)

A

calcul de taux moyen de croissance d’une variable

ex: calcul du rendement dans le temps d’un actif

23
Q

comment trouver la moyenne géométrique

A

G = racine enième des X (x >= 0)

Rg = somme des produits de (1 + Rt)^1/T - 1

24
Q

décrit la moyenne harmonique

A

type spécial de moyenne pondérée ou le poids est inversement proportionnel à sa grandeur (plus de poids est élevé, moins on va en avoir)

application: “cost-averaging” qui implique un investissement constant sur les marchés financiers

25
Q

comment trouver la moyenne harmonique

A

Xn = n/ somme des (1/X) pour X >= 0

26
Q

met en ordre croissant les moyennes géométriques, arithmétique et harmonique

A

harmonique
géométrique
arithmétique

s’applique si les données sont identiques

27
Q

décrit et nomme les quantiles

A

valeur égale ou inférieur à une fraction des données

médiane = 2
quartile = 4
quintile = 5
déciles = dix
percentiles = cent

28
Q

la dispersion mesure quoi

A

la variabilité autour de la tendance moyenne

29
Q

décrit la dispersion absolue

A

qté de la variabilité sans comparaison à un point de référence

ex: amplitude, écart absolu moyen, variance

30
Q

décrit la dispersion relative

A

qté de la dispersion par rapport à un point de référence

ex: risque actif, coefficient de variation

31
Q

avantages amplitude

A

facile à calculer

31
Q

désavantages amplitude

A

aucun info sur la forme ou la distribution
affecté par valeur extrèmes

32
Q

décrit l’écart absolue moyen et comment le trouver

A

moyenne des écart absolue par rapport à la moyenne (comme la variance)

33
Q

avantage écart absolu moyen

A

donne image précise de la distribution p/r a amplitude

34
Q

désavantages écart absolu moyen

A

plus difficile à manipuler mathématiquement (versus variance)

35
Q

avantage variance

A

mesure la + utilisé

36
Q

désavantages variance

A

absence d’unité donc difficile à interpréter et communiquer

37
Q

décrit écart type

A

mesure la plus utilisé pour estimer le risque

38
Q

décrit semi-variance

A

seus les risqueés liés aux écarts négatifs par rapport à la moyenne ou autre valeur cible

39
Q

décrit coefficient de variation et comment le trouver

A

mesure relative de la dispersion des données qui permet de comparer portefeuilles entre eux

écart type / moyenne

plus le cv est élevé, plus l’écart type est élevé donc plus c’est risqué

40
Q

décrit l’asymétrie (skewness) d’une distribution

A

on fait souvent l’hypothèse que les rendements sont distribués NORMALEMENT

Cela facilite calcul, car distribution completement décrite par moyenne et écart-type

les moments permettent de décrire la distribution selon autres:

moment ordre 1: moyenne
ordre 2: variance
ordre 3: coeff d’asymétrie
ordre 4: coeff d’aplatissement

41
Q

décrit le coefficient d’asymétrie

A

coeff d’asymétrie négatif = normale vers la droite

coeff d’asymétrie positif = normale vers la gauche (ce qu’on préfere car signifie une plus grande fréquence d’excellentes performances)

42
Q

décrit le coefficient d’aplatissement (kurtosis)

A

Ke > 0 = leptokurtique, donc distribution pointue p/r a la normale

Ke < 0 = platikurtique, donc aplatie p/r a la normale

pour l’excess de kurtosis, il faut ajouter le terme “-3(n -1)^2 / (n - 2)(n - 3)”

43
Q

l’analyse de la dépendance entre 2 variables se fait via:

A

nuage de points
analyse de corrélation (coefficient de pearson)

44
Q

le coefficient de corrélation de pearson est toujours entre quels valeurs ?

A

-1 et 1