2 - régression logistique 1 Flashcards
types de données
- qualitatives
- quantitatives
types de données quantitatives
- continues : R, chiffre fractionnaire ou à virgule
- discrètes : valeurs entières
types de données qualitatives
- nominale
- ordinale
modèle utilisé pour des donnes quantitatives
modèle linéaire
modèle utilisé pour des données qualitatives
modèle logistique
hypothèses du modèle linéaire simple
- les erreurs sont distribuées selon une distribution normale
- la variance des erreurs est cst
- les observations sont indep
V ou F : lorsque Y est binaire, il est possible d’utiliser un modèle linéaire simple
F, graph nous donne 2 plateaux, la droite n’est donc pas représentative des données
nommer les raisons pour lesquelles le modèle linéaire simple n’est pas approprié quand y = binaire
1- erreurs prennent 2 valeurs possibles –> la distribution n’est pas normale
2- la variance des erreurs dépend de x donc plus cst
3- correspond à une probabilité donc doit se retrouver entre 0,1
modèle à utiliser lorsque y est binaire
logistique
comment tenter de voir si l’âge a un impact sur le risque de développer CHD
séparer les pts en groupe pour comparer les proportions
modèle logistique : allure du graph
courbe en S
objectifs de la régression logistique
- estimation
- prédiction
régression logistique : estimation
estimer l’ampleur de la relation entre le outcome (y) et une exposition (x) en évaluant l’association entre x et y
régression logistique : prédiction
développer une équation qui détermine cmt la probabilité qu’un individu avec la condition (y) dépend de x
fct logistique vs logit
- logistique : donne la probabilité de développer l’outcome (variable dep CHD) en fct de l’exposition (variable indep âge)
- logit : relation linéaire qui lie la variable indép (âge) et dép (CHD)