Analyse de survie de base R Flashcards
Une fonction clé pour l’analyse des données de survie dans R est la fonction
Surv()
role de Surv()
spécifier le type de données de survie que nous avons, à savoir,
censuré à droite, censuré à gauche, censuré par intervalle.
la fonction Surv()accepte comme arguments
premier argument les temps de survie observés,
et comme second l’indicateur d’événement.
La fonction utilisée pour calculer l’estimation de Kaplan-Meier est
survfit()
exemple de estimation de kaplan meir
fit = survfit(Surv(time, status) ~ 1, data = )
La sortie de base de la fonction survfit()donne
le nombre de sujets,
le nombre d’événements,
le temps de survie médian
et son intervalle de confiance à 95%.
le code pour calculer les probabilités de survie à 1000 et 2000 jours
summary(KM_fit, times = c(1000, 2000))
voulons trouver à combien de jours la probabilité de survie est égale à 0,7 et à combien de jours elle est égale à 0,6 - le code est
quantile(KM_fit, probs = 1 - c(0.7, 0.6))
Pour calculer l’estimateur de Breslow, nous utilisons
la fonction survfit() avec la même syntaxe que pour l’estimateur de Kaplan-Meier
la seule différence est que nous devons maintenant définir l’argument typesur “fleming-harrington”.
Nous avons deux tests statistiques standard pour tester une hypothèse simple avec une variable de regroupement
logrank
quel test de comparaison choisir
Le test du log-rank est le test le plus puissant lorsque l’hypothèse des risques proportionnels (PH) est satisfaite.
Pour vérifier l’hypothèse l’hypothèse de risque proportionnel
nous pouvons tracer les fonctions de risque cumulées pour les deux groupes;
lorsque PH est satisfait, les deux courbes seront proportionnelles l’une à l’autre (c’est-à-dire qu’elles s’éloignent progressivement l’une de l’autre).
formule pour tracer la fonction de risque cumulé
plot(KM_fit, fun = “cumhaz”)
les differente fonctions daln l’analue de survie
La fonction de survie S(t) La fonction de probabilité de densité f (t) La fonction de répartition F(t) La fonction de risque h(t) La fonction de risque cumul´ee H(t)
La fonction de probabilit´e de densit´e f (t)
repr´esente la limite de
la probabilit´e que l’´ev´enement se produise au temps t
La fonction de survie S(t)
probabilité que l’evenement se produise apres le temps t
S(t) = Pr(T > t)
La fonction de répartition F(t)
probabilité que l’évènement se produise après le temps t.
F(t) = Pr(T ≤ t) = 1 − S(t)
La fonction de risque h(t)
représente la limite de la probabilité que l’´évènement se produise au temps t, sachant qu’aucun évènement ne s’est produit jusqu’au temps t.
La fonction de risque cumulée H(t)
Ht = -log(S(t))
Formulation générale d’un modelé `a risques proportionnels (PH)
λ(t|Xi) = λ0(t)exp(βi*Xi)
λ0(t)
est la fonction de risque de base (groupe de référence :x1 = x2 = ::: = 0).
estimation de λ0(t)
λ0(t) n’est pas estimée.
Pourquoi le Modelé et dit semi-paramétrique
Partie λ0(t) est non-paramétrique (pas d’estimation)
Partie exp(βi*Xi) et paramétrique (fonction Exponentielle avec prédicteur
linéaire)
La proportionnalité des risques
βk (k = 1; :::; p) ne dependent pas du temps
pour vérifier graphiquement PH
Tracer log(−log(S(t)))
La proportionnalité des risques est respectée
si les courbes sont parallèles
La proportionnalité des risques
Avantages de l’approche visuelle
Interprétation des résultats.
Évaluation possible de la correction pour gérer la
non-proportionnalité des risques
La proportionnalité des risques
Limites de l’approche visuelle
Interprétations subjectives
Seulement une covariable
Covariables catégorielles uniquement
modéliser la non-proportionnalité du risque lié à la
covariable X1
λ(t| X1; :::; Xi) = λ0(t)exp( β1(t) X1 + β2X2 + ::: + βiXi)
β1(t) X1 = La relation entre la Covariable change avec le temps.
on dit que la valeur est dépendante du temp
modeliser un effet non-proportionnel de la covariable
X1 ?
du model λ(t| X1; :::; Xi) = λ0(t)exp( β1(t) X1 + β2X2 + … βiXi)
λ(t| X1; :::; Xi) = λ0(t)exp( β1(t) X1 + γ1X1 + β2X2 + …+ βiXi)
Si t ≤ u alors HR = exp(β1).
Si t > u alors HR = exp(β1 + γ1).
Si γ1 = 0, alors il n’y a aucun effet dépendant du temps.
on dit que l’effet et dépendant du temps
la démarché dans la prise en compte de variable temporelle
modifier la structure de la base de données
exemple d’une indication de stratification
une variable catégorielle qui ne satisfait pas l’hypothèse des risques proportionnels,
Pour ajuster le modèle de Cox stratifié,
inclure le facteur de stratification dans la formule du modèle utilisant la fonction strata()
commentaire du code suivant:
coxph(Surv(years, status2) ~ age + drug + log(serBilir) + strata(sex), data = pbc2.id)
et caractéristique de la stratification
correspond à un modèle de Cox stratifié pour l’ensemble de données PBC avec différentes fonctions de risque de base pour chacun sex
Notez qu’une caractéristique de la stratification est que nous corrigeons (de la manière la plus générale) l’analyse pour sex mais nous n’obtenons aucun coefficient pour sex.
Si nous voulons permettre que l’effet de age sur le logarithme diffère entre les hommes et les femmes,
coxph(Surv(years, status2) ~ age + drug + log(serBilir),
data = pbc2.id)
nous incluons le terme d’interaction entre age et strata(sex)
coxph(Surv(years, status2) ~ age * strata(sex) + drug + log(serBilir),
data = pbc2.id)
Lorsque nous calculons les probabilités de survie à partir d’un modèle de Cox stratifié, nous obtenons
une courbe différente par strate
Nous observons que même si nous avons précisé que le patient pour lequel nous voulons calculer les probabilités de survie est un homme, nous obtenons deux courbes à la fois pour les hommes et les femmes. C’est parce qu’il sexs’agit d’un facteur de stratification et non d’une covariable.
Il est possible de stratifier selon plusieurs variables, comme le sexe et la présence d’œdèmes. Le code à renseigner est
Dans ce cas,
alors strata(sex, edema).
Dans ce cas, les différents groupes sont constitués par toutes les combinaisons possibles des
différentes variables., les différents groupes sont constitués par toutes les combinaisons possibles des
différentes variables.