De la biomédecine quantitative à la science des données et à l'intelligence artificielle pour la santé Flashcards
Les 5 étapes du processus de recherche (en statistiques)
- Formulation d’une hypothèse de recherche
- Mise en place d’un schéma d’étude adapté
- Recueil des données
- Analyse des données (outils statistiques)
- Extrapolation/inférence à la population ciblée et diffusion des résultats.
Les données FAIR
explication des initiales
- Findable
- Accessible
- Interoperable
- Reusable
Médecine en 4P (+ 2)
Médecine Personnalisée, Prédictive (risque), Préventive, Participative, (Pertinente et Parcours de soin).
Donner les caractéristiques des facteurs de crédibilité
Les FC (facteurs crédibilité) :
- Permettent le traitement de l’incertitude
- Sont attachés à la règle de connaissance utilisée (A et B donnent C avec un certain FC)
- Varient entre -1 et +1
- Peuvent être rattaché aux prémisses (A ou B).
- Sont visualisables par des arbres décisionnels.
Différence entre apprentissage supervisé et non-supervisé ?
- Apprentissage non-supervisé : nature des données d’entrainement inconnu. Regroupement en groupe selon similitudes trouvées par la machine. But → trouver ce qui relie les groupe.
- Apprentissage supervisé : classes connues mais mélangées, but → trouver méthode permettant de constituer ces classes. Apprentissage selon plusieurs type de validation : interne, externe, croisée.
Quels sont les différents type de validation (retrouvés dans l’apprentissage supervisé) et leurs caractéristiques ?
o Validation interne : on sort un échantillon d’apprentissage de taille n (2/3 de l’échantillon total) et on recherche une définition/règle statistique permettant d’ensuite créer des classes correctes. Vérification par % de classifications correctes. On applique ensuite la règle trouvée sur l’échantillon restant (1/3) et on vérifie le % correct.
o Validation externe : on utilise tout l’échantillon pour l’apprentissage et on utilise un autre échantillon pour la validation. Plus sûr +++.
o Validation croisée : jeu de données coupé en x parties → chaque partie servira à un moment donné à l’apprentissage puis à la validation.