Qu’est-ce que le data mining ? Flashcards

1
Q

Qu’est-ce que le datamining ?

A

Le data mining est une science qui se situe à la frontière des mathématiques, de l’informatique et de l’intelligence artificielle. C’est un processus d’exploration et d’analyse de données visant à découvrir des modèles, des relations ou des informations utiles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comment le datamining est-il décrit par JP Benzécri en 1973 ?

A

JP Benzécri a décrit le datamining comme “l’analyse des données est un outil pour dégager de la gangue des données le pur diamant de la véridique nature”. Cela signifie que le datamining permet de trouver des informations précieuses et pertinentes cachées dans un grand volume de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

donner un exemple concret de datamining

A

un exemple concret de datamining est l’extraction de patterns à partir de millions de séquençages génétiques pour prédire une maladie. En utilisant des techniques de data mining, on peut découvrir des schémas ou des associations entre certaines séquences génétiques et des maladies spécifiques, ce qui peut aider à prédire les risques de maladies chez les individus.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelle sont les origine du data mining ?

A

. les statistique
. l’IA
. reconnaissance de formes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Comment peut-on définir le datamining ?

A

Le data mining est le processus non trivial d’identification de structures valides, nouvelles, potentiellement utiles et finalement compréhensibles dans les données. Selon UM Fayyad et G. Piatetski-Shapiro, il s’agit de découvrir des motifs dans de vastes ensembles de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Comment DJ Hand définit-il le data mining ?

A

DJ Hand définit le data mining comme la découverte de structures intéressantes, inattendues ou précieuses dans de grands ensembles de données.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qu’est-ce que le data mining analyser

A

Le data mining analyse des données recueillies à d’autres fins, ce qui en fait une analyse secondaire de bases de données souvent conçue pour la gestion de données individuelles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qu’est-ce qui distingue le datamining de la collecte efficace de données ?

A

Le data mining ne se préoccupe pas de collecter des données de manière efficace, telles que les sondages ou les plans d’expériences, comme l’a mentionné Hand en 2000. Son objectif est d’analyser des données déjà disponibles.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quels sont les domaines qui ont remporté l’émergence du data mining ?

A

Le data mining est né de l’évolution des systèmes de gestion de bases de données vers l’informatique décisionnelle avec les entrepôts de données. Il a également été favorisé par la disponibilité de gigantesques bases de données, telles que les transactions par carte de crédit, les appels téléphoniques et les factures de supermarchés. De plus, le développement de la gestion de la relation client (CRM), activé sur le marketing client plutôt que sur les produits, ainsi que les recherches en intelligence artificielle, en apprentissage et en extraction de connaissances, ont gagné à son émergence.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qu’est-ce qu’un bon algorithme d’apprentissage ?

A

— Interprétabilité : la règle de classification est “compréhensible” ;
— Critique : fournit un score en classification, un intervalle en régression ;
— Consistance : convergence vers l’erreur bayésienne : quand n tend vers l’infini, fn
tend vers la règle de Bayes ;
— Minimax : cette convergence est la plus rapide possible ;
— Non-asymptotique : garanties de performance pour n donné ;
— Parameter-free : Paramétrage automatique ;
— Vitesse : complexité linéaire, possibilité de paralléliser ;
— Online : mise à jour séquentielle.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

ques qu’un Patterns ?

A

un système qui gerer des miller de patterns tous ne sont pas intéressants.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

un pattern et intressant si ?

A
  • facilement compris par l’homme
    -valide sur des nouvelle données ou test
  • potentielment utile
  • nouveau, ou validant certenes hypothèse que l’on cherche à confirmet
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

quelle et la direfence en Objectif & subjectif en data mining

A

Objectif ; basé sur des statistique et des strucure de parttens

subjectif : basé sur des croyances des utilisateur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

pourquoi un bon algorithme a c’est aparmetre ; Interprétabilité ,Critique,
Consistance, Minimax, Non-asymptotique , Parameter-free, Vitesse , Online ?

A

— Chacune est plus ou moins adaptée au problème considéré, à la nature des données, aux
propriétés de la relation entre descripteurs et variable expliquée. . .
— Il faut apprendre les qualités et les défauts de chaque méthode
— Il faut apprendre à expérimenter pour trouver la plus pertinentes
— L’estimation de la qualité des méthodes est donc centrale (mais pas toujours évidente).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

quelle son les paradoxes

A

— Un bon modèle statistique ne donne pas nécessairement des prédictions précises au niveau
individuel.
— facteurs de risque en épidémiologie
— On peut prévoir sans comprendre:
— pas besoin d’une théorie du consommateur pour faire du ciblage
— un modèle n’est qu’un algorithme
— Questions d’éthique et traitements de données personnelles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly