lec 2(done) Flashcards

Question 1

Q

Data Mining Functionalities:

Answer

A

1-Class/concept description
2-Mining frequent patterns, associations, and correlations
3-Classification and regression for predictive analysis
4-Cluster analysis
5-Outlier analysis

Question 2

Q

Data characterization:

Answer

A

Summarization of the general characteristics or features of a target class of data.

Question 3

Q

Data discrimination:

Answer

A

Comparison of the general features of the target class against one or a set of contrasting classes.

Question 4

Q

Frequent Patterns:

Answer

A

patterns that occur frequently in data.

Question 5

Q

Association Analysis:

Answer

A

Mining frequent patterns leads to the discovery of interesting associations and correlations within data.

Question 6

Q

Frequent Patterns and Associations applications:

Answer

A

1-Marketing and Sales Promotion.
2-Supermarket shelf management.
3-Inventory Management.

Question 7

Q

Classification:

Answer

A

Construct a model (function) based on some training examples to describe and distinguish data classes or concepts for future prediction.

Classification predicts categorical (discrete) labels.

Question 8

Q

Typical methods for data classification:

Answer

A

Decision trees, naïve Bayesian classification, support vector machines, neural networks, classificationrules (i.e., IF-THEN rules), logistic regression, …

Question 9

Q

Regression

Answer

A

is used to predict numerical (continuous) values.

Question 10

Q

Applications of Classification and Prediction:

Answer

A

Credit card fraud detection, direct marketing, classifying diseases..
Predicting wind velocity, temperature, sales amount of a product, stock market,…

Question 11

Q

Cluster analysis:

Answer

A

Unsupervised learning (Class label is unknown)

- Group data to form new categories (i.e., clusters)

Question 12

Q

Cluster analysis Applications:

Answer

A

1-Cluster houses to find distribution patterns.

2-Document clustering.

Question 13

Q

Outlier:

Answer

A

A data object that does not comply with the general behavior of the data (noise or exception)

Useful in fraud detection, rare events analysis

Question 14

Q

Major Issues in Data Mining:

Answer

A

1-Mining Methodology:
-Mining various and new kinds of knowledge.
-Mining knowledge in multi-dimensional space.
-Data mining: An interdisciplinary effort.
-Handling noise, uncertainty, and incompleteness of data.
-Pattern evaluation.
2-User Interaction:
-Incorporation of background knowledge.
-Presentation and visualization of data mining results.

3-Efficiency and Scalability:

Efficiency and scalability of data mining algorithms.
Parallel, distributed, and incremental mining methods.

4-Diversity of data types:

Handling complex types of data.
Mining dynamic, networked, and global data repositories.

5-Data mining and society:

Social impacts of data mining.
Privacy-preserving data mining.

lec 2(done) Flashcards

(14 cards)