DATA MINING Flashcards

1
Q

Quais são as ETAPAS do DATA MINING?

A

*

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Quais são os OBJETIVOS do DATA MINING?

A
  • Previsão
  • Identificação
  • Classificação
  • Organização
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

(CESPE – MPU – Analista de Suporte e Infraestrutura) Em se tratando de mineraçãode dados, a técnica de agrupamento (clustering) permite a descoberta de dados porfaixa de valores, por meio do exame de alguns atributos das entidades envolvidas.

A

Comentários: conforme vimos em aula, a questão está perfeita (Correto).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

(CESPE – SERPRO – Programação e Controle) Em algoritmos de clusterizaçãohierárquica, os clusters são formados gradativamente por meio de aglomerações oudivisões de elementos, gerando uma hierarquia de clusters.

A

Comentários: o agrupamento hierárquico ou clustering hierárquico tem como característica um processo de junções (aglomerações) ou separações de grupos ou elementos. Ele visa detectar a existência de diferentes grupos dentro de um determinado conjunto de dados e, em caso de existência, determina dividi-los ou aglomerá-los. O Clustering tenta identificar um conjunto finito de categorias ou clusters para os quais cada registro ou elemento possa ser mapeado (Correto).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

(FCC / TRT/14ª Região – 2011) No contexto de DW, é uma categoria de ferramentas de análisedenominada open-end e que permite ao usuário avaliar tendências e padrões não conhecidosentre os dados. Trata-se de:

a) slice.
b) star schema.
c) ODS.
d) ETL.
e) data mining.

A

Ferramentas de análise denominada open-end e que permite ao usuário avaliar tendências epadrões não conhecidos entre os dados é o Data Mining. O que é uma ferramenta de análiseopen-end? Ao invés de fazerem perguntas, os usuários entregam para a ferramenta grandesquantidades de dados em busca de tendências ou agrupamentos dos dados. Ferramentas de datamining utilizam-se das mais modernas técnicas de computação, como redes neurais, descobertapor regra, detecção de desvio, programação genética, para extrair padrões e associações dedados.

Gabarito: Letra E

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q
  1. (FUNRIO / MPOG – 2013) Qual o tipo de descoberta de conhecimento através de mineraçãode dados (do inglês “data mining”), em que se relaciona a presença de conjuntos de itensdiversos, como por exemplo: “Quando uma mulher compra uma bolsa em uma loja, ela estápropensa a comprar sapatos”?

a) Hierarquias de classificação.
b) Padrões sequenciais.
c) Regras de associação.
d) Séries temporais.
e) Agrupamentos por similaridade.

A

Regras de Associação são regras que correlacionam a presença de um conjunto de itens com outrafaixa de valores para um conjunto de variáveis diverso. A correção entre a compra de bolsas esapatos é uma regra de associação.

Gabarito: Letra C

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q
  1. (FCC / TRF-3R – 2014) Mineração de dados é a investigação de relações e padrões globais queexistem em grandes bancos de dados, mas que estão ocultos no grande volume de dados.Com base nas funções que executam, há diferentes técnicas para a mineração de dados,dentre as quais estão:

I. identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros.Por exemplo: 75% dos envolvidos em processos judiciais ligados a ataques maliciosos aservidores de dados também estão envolvidos em processos ligados a roubo de dadossigilosos.

II. identificar sequências que ocorrem em determinados registros. Por exemplo: 32% depessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova períciamédica ajuízam uma causa contra o INSS solicitando ressarcimento monetário.

III. as categorias são definidas antes da análise dos dados. Pode ser utilizada para identificaros atributos de um determinado grupo que fazem a discriminação entre 3 tipos diferentes,por exemplo, os tipos de processos judiciais podem ser categorizados como infrequentes,ocasionais e frequentes.

Os tipos de técnicas referenciados em I, II e III, respectivamente, são:

a) I - Padrões sequenciais
II - Redes Neurais
III - Árvore de decisão

b) I - Redes Neurais
II - Árvore de decisão
III - Padrões sequenciais

c) I - Associação
II - Padrões sequenciais
III - Classificação

d) I - Classificação
II - Associação
III - Previsão

e) I - Árvore de decisão
II - Classificação
III - Associação

A

Comentários:

(I) Identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros sópode estar relacionado à Associação; (II) Identificar sequências que ocorrem em determinadosregistros está relacionado a padrões sequenciais; (III) As categorias são definidas antes da análisedos dados.

Gabarito: Letra C

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
A

I. Regras de associação podem ser usadas, por exemplo, para determinar, quando um clientecompra um produto X, ele provavelmente também irá comprar um produto Y.

II. Classificação é uma técnica de aprendizado supervisionado, no qual se usa um conjunto dedados de treinamento para aprender um modelo e classificar novos dados.

III. Agrupamento é uma técnica de aprendizado não-supervisionado que particiona um conjuntode dados em grupos.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly