DATA MINING Flashcards
Quais são as ETAPAS do DATA MINING?
*
Quais são os OBJETIVOS do DATA MINING?
- Previsão
- Identificação
- Classificação
- Organização
(CESPE – MPU – Analista de Suporte e Infraestrutura) Em se tratando de mineraçãode dados, a técnica de agrupamento (clustering) permite a descoberta de dados porfaixa de valores, por meio do exame de alguns atributos das entidades envolvidas.
Comentários: conforme vimos em aula, a questão está perfeita (Correto).
(CESPE – SERPRO – Programação e Controle) Em algoritmos de clusterizaçãohierárquica, os clusters são formados gradativamente por meio de aglomerações oudivisões de elementos, gerando uma hierarquia de clusters.
Comentários: o agrupamento hierárquico ou clustering hierárquico tem como característica um processo de junções (aglomerações) ou separações de grupos ou elementos. Ele visa detectar a existência de diferentes grupos dentro de um determinado conjunto de dados e, em caso de existência, determina dividi-los ou aglomerá-los. O Clustering tenta identificar um conjunto finito de categorias ou clusters para os quais cada registro ou elemento possa ser mapeado (Correto).
(FCC / TRT/14ª Região – 2011) No contexto de DW, é uma categoria de ferramentas de análisedenominada open-end e que permite ao usuário avaliar tendências e padrões não conhecidosentre os dados. Trata-se de:
a) slice.
b) star schema.
c) ODS.
d) ETL.
e) data mining.
Ferramentas de análise denominada open-end e que permite ao usuário avaliar tendências epadrões não conhecidos entre os dados é o Data Mining. O que é uma ferramenta de análiseopen-end? Ao invés de fazerem perguntas, os usuários entregam para a ferramenta grandesquantidades de dados em busca de tendências ou agrupamentos dos dados. Ferramentas de datamining utilizam-se das mais modernas técnicas de computação, como redes neurais, descobertapor regra, detecção de desvio, programação genética, para extrair padrões e associações dedados.
Gabarito: Letra E
- (FUNRIO / MPOG – 2013) Qual o tipo de descoberta de conhecimento através de mineraçãode dados (do inglês “data mining”), em que se relaciona a presença de conjuntos de itensdiversos, como por exemplo: “Quando uma mulher compra uma bolsa em uma loja, ela estápropensa a comprar sapatos”?
a) Hierarquias de classificação.
b) Padrões sequenciais.
c) Regras de associação.
d) Séries temporais.
e) Agrupamentos por similaridade.
Regras de Associação são regras que correlacionam a presença de um conjunto de itens com outrafaixa de valores para um conjunto de variáveis diverso. A correção entre a compra de bolsas esapatos é uma regra de associação.
Gabarito: Letra C
- (FCC / TRF-3R – 2014) Mineração de dados é a investigação de relações e padrões globais queexistem em grandes bancos de dados, mas que estão ocultos no grande volume de dados.Com base nas funções que executam, há diferentes técnicas para a mineração de dados,dentre as quais estão:
I. identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros.Por exemplo: 75% dos envolvidos em processos judiciais ligados a ataques maliciosos aservidores de dados também estão envolvidos em processos ligados a roubo de dadossigilosos.
II. identificar sequências que ocorrem em determinados registros. Por exemplo: 32% depessoas do sexo feminino após ajuizarem uma causa contra o INSS solicitando nova períciamédica ajuízam uma causa contra o INSS solicitando ressarcimento monetário.
III. as categorias são definidas antes da análise dos dados. Pode ser utilizada para identificaros atributos de um determinado grupo que fazem a discriminação entre 3 tipos diferentes,por exemplo, os tipos de processos judiciais podem ser categorizados como infrequentes,ocasionais e frequentes.
Os tipos de técnicas referenciados em I, II e III, respectivamente, são:
a) I - Padrões sequenciais
II - Redes Neurais
III - Árvore de decisão
b) I - Redes Neurais
II - Árvore de decisão
III - Padrões sequenciais
c) I - Associação
II - Padrões sequenciais
III - Classificação
d) I - Classificação
II - Associação
III - Previsão
e) I - Árvore de decisão
II - Classificação
III - Associação
Comentários:
(I) Identificar afinidades existentes entre um conjunto de itens em um dado grupo de registros sópode estar relacionado à Associação; (II) Identificar sequências que ocorrem em determinadosregistros está relacionado a padrões sequenciais; (III) As categorias são definidas antes da análisedos dados.
Gabarito: Letra C
I. Regras de associação podem ser usadas, por exemplo, para determinar, quando um clientecompra um produto X, ele provavelmente também irá comprar um produto Y.
II. Classificação é uma técnica de aprendizado supervisionado, no qual se usa um conjunto dedados de treinamento para aprender um modelo e classificar novos dados.
III. Agrupamento é uma técnica de aprendizado não-supervisionado que particiona um conjuntode dados em grupos.