Sistemas de Suporte à Decisão e Inteligência de Negócio II Flashcards

1
Q

O que é o Data Mining?

A

Também chamado de Mineração de Dados ou Prospecção de Dados, trata-se processo de explorar grandes quantidades de dados à procura de padrões consistentes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Que tipo de ferramenta possibilita, por exemplo, que companhias aéreas prevejam quem perderá um voo; é capaz de informar a grandes lojas de departamento quem possivelmente está grávida; ajuda médicos a identificarem infecções fatais; e impressionantemente podem ser utilizadas até para prever – por meio de dados celulares –possíveis massacres em diversos países?

A

O Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

A mineração de dados é muito parecida com a meteorologia. Por que?

A

Os meteorologistas basicamente buscam duas coisas: primeiro, eles querem descrever padrões climáticos genéricos; segundo, eles querem prever a temperatura e umidade de um dia qualquer.

O Data Mining também busca prever determinadas situações com base em uma análise de dados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Uma rede varejista descobriu que a venda de colírios aumentava na véspera de feriados, essa rede passou a preparar seus estoques e promoções com base nesse cenário.

O Data Mining pode ter sido usado para fazer essa “descoberta” CERTO ou ERRADO?

A

CERTO! Por meio da mineração de dados podem se chegar à conclusões esporádicas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Qual o processo de explorar grande quantidade de dados para extração não-trivial de informação implícita desconhecida?

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

_____ é uso de teorias, métodos, processos e tecnologias para organizar uma grande quantidade de dados brutos para identificar padrões de comportamentos em determinados públicos.

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qual é a categoria de ferramentas de análise denominada open-end e que permite ao usuário avaliar tendências e padrões não conhecidos entre os dados?

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

_____ é o processo de descoberta de novas correlações, padrões e tendências entre as informações de uma empresa, por meio da análise de grandes quantidades de dados armazenados em bancos de dados usando técnicas de reconhecimento de padrões, estatísticas e matemáticas.

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

_____ constitui em uma técnica para a exploração e análise de dados, visando descobrir padrões e regras, a princípio ocultos, importantes à aplicação.

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que é o conjunto de ferramentas que permitem ao usuário avaliar tendências e padrões não conhecidos entre os dados.

Esses tipos de ferramentas podem utilizar técnicas avançadas de computação como redes neurais, algoritmos genéticos e lógica nebulosa (fuzzy), dentre outras?

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

O que é o conjunto de ferramentas e técnicas de mineração de dados que têm por objetivo buscar a classificação e o agrupamento (clusterização) de dados, bem como identificar padrões.

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

O que é o processo de explorar grandes quantidades de dados à procura de padrões consistentes com o intuito de detectar relacionamentos sistemáticos entre variáveis e novos subconjuntos de dados?

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Que técnica consiste em explorar um conjunto de dados visando a extrair ou a ajudar a evidenciar padrões, como regras de associação ou sequências temporais, para detectar relacionamentos entre estes?

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Quais são as ferramentas que utilizam diversas técnicas de natureza estatística, como a análise de conglomerados (cluster analysis), que tem como objetivo agrupar, em diferentes conjuntos de dados, os elementos identificados como semelhantes entre si, com base nas características analisadas?

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O que é o conjunto de técnicas que, envolvendo métodos matemáticos e estatísticos, algoritmos e princípios de inteligência artificial, tem o objetivo de descobrir relacionamentos significativos entre dados armazenados em repositórios de grandes volumes e concluir sobre padrões de comportamento de clientes de uma organização?

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

_____ é o processo de explorar grandes quantidades de dados à procura de padrões consistentes, como regras de associação ou sequências temporais, para detectar relacionamentos sistemáticos entre variáveis, detectando assim novos subconjuntos de dados.

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

_____ é o processo de analisar de maneira semi automática grandes bancos de dados para encontrar padrões úteis.

A

Data Mining

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

As ferramentas de mineração de dados geralmente utilizam uma arquitetura cliente/servidor ou até uma arquitetura web. CERTO ou ERRADO?

A

CERTO!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Há diferentes tipos de mineração de dados. Dentre elas a DIAGNÓSTICA. O que é esse tipo de mineração?

A

Aquela utilizada para entender os dados e/ou encontrar causas de problemas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Há diferentes tipos de mineração de dados. Dentre elas a PREDITIVA. O que é esse tipo de mineração?

A

Aquela utilizada para antecipar comportamentos futuros

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

A mineração de dados só pode ocorrer em bancos de dados muito grades como Data Warehouses. CERTO ou ERRADO?

A

ERRADO! Apesar de ser mais comum, NÃO é REGRA

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

É possível realizar a mineração de dados de bases de dados não estruturadas?

A

SIM! Qualquer base de dados pode ser minerada

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Para realizar o Data MiniNg é necessário ter conhecimentos de programação. CERTO ou ERRADO?

A

ERRADO! Não é necessário ter conhecimentos de programação para realizar consultas, visto que existem ferramentas especializadas que auxiliam o usuário final de negócio;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

No ambiente organizacional, devido à grande quantidade de dados, não é recomendado o emprego de data mining para atividades ligadas a marketing. CERTO ou ERRADO?

A

ERRADO! É recomendável – sim – o emprego de Data Mining para atividades ligadas a marketing

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

A Mineração de Dados faz parte de um processo muito maior de descoberta de conhecimento.

Qual é esse processo?

A

KDD (Knowledge Discovery in Databases

Descoberta de Conhecimento em Bancos de Dados

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

O Processo de Descoberta de Conhecimento em Bancos de Dados (KDD), compreende 5 fases. Quais são elas?

A

(1) Seleção;
(2) Pré-processamento;
(3) Transformação;
(4) Data Mining;
(5) Interpretação e Avaliação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

O processo de descoberta de conhecimento (KDD) é interativo e iterativo, envolvendo várias etapas com muitas decisões tomadas pelo usuário. CERTO ou ERRADO?

A

CERTO!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Qual a primeira fase do Processo de Descoberta de Conhecimento em Bancos de Dados (KDD)?

A
  1. Seleção.

Selecionar um conjunto de dados de diversas bases ou se concentrar em um subconjunto de variáveis ou amostras de dados – no qual a descoberta será realizada.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

No Processo de Descoberta de Conhecimento em Bancos de Dados (KDD), após a seleção de dados relevantes, a próxima fase é o Pré-processamento. No que consiste essa fase?

A

Operações básicas incluem limpeza, remoção de erros, eliminação de redundância, decidir estratégias para lidar com campos de dados ausentes, entre outros.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

No Processo de Descoberta de Conhecimento em Bancos de Dados (KDD), com os dados pré processados qual a próxima fase?

A
  1. Transformação.

Os dados são enriquecidos e consolidados em formas apropriadas à mineração, sumarizando-os ou agregando-os.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

No Processo de Descoberta de Conhecimento em Bancos de Dados (KDD), com os dados transformados, passamos à etapa de _____.

A

Mineração de Dados (Data Mining)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

No Processo de Descoberta de Conhecimento em Bancos de Dados (KDD), após a realização da Mineração de Dados, qual a última fase?

A
  1. Interpretação e Avaliação

A descoberta de diversos padrões que serão interpretados e avaliados em busca de padrões realmente interessantes e úteis, além de suas possíveis explicações ou interpretações.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

A técnica de pré-processamento (no processo de KDD) possui alguns objetivos principais: melhorar a qualidade dos dados; diminuir a ambiguidade das expressões linguísticas; diminuir a quantidade de dados a ser processado; estruturar as informações como tuplas; e melhorar a eficiência da mineração de dados. CERTO ou ERRADO?

A

CERTO!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

O objetivo das técnicas de pré-processamento de dados é preparar os dados brutos para serem analisados sem erros de incompletudes, inconsistências e ruídos. CERTO ou ERRADO?

A

CERTO!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Segundo Navathe, a Mineração de Dados costuma ser executada com alguns objetivos finais ou aplicações. Quais são esses objetivos?

A

Previsão;
Identificação;
Classificação; e
Otimização.

(PICO)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Segundo Navathe, a Mineração de Dados costuma ser executada com alguns objetivos finais ou aplicações. São eles a Previsão, Identificação, Classificação e Otimização.

O que é a Previsão?

A

A mineração de dados pode mostrar como certos atributos dos dados se comportarão no futuro.

Um de seus objetivos é prever comportamentos futuros baseado em comportamentos passados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Segundo Navathe, a Mineração de Dados costuma ser executada com alguns objetivos finais ou aplicações. São eles a Previsão, Identificação, Classificação e Otimização.

O que é a Identificação?

A

Padrões de dados podem ser usados para identificar a existência de um item, um evento ou uma atividade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Segundo Navathe, a Mineração de Dados costuma ser executada com alguns objetivos finais ou aplicações. São eles a Previsão, Identificação, Classificação e Otimização.

O que é a Classificação?

A

A mineração de dados pode particionar os dados de modo que diferentes classes ou categorias possam ser identificadas com base em combinações de parâmetros.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Segundo Navathe, a Mineração de Dados costuma ser executada com alguns objetivos finais ou aplicações. São eles a Previsão, Identificação, Classificação e Otimização.

O que é a Otimização?

A

Um objetivo relevante da mineração de dados pode ser otimizar o uso de recursos limitados, como tempo, espaço, dinheiro ou materiais e maximizar variáveis de saída como vendas ou lucros sob determinado conjunto de restrições.

Como tal, esse objetivo da mineração de dados é semelhante à função objetiva, usada em problemas de pesquisa operacional, que lida com otimização sob restrições.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
40
Q

Qual objetivo final/aplicação da Mineração de Dados faz:

Análise de transações de compras passadas para prever o que os consumidores comprarão futuramente sob certos descontos, quanto volume de vendas uma loja gerará em determinado período e se a exclusão de uma linha de produtos gerará mais lucros?

A

Previsão

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
41
Q

Em qual objetivo final/aplicação da Mineração de Dados:

A lógica de negócios é usada junto com a mineração de dados.

Em um contexto científico, certos padrões de onda sísmica podem prever um terremoto com alta probabilidade?

A

Previsão

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
42
Q

Em qual objetivo final/aplicação da Mineração de Dados:

Intrusos tentando quebrar um sistema podem ser identificados pelos programas por eles executados, arquivos por eles acessados ou pelo tempo de CPU por sessão aberta?

A

Identificação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
43
Q

Em relação ao objetivo final/aplicação da Mineração de Dados:

A área conhecida como autenticação é uma forma de _____.

Ela confirma se um usuário é realmente um usuário específico ou de uma classe autorizada, e envolve uma comparação de parâmetros, imagens ou sinais contra um banco de dados

A

Identificação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
44
Q

Em qual objetivo final/aplicação da Mineração de Dados:

Os clientes em um supermercado podem ser categorizados em compradores que buscam desconto, compradores com pressa, compradores regulares leais, compradores ligados a marcas conhecidas e compradores eventuais?

A

Classificação

Essa classificação pode ser usada em diferentes análises de transações de compra de cliente como uma atividade pós-mineração.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
45
Q

Em relação ao objetivo final/aplicação da Mineração de Dados:

Às vezes, a classificação baseada em conhecimento de domínio comum é utilizada como uma entrada para decompor o problema de mineração e torná-lo mais simples (Ex: alimentos saudáveis, alimentos de festa ou alimentos de lanche escolar são categorias distintas nos negócios do supermercado.) CERTO ou ERRADO?

A

CERTO!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
46
Q

Em qual objetivo final/aplicação da Mineração de Dados:

Os clientes em um supermercado podem ser categorizados em compradores que buscam desconto, compradores com pressa, compradores regulares leais, compradores ligados a marcas conhecidas e compradores eventuais?

A

Classificação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
47
Q

O que são Técnicas e Tarefas, em relação à Data Mining?

A

Tarefas: consistem na especificação do que estamos querendo buscar nos dados (O que?); e

Técnicas: consistem na especificação de como descobrir os padrões (Como?).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
48
Q

As Técnicas e Tarefas de Data Mining podem ser divididas em 3 categorias, quais são elas?

A

Predição/Previsão;
Associação; e
Agrupamento/Clusterização.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
49
Q

A técnica de AGRUPAMENTO, de Data Mining, também pode ser chamada de…?

A

Clusterização

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
50
Q

As Técnicas e Tarefas de Data Mining podem ser divididas em 3 categorias, quais são elas?

A

Predição/Previsão;
Associação; e
Agrupamento/Clusterização.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
51
Q

Qual técnica/tarefa de Data Mining busca descrever a natureza de ocorrências futuras de certos eventos com base nos acontecimentos passados?

A

Predição/Previsão;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
52
Q

Qual técnica/tarefa de Data Mining busca descobrir relacionamentos entre variáveis correlacionando a presença de um item com uma faixa de valores para outro conjunto de variáveis?

A

Associação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
53
Q

Qual técnica de Data Mining busca descrever a natureza de ocorrências futuras de certos eventos com base nos acontecimentos passados?

A

Predição/Previsão;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
54
Q

Qual técnica de Data Mining busca descobrir relacionamentos entre variáveis correlacionando a presença de um item com uma faixa de valores para outro conjunto de variáveis?

A

Associação

55
Q

Qual técnica/tarefa de Data Mining particiona dados em segmentos previamente desconhecidos com características semelhantes?

A

Agrupamento/Clusterização

56
Q

Quais as técnicas de aprendizado supervisionado, em Data Mining?

A

Classificação; e

Regressão

57
Q

Quais as técnicas de aprendizado não supervisionado, em Data Mining?

A

Associação;
Agrupamento; e
Anomalia

(AAA)

58
Q

Qual a técnica de mineração de dados que designa itens de dados a uma determinada classe ou categoria previamente definida (aprendizado supervisionado) a fim de prever a classe alvo para cada item de dado?

A

Classificação

59
Q

Companhias de Seguro utilizam Data Mining para adivinhar quais pacientes idosos morrerão em breve; Lojas de roupas podem usar dados para adivinhar se determinada pessoa está grávida ou não.

Qual técnica de mineração de dados é utilizada para isso?

A

Classificação

60
Q

Que tipo de Técnica de Data Mining utiliza um algoritmo de aprendizado supervisionado a fim de distribuir um conjunto de dados de entrada em categorias ou classes pré-definidas de saída para realizar a análise de dados. Constroem-se modelos de classificação a partir de um conjunto de dados de entrada, identificando cada classe por meio de múltiplos atributos e os rotulando/etiquetando – sendo essa técnica possível de ser utilizada com outras técnicas?

A

Classificação

61
Q

Companhias de Seguro utilizam Data Mining para adivinhar quais pacientes idosos morrerão em breve; Lojas de roupas podem usar dados para adivinhar se determinada pessoa está grávida ou não.

Qual técnica de mineração de dados é utilizada para isso?

A

Classificação

62
Q

Com o uso da classificação como técnica de Data Mining, busca-se a identificação de uma classe por meio de múltiplos atributos. Essa técnica também pode ser usada em conjunto com outras técnicas de mineração de dados. CERTO ou ERRADO?

A

CERTO!

63
Q

Dentre os algoritmos utilizados em data mining, há um algoritmo que visa o estabelecimento de categorias, a partir do conjunto de dados, bem como a distribuição dos dados nas categorias estabelecidas. Essa descrição corresponde aos algoritmos de…?

A

Classificação

64
Q

O que são as Redes Neurais (Artificiais), ferramenta de classificação de dados?

A

São algoritmos inspirados no sistema nervoso central de animais – em particular, o cérebro – que possuem a capacidade de aprender com experiências passadas, prever um comportamento ou reconhecer um padrão desde que apresentadas no formato de um conjunto de dados estruturado.

65
Q

Quais ferramentas de classificação de dados foram originalmente projetadas por psicólogos e neurobiologistas que procuravam desenvolver um conceito de neurônio artificial análogo ao neurônio natural?

A

As Redes Neurais (Artificiais)

66
Q

O que são as Algoritmos Genéticos, ferramenta de classificação de dados?

A

São uma classe de procedimentos de pesquisa aleatórios capazes de realizar pesquisa adaptativa e robusta por uma grande faixa de topologias de espaço de busca.

67
Q

Quais ferramentas de classificação de dados utilizam mecanismos de biologia evolutiva, como hereditariedade, recombinação, seleção natural e mutação, para solucionar e agrupar problemas?

A

Algoritmos Genéticos

68
Q

Quais ferramentas de classificação de dados são basicamente uma representação gráfica das regras de classificação?

A

Árvores de Decisões

69
Q

O que são as Árvores de Decisões, ferramenta de classificação de dados?

A

Ferramenta que demonstra visualmente as condições e as probabilidades para categorizar dados por meio de uma estrutura que contém nó raiz, nós folha e nós finais.

Cada nó interno denota um teste em um atributo, cada ramificação denota o resultado de um teste e cada nó folha contém um rótulo de uma classe.

O objetivo da técnica é andar pela árvore verificando cada um dos testes até chegar a uma folha, que representa a categoria, classe ou rótulo do item avaliado.

70
Q

Quais ferramentas de classificação de dados são basicamente uma representação gráfica das regras de classificação?

A

Árvores de Decisões

71
Q

Em relação à técnica de mineração de dados, na regressão, em vez de prever uma categoria, o objetivo é prever um _____.

A

Número

72
Q

Que ferramenta de classificação de dados é capaz de classificar dados dentre de um conjunto finito de classes com base em valores de entrada por meio de uma abordagem chamada estratificação, que permite determinar as regras para que se possa designar ou direcionar cada caso a uma categoria pré-existente, separando-os em níveis diferentes (Ex: executar o processo da troca, enviar para a assistência, comunicar o cliente e reeviar o produto)?

A

Árvores de Decisões

73
Q

É uma aplicação especial da regra de classificação. Se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada _____.

A

Regressão

74
Q

Se uma empresa quer saber não apenas se cada cliente estava grávida, mas quando enviar cada cupom de desconto. Então eles conseguiram estimar as datas de nascimento também dos bebês.

Essa é uma questão de regressão, i.e., quantas semanas até a cliente dar à luz. CERTO ou ERRADO?

A

CERTO!

75
Q

É uma aplicação especial da regra de classificação. Se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada _____.

A

Regressão

76
Q

Qual Técnica/Tarefa de Data Mining “compreende a busca por uma função que mapeie os registros de um banco de dados em um intervalo de valores reais”?

A

Regressão (Falou em intervalo de valores, falou em Regressão)

77
Q

Uma das abordagens de mining define que, se uma regra de classificação é considerada uma função sobre variáveis que as mapeia em uma classe destino, a regra é chamada…?

A

Regressão

78
Q

Uma regra de _____ pode ser vista como uma expressão da forma X → Y, onde há a relação dos valores de X e Y em um certo conjunto de valores (Ex:{fralda} → {cerveja}).

A

Associação

79
Q

Geralmente, as regras de associação são escritas em um formato como: se [algo acontecer], então [algo acontecerá] ou se [evento], então [ações]. CERTO ou ERRADO?

A

CERTO!

80
Q

Existem duas variações comuns de regras de associação: padrões sequenciais e os padrões
temporais.

O que é o padrão sequencial?

A

Nos padrões sequenciais, uma sequência de ações é buscada.

Exemplo: se um paciente passou por uma cirurgia de ponte de safena para artérias bloqueadas e um aneurisma e, depois, desenvolveu ureia sanguínea alta dentro de um ano de cirurgia, ele provavelmente sofrerá de insuficiência renal nos próximos dezoito meses.

81
Q

No tocante ao data mining, o tipo de informação que é extraída desta ferramenta, em que se pode descobrir, por exemplo, que, quando se compra uma casa, compra-se também uma geladeira, considerando-se que essas compras são realizadas num período de duas semanas, é…?

A

Associação

82
Q

Existem duas variações comuns de regras de associação: padrões sequenciais e os padrões
temporais.

O que é o padrão sequencial?

A

Nos padrões sequenciais, uma sequência de ações é buscada.

Exemplo: se um paciente passou por uma cirurgia de ponte de safena para artérias bloqueadas e um aneurisma e, depois, desenvolveu ureia sanguínea alta dentro de um ano de cirurgia, ele provavelmente sofrerá de insuficiência renal nos próximos dezoito meses.

83
Q

Existem duas medidas capazes de indicar a qualidade ou grau de certeza de uma regra de associação. Quais são elas?

A

Suporte (Prevalência); e

Confiança (Força)

84
Q

Existem duas medidas capazes de indicar a qualidade ou grau de certeza de uma regra de associação:
Suporte (Prevalência); e Confiança (Força)

O que é o Suporte (Prevalência)?

A

Trata-se da FREQUÊNCIA com que um conjunto de itens específicos ocorrem no banco de dados, isto é, o percentual de transações que contém todos os itens em um conjunto.

Em termos matemáticos, a medida de suporte para uma regra X → Y é a frequência em que o conjunto de itens aparece nas transações do banco de dados.

Um suporte alto nos leva a crer que os itens do conjunto X e Y costumam ser comprados juntos, pois ocorrem com alta frequência no banco de dados.

(Ex: 70% das compras realizadas em um mercado contém arroz e refrigerante).

85
Q

Existem duas medidas capazes de indicar a qualidade ou grau de certeza de uma regra de associação. Quais são elas?

A

Suporte (Prevalência); e

Confiança (Força)

86
Q

Existem duas medidas capazes de indicar a qualidade ou grau de certeza de uma regra de associação:
Suporte (Prevalência); e Confiança (Força)

O que é o Suporte (Prevalência)?

A

Trata-se da FREQUÊNCIA com que um conjunto de itens específicos ocorrem no banco de dados, isto é, o percentual de transações que contém todos os itens em um conjunto.

Em termos matemáticos, a medida de suporte para uma regra X → Y é a frequência em que o conjunto de itens aparece nas transações do banco de dados.

Um suporte alto nos leva a crer que os itens do conjunto X e Y costumam ser comprados juntos, pois ocorrem com alta frequência no banco de dados.

(Ex: 70% das compras realizadas em um mercado contém arroz e refrigerante).

87
Q

Que tipo de técnica de Data Mining visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança, permitindo a descoberta por faixa de valores e pelo exame de atributos das entidades envolvidas?

A

Análise de Agrupamentos

88
Q

Que tipo de técnica de Data Mining tem por objetivo descobrir diferentes clusters em uma massa de dados e agrupá-los de uma forma que ajude com sua análise?

A

Análise de Agrupamentos

89
Q

Que tipo de técnica de Data Mining visa fazer agrupamentos automáticos de dados segundo o seu grau de semelhança, permitindo a descoberta por faixa de valores e pelo exame de atributos das entidades envolvidas?

A

Análise de Agrupamentos

90
Q

Que tipo de técnica de Data Mining tem por objetivo descobrir diferentes clusters em uma massa de dados e agrupá-los de uma forma que ajude com sua análise?

A

Análise de Agrupamentos

91
Q

Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. CERTO ou ERRADO?

A

CERTO!

92
Q

Qual técnica de Data Mining realiza agrupamentos comuns chamados clusters, de modo que o grau de associação seja forte entre os membros do mesmo grupo e fraco entre membros de grupos diferentes?

A

Análise de Agrupamentos

93
Q

Em se tratando de mineração de dados, a técnica de agrupamento (clustering) permite a descoberta de dados por faixa de valores, por meio do exame de alguns atributos das entidades envolvidas. CERTO ou ERRADO?

A

CERTO!

94
Q

Considere uma dada população de eventos ou novos itens que podem ser particionados (segmentados) em conjuntos de elementos similares, tal como, por exemplo, uma população de dados sobre uma doença que pode ser dividida em grupos baseados na similaridade dos efeitos colaterias produzidos.

Como um dos modos de descrever o conhecimento descoberto durante a data mining este é chamado de…?

A

Clustering

95
Q

O agrupamento hierárquico ou clustering hierárquico tem como característica um processo de junções (aglomerações) ou separações de grupos ou elementos.

Ele visa detectar a existência de diferentes grupos dentro de um determinado conjunto de dados e, em caso de existência, determina dividi-los ou aglomerá-los.

O Clustering tenta identificar um conjunto finito de categorias ou clusters para os quais cada registro ou elemento possa ser mapeado. CERTO?

A

CERTO!

96
Q

Considere uma dada população de eventos ou novos itens que podem ser particionados (segmentados) em conjuntos de elementos similares, tal como, por exemplo, uma população de dados sobre uma doença que pode ser dividida em grupos baseados na similaridade dos efeitos colaterias produzidos.

Como um dos modos de descrever o conhecimento descoberto durante a data mining este é chamado de…?

A

Clustering

97
Q

Qual é a funcionalidade do Oracle Data Mining que encontra aglomerados de objetos de dados semelhantes em algum sentido entre si?

A

Clustering

98
Q

Qual o termo em Inglês para Detecção de Anomalias, em Data Mining?

A

Outlier (Fora da Linha)

99
Q

Como podem ser classificadas as Anomalias detectadas por um Sistema de Data Mining?

A

Naturais ou Artificiais.

Uma pessoa que há trinta anos declara ter crescimento de patrimônio anual de 1% e, de repente, declara ter tido um crescimento de 1000% pode ter ganhado na megasena – essa é uma anomalia natural.

Por outro lado, essa mesma pessoa pode simplesmente ter errado na hora de digitar e declarou patrimônio de R$10.000.000 em vez de R$100.000 – essa é uma anomalia artificial.

100
Q

Outlier ou anomalias são padrões nos dados que não estão de acordo com uma noção bem definida de comportamento normal. CERTO ou ERRADO?

A

CERTO!

101
Q

Funcionalidade cujo objetivo é encontrar conjuntos de dados que não obedecem ao comportamento ou modelo dos dados. Uma vez encontrados, podem ser tratados ou descartados para utilização em mining. Trata-se de…?

A

Análise de outliers

102
Q

Outlier ou anomalias são padrões nos dados que não estão de acordo com uma noção bem definida de comportamento normal. CERTO ou ERRADO?

A

CERTO!

103
Q

Aprendizagem de máquina pode ajudar a clusterização na identificação de outliers, que são objetos completamente diferentes do padrão da amostra. CERTO ou ERRADO?

A

CERTO!

104
Q

Qual é a área da inteligência artificial que busca desenvolver técnicas computacionais sobre aprendizado assim como a construção de sistemas capazes de adquirir conhecimento de forma autônoma que tome decisões baseado em experiências acumuladas por meio da solução bem-sucedida de problemas anteriores?

A

Aprendizado de Máquina (Machine Learning)

105
Q

O Aprendizado de Máquina (Machine Learning) é uma ferramenta poderosa para a aquisição automática de conhecimento por meio da imitação do comportamento de aprendizagem humano com foco em aprender a reconhecer padrões complexos e tomar decisões. CERTO ou ERRADO?

A

CERTO!

106
Q

Qual o meio para encontrar padrões interessantes/úteis em um contexto de informações textuais não estruturadas, combinado com alguma tecnologia de extração e de recuperação da informação, processo de linguagem natural e de sumarização ou indexação de documentos?

A

Mineração de Texto (Text Mining)

107
Q

Mecanismos de busca utilizam mineração de textos para apresentar ao usuário os resultados de suas pesquisas, de modo que ambos os conceitos se equivalem. CERTO ou ERRADO?

A

ERRADO! A Mineração de Texto busca descobrir informações previamente desconhecidas;

Mecanismos de Busca partem já do que o usuário deseja procurar e apenas recupera

108
Q

A mineração de textos utiliza técnicas diferentes da mineração de dados, tendo em vista que os textos representam um tipo específico de dado. CERTO ou ERRADO?

A

ERRADO! Na verdade, as técnicas utilizadas são as mesmas – muda apenas o tipo de dado

109
Q

Qual é o modelo de referência de mineração de dados que descreve um conjunto de processos para realizar projetos de mineração de dados em uma organização baseado nas melhores práticas utilizadas por profissionais e acadêmicos do ramo?

A

O CRISP-DM (Cross Industry Standard Process for Data Mining)

110
Q

O Projeto _____ desenvolveu um modelo de processos de mineração de dados com foco industrial e independente de ferramentas. Partindo dos processos embrionários de descoberta de conhecimento usados atualmente na indústria e respondendo diretamente aos requisitos do usuário, este projeto definiu e validou um processo de mineração de dados aplicável em diversos setores da indústria. Isso tornará grandes projetos de mineração de dados mais rápidos, mais baratos, mais confiáveis e mais gerenciáveis. Até casos de mineração de dados em pequena escala se beneficiarão do uso do _____.

A

CRISP-DM

111
Q

O Projeto CRISP-DM é uma metodologia proprietária que pode não ser aplicada livremente a qualquer projeto. CERTO ou ERRADO?

A

ERRADO! É uma metodologia não proprietária que pode ser aplicada livremente a qualquer projeto independentemente do tamanho ou tipo do negócio

112
Q

O modelo de referência CRISP-DM tem seu ciclo de vida estruturado em 6 fases, quais são elas?

A
  1. Entendimento do Negócio;
  2. Entendimento dos Dados;
  3. Preparação dos Dados;
  4. Modelagem;
  5. Avaliação; e
  6. Implantação.
113
Q

Qual a primeira fase do modelo de referência CRISP-DM?

A
  1. Entendimento do Negócio
114
Q

Qual fase do modelo de referência CRISP-DM:

Concentra-se no entendimento dos objetivos e requisitos do projeto de uma perspectiva de negócio e, em seguida, na conversão desse conhecimento em uma definição de problema de mineração de dados e em um plano preliminar desenvolvido para atingir os objetivos?

Em outras palavras, essa fase busca entender qual problema o negócio quer resolver!

A
  1. Entendimento do Negócio;
115
Q

É muito comum que uma área de tecnologia da informação faça um projeto de mineração de dados para uma área que ela não domina o assunto (área de saúde, finanças, turismo, esportes, comércio, etc.)

A galera da área de tecnologia entende de tecnologia, não entende de finanças por exemplo.

Dessa forma, qual fase do modelo de referência CRISP-DM pode ser utilizado para resolver esse problema?

A
  1. Entendimento do Negócio
116
Q

Qual é a fase do modelo de referência CRISP-DM em que os analistas de tecnologia vão entender qual é o problema que o negócio quer resolver, seus objetivos, como está a situação atual, quais são os requisitos do projeto, quais são os principais pressupostos e limitações, em qual forma será a entrega dos resultados, quais são os critérios de sucesso, entre outros parâmetros – tudo isso para desenvolver um planejamento de projeto?

A
  1. Entendimento do Negócio
117
Q

Durante a fase de entendimento do negócio do modelo CRISP-DM, busca-se descrever claramente o problema, fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes. CERTO ou ERRADO?

A

ERRADO! Fazer a identificação dos dados e verificar se as variáveis relevantes para o projeto não são interdependentes (ou seja, não se sobrepõem) são atividades da fase de ENTENDIMENTO DOS DADOS e, não, do negócio.

118
Q

Qual é a fase do modelo CRISP-DM que começa com uma coleta inicial dos dados e prossegue com atividades para explorá-los com o intuito de obter um maior conhecimento e familiaridade. Em seguida, busca-se avaliar a qualidade dos dados, descobrir as primeiras ideias sobre os dados ou detectar subconjuntos interessantes para formar hipóteses de informação ocultas e descobrir insights?

A
  1. Entendimento dos Dados
119
Q

Qual fase do modelo CRISP-DM é responsável por descrever os dados – por vezes, utilizando estatísticas?

A
  1. Entendimento dos Dados;

Na descrição, pode-se obter uma espécie de fotografia dos dados contendo a localização, o formato, a fonte, o número de registros, o número de atributos, como será a extração dos dados, e outras características que interessem, assegurando que esses dados consigam representar o problema em análise.

120
Q

Qual fase do modelo CRISP-DM também envolve o que geralmente é denominado análise exploratória de dados?

A
  1. Entendimento dos Dados
121
Q

Qual fase do modelo CRISP-DM ocorre quando já entendemos o problema do negócio e já exploramos os dados disponíveis. Ela abrange todas as atividades
para construir o conjunto de dados final a partir dos dados brutos iniciais, isto é, aqueles que serão alimentados na ferramenta de modelagem?

A
  1. Preparação dos Dados
122
Q

Também chamada de pré-processamento, em que fase do modelo CRISP-DM ocorre a preparação dos dados para a fase de modelagem?

A
  1. Preparação dos Dados
123
Q

Qual fase do modelo CRISP-DM inclui tarefas como seleção de tabelas, integração, transformação, limpeza e organização de dados – além da seleção e engenharia de recursos?

A
  1. Preparação dos Dados
124
Q

Qual fase do modelo CRISP-DM mais demorada, ocupando mais de 70% do tempo/esforço total gasto em qualquer projeto de ciência de dados?

A
  1. Preparação dos Dados

Porque ela é a responsável por carregar os dados identificados na etapa anterior e prepará-los para análise por meio de métodos de mineração de dados.

125
Q

Qual fase do modelo CRISP-DM é também chamada de Modelagem, nessa fase ocorre a seleção das técnicas, ferramentas e algoritmos a serem utilizados, como também a elaboração e execução da modelagem sobre o conjunto de dados preparado na fase anterior?

A
  1. Construção do Modelo (Modelagem)
126
Q

Qual etapa do modelo CRISP-DM utiliza os dados limpos e formatados preparados na etapa anterior para fins de modelagem. Ela inclui a criação, avaliação e ajuste fino de modelos e parâmetros para valores ideais, com base nas expectativas e critérios estabelecidos durante a fase de entendimento dos negócios?

A
  1. Construção do Modelo (Modelagem)
127
Q

Após definidos os critérios de sucesso na primeira fase o modelo CRISP-DM é a hora de verificar se ela foi atingida. Se não foi, é necessário voltar a primeira fase e entender o que deu de errado, determinar um novo escopo e tentar novamente.

Em que fase é feito essa verificação?

A
  1. Teste e Avaliação
128
Q

Nessa fase do projeto, você construiu um modelo (ou vários modelos) que parece ter alta qualidade do ponto de vista da análise de dados.

Antes de prosseguir para a implantação final do modelo, é importante avaliá-lo mais detalhadamente e revisar as etapas executadas para garantir que ele atinja adequadamente os objetivos de negócios.

No final desta fase, uma decisão sobre o uso dos resultados da mineração de dados deve ser alcançada.

Que fase do modelo CRISP-DM Teste e Avaliação acima explicitada?

A
  1. Teste e Avaliação
129
Q

Qual etapa do modelo CRISP-DM é também chamada de desenvolvimento, e busca colocar o modelo para funcionar?

A
  1. Implantação/Implementação
130
Q

Qual etapa do modelo CRISP-DM coloca fim ao seu projeto, mas é necessário se lembrar de monitorar os resultados e de adaptar o modelo sempre que necessário?

Os modelos que foram desenvolvidos, ajustados, validados e testados durante várias iterações são salvos e preparados para o ambiente de produção (o nome é estranho, mas esse é o ambiente em que o software está de fato funcionando).

A
  1. Implantação/Implementação
131
Q

No modelo CRISP-DM o estágio de implantação também inclui a verificação e o monitoramento de aspectos para avaliar o modelo em produção quanto a resultados, desempenho e outras métricas.

Dependendo dos requisitos, a fase de implantação pode ser tão simples quanto gerar um relatório ou tão complexa quanto implementar um processo de mineração de dados repetível. CERTO?

A

CERTO!

132
Q

Em muitos casos, será o cliente, não o analista de dados, quem executará as etapas de implantação do modelo CRISP-DM.

No entanto, mesmo que o analista não realize o esforço de implantação, é importante que o cliente entenda antecipadamente quais ações precisarão ser executadas para realmente fazer. CERTO?

A

CERTO!

133
Q

Em um processo de mineração, durante a etapa de preparação dos dados, são analisados os requisitos de negócio para consolidar os dados. CERTO ou ERRADO?

A

ERRADO! Há uma etapa específica responsável pela análise de requisitos de negócio chamada Entendimento do Negócio, que obtém conhecimentos sobre os objetivos do negócio e seus requisitos; a etapa de preparação de dados é responsável por limpar, transformar, integrar e formatar os dados selecionados

134
Q

A etapa de modelagem do modelo CRISP-DM permite a aplicação de diversas técnicas de mineração sobre os dados selecionados, conforme os formatos dos próprios dados. CERTO ou ERRADO?

A

CERTO! A etapa de Modelagem ou Construção de Modelo CRISP-DM permite realmente a escolha e aplicação de diversas técnicas de mineração sobre os dados a serem analisados.