BIG DATA Flashcards

1
Q

O que é Data Scraping?

A
  • Basicamente é uma técnica que coleta dados de bases de dados complexas (com muitas tabelas e relacionamentos) ou de sites de difícil navegabilidade, processa automaticamente esses dados e os exibe de uma forma mais legível –ele transforma dados pouco estruturados em dados mais estruturados e fáceis de manipular.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

As ações inerentes ao processo de preparação de dados incluem detecção de anomalias,deduplicação, desambiguação de entradas e mineração de dados.

A

ERRADA❌

Todas essas ações são realmente inerentes ao processo de preparação de dados (DataPreparation), exceto a mineração de dados! Por que? Porque a mineração ocorre após apreparação dos dados! Não há como minerar dados (explorar em busca de padrões e informaçõesúteis) sem antes preparar esses dados;

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

O que é BIG DATA?

A

definição favorita o define como a captura, gerenciamento e a análise de dadosestruturados ou não estruturados que podem ser consultados e pesquisados através de bancosde dados relacionais. Frequentemente são dados obtidos de arquivos não estruturados comovídeo digital, imagens, dados de sensores, arquivos de logs e de qualquer tipo de dados nãocontidos em registros típicos com campos que podem ser pesquisados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

O que é DATA PREPARATION?

A

☑️ No BIG DATA, os dados podem passar por uma preparação que coleta, limpa, normaliza, combina,estrutura e organiza dados para análise posterior (Data Preparation);

☑️ Esse é um passo inicial para que o trabalho seja bem-sucedido, uma vez que melhora a qualidade dos dados e, comoconsequência, melhora os resultados de uma futura mineração de dados (Data Mining3). Galera,dados pouco estruturados e com uma qualidade ruim podem gerar resultados pouco confiáveis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quais as DEFINIÇÕES para DADOS ESTRUTURADOS, NÃO ESTRUTURADOS e SEMI-ESTRUTURADOS?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Quais são as 05 DIMENSÕES do BIG DATA?

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Qual a DEFINIÇÃO de BIG DATA ANALYTICS?

A
  • Big Data Analytics: o estudo e interpretação de grandes quantidadesde dados armazenados com a finalidade de extrair padrões de comportamento. Em outraspalavras, utiliza-se uma combinação de sistemas de softwares matemáticos de alta tecnologiaque juntos são capazes de tratar dados estruturados e não-estruturados, analisá-los e extrair umsignificado de alto valor para organizações.
  • Dessa forma, o Big Data Analytics poderá auxiliar empresas privadas ou administradores deórgãos públicos a entender seus usuários, encontrar oportunidades não percebidasanteriormente, fornecer um serviço melhor e mitigar possíveis fraudes – são bastante utilizadosem órgãos fazendários – como a Receita Federal – para evitar sonegação de tributos
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qual a DIFERENÇA entre BIG DATA e BI.?

A
  • Business Intelligence trata de encontrar respostas que explicam o passado;
  • Big Data Analytics trata de encontrar as perguntas que explicam o futuro.

Ambos possuem grande importância, complementam-se e devem ser bem entendidos para que asempresas possam aproveitá-los da melhor forma, agregando e alcançando os valores e resultadosdesejados aos negócios.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que é. MACHINE LEARNING?

A

Uma aplicação que reconheça o acesso de um usuário e forneça sugestões diferentes para cadatipo de usuário em geral utiliza sistemas de recomendações que – por sua vez – utilizamalgoritmos de Machine Learning para que a aplicação consiga aprender com o contexto e fazersugestões mais certeiras.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

(CESGRANRIO / PETROBRAS – 2018) A principal definição de Big Data parte de trêscaracterísticas, conhecidas como 3 V do Big Data, a saber: velocidade, variedade e volume. Otermo velocidade refere-se, principalmente, à:

a) necessidade das aplicações de gerar respostas rapidamente, a partir de grandes massas dedados.
b) existência de um alto fluxo de dados na entrada.
c) necessidade de gerar aplicações rapidamente, em função da demanda do negócio.
d) importância da facilidade de manipular cubos de visualização de dados, rapidamente.
e) rapidez com que os dados se tornam inválidos com o tempo.

A

O termo velocidade refere-se à velocidade com que os dados são criados. Em outras palavras,trata-se da existência de um alto fluxo de dados na entrada. São mensagens de redes sociais seviralizando em segundos, transações de cartão de crédito sendo verificadas a cada instante ou osmilissegundos necessários para calcular o valor de compra e venda de ações.

Gabarito: Letra B

How well did you know this?
1
Not at all
2
3
4
5
Perfectly