Big Data Flashcards
Redundância- espelhamento dos dados (dados duplicados)
Os 5 v’s do big data
Volume: Volume de dados gerados Diariamente
Velocidade: Transmite em altas velocidade (internet, e ssd) e Devem ser tratados em tempo hábil
Variedade: Inúmeros formatos (estruturados e não estruturados)
Veracidade: Apenas dados confiáveis
Valor: só terá benefícios para a empresa se forem significativos e tiverem Valor, Sabedoria (dado lapidado e no ambiente certo)
Tipos de dados
Dados Estruturados: são dados organizados, representados por estrutura rígida, planejado para armazená-lo ex: banco de dados, formularios
Dados Semi-Estruturados: Dados desorganizados, estrutura flexível e dinâmico, sem estrutura Ex: XML, JSon
Dados Não Estruturados: dados desorganizados, estrutura flexível e dinâmico, sem estrutura
Tipos de Análise
● Descritiva
● Prescritiva
● preditiva
Passo a Passo
- Coleta do dado não estruturado
- Estrutura (SQL, data warehouse)
- Filtro, classificação, estrutura
- Dados Estruturados
- Resultados
- Aplicação na empresa