00 - Análise de Dados e Informações Flashcards
Qual é a definição de Dados?
Dados podem ser definidos como sucessões de fatos brutos, que
não foram organizados, processados, relacionados, avaliados ou
interpretados, representando apenas partes isoladas de eventos,
situações ou ocorrências.
O que é Informação?
É o agrupamento de dados de forma organizada para fazer sentido e gerar conhecimento.
O que é Conhecimento?
O conhecimento acontece quando as informações passam por um processo de validação, com foco naquilo que se quer obter.
O que é Inteligência?
A inteligência acontece quando os tomadores de decisão aplicam ao conhecimento gerado, suas habilidades, suas competências de negócio e vivência na organização, para identificar direções estratégicas.
Define-se informação como significado, ou seja, como
registros icônicos e simbólicos — fonéticos ou numéricos — e
signos — linguísticos, lógicos ou matemáticos —, por meio dos
quais se representam atos, conceitos ou instruções.
Errado.
A questão descreve o conceito de dado.
O atributo de inteligência depende mais da qualidade da informação disponível do que da sua quantidade, tendo, portanto, natureza qualitativa.
Certo.
A informação caracteriza-se por ser frequentemente tácita, bem como por ser de estruturação e captura difíceis em máquinas.
Errado.
Essa é a característica de Conhecimento.
A informação se caracteriza pela compreensão e internalização do conteúdo recebido, por meio do seu uso em nossas ações; o dado, por sua vez, é um elemento bruto dotado apenas de significado e relevância que visem fornecer uma solução para determinada situação de decisão.
Errado.
O conhecimento se caracteriza pela compreensão e internalização do conteúdo recebido, por meio do seu uso em nossas ações;
o dado, por sua vez, é um elemento bruto (ok)
dotado apenas de significado (a informação)
e relevância que visem fornecer uma solução para determinada situação de decisão. (o conhecimento)
O diretor de uma montadora de veículos necessita tomar uma decisão acerca da continuidade ou não de um dos produtos vendidos no Brasil. Para tanto, solicitou um relatório sobre as vendas de carros da marca do último trimestre de 2018, por faixa de preço, região, modelo e cor. Nessa situação, no contexto de análise da informação, o relatório representa:
Relatório = Informação
Dados, palavras-chaves associadas:
Fatos
Textos
Imagens
Informação:
Dados que passam por algum tipo de processamento. Ex: relatório;
Conhecimento, palavras-chaves associadas:
Confiabilidade
Relevância
Importância
Inteligência, palavras-chaves associadas:
Experiência
Intuição
Complexidade
Dados Estruturados…
São aqueles quem possuem a mesma estrutura de representação rígida e previamente projetada, ou sejam, existe um esquema que estabelece algumas características dos dados que serão armazenados.
Esses dados são organizados e gravado em um banco de dados.
Podem interagir facilmente com o computador (são de fácil manipulação e interpretação).
Dados Semiestruturados…
São dados onde o esquema de representação está presente de forma explícita ou implícita, podendo ser, inclusive, auto descritivo. Uma análise do dado dever ser feita para que a sua estrutura seja identificada e extraída.
Como exemplos de dados semiestruturados podemos citar: XML – eXtensible Markup Language, RDF – Resource Description Framework, OWL – Web Ontology Language.
Os dados semiestruturados apresentam uma organização bastante heterogênea, o que pode dificultar as consultas a esses dados.
Certo.
Os dados semiestruturados geralmente não são mantidos em um banco de dados (embora a maioria dos bancos de dados relacionais admita o tipo XML, seguindo a recomendação do padrão SQL)
Certo.
Dados semiestruturados não são estritamente tipados, mas também não são completamente desestruturados.
Certo.
São características dos dados semiestruturados: (8)
- Definição à posteriori – os esquemas são definidos após a existência dos dados por meio da investigação de suas estruturas particulares.
- Estrutura irregular – não existe um esquema padrão para os dados, as coleções de dados são definidas de maneiras diferentes, podendo conter informações incompletas.
- Estrutura implícita – muitas vezes uma estrutura implícita.
- Estrutura parcial – apenas parte dos dados disponíveis podem ter uma estrutura.
- Estrutura extensa - a ordem de magnitude de uma estrutura para estes dados é grande, uma vez que eles são muito heterogêneos.
- Estrutura evolucionária: a estrutura dos dados modifica-se tão frequentemente quanto os seus valores.
- Estrutura descritiva e não prescritiva - dada a natureza irregular e evolucionária dos dados semiestruturados, as estruturas de representação implícitas ou explícitas normalmente se restringem a descrever o estado corrente de poucas ocorrências de dados similares. Desta forma, não é possível prescrever esquemas fechados e muitas restrições de integridade com relação à semântica dos atributos.
- Distinção entre estrutura e dados não é clara - como a estrutura está embutida na descrição dos dados, muitas vezes a distinção lógica entre estrutura e valor não é clara.
Dados não estruturados…
São os dados que não possuem uma estrutura definida (nem explícita, nem implícita).
Podem ser listados como exemplo documentos, textos, imagens e vídeos. Esses, geralmente, não possuem descrição para suas estruturas, nem implicitamente. A grande maioria dos dados disponíveis na Web são classificados dentro destes formatos.
Tendo em vista a grande quantidade de dados (volume), uma imensa variedade de dados e a necessidade de processamento cada vez mais rápida (velocidade) surge o conceito de _______.
Big Data
____________ é um termo que descreve o grande volume de dados — tanto estruturados quanto não- estruturados — que sobrecarrega as organizações diariamente.
Big Data
Dados não estruturados podem ser caracterizados por arquivos de diversos tipos — textos, imagens, vídeos, entre outros —, cujas estruturas não são descritas implicitamente.
Certo.
Por padrão, documentos do tipo XML (eXtensible Markup Language) são estruturados.
Errado.
Os documentos XML são considerados semiestruturados.
Dados não estruturados de um mesmo grupo possuem as mesmas descrições e, consequentemente, os mesmos atributos.
Errado.
Os dados não estruturados tendem a possuir uma forma mais livre, não tabular, são dispersos e não facilmente recuperáveis.
Esses dados requerem uma intervenção deliberada para dar sentido aos mesmos. E- mails, documentos, páginas da web e arquivos (sejam eles texto, áudio e / ou vídeo) em locais dispersos são exemplos de dados não estruturados.