9. Banco de dados Flashcards
O que é uma base de dados?
Um conjunto estruturado de informações armazenadas eletronicamente.
Quais são os principais componentes de um banco de dados?
Tabelas, registros, atributos, chave primária e chave estrangeira.
O que é uma chave primária?
Um identificador único para cada registro em uma tabela.
O que é uma chave estrangeira?
Um campo que cria uma relação entre tabelas no banco de dados.
O que é documentação de banco de dados?
Registro detalhado da estrutura, regras e processos do banco de dados.
Qual a importância da documentação do banco de dados?
Facilita manutenção, entendimento do sistema e evita perda de conhecimento técnico.
O que é um dicionário de dados?
Um documento que descreve tabelas, atributos e tipos de dados usados no banco.
O que são regras de integridade em um banco de dados?
Restrições que garantem a consistência e confiabilidade dos dados.
O que é prototipação de banco de dados?
A criação de um modelo inicial para testar a estrutura antes da implementação final.
Qual é o principal objetivo da prototipação de banco de dados?
Identificar falhas, validar conceitos e melhorar a comunicação entre equipe e usuários.
Cite uma ferramenta usada para modelagem de banco de dados.
MySQL Workbench, Microsoft Visio ou Draw.io.
Qual a diferença entre prototipação de alta e baixa fidelidade?
Alta fidelidade se aproxima da versão final; baixa fidelidade é um esboço inicial.
O que é abstração na modelagem conceitual?
Simplificação dos dados, representando apenas os aspectos mais relevantes para o sistema.
📌 Exemplo:
Em vez de representar cada cliente com todos os seus dados detalhados, abstraímos para representar apenas o que é necessário, como o nome, e-mail e número de telefone.
Qual o objetivo da abstração na modelagem de banco de dados?
Reduzir a complexidade e focar nas informações essenciais.
O que é o Modelo Entidade-Relacionamento (ER)?
Uma ferramenta gráfica para representar as entidades e os relacionamentos entre elas em um banco de dados.
📌 Exemplo:
Em um banco de dados de vendas, as entidades podem ser Cliente e Produto, e o relacionamento pode ser Compra, conectando as duas entidades.
Quais são os principais elementos do Modelo ER?
Entidades, atributos, relacionamentos e chaves.
O que são entidades no Modelo ER?
Objetos ou coisas do mundo real que o banco de dados vai representar (ex: Cliente, Produto).
O que são atributos no Modelo ER?
Características que descrevem as entidades (ex: Nome, Preço).
O que são relacionamentos no Modelo ER?
Conexões entre as entidades que mostram como elas se interagem (ex: Compra).
O que é análise funcional na modelagem de banco de dados?
Processo de identificar as funções que o sistema deve realizar e como os dados serão processados.
📌 Exemplo:
Em um sistema bancário, a análise funcional pode incluir requisitos como consultar saldo, transferir fundos e gerenciar contas.
Qual o objetivo da análise funcional em modelagem de banco de dados?
Entender as necessidades do usuário e garantir que o sistema realize todas as operações necessárias.
O que é administração de dados?
Práticas e políticas para gerenciar, armazenar, proteger e manter os dados no banco de dados.
Exemplo:
Segurança de dados: Criptografia e autenticação para proteger informações sensíveis.
Backup de dados: Garantir que os dados possam ser restaurados em caso de falha.
Qual é o objetivo da administração de dados?
Garantir integridade, segurança e manutenção eficiente dos dados.
O que são dados estruturados?
Dados organizados em tabelas com linhas e colunas, com formato fixo e fácil de consultar.
Cite um exemplo de dados estruturados.
Uma tabela de clientes em um banco de dados relacional (ex: SQL).
Quais são as características principais dos dados estruturados?
Formato fixo, organizado, fácil consulta e alta integridade.
O que são dados não estruturados?
Dados sem uma organização predefinida, como texto livre, imagens, vídeos, etc.
Cite um exemplo de dados não estruturados.
E-mails, vídeos, posts em redes sociais, documentos de texto.
Quais são as características principais dos dados não estruturados?
Falta de estrutura fixa, dificuldade para análise direta, formato diversificado.
Qual é a principal diferença entre dados estruturados e não estruturados?
Dados estruturados seguem uma organização fixa, enquanto dados não estruturados são flexíveis e variados.
Quais tipos de dados são mais difíceis de analisar diretamente?
Dados não estruturados.
Onde os dados não estruturados são mais comuns?
Em Big Data, redes sociais, armazenamento de multimídia e documentos de texto livre.
Quais ferramentas podem ser usadas para analisar dados não estruturados?
Mineração de dados, análise de texto, aprendizado de máquina, e ferramentas de Big Data.
O que é um banco de dados relacional?
Um sistema de gerenciamento de banco de dados que organiza os dados em tabelas e usa chaves para estabelecer relações entre elas.
O que é uma tabela em um banco de dados relacional?
A estrutura básica de armazenamento de dados, composta por linhas (registros) e colunas (atributos).
O que é um registro em um banco de dados relacional?
Uma linha de dados dentro de uma tabela, representando uma entrada única.
O que é uma chave primária?
Uma coluna que identifica de forma única cada registro em uma tabela.
O que é uma chave estrangeira?
Uma coluna que cria uma ligação entre uma tabela e outra, relacionando-se à chave primária de outra tabela.
O que significa a propriedade ACID em um banco de dados?
Atomicidade, Consistência, Isolamento e Durabilidade – propriedades que garantem a integridade e a confiabilidade das transações.
Quais são as principais operações feitas com SQL?
SELECT (consulta), INSERT (inserir dados), UPDATE (atualizar dados) e DELETE (deletar dados).
Qual a vantagem de usar bancos de dados relacionais?
A organização dos dados em tabelas facilita consultas rápidas e a manutenção da integridade dos dados através de regras e chaves.
O que é uma transação em um banco de dados relacional?
Uma sequência de operações que são executadas como uma unidade única, garantindo que o banco de dados se mantenha consistente.
Qual é o modelo utilizado para estruturar dados em um banco de dados relacional?
O modelo baseado em relações, que organiza dados em tabelas e permite operações matemáticas como álgebra relacional.
O que é Normalização?
Processo de organizar os dados de um banco de dados relacional para reduzir a redundância e dependências inconsistentes.
Quais objetivos da normalização em um banco de dados?
✔️ Evitar a duplicação de dados.
✔️ Minimizar erros e inconsistências.
✔️ Facilitar as atualizações, inserções e exclusões de dados.
Qual Forma Normal (FN) que elimina grupos repetitivos e assegura que os dados sejam atômicos (sem subdivisões)?
1ª Forma Normal (1NF)
Qual Forma Normal (FN) que elimina dependências parciais, ou seja, atributos que dependem apenas de uma parte da chave primária?
2ª Forma Normal (2NF)
Qual Forma Normal (FN) que elimina dependências transitivas, ou seja, quando um atributo depende de outro que não faz parte da chave primária?
3ª Forma Normal (3NF)
Qual Forma Normal (FN) que faz o aperfeiçoamento da 3NF, removendo dependências mais complexas?
Forma Normal Boyce-Codd (BCNF)
📌 Exemplo de Normalização:
Suponha uma tabela de vendas que contém as colunas: ID_Venda, Cliente, Produto, Preço, onde o cliente e o produto aparecem várias vezes. Para normalizar o que fazemos?
Separamos a tabela em:
✔️Tabela “Clientes”: ID_Cliente, Nome, Endereço.
✔️Tabela “Produtos”: ID_Produto, Nome, Preço.
✔️Tabela “Vendas”: ID_Venda, ID_Cliente, ID_Produto, Data.
O que são Tipos de Dados?
Definem o formato dos dados que uma coluna pode armazenar em um banco de dados relacional.
Refere-se a qual tipo de dados?
INT
DECIMAL/NUMERIC
FLOAT/DOUBLE
✔️ INT: Números inteiros (ex: 1, 100).
✔️ DECIMAL/NUMERIC: Números decimais (ex: 10.50).
✔️ FLOAT/DOUBLE: Números de ponto flutuante (ex: 12.345).
Refere-se a qual tipo de dados?
ARCHAR
CHAR
TEXT
✔️ ARCHAR: Texto de comprimento variável (ex: “João”).
✔️ CHAR: Texto de comprimento fixo (ex: “ABCD”).
✔️ TEXT: Texto com comprimento grande.
Refere-se a qual tipo de dados?
DATE
TIME
DATETIME/TIMESTAMP
✔️ DATE: Apenas a data (ex: “2025-03-31”).
✔️ TIME: Apenas a hora (ex: “14:30”).
✔️ DATETIME/TIMESTAMP: Data e hora (ex: “2025-03-31 14:30”).
Refere-se a qual tipo de dado?
BOOLEAN
✔️ BOOLEAN: Valores verdadeiro/falso (ex: TRUE ou FALSE).
Refere-se a qual tipo de dado?
BLOB
✔️ BLOB: Armazenamento de dados binários, como imagens ou arquivos (ex: imagens de produtos).
O que são Consultas SQL?
SQL (Structured Query Language) é a linguagem padrão usada para interagir com bancos de dados relacionais. Com ela, é possível criar, consultar, atualizar e excluir dados.
O que o comando JOIN faz no SQL?
Combina dados de duas ou mais tabelas com base em uma chave comum.
O que o comando INNER JOIN faz no SQL?
Retorna registros que têm correspondência em ambas as tabelas.
O que o comando LEFT JOIN faz no SQL?
Retorna todos os registros da tabela à esquerda e os registros correspondentes da tabela à direita.
O que o comando RIGHT JOIN faz no SQL?
Retorna todos os registros da tabela à direita e os registros correspondentes da tabela à esquerda.
O que o comando FULL JOIN faz no SQL?
Retorna todos os registros quando há uma correspondência em uma das tabelas.
o que o comando GROUP BY faz no SQL?
Agrupa os resultados de uma consulta por um ou mais campos, e pode ser usado em conjunto com funções de agregação (como SUM, COUNT, AVG).
o que o comando HAVING faz no SQL?
Filtra os resultados de um GROUP BY com base em uma condição.
O que é uma subconsulta no SQL?
Uma consulta dentro de outra consulta, útil para operações complexas.
O que é mineração de dados?
Processo de descoberta de padrões e informações úteis em grandes volumes de dados.
Quais são as principais técnicas de mineração de dados?
Classificação, agrupamento, regressão, associação e detecção de anomalias.
Qual o objetivo da mineração de dados?
Encontrar padrões ocultos e gerar insights para tomada de decisão.
Em quais áreas a mineração de dados é aplicada?
Marketing, saúde, finanças, segurança da informação e redes sociais.
O que é classificação na mineração de dados?
Técnica que categoriza dados com base em padrões identificados.
O que é agrupamento (clustering)?
Técnica que segmenta dados em grupos com características semelhantes.
O que a técnica de regressão faz?
Prevê valores numéricos com base em padrões históricos.
O que é análise de associação?
Identificação de relações entre variáveis, como itens frequentemente comprados juntos.
O que é detecção de anomalias?
Identificação de dados que fogem do padrão esperado.
Qual a relação entre mineração de dados e aprendizado de máquina?
A mineração de dados usa algoritmos de aprendizado de máquina para identificar padrões nos dados.
O que significa KDD?
Processo de Descoberta de Conhecimento em Bases de Dados (Knowledge Discovery in Databases).
Quais são as etapas do KDD?
Seleção, pré-processamento, transformação, mineração de dados e interpretação.
Qual a diferença entre mineração de dados e Big Data?
Mineração de dados extrai padrões; Big Data lida com grandes volumes de dados.
O que é pré-processamento de dados?
Etapa de limpeza e preparação dos dados antes da mineração.
O que é o modelo CRISP-DM?
Metodologia padrão para projetos de mineração de dados, com seis fases.
Quais são as seis fases do CRISP-DM?
- Compreensão do negócio
- Compreensão dos dados
- Preparação dos dados
- Modelagem
- Avaliação
- Implantação
O que acontece na fase de compreensão do negócio?
Definição dos objetivos e requisitos do projeto.
O que é feito na fase de compreensão dos dados?
Coleta e análise inicial dos dados para entender sua qualidade e estrutura.
O que ocorre na fase de preparação dos dados?
Limpeza, transformação e formatação dos dados para análise.
O que acontece na fase de modelagem?
Aplicação de algoritmos de mineração de dados para identificar padrões.
O que é avaliado na fase de avaliação?
Verificação se os modelos atendem aos objetivos do negócio.
O que ocorre na fase de implantação?
Aplicação do modelo no ambiente real e monitoramento de resultados.
Por que o CRISP-DM é amplamente utilizado?
É flexível, iterativo e aplicável a diferentes setores.
O CRISP-DM segue um processo linear?
Não, é um processo iterativo e cíclico.
O que é aprendizado de máquina?
Técnica da inteligência artificial que permite que sistemas aprendam padrões sem programação explícita.
Quais são os três principais tipos de aprendizado de máquina?
Aprendizado supervisionado, não supervisionado e por reforço.
O que é aprendizado supervisionado?
Modelo treinado com dados rotulados para prever saídas com base em entradas.
O que é aprendizado não supervisionado?
Modelo identifica padrões sem dados rotulados, como agrupamento (clustering).
O que é aprendizado por reforço?
Modelo aprende por tentativa e erro, recebendo recompensas ou penalidades.
Cite um exemplo de algoritmo de aprendizado supervisionado.
Regressão logística, árvores de decisão, redes neurais.
Cite um exemplo de algoritmo de aprendizado não supervisionado.
K-means, DBSCAN, análise de componentes principais (PCA).
Qual a diferença entre classificação e regressão?
Classificação prevê categorias, regressão prevê valores numéricos.
O que é overfitting?
Quando o modelo memoriza os dados de treino e não generaliza bem para novos dados.
O que é underfitting?
Quando o modelo é muito simples e não aprende padrões nos dados.
O que é validação cruzada?
Técnica para avaliar modelos dividindo os dados em várias partes de treino e teste.
O que é um hiperparâmetro?
Parâmetro ajustado antes do treinamento do modelo para melhorar o desempenho.
O que é um modelo preditivo?
Modelo que usa aprendizado de máquina para prever resultados futuros com base em dados históricos.
Qual a relação entre aprendizado de máquina e mineração de dados?
Aprendizado de máquina é usado na mineração de dados para identificar padrões automaticamente.
O que é um conjunto de dados (dataset)?
Coleção estruturada de dados usada para treinar e testar modelos de aprendizado de máquina.
O que é Big Data?
Conjunto de dados massivos e complexos que exigem tecnologias avançadas para armazenamento, processamento e análise.
Quais são as três principais premissas do Big Data?
Os 3 Vs: Volume, Velocidade e Variedade.
O que significa o Volume no Big Data?
Grande quantidade de dados gerados continuamente.
O que significa a Velocidade no Big Data?
Rapidez na geração, processamento e análise dos dados.
O que significa a Variedade no Big Data?
Diferentes formatos de dados, como estruturados, semiestruturados e não estruturados.
Quais são os dois “Vs” adicionais no Big Data?
Veracidade (qualidade dos dados) e Valor (utilidade dos dados).
Cite três aplicações do Big Data.
Marketing digital (personalização de anúncios).
Saúde (análise de prontuários e diagnósticos).
Finanças (detecção de fraudes).
Qual a relação entre Big Data e Inteligência Artificial?
O Big Data fornece grandes volumes de dados para treinar modelos de IA.
O que é um Data Lake?
Armazém de dados brutos e não estruturados para análise posterior.
Qual a diferença entre Big Data e banco de dados tradicional?
Big Data trabalha com volumes massivos e dados não estruturados, enquanto bancos tradicionais lidam com dados organizados em tabelas.
O que é Hadoop?
Framework de código aberto usado para armazenar e processar grandes volumes de dados.
O que é processamento em tempo real no Big Data?
Análise instantânea dos dados à medida que são gerados.
Quais setores mais utilizam Big Data?
Tecnologia, saúde, finanças, varejo, segurança, transporte e governo.
Como o Big Data impacta o marketing?
Permite personalizar campanhas com base no comportamento do consumidor.
O que é análise preditiva no Big Data?
Uso de dados para prever tendências e comportamentos futuros.
O que é processamento distribuído em Big Data?
Uso de múltiplos servidores para processar grandes volumes de dados simultaneamente.
O que é Spark?
Plataforma de processamento de Big Data mais rápida que o Hadoop.
O que é NoSQL?
Bancos de dados não relacionais, otimizados para grandes volumes de dados e escalabilidade.
Cite três exemplos de bancos NoSQL.
MongoDB, Cassandra e Redis.
O que são pipelines de dados?
Fluxos automatizados que coletam, processam e armazenam dados para análise.
O que é Internet das Coisas (IoT) no contexto do Big Data?
Dispositivos conectados geram grandes volumes de dados para análise e automação.
O que é edge computing?
Processamento de dados próximo à origem (dispositivos IoT) para reduzir latência.
O que são algoritmos de recomendação?
Sistemas que analisam dados para sugerir conteúdos, como em Netflix e Spotify.
Como o Big Data impacta a segurança digital?
Detecta fraudes e ataques cibernéticos por meio da análise de padrões anômalos.
O que são dashboards em Big Data?
Painéis visuais que apresentam insights e métricas em tempo real.
O que é um data scientist?
Profissional que analisa e interpreta grandes volumes de dados para obter insights.
O que significa escalabilidade em Big Data?
Capacidade de aumentar o processamento e armazenamento conforme a demanda cresce.
Qual o papel da nuvem no Big Data?
Fornece infraestrutura escalável para armazenar e processar grandes volumes de dados remotamente.