Normalização do BD Flashcards
O que é a normalização?
É uma forma de reorganização de dados com o intuito de reduzir a
redundância, analisando uma tabela e assegurando que ela é bem formada.
Aumentando a integridade e o desempenho.
O que são anomalias? Quais os tipos de anomalias dos bancos de dados?
São problemas que ocorrem em bancos de dados mal projetados.
São elas:
• anomalia de inserção
• anomalia de exclusão
• anomalia de modificação
Qua, a solução encontrada para se certificar de que a tabela está normalizada?
Ela precisa preencher uma série de regras chamadas de Formas Normais (FN).
Cada forma normal representa uma condição mais forte
que a sua precedente. Na prática, considera-se que um banco de
dados está normalizado se as suas tabelas estão na terceira
forma normal – ela é considerada o nível mínimo necessário para
grande parte das aplicações
O uma tabela precisa ter para estar de acordo com a primeira forma normal? (1FN)
Uma tabela está na 1FN se, e somente se, todos os valores dos atributos forem atômicos (indivisíveis), ISTO É, NÃO DEVEM
EXISTIR ATRIBUTOS MULTIVALORADOS ou compostos.
Ex: Dado Endereço:
Rua Conceição de Monte Alegre 198, Cidade Monções
– São Paulo/SP 》 Não está na (1FN) 《
• Para colocar de acordo com a 1FN é necessário separar, Rua, Número, Bairro, Cidade, UF.
P que uma tabela precisa para estar na Segunda fórmula Normal (2FN)?
• Não pode existir dependências parciais.
• Uma tabela está na 2FN se, e somente se, estiver na 1fn e cada atributo não-chave for dependente da chave primária (ou candidata) inteira, isto é, não devem existir dependências parciais.
O que é uma anomalia de inclusão?
• Não deve ser possível adicionar um dado em uma tabela a não ser que outro dado esteja disponível.
Por exemplo: não deve ser permitido cadastrar um novo livro na Tabela de Livros sem que o autor desse livro esteja cadastrado na Tabela de Autores
O que é uma anomalia de Exclusão?
• Ao excluir um registro do banco de dados, dados referenciados em outra tabela devem ser excluídos.
Por exemplo: se excluirmos um autor na Tabela de Autores, os livros desse autor também devem ser excluídos, em cascata, na Tabela de Livros.
O que é Anomalia de Modificação?
• Ao alterar um dado em uma tabela, dados em outras tabelas precisam ser alterados.
Por exemplo: se o código que identifica um autor for modificado, esse código deve ser modificado na Tabela de Autores e na Tabela de Livros para manter o relacionamento correto entre livros e seus autores.
Quais são as fases da Modelagem do CRISP-DM?
CRISP-DM é um modelo de referência não proprietário, neutro, documentado e disponível na Internet, sendo amplamente utilizado para descrever o ciclo de vida de projetos de Ciência de Dados.
• O modelo é composto por seis fases:
1. entendimento do negócio;
2. compreensão dos dados;
3. preparação dos dados;
4. modelagem;
5. avaliação;
6. implantação.
• CRISP-DMéum modelo de processo demineração de dadosque descreve abordagens comumente usadas por especialistas em mineração de dados para atacar problemas.
Em quais níveis se dá a abstração?
Abstração de Dados é a capacidade de um SGBD oferecer aos usuários uma representação conceitual de dados que NÃO inclui muitos detalhes de como os dados são armazenados ou como as operações são implementadas.
Esta abstração se dá em três níveis:
- Nível de visão do usuário: as partes do banco de dados que o usuário tem acesso de acordo com a necessidade individual de cada usuário ou grupo de usuários;
- Nível conceitual: define quais os dados que estão armazenados e qual o relacionamento entre eles;
- Nível físico: é o nível mais baixo de abstração, em que define efetivamente de que maneira os dados estão armazenados.
a normalização tem o objetivo de melhorar a performance do banco de dados?
NÃO PEGADINHA.
A normalização é utilizada para evitar as anomalias de EXCLUSÃO, ATUALIZAÇÃO e INSERÇÃO de dados!
Para isso, é feita a minimização de redundâncias a partir das Formas Normais de normalização
O que é uma relação FNBC?
FNBC (Boyce-Codd)
“Uma relação está em FNBC se para toda dependência funcional X > Z, X é uma superchave.”
Quais são os tipos de restrições presentes nos bancos de dados?
- As RESTRIÇÕES IMPLÍCITAS: aplicadas ao modelo de dados são chamadas de restrições implícitas
- RESTRIÇÕES EXPLÍCITAS:
que são aplicadas diretamente nos esquemas do modelo de dados, especificando-as na DDL (Data Definition Language). Elas são chamadas de restrições baseadas em esquema ou restrições explícitas. - RESTRIÇÕES SEMÂNTICAS:
que não podem ser aplicadas diretamente nos esquemas do modelo de dados. Chamamos isso de restrições baseadas em aplicativos ou SEMÂNTICAS (ou Regras de Negócio). Como não se encaixam nas categorias básicas devem ser implementadas pelo software que acessa o BD.
A integridade dos dados do SGBD é formada por uma combinação de?
Integridade semântica: o dado de uma coluna sempre será do tipo de dado definido na criação da coluna.
Integridade de entidade: cada linha de uma tabela possui um indicador
que garanta a unicidade da mesma
Integridade referencial: os relacionamentos lógicos entre as entidades serão forçados pelos SGDB
Integridade de domínio: domínio é um conjunto de valores previamente definido no qual uma coluna só poderá conter valores pertencentes a esse domínio
O que são índices clusterizados?
Os índices clusterizados ordenam os dados, classificando e armazenando todas as linhas da tabela (ou view) com base nos valores de chave, incluindo dessa forma, essas colunas na definição de índice. Assim, pode existir apenas um índice clusterizado por tabela, pois as linhas podem ser classificadas apenas em uma única ordem
Com isso, nos índices clustered, a estrutura do índice e os dados estão no mesmo arquivo; por isso o termo clustered (agrupado). São duas estruturas implementadas no mesmo arquivo.
Podem resultar em ganhos significativos de performance na execução de consultas que acessam registros associados a um certo valor, como os itens de uma ordem de compra, por exemplo.
Outro importante detalhe, é que não são raramente utilizados, pois dentre as estratégias de otimização para bancos de dados, os índices são os mais usados, tendo em vista que a maior parte dos SGBDs (como o SQL Server) cria índices clusterizados por padrão (default) a partir da coluna de chave primária, que é quase sempre utilizada em tabelas.