Desduplicação Flashcards

1
Q

O que faz a Deduplicação?

A

A deduplicação permite armazenar apenas uma cópia de dados para qualquer usuário ou sistema..
É uma técnica especializada de compactação de dados usada para eliminar cópias duplicadas de dados repetidos. Ela permite a melhoria da utilização do armazenamento e também pode ser aplicada na transferência de dados em uma rede de computadores para reduzir o número de bytes que devem ser enviados.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

O que é um JBOD?

A

JBOD é a abreviação de “Just a Bunch Of Disks” ou “Just a Bunch Of Drives”. Essa configuração de armazenamento é usada para combinar vários discos rígidos em um único volume lógico. Diferentemente de partições, onde um único disco é segmentado em múltiplos volumes, o JBOD combina vários discos em um volume maior. Isso permite aproveitar todo o espaço de armazenamento em cada disco.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Métodos de deduplicação no mercado:

Nível de arquivo
Nível de bloco
Nível de byte

Explique cada conceito

A
  • Nível de arquivo: funciona checando se os mesmos objetos (arquivos) já estão armazenados.
  • Nível de bloco: usa a mesma abordagem que a deduplicação em nível de arquivo,
    mas aqui os objetos são blocos de dados.
  • Nível de byte: a sobrecarga é muito alta para utilizar nos sistemas de armazenamento reais.
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Especifique características da deduplicação em nível de arquivo:

A

Deduplicação em Nível de Arquivo
* Permite ignorar o armazenamento de cópias de vários arquivos – elas são apenas substituídas pelo “link” do arquivo original.
* Verifica-se se o arquivo já está colocado no armazenamento.
* Técnica das Impressões Digitais: sequência de caracteres única em cada arquivo. É baseada em métodos de: hashing ou atributos de arquivo (depende da solução de deduplicação utilizada).
Vantagens
* Muito mais fácil de implementar e funcionar, mas permite menos economia de armazenamento do que a deduplicação em nível de bloco;
* Se estiver operando no nível do arquivo, o sistema tratará qualquer pequena alteração de arquivo como um novo arquivo, assim não se consegue deduplicar arquivos frequentemente modificados;
* Porém, é uma das técnicas mais rápidas e mais simples de deduplicação, seus índices são pequenos e levam menos tempo para computação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Especifique características da deduplicação em nível de bloco:

A

Deduplicação em Nível de Bloco
* Mais profunda e verifica a exclusividade dos blocos de todos os arquivos, ou seja, é mais complexa e refinada.
Funcionamento:
1. Quando um arquivo é modificado, o sistema armazena somente partes (blocos) alterados do arquivo original.
2. Como cada bloco tem sua própria identificação (normalmente gerada via algoritmo de hash), o sistema compara com os metadados armazenados
3. Maior economia de espaço (a taxa de redução utilizando deduplicação em nível de bloco pode chegar a 95%), mas requer mais computação pois o número de objetos (blocos) a serem processados é muito maior.
* O processo de deduplicação permite reduzir o volume de dados armazenados e otimizar os gastos com armazenamento

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Especifique características da deduplicação em nível de bytes:

A

Deduplicação em Nível de Bytes
* Maior overhead;
* Ao analisar sequências de bytes (não atrelados a blocos predefinidos), ela consegue obter o melhor resultado;
* Substituindo tamanhos diferentes de sequências de dados repetidos por ponteiros, reduzindo sensivelmente o stress sobre o link;
* Este é o modo mais eficiente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly