Backup Flashcards
Noções Gerais
Com o crescimento exponencial da capacidade e do desempenho de dispositivos semicondutores como a memória e microprocessadores cada vez mais rápidos e com cada vez mais memória estão continuamente se tornando mais usuais. Para acompanhar esse crescimento, é natural esperar que a tecnologia de armazenamento secundário deva caminhar neste mesmo ritmo.
No entanto, como muitos fabricantes indicam, o crescimento do desempenho de acesso aos dispositivos secundários não cresce nessa mesma taxa, para contornar esse fato, a tecnologia RAID foi desenvolvida. O Redundant Array of Inexpensive/Independent Disks combina várias unidades de armazenamento, concentradas em um único equipamento, para formar uma unidade lógica única.
As unidades são acessadas como se fossem um único disco, instalado em uma máquina. A tecnologia pode fornecer redundância de dados, ganhos de performance ou de espaço total de armazenamento, dependendo do nível de operação escolhido para o RAID. Cada nível fornece um balanceamento entre disponibilidade, capacidade, desempenho e confiabilidade.
RAID por meio de Software ou Hardware.
O primeiro é configurado pelo Sistema Operacional, é utilizado principalmente em organizações pequenas, tem um menor consumo de CPU e possui maior flexibilidade.
O Segundo é configurado com utilitários do fornecedor, a controladora realiza as operações, o desempenho é melhor e é transparente para o Sistema Operacional.
RAID 0
busca desempenho com método striping;
A ideia básica então era dividir o arquivo em blocos e distribuir a gravação desses blocos no conjunto de discos. Logo, era possível dobrar a velocidade de leitura e gravação.
como mostra a imagem em que um arquivo foi quebrado em 8 blocos e distribuído em dois discos:
pode ser implementando com mais discos
tal implementação está sujeito a falhas de tal modo que se um disco falhar, o arquivo desejado estará corrompido. Reparem que a probabilidade de se ter um arquivo corrompido também dobrou considerando a soma de probabilidade de falhas de ambos. Por esse motivo, o modelo RAID 0 não tem sido utilizado em servidores.
RAID 1
prima pela disponibilidade dos dados em detrimento de espaço de armazenamento. Dessa forma, o mesmo bloco de um arquivo será sempre replicado em outro disco
Percebam que, nesse modelo, há um pequeno ganho de desempenho quando comparado ao modelo padrão de apenas um disco pois a leitura pode ocorrer de forma simultânea em discos distintos buscando informações distintas, reduzindo o tempo de consulta padrão.
caso sejam utilizados dois discos de 500 Gb em um total de 1000 Gb na soma, efetivamente, em termos de capacidade, teremos apenas 500 Gb
Caso um disco falhe, a controladora automaticamente passa a ler e gravar a informação no disco redundante e o administrador pode trocar o disco com defeito sem parar o funcionamento do serviço, sendo transparente ao usuário final. (hot-swap)
replicação dos dados é também conhecida como Mirroring (Espelhamento)
RAID 10/01
Conforme vimos, tanto o RAID 1 quanto o RAID 0 apresentam suas vantagens e desvantagens. Com vistas a agregar as vantagens de ambos, criou-se outro modelo que combina os dois modelos anteriores, que é apresentado por meio da imagem abaixo!
Reparem na necessidade mínima de quatro discos, diferentemente dos modelos anteriores que poderiam ser implementados com apenas dois discos.
RAID 10 (1+0) é dividido em duas etapas. Primeiro, faz-se a divisão dos blocos de dados conforme tecnologia RAID 0
RAID 5
modelo mais eficiente no sentido de garantir critério de desempenho, disponibilidade, correção de erros a um custo reduzido com menor perda de espaço útil de dados.
Devido a essas características é que o RAID 5 é o mais utilizado em servidores de grande porte com diversos HDs atualmente
A sua principal característica é a utilização de sistema de controle e recuperação de erros através da utilização de bits de paridade
Primeiramente, observemos que não há um disco exclusivo para armazenamento das informações de paridade, sendo este o modelo o RAID 4, pois estas são distribuídas em todos os discos.
mínimo três discos e o espaço perdido de armazenamento útil para guardar informações de paridade sempre será de um disco
RAID 50
Assim como existe o arranjo RAID 10, temos também o arranjo RAID 50, que visa agregar mais desempenho ao RAID 5 padrão. Desse modo, realiza-se um Stripping dos dados (RAID 0) antes de realizar o RAID 5. A figura abaixo torna claro o nosso entendimento:
Há de se mencionar que podem ser criadas quantas matrizes de RAID 5 forem necessárias. Um outro exemplo conforme figura abaixo:
Ele consiste em dobrar a quantidade de bits de paridade. Dessa forma, aumenta-se a confiabilidade do sistema de tal modo que não há perda de dados em casos de falha de até dois HDs simultaneamente.
o mínimo de discos para sua implementação é igual a 4
A perda de espaço para dados úteis sempre será igual ao espaço total de dois discos
A dificuldade da sua implementação reside na complexidade do modelo a ser embarcado nas controladoras de discos e consequentemente o custo
A dificuldade da sua implementação reside na complexidade do modelo a ser embarcado nas controladoras de discos e consequentemente o custo
nada mais é do que a concatenação dos discos de modo que façam parte de um volume único e conjugado de disco
Não há ganho de desempenho ou redundância, mas tão somente no incremento de espaço de armazenamento total em disco
O que é importante esclarecer é a diferença em relação ao RAID 0.
No JBOD, os arquivos não são fragmentados e distribuídos. Os próprios arquivos são espalhados nos discos, de modo que cada arquivo fica armazenamento integralmente em um disco do arranjo. Já no RAID 0 há a fragmentação do arquivo em blocos para distribuição.
5 tipos de backup
Errada, tolerância a falhas é diferente a recuperação de falhas
Boas práticas de backup
políticas de backup
Backup Normal
Backup Normal: também conhecido como Backup Completo, Total ou Full, ele copia todos os arquivos selecionados e os marca como arquivos backupeados. Se eu tiver a fim de restaurar meus arquivos, basta que eu tenha a cópia mais recente e está tudo certo. Geralmente, o backup normal é executado quando você está realizando backup pela primeira vez.
uma de suas vantagens é que a recuperação das informações é mais simples, visto que está tudo em um único backup.
Backup Diferencial
Backup Diferencial: Alguns autores também referenciam esse modelo como backup cumulativo. Realiza a cópia os arquivos novos ou modificados desde o último backup completo, e não realiza a marcação como arquivos backupeados. Para restaurar os dados, são necessários o último conjunto de backup completo e o último conjunto de backup diferencial. Como os arquivos backupeados não são marcados, ele faz backup novamente de tudo em relação ao backup completo.
Notem que uma das desvantagens é que exige mais espaço de armazenamento uma vez que há informação duplicada. Os dados do DIFFERENTIAL 2, contemplam todos do DIFFERENTIAL 1 acrescido de todas as mudanças em relação ao último backup completo. No entanto, uma grande vantagem é a restauração mais rápida, uma vez que será necessário somente o último backup completo mais o último backup diferencial, uma vez que este já contém todas as alterações existentes.