Backup Flashcards

1
Q

Noções Gerais

A

Com o crescimento exponencial da capacidade e do desempenho de dispositivos semicondutores como a memória e microprocessadores cada vez mais rápidos e com cada vez mais memória estão continuamente se tornando mais usuais. Para acompanhar esse crescimento, é natural esperar que a tecnologia de armazenamento secundário deva caminhar neste mesmo ritmo.

No entanto, como muitos fabricantes indicam, o crescimento do desempenho de acesso aos dispositivos secundários não cresce nessa mesma taxa, para contornar esse fato, a tecnologia RAID foi desenvolvida. O Redundant Array of Inexpensive/Independent Disks combina várias unidades de armazenamento, concentradas em um único equipamento, para formar uma unidade lógica única.

As unidades são acessadas como se fossem um único disco, instalado em uma máquina. A tecnologia pode fornecer redundância de dados, ganhos de performance ou de espaço total de armazenamento, dependendo do nível de operação escolhido para o RAID. Cada nível fornece um balanceamento entre disponibilidade, capacidade, desempenho e confiabilidade.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

RAID por meio de Software ou Hardware.

A

O primeiro é configurado pelo Sistema Operacional, é utilizado principalmente em organizações pequenas, tem um menor consumo de CPU e possui maior flexibilidade.

O Segundo é configurado com utilitários do fornecedor, a controladora realiza as operações, o desempenho é melhor e é transparente para o Sistema Operacional.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

RAID 0

A

busca desempenho com método striping;

A ideia básica então era dividir o arquivo em blocos e distribuir a gravação desses blocos no conjunto de discos. Logo, era possível dobrar a velocidade de leitura e gravação.

como mostra a imagem em que um arquivo foi quebrado em 8 blocos e distribuído em dois discos:

pode ser implementando com mais discos

tal implementação está sujeito a falhas de tal modo que se um disco falhar, o arquivo desejado estará corrompido. Reparem que a probabilidade de se ter um arquivo corrompido também dobrou considerando a soma de probabilidade de falhas de ambos. Por esse motivo, o modelo RAID 0 não tem sido utilizado em servidores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

RAID 1

A

prima pela disponibilidade dos dados em detrimento de espaço de armazenamento. Dessa forma, o mesmo bloco de um arquivo será sempre replicado em outro disco

Percebam que, nesse modelo, há um pequeno ganho de desempenho quando comparado ao modelo padrão de apenas um disco pois a leitura pode ocorrer de forma simultânea em discos distintos buscando informações distintas, reduzindo o tempo de consulta padrão.

caso sejam utilizados dois discos de 500 Gb em um total de 1000 Gb na soma, efetivamente, em termos de capacidade, teremos apenas 500 Gb

Caso um disco falhe, a controladora automaticamente passa a ler e gravar a informação no disco redundante e o administrador pode trocar o disco com defeito sem parar o funcionamento do serviço, sendo transparente ao usuário final. (hot-swap)

replicação dos dados é também conhecida como Mirroring (Espelhamento)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

RAID 10/01

A

Conforme vimos, tanto o RAID 1 quanto o RAID 0 apresentam suas vantagens e desvantagens. Com vistas a agregar as vantagens de ambos, criou-se outro modelo que combina os dois modelos anteriores, que é apresentado por meio da imagem abaixo!

Reparem na necessidade mínima de quatro discos, diferentemente dos modelos anteriores que poderiam ser implementados com apenas dois discos.

RAID 10 (1+0) é dividido em duas etapas. Primeiro, faz-se a divisão dos blocos de dados conforme tecnologia RAID 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

RAID 5

A

modelo mais eficiente no sentido de garantir critério de desempenho, disponibilidade, correção de erros a um custo reduzido com menor perda de espaço útil de dados.

Devido a essas características é que o RAID 5 é o mais utilizado em servidores de grande porte com diversos HDs atualmente

A sua principal característica é a utilização de sistema de controle e recuperação de erros através da utilização de bits de paridade

Primeiramente, observemos que não há um disco exclusivo para armazenamento das informações de paridade, sendo este o modelo o RAID 4, pois estas são distribuídas em todos os discos.

mínimo três discos e o espaço perdido de armazenamento útil para guardar informações de paridade sempre será de um disco

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

RAID 50

A

Assim como existe o arranjo RAID 10, temos também o arranjo RAID 50, que visa agregar mais desempenho ao RAID 5 padrão. Desse modo, realiza-se um Stripping dos dados (RAID 0) antes de realizar o RAID 5. A figura abaixo torna claro o nosso entendimento:

Há de se mencionar que podem ser criadas quantas matrizes de RAID 5 forem necessárias. Um outro exemplo conforme figura abaixo:

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q
A

Ele consiste em dobrar a quantidade de bits de paridade. Dessa forma, aumenta-se a confiabilidade do sistema de tal modo que não há perda de dados em casos de falha de até dois HDs simultaneamente.

o mínimo de discos para sua implementação é igual a 4

A perda de espaço para dados úteis sempre será igual ao espaço total de dois discos

A dificuldade da sua implementação reside na complexidade do modelo a ser embarcado nas controladoras de discos e consequentemente o custo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

A dificuldade da sua implementação reside na complexidade do modelo a ser embarcado nas controladoras de discos e consequentemente o custo

A

nada mais é do que a concatenação dos discos de modo que façam parte de um volume único e conjugado de disco

Não há ganho de desempenho ou redundância, mas tão somente no incremento de espaço de armazenamento total em disco

O que é importante esclarecer é a diferença em relação ao RAID 0.
No JBOD, os arquivos não são fragmentados e distribuídos. Os próprios arquivos são espalhados nos discos, de modo que cada arquivo fica armazenamento integralmente em um disco do arranjo. Já no RAID 0 há a fragmentação do arquivo em blocos para distribuição.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

5 tipos de backup

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
A

Errada, tolerância a falhas é diferente a recuperação de falhas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Boas práticas de backup

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

políticas de backup

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Backup Normal

A

Backup Normal: também conhecido como Backup Completo, Total ou Full, ele copia todos os arquivos selecionados e os marca como arquivos backupeados. Se eu tiver a fim de restaurar meus arquivos, basta que eu tenha a cópia mais recente e está tudo certo. Geralmente, o backup normal é executado quando você está realizando backup pela primeira vez.

uma de suas vantagens é que a recuperação das informações é mais simples, visto que está tudo em um único backup.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Backup Diferencial

A

Backup Diferencial: Alguns autores também referenciam esse modelo como backup cumulativo. Realiza a cópia os arquivos novos ou modificados desde o último backup completo, e não realiza a marcação como arquivos backupeados. Para restaurar os dados, são necessários o último conjunto de backup completo e o último conjunto de backup diferencial. Como os arquivos backupeados não são marcados, ele faz backup novamente de tudo em relação ao backup completo.

Notem que uma das desvantagens é que exige mais espaço de armazenamento uma vez que há informação duplicada. Os dados do DIFFERENTIAL 2, contemplam todos do DIFFERENTIAL 1 acrescido de todas as mudanças em relação ao último backup completo. No entanto, uma grande vantagem é a restauração mais rápida, uma vez que será necessário somente o último backup completo mais o último backup diferencial, uma vez que este já contém todas as alterações existentes.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Backup Incremental

A

Backup Incremental: Realiza a cópia somente dos arquivos criados ou alterados desde o último backup completo ou incremental, e os marca como arquivos backupeados. Para restaurar os dados, é necessário o último conjunto de backup completo e todos os conjuntos de backups incrementais – percebam que é mais complicado, quando comparado com o backup diferencial.

Notem que uma das vantagens é que ele exige bem menos espaço de armazenamento, pois não guarda informações redundantes, e é mais rápido de se realizar.

Além disso, é possível manter várias versões dos mesmos arquivos em diferentes conjuntos de backup. No entanto, a restauração é mais lenta, visto que é necessário restaurar todos os backups incrementais e restaurar um arquivo específico pode ser mais difícil.

17
Q

Backup de “Cópia”

A

Backup de “Cópia” copia todos os arquivos selecionados, mas não realiza a marcação dos dados como tendo sido backupeados. Também conhecido como backup Mirrored.

18
Q

Backup Diário

A

Já o Backup Diário copia todos os arquivos criados ou modificados no dia do backup e não realiza a marcação como copiados. Esses dois últimos tipos de backup são bem menos comuns em prova – até porque são bastante fáceis de assimilar.

19
Q

Consolidação

A
20
Q

Cópia de segurança física:

A
  • Velocidade: Geralmente mais rápida na criação e recuperação das cópias, pois copia o estado bruto dos arquivos e sistemas de armazenamento.
  • Integridade: Menos propensa a corrupção de dados, pois copia os arquivos e sistemas de armazenamento como um todo.
  • Dependência: Menos dependente de versões específicas de software, permitindo maior flexibilidade na recuperação de dados em diferentes plataformas.
  • Operação: Pode ser menos fácil de operar, já que envolve ferramentas e processos mais complexos para gerenciar os backups.
21
Q

Cópia de segurança lógica:

A
  • Flexibilidade: Oferece maior flexibilidade na reestruturação dos dados durante a recuperação, pois copia os dados no nível lógico.
  • Velocidade: Geralmente mais lenta na criação e recuperação das cópias, já que precisa lidar com a estrutura lógica dos dados.
  • Dependência: Vinculada a versões específicas de software ou plataforma, o que pode dificultar a recuperação em diferentes sistemas.
  • Operação: Pode ser mais fácil de operar, já que lida com os dados em um nível mais compreensível.
22
Q

POOL DE ARMAZENAMENTO

A

Este possibilita aos administradores dos sistemas o agrupamento de discos físicos com vistas à formação de um POOL DE RECURSOS, de tal modo que os administradores podem alocar espaços para provisionar discos, resultando em uma forma de virtualização de armazenamento.

23
Q

SCHEDULE

A

Nada mais é do que a definição das rotinas e seus períodos de aplicação (diário, semanal, quinzenal)

24
Q

retenção

A

Este define que os dados devem ser armazenados por um período até poderem ser descartados, disponibilizando espaço para novos dados. Assim, na prática, se foi realizado um backup no dia de hoje, com prazo de retenção de seis meses, tem-se que daqui seis meses esses dados do backup poderão ser apagados sem prejuízo para a instituição.

25
Q

Backup quente (hot)

A

é realizado enquanto o banco de dados está em uso, permitindo que as operações continuem sem interrupção durante o processo de backup. Esse tipo de backup é adequado para ambientes de missão crítica, pois não requer tempo de inatividade.

26
Q

Backup frio (cold)

A

é realizado quando o banco de dados está desligado e, portanto, não está em uso. Embora esse tipo de backup possa garantir a consistência dos dados, não é adequado para ambientes de missão crítica que exigem disponibilidade contínua.

27
Q

Backup particionado

A

é um método que envolve dividir um banco de dados em várias partes menores para facilitar o gerenciamento e o backup.

28
Q

Backup offline database

A

é, como o nome indica, realizado quando o banco de dados está desligado. Isso é semelhante ao backup frio (cold) e não é adequado para ambientes de missão crítica que exigem disponibilidade contínua.

29
Q

Backup comprimido (shrink)

A

se refere à prática de compactar os dados antes de fazer o backup, a fim de economizar espaço de armazenamento. Embora possa ser útil para reduzir o tamanho do backup, não consegue suprir uma dinâmica de uso a quente, como no modo HOT.

30
Q

SNAPSHOT

A

Esse nome advém da capacidade de se basear nos arquivos de estados, dados de disco e configuração de uma máquina virtual em um ponto específico no tempo.
Assim, a partir de um SNAPSHOT, pode-se restaurar determinada máquina virtual para recuperação de dados, retorno de configuração ou atualizações que corromperam os sistemas ou não são mais desejadas, entre outros.
Geralmente, esse recurso pode ser executado a quente, isto é, não necessita de parada da máquina em operação. Esse é justamente o conceito de Backup Hot que já vimos.
Uma outra utilização do SNAPSHOT é frente à necessidade de recriação de ambientes ou reprodução de várias condições a partir deles. Por exemplo, pode-se replicar ambientes de desenvolvimento, teste, homologação e produção facilmente a partir deste recurso.

31
Q

RPO (Recovery Point Objective) X RTO (Recovery Time Objective)

A

Recovery Point Objective – RPO: O período de tempo máximo desejado antes de uma falha ou desastre durante o qual as alterações feitas nos dados podem ser perdidas como processo de uma recuperação.

Recovery Time Objective – RTO: O período de tempo máximo desejado para trazer um ou mais aplicativos, juntamente com seus dados, a um estado corretamente operacional.

32
Q
A

Seu nome vem de “Robust File Copy”.

Esta é uma ferramenta de linha de comando para Windows que provê recursos para que se efetue cópia de dados de maneira segura e eficiente através da linha de comando.

O Robocopy realiza cópias dos diretórios de uma maneira simples e muito funcional de modo que todos os permissionamentos existentes nos arquivos e diretórios originais são mantidos.

Um dos grandes diferenciais do Robocopy é a sua eficiência e velocidade na geração das cópias dos dados.

33
Q

RSYNC

A

capaz de realizar a sincronia remota dos dados entre duas máquinas

não implementa recursos de criptografia. Entretanto, pode-se utilizar o SSH para tal. Nas implementações atuais do RSYNC, o SSH já vem implementado, possibilitando assim a sua utilização em ambientes inseguros como a Internet.

Um de seus protocolos base de funcionamento é o “remote-update”

Esse protocolo permite aos dispositivos identificarem apenas as diferenças dos arquivos ou diretórios, reduzindo, portanto, o volume de troca dos dados. Ou seja, não precisa enviar ou trocar arquivos que não sofreram alteração. Isso faz com que seja uma ferramenta mais rápida e eficiente.

nada mais é do que a implementação do Backup Incremental

caso seja desabilitado, teremos um Backup diferencial.

34
Q

NETBACKUP

A

ramo corporativo de propriedade da SYMANTEC

ferramenta multiplataforma (cross-platform) por ser capaz de atuar em ambientes Windows, Unix e Linux.

Uma de suas características mais relevantes é a possibilidade de se administrar um sistema completo de backup através de um gerenciador centralizado

capacidade e suporte a diversos tipos de mídia de armazenamento, como fitas, discos e suas variações, suportando inclusive troca a quente desses componentes (enquanto o dispositivo está ligado e operacional). ==217d28==

35
Q

Deduplicação

A