1. Computação Na Nuvem Flashcards
O que faz a NIST (ou NITS) para a cloud computing?
É o órgão responsável pelo controle, inovação e análise das operações em nuvem.
Criou um documento de padronização para serviços de operações em nuvem.
Quais as cinco características que todo serviço de cloud computing precisa ter?
- Sistema multiplataforma/âmplo acesso à rede (Broad network access)
- serviços mensurados (measured services)
- elasticidade
- agrupamento de recursos (ressource pooling)
- autosserviço sob demanda (on-demand self-service)
O que quer dizer que um sistema de cloud computing precisa ser multiplataforma?
Precisa permitir o acesso por diferentes arquiteturas de hardware (notebooks, PC de mesa, dispositivos móveis) e diferentes softwares (SOs e navegadores de Internet diferentes)
O que significa o fato de os serviços de cloud computing precisarem ser mensurados?
(A característica de measured services)
Quem fornece precisa mensurar o que está sendo feito para poder ajustar/modular os recursos que estão por trás do que o cliente contratou (ex: ajustar quanto de processador e RAM é necessário para rodar um arquivo que está no HD contratado pelo cliente, ou o quanto de internet ela precisa disponibilizar para o cliente fazer o download e o upload) e fornecer um alto desempenho/manter a qualidade
Como a elasticidade se relaciona com a característica de serviço mensurado?
A elasticidade é a capacidade de o serviço se adaptar para fornecer AUTOMATICAMENTE (sem o usuário perceber ou ter que fazer algo mais) o que foi mensurado como necessário para manter o desempenho
É a capacidade de fornecer, por exemplo, mais conexão de Internet para uma área de aluno quando o sistema mensura que vários alunos estão vendo vídeoaula ao mesmo tempo (e fornecer menos quando tem só um)
Qual a diferença entre elasticidade e escalabilidade de um sistema de cloud computing?
Elasticidade = capacidade de se adaptar e fornecer o que precisa
Para isso, é preciso que o sistema seja escalável. Ou seja, escalabilidade = infraestrutura suporta o aumento da carga para o serviço ser elástico
O que é resource pooling (agrupamento de recursos) num serviço de HD em cloud computing?
É, por exemplo, eu contratar 500gb de HD e o serviço me fornecer 100gb de um HD e 400gb de outro que talvez já esteja ocupado, sendo que todos os usuários usem o mesmo HD e cada usuário tem o seu espaço separado e seguro contra qualquer invasão dos outros.
Além disso, pode direcionar o usuário para servidores ociosos.
O que é o autosserviço sob demanda?
É o usuário poder, online, aumentar a capacidade conforme sua necessidade (contratar 500gb a mais automaticamente, por exemplo)
O que é uma arquitetura multi-tenancy?
É o usuário poder acessar o software (do SaaS) sem precisar instalar nada
O que é PaaS (plataforma as a service)?
“Programação as a service” - contratação de plataformas de desenvolvimento de software as a service
É o ambiente para programar, testar, armazenar o código e fazer manutenção dele -> programadores podem fazer código conjuntamente online
O que é IaaS?
Infrastructure as a service
Contratar hardware as a service (máquinas virtuais, processador, memória, HD, placa de vídeo, etc)
Entre SaaS, PaaS e IaaS, quais o cliente pode configurar a infraestrutura e quais o provedor configura?
Cliente = configura apenas no IaaS
Provedor = configura a intra do SaaS e PaaS
O que é o middleware?
Quem o configura num SaaS, PaaS e IaaS?
É o software de comunicação entre os sistemas locais e os que estão na nuvem
Serve para interligar tudo sem sobrecarregar as operações da infra local.
Cliente configura o middleware só na IaaS.
No SaaS e PaaS, é o provedor que cuida do middleware.
Pra que serve o DaaS (data as a service)? É um cloud storage?
Para armazenamento de grandes volumes de dados, big data, SGBDs, data warehouses, etc.
Não é necessariamente um cloud storage, pois aqui o foco é só em DADOS
Qual a diferença entre HaaS e IaaS?
HaaS = hardware as a service = contratação de peças isoladas (só o processador, só a RAM, só a placa, etc)
- também pode ser operação local física de aluguel de impressora, scanner, computador, acessórios, Tablet…
IaaS = contratação da máquina completa, da infraestrutura completa
Núvem pública e privada são tipos de serviço em nuvem?
Não, elas são MODELOS DE IMPLEMENTAÇÃO
serviços em nuvem são SaaS, PaaS, IaaS, DaaS…
Qual a diferença entre nuvem pública e nuvem comunitária?
Nuvem pública = todo mundo pode acessar
Nuvem comunitária = é uma nuvem “privada” de várias empresas que se unem para formar uma nuvem só delas e compartilhada só por elas
Empresa faz uso de duas infraestruturas de nuvens privadas, separadas geograficamente. Isso é nuvem híbrida? Por quê?
Não é nuvem híbrida, pois, para ser híbrida, é preciso ter dois tipos distintos de nuvem. Aqui, são duas nuvens do mesmo tipo.
Entre SaaS, PaaS e IaaS, qual o mais barato para se implementar?
PaaS.
Para uso de recursos de rede compartilhados, como impressoras e computadores, qual o modelo de cloud computing recomendado?
IaaS.
No IaaS, o consumidor gerência e controla sistemas operacionais, armazenamento, componentes e sistema de segurança e a infraestrutura da nuvem subjacente?
Não controla a infra da nuvem subjacente.
Mas o resto sim.
Apache hadoop é um sistema voltado para a _________ de big data
Clusterização
(Agrupa e filtra grandes volumes de dados)
Analista vai tirar a configuração do hadoop do modo local para configurá-lo para funcionar em modo pseudodistribuído. Ele fará as especificações para isso num arquivo de qual extensão?
.xml
Todos os componentes do ecossistema hadoop possuem código aberto? O próprio hadoop é código aberto?
A maioria é código aberto, mas não todos.
O hadoop é código aberto.
O que o HDFS (sistema de arquivos distribuídos do hadoop) faz com os dados clusterizados pelo hadoop?
Divide os dados em blocos,
Armazena-os em máquinas diferentes
Mas permite a consulta simultânea nas máquinas.
Hadoop HDFS é escrito em qual linguagem?
Java.
O que faz o MapReduce do hadoop?
Uma das dificuldades de big data é trabalhar com uma grande quantidade de dados. Uma das formas de se fazer uma operação é dividi-la em vários computadores, onde cada um trabalha com um lote menor de informações. Para isso, é preciso distribuir os dados para cada computador e depois reunir os resultados em um lugar só.
Faz o MAP: mapeamento, processamento e decomposição dos dados dos inputs (dados de entrada) - distribui os dados em lotes e os entrega para vários computadores
E o REDUCE: gera os resultados dos processamentos (gera os dados de saída)
Quem são os mestres e quem é o slave do HDFS? Qual a consequência disso?
Mestres:
NameNode e SecondaryNameNode
Slave: Datanode
(Usou node, é do HDFS)
O NameNode gerência os Datanodes. Como os dados são replicados, se houver falha em um dos Datanodes, basta consultar o NameNode para descobrir onde estão as réplicas dos dados de que eu preciso
Quem é o master e quem é o slave do MapReduce?
Master: jobtracker
Slave: tasktracker
(Usou tracker, é do MapReduce)
O que faz o YARN do hadoop?
Gerência e agenda recursos na infraestrutura do hadoop.
O apache SQOOP transfere dados entre o ________ e o ____________
Hadoop
Banco de dados relacional
Qual ente do ecossistema hadoop aplica técnicas de data warehousing? A sua linguagem de consulta é SQL?
É o HIVE
A linguagem de consulta é BASEADA em SQL.
Qual a plataforma de big data recomendada para empresa que precisa fazer operações em tempo real?
Apache STORM.
O HBase é um banco de dados relacional ou não relacional? Ele é voltado para linha ou para coluna?
Não relacional - ele é NoSQL.
É voltado para coluna.