Machine Learning & IA Flashcards

Deck with questions derived from the books Deep Learning by Ian Goodfellow; Artificial Intelligence by Stuart Russell and Peter Norvig

1
Q

O que é representation learning?

A

É uma técnica que consiste em não só usar a representação para aprender algo mas também aprender a representação em si.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Como funciona um autoencoder?

A

Trata-se de uma função que codifica os dados e posteriormente decodifica para algo similar ao original, mas com features novas.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

De maneira resumida, o que é deep learning?

A

É uma forma de machine learning que permite o aprendizado de conceitos novos através de uma combinação de conceitos mais simples.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Qual a lógica por trás da implementação de deep learning?

A

Deep learning funciona através de camadas. Cada camada recebe diversas entradas, processa-as e devolve um valor para ser utilizado por outra camada. Com isso, é possível aprender ideias complexas através da combinação do processamento de ideias simples.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Quais são as principais métricas para avaliar a profundidade dos modelos ?

A

A análise do grafo de execução (qual o máximo de layers que um dado pode passar até seu processamento ser finalizado) e a análise do grafo da hierarquia de conceitos (quantas etapas conceituais precisam ser realizadas até que ele seja processado).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

O que é a representação distribuída?

A

É a ideia de cada feature representar vários dados e cada dado ser representado por várias features.

Por exemplo, diante dos dados “carro”, “moto” e “bicicleta” e as features “azul”, “amarelo” e “vermelho”, representação distribuída seria permitir que o conceito de carro incluísse a diferença entre carro azul, carro amarelo e carro vermelho (ao invés de criar um conceito para cada).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Em poucas palavras, o que é IA?

A

É o estudo de agentes que recebem percepções do ambiente e executam ações. Esses agentes implementam funções que mapeiam sequências de percepções em ações.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Qual a maior vantagem de usar a norma L² ao quadrado ao invés da norma L² ? E a maior desvantagem ?

A

A maior vantagem de usar a norma ao quadrado é que a derivada em relação a uma variável depende apenas dela (enquanto na norma L² depende de todas as variáveis do sistema).

A maior desvantagem é a velocidade com a qual a norma se aproxima de 0 perto da origem, o que pode dificultar a diferenciação entre valores zero e valores próximos (mas diferentes) de zero.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

O que é um agente autônomo?

A

Um agente capaz de fazer coisas que não foi explicitamente programado para fazer

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

O que é um agente?

A

Qualquer entidade capaz de perceber seu ambiente através de sensores e agir sobre esse ambiente por intermédio de atuadores

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Do que depende a decisão de um agente?

A

Do conhecimento interno e da sequência inteira de percepções até o momento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Qual a diferença entre a função do agente e o programa do agente?

A

A função do agente é responsável pelo mapeamento matemático das ações que o agente pode fazer a partir de toda combinação possível de entrada e sequência de percepções. O programa do agente é a implementação física da função do agente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

O que significa racionalidade no contexto de um agente?

A

Trata-se da capacidade de tomar decisões que produzem consequências que melhor se enquadram em uma certa medida de desempenho

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qual heurística deve ser seguida ao projetar as medidas de desempenhos de agentes?

A

As medidas de desempenho de um agente devem, por via de regra, serem projetadas baseadas no resultado esperado do agente, não do comportamento esperado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

O que é um agente racional?

A

É um agente que, para cada sequência de percepções possível, toma a decisão que maximiza sua medida de desempenho. Essa decisão deve ser tomada a partir da combinação entre o conhecimento interno e a sequência de percepções do agente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

No contexto de agentes racionais, o que significa o acrônimo PEAS?

A

Performance, Environment, Actuators, Sensors. São as coisas que delimitam o ambiente de tarefa de um agente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Quais são as dimensões presentes em um ambiente de tarefas?

A

Completamente Observável vs Parcialmente Observável;
Agente único vs Multiagente;
Determinístico vs Não-Determinístico;
Episódico vs Sequencial;
Estático vs Dinâmico;
Discreto vc Contínuo;
Conhecido vs Desconhecido

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Em um problema de inteligência artificial, quais entidades devem ser tratadas como agentes?

A

As entidades cujo comportamento pode ser melhor descrito como a maximização de medidas de desempenho cujo valor depende do comportamento dos outros agentes

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Qual a combinação mais difícil de dimensões para um agente?

A

Parcialmente observável, multiagente, não determinístico, sequencial, dinâmico, contínuo e desconhecido.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Qual é o desafio fundamental da IA?

A

Descobrir como escrever programas que, na medida do possível, produzam um comportamento racional a partir de um pequeno programa em vez de uma grande tabela

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

Quais são os 4 tipos básicos de agentes?

A

Agente reativo simples, agente reativo baseado em modelo, agente baseado em objetivos e agente baseado em utilidade

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

O que é um agente reativo simples?

A

É um agente que seleciona ações com base apenas na percepção atual.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

Em quais dimensões um agente reativo simples não pode agir? O que acontece quando ele é colocado nesses ambientes?

A

Por não possuir memória ou qualquer tipo de estado interno, um agente reativo simples não pode agir em ambientes que não sejam completamente observável. Quando são colocados nesses ambientes, podem ter comportamento aleatório ou entrar em loops infinitos

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

O que é um agente reativo baseado em modelo?

A

É uma variação do agente reativo simples que incorpora uma memória interna como forma de monitorar partes do ambiente que não podem ser monitoradas pelos sensores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
Q

Quais são as duas informações que um agente reativo baseado em modelo precisa saber para realizar o seu trabalho?

A

Como o mundo muda com o tempo (seja como o mundo muda independente de suas ações, seja como suas ações mudam o mundo) e como o estado do mundo é refletido nas percepções do agente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
26
Q

O que é um modelo de transição?

A

É um modelo responsável por mapear as mudanças do mundo e usá-las para produzir um novo estado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
27
Q

O que é um modelo sensorial?

A

É um modelo responsável por mapear o mundo atual para as percepções do agente.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
28
Q

Como funciona o pseudocódigo do agente reativo simples?

A

função AGENTE -REATIVO-SIMPLES(percepção) devolve uma ação
persistente: regras, um conjunto de regras condição-ação
estado <– INTERPRETAR-ENTRADA(percepção)
regra <– REGRA-CORRESPONDENTE(estado, regras)
ação <– regra.AÇÃO
devolve ação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
29
Q

Como funciona o pseudocódigo do agente reativo baseado em modelos?

A

função AGENTE-REATIVO-BASEADO-EM-MODELOS(percepção) devolve uma ação
persistente: estado, a concepção atual do agente do estado do mundo
modelo_transição, uma descrição de como o próximo estado depende da ação
modelo_sensorial, uma descrição de como o próximo estado atual do mundo é refletido nas percepções do agente
regras, um conjunto de regras condição-ação
ação, a ação mais recente, inicialmente nenhuma
estado <– ATUALIZAR-ESTADO (estado, ação, percepção, modelo_transição, modelo_sensorial)
regra <– REGRA-CORRESPONDENTE(estado, regras)
ação <– regra.AÇÃO
devolve ação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
30
Q

Qual a diferença fundamental entre agentes baseados em objetivos e agentes reativos?

A

Enquanto agentes reativos são programados para reagir a estímulos, agentes baseados em objetivos agem proativamente para resolver problemas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
31
Q

Cite dois exemplos de subáreas dos agentes baseados em objetivos.

A

Busca e planejamento

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
32
Q

O que é um agente baseado em utilidade?

A

É um agente baseado em uma função utilidade, que nada mais é do que uma internalização das medidas de desempenho que ele usa para maximizar a qualidade de suas ações.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
33
Q

Qual tipo de IA é mais comum entre as consideradas Estado da Arte?

A

IAs capazes de aprender que são ensinadas a fazer sua função

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
34
Q

Quais são os quatro componentes conceituais báiscos de um agente com aprendizado?

A

Crítico, gerador de problemas, elemento de desempenho e elemento de aprendizado.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
35
Q

Em uma IA com aprendizado, qual componente é responsável por analizar o estado atual e devolver uma ação?

A

Elemento de Desempenho

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
36
Q

Em uma IA com aprendizado, para que serve o crítico?

A

Para dar ao elemento de aprendizado um parâmetro de qualidade fixo.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
37
Q

Em uma IA com aprendizado, para que serve o elemento de aprendizado?

A

Ele é responsável por ajustar o elemento de desempenho com base no resultado oferecido por ele junto com feedback vindo do crítico que diz o quão bom foi o desempenho.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
38
Q

Como funciona uma representação atômica?

A

Uma representação atômica é uma em que cada estado do mundo é indivisível e não possui estrutura interna.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
39
Q

Cite exemplos de representações atômicas no mundo da IA

A

Busca de jogos, modelos ocultos de Markov e processos de decisão de Markov

40
Q

Como funciona uma representação fatorada?

A

Em uma representação fatorada, cada estado é dividido em um conjunto de atributos com seus respectivos fatores.

41
Q

Cite exemplos de representações fatoradas no mundo da IA

A

Algoritmos de satisfação de restrição, lógica proposicional, planejamento, redes bayesianas e diversos algoritmos de machine learning

42
Q

Como funciona uma representação estruturada?

A

Em uma representação estruturada, cada estado é dividido em um conjunto de atributos, seus valores e seus relacionamentos entre si

43
Q

Cite exemplos de representações estruturadas

A

Bancos de dados relacionais, lógica de primeira ordem, modelos de probabilidade de primeira ordem e compreensão de linguagem natural

44
Q

No contexto de separar uma base de dados em treinamento e teste, qual a vantagem de usar métodos como hashing ao invés de selecionar aleatoriamente na amostra?

A

Ao selecionar os dados aleatoriamente, cada atualização da base de dados poderá mudar significativamente os dados de treino e os de teste, o que acarretaria em vazamento de dados. Um método como hashing garante estabilidade nos agrupamentos.

45
Q

No contexto de separar uma base de dados em treinamento e teste, qual a maior desvantagem de usar o train_test_split da biblioteca Scikit-learn? Qual a forma mais eficiente de resolver esse problema?

A

Ao usar o train_test_spit, os dados são separados de forma aleatória. Isso é um problema se houver necessidade de estratificar a amostra (ou seja, garantir que proporções presentes na amostra também sejam seguidas nos conjuntos). A forma mais fácil de resolver isso é usando a classe StratifiedShuffledSplit da biblioteca ScikitLearn

46
Q

Qual a diferença entre uma função de utilidade e uma função de custo?

A

Para uma função de utilidade, quanto maior o valor, melhor. Para uma função de custo, quanto menor, melhor.

47
Q

Quais são as principais barreiras do deep learning?

A

A quantidade de dados necessária para produzir as previsões, poder computacional necessário e a dificuldade de explicar como a previsão foi feita

48
Q

Quais são os principais pontos de atenção ao se lidar com modelos de regressão linear?

A

Validar previamente se os valores estão dispostos de forma linear e entender que ele é extremamente sensível a pontos fora da curva.

49
Q

Qual a principal técnica utilizada para impedir que modelos mais complexos (com tendência a over-fitting) sejam selecionados ao invés de modelos mais simples e generalistas?

A

Através de um processo conhecido como regularização, que envolve combinar o erro total do modelo com os valores absolutos dos coeficientes da equação resultante.

50
Q

Em poucas palavras, como funciona o algoritmo de SVM?

A

Trata-se de um algoritmo que busca desenhar um hiperplano que maximiza a distância para o ponto mais próximo.

51
Q

Como funciona a função de erro do algoritmo de SVM?

A

Ela identifica todos os pontos erroneamente classificados e define seu erro como sendo a distância para o hiperplano estabelecido pelo algoritmo.

52
Q

Como é medido o erro marginal do algoritmo de SVM?

A

Primeiro, estabelece-se as retas wx + b = 1 e wx + b = -1. Para os pontos localizados entre o hiperplano estabelecido pelo SVM (wx + b = 0) e suas margens, é definido um erro como sendo a distância entre o ponto e sua margem mais distante.

53
Q

Num contexto de Decision Trees, o que é a entropia?

A

É a medida de dispersão dos dados. Ela é inversamente proporcional ao conhecimento dos dados.

54
Q

Em regressão linear, quais são as restrições das variáveis?

A

A variável dependente precisa ser contínua. As independentes podem ser discretas ou contínuas.

55
Q

Quais são os tipos de regressão linear? Qual a diferença entre eles?

A

Existe a regressão linear simples e a múltipla. A diferença é que a simples é quando uma variável é usada e a múltipla envolve várias variáveis.

56
Q

De forma resumida, como se resolve um problema de busca?

A

1 - Comece com o estado inicial na fronteira
2 - Se a fronteira está vazia, não existe solução
3 - Remova um nó da fronteira
4 - Se o nó é o objetivo, retornar a solução
5 - Caso contra´rio, expanda o nó, adicione os nós resultantes à fronteira e repita a etapa 2

57
Q

Como funciona o algoritmo de greedy best-first search?

A

É um algoritmo de busca informada em árvore que começa pelo nó mais próximo do objetivo (estimado por uma função heurística h(n))

58
Q

Como funciona, de forma resumida, o algoritmo A*?

A

Trata-se de uma variação do greedy best-first search que também leva em conta o custo para alcançar aquele nó na hora de decidir o próximo passo.

59
Q

Existe algum método de busca que garante o resultado ótimo? Se sim, qual(is) critério(s) precisa(m) ser atingido para que isso aconteça?

A

O algoritmo A* garante o resultado ótimo se a heurística h(n) é admisível (nunca superestima o custo real) e consistente (para cada nó n e sucessor n’ com custo de passo c, h(n) <= h(n’) + c).

60
Q

No contexto de IAs com conhecimento, o que significa sentença, modelo, base de conhecimento e implicação?

A

Sentença: Uma asserção sobre o mundo em uma linguagem de representação de conhecimento

Modelo: Um conjunto de sentenças com um valor de Verdadeiro ou Falso atribuídas

Base de conhecimento: Conjunto de sentenças conhecida pelo agente baseado em conhecimento

Implicação: Dizer que a implica b quer dizer que todos os modelos em que a é verdade, b também é.

61
Q

Como funciona a prova de implicação por checagem de modelo?

A

Ela consiste em enumerar todos os modelos possíveis; se em todos os modelos em que a base conhecimento é verdadeira, b também é verdadeiro, então a base de conhecimento implica em b

62
Q

O que é a forma normal conjunctiva?

A

É uma sentença lógica que se trata de uma conjunção (and) de cláusulas (or).

63
Q

Quais etapas necessárias para converter uma expressão para a forma normal conjunctiva?

A
  • Primeiro, elimine as bicondicionais (trocar a <–> b em ( a –> b) ^ (b –> a))
  • A seguir, eliminar implicações (trocar a –> b por ¬ a v b)
  • Então usar as leis de De Morgan para colocar as negações dentro dos parênteses
  • Por último, use as leis distributivas para distribuir v.
64
Q

Como funciona a prova de implicação por inferência por resolução ?

A

Para provar que a base de conhecimento (kb) implica em b, é necessário provar que kb ^ ¬ b é uma contradição (se não for possível, não é uma implicação). Para isso, é necessário seguir os seguintes passos:
- Converter (kb ^ ¬b) na forma normal conjunctiva.
- Iterar pelas sentenças verificando se é possível usar resolução para produzir uma nova cláusula
- Se a cláusula vazia for produzida, nós temos uma contradição e kb implica em a
- Caso contrário, se não é possível adicionar novas cláusulas, não há implicação.

65
Q

Qual a maior diferença entre a lógica proposicional e a lógica de primeira ordem?

A

Em essência, a lógica proposicional consiste em criar afirmações e atribuir a elas um valor lógico. Por outro lado, lógica proposicional envolve criar conceitos e estabelecer relações como ele como relações generalistas e relações de existência.

66
Q

O que é uma rede Bayesiana?

A

Um grafo direcionado em que cada nó representa uma variável aleatória. Uma ligação de X a Y significa que X é pai de Y. Por último, cada nó X tem distribuição de probabilidade P(X Parents(x) )

67
Q

O que é a propriedade de Markov?

A

A propriedade que o estado atual depende somente de um número fixo finito de estados anteriores.

68
Q

O que é uma cadeia de Markov?

A

Uma sequência de variáveis aleatórias onde a distribuição de cada variável segue a propriedade de Markov.

69
Q

O que são os modelos ocultos de markov?

A

Modelos Ocultos de Markov (HMMs) consistem em uma cadeia de estados onde, em cada estado, uma observação é gerada de acordo com uma distribuição de probabilidade associada a esse estado. A particularidade dos HMMs está na “ocultação” dos estados verdadeiros do observador, sendo visíveis apenas as observações emitidas. Portanto, a transição de um estado para outro é determinada por probabilidades de transição desconhecidas.

70
Q

O que são algoritmos de busca local?

A

São algoritmos que mantém um único nó e sua busca consiste em navegar a nós vizinhos.

71
Q

Quais são as principais variações do algoritmo hill climbing?

A

Aumento mais íngreme: Procura o maior vizinho

Estocástico: Escolhe aleatoriamente entre os vizinhos melhores que o estado atual

Primeira escolha: escolhe o primeiro valor melhor.

72
Q

Como funciona o algoritmo simulated annealing?

A

No começo, maior probabilidade de aceitar vizinhos piores que o estado atual; essa probabilidade reduz com o tempo.

73
Q

Quais são os elementos principais de um problema de satisfação de constraints?

A
  • Conjunto de variávels {x1, x2, …, xn}
  • Domínios para cada variável {D1, D2, …, Dn}
  • Conjunto de limitações C:
    • Limitações duras: limitações que precisam ser satisfeitas em uma solução correta
    • Limitações suaves: limitações que expressam uma noção de quais soluções são preferíveis
    • Limitações unárias: limitações envolvendo apenas uma variável
    • Limitações binárias: limitações envolvendo duas variáveis
    • Consistência de nó: quando todos os valores no domínio de uma variáel satisfazem suas limitações unárias
    • Consistência de arco: quando todos os valores no domínio de uma variável satisfazem suas limitações binárias
      - Para fazer X ter consistência de arco em relação a Y, remova elementos do domínio de X até cada escolha em X ter uma escolha possível em Y
74
Q

Quais são as heurísticas mais populares para selecionar valores para variáveis?

A
  • Heurística valores restantes mínimos (MRV): selecionar a variável que tem o menor domínio
  • Heurística de grau: selecionar a variável que tem o maior grau (nós conectados)
75
Q

Defina programação linear

A
  • Minimizar uam função de custo c1x1 + c2x2 + … + cnxn
  • Com constantes da forma a1x1 + a2x2 + …. + anxn <= b
  • Com limites para cada variável li <= xi <= ui
76
Q

Como funciona aprendizado por reforço?

A

A partir de um conjunto de recompensas e/ou punições, aprenda quais ações tomar no futuro

77
Q

O que é o processo de decisão de Markov?

A

É um modelo para tomada de decisão, representando estados, ações e suas recompensas.

78
Q

Quais são os elementos de um processo de decisão de Markov?

A
  • Conjunto de estados S.
  • Conjunto de ações Ações(S)
  • Modelo de transição P (s’ | s, a)
  • Função de recompensa R (s, a, s’)
79
Q

O que é Q-Learning?

A

Método para aprender uma função Q(s,a), estimativa do valor de performar uma ação a em um estado s

80
Q

Como funciona Q-Learning?

A
  • Comece com Q(s,a) = 0 para todo s, a
  • Quando tomamos uma ação e recebemos uma recompensa:
    • Estimar o valor de Q(s,a) baseado na recompensa atual e recompensas futuras esperadas
    • Atualizar Q(s,a) para levar em consideração a estimativa antiga assim como a estimativa nova
81
Q

No contexto de funções de ativação para deep learning, o que é uma função degrau?

A

É uma função f(x) que retorna 0 se x for menor que 0, caso contrário retorna 1

82
Q

No contexto de funções de ativação para deep learning, qual a definição de uma sigmoide logística?

A

É uma função f(x) = e^x / (e ^ x + 1)

83
Q

No contexto de funções de ativação para deep learning, qual a vantagem de usar a sigmoide logística ao invés da função degrau?

A

A função sigmoide logística é melhor quando se deseja uma probabilidade de algo pertencer a uma categoria ao invés de uma categorização binária.

84
Q

No contexto de funções de ativação para deep learning, o que significa ReLU?

A

Rectified Linear Unity

85
Q

No contexto de funções de ativação para deep learning, qual a definição da função ReLU?

A

f(x) = max(x,0)

86
Q

O que são redes neurais artificiais?

A

São redes que modelam funções matemáticas de entradas para saídas baseadas na estrutura e parâmetros da rede. Permitem o aprendizado dos parâmetros da rede baseado em dados.

87
Q

No contexto de deep learning, como funciona o algoritmo de gradiente descendente?

A
  • Comece com uma escolha aleatória de pesos para o modelo de deep learning
  • Repita:
    • Calcule o gradiente baseado em todos os pontos de dados e identifique a direção que levará a reduzir a perda
    • Atualize os pesos baseado nos gradientes
88
Q

No contexto de deep learning, qual a diferença entre o algoritmo de gradiente descendente, gradiente descendente estocástico e gradiente descendente mini-batch?

A

O algoritmo de gradiente descendente usa todos os pontos para calcular o gradiente; a versão estocástica usa um único ponto; a versão mini-batch usa uma pequena coletânea de pontos.

89
Q

No contexto de deep learning, qual a maior limitação do perceptron?

A

Ele só consegue aprender limites de decisões linearmente separáveis

90
Q

No contexto de deep learning, o que é o algoritmo de backpropagation?

A

É um algoritmo para treinar redes neurais artificial com layers escondidos.

91
Q

No contexto de deep learning, como funciona o algoritmo de backpropagation?

A
  • Comece com uma escolha aleatória de pesos para o modelo de deep learning
  • Repita:
    • Calcule o erro do layer de saída
    • Para cada layer, começando com o layer de saída e movendo internamente até o primeiro layer escondido:
      • Propague os erros para um layer antes
      • Atualize os pesos
92
Q

No contexto de deep learning, o que é o algoritmo dropout? Para que ele serve?

A

Dropout consiste em remover temporariamente unidades selecionadas aleatoriamente de uma rede neural. Sua principal relevância é prevenir o excesso de dependência de algumas unidades específicas.

93
Q

No contexto de deep learning, o que é convolução de imagens?

A

É o processo de aplicar um filtro que adiciona o valor de cada pixel em uma imagem a seus vizinhos, pesados de acordo com uma matriz de kernel.

94
Q

No contexto de deep learning, como funciona o processo de pooling e max-pooling?

A

Poooling consiste em reduzir o tamanho de uma entrada através da amostragem de regiões na entrada. Max-pooling é um processo de pooling que escolhe o valor máximo em cada região.

95
Q

Qual a diferença entre FFNNs e RNNs?

A

FFNN (feed forward neural network) são redes neurais que possuem conexões somente em uma direção. RNN (Recurrent neural networks) possuem conexões que se retroalimentam para futuras execuções daquela rede.

96
Q

Qual a maior vantagem do uso de RNNs sobre FFNNs?

A

Enquanto FFNNs só permitem o mapeamento de 1 x 1 entre entradas e saídas, RNNs permitem outros tipos de mapeamento. Por exemplo, RNNs são capazes de receber vários valores (como um vídeo – um conjunto de imagens) e retornar um (se o vídeo possui uma violação de direitos autorais ou não).