Aprendizado Supervisionado Flashcards

1
Q

Definição de um agente baseado em aprendizado supervisionado

A

Um agente que aprende uma função capaz de mapear entradas e saídas com base em uma grande quantidade de amostras rotuladas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

O que é um dataset?

A

DataSet é um conjunto de informações por onde o agente irá aprender sua função

É como uma grande tabelona que tem
Amostra | Features/dados | Classificação -> problema de classificação

Dividido em treino e teste

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Como o dataset é utilizado?

A

Ele é dividido uma parte para aprendizado e outra para teste

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

O que é a função em um agente supervisionado

A

A função f(x) é por onde acontece o mapeamento de entrada para saída no dataset. No entanto essa função é desconhecida.

O agente precisa aprender uma função que se aproxime da função verdadeira, h(x)
Essa função é escolhida entre um conjunto de hipoteses e precisa generalizar a entradas nunca antes vistas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Função de previsão

A

h(x) : A função matemática que um modelo de aprendizado de máquina supervisionado encontra durante o treinamento, mapeando entradas para saídas.

Precisa generalizar entradas nunca antes vistas

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

O que é generalização em um modelo de aprendizado de máquina supervisionado?

A

É a capacidade do modelo de fazer previsões precisas em novos dados que não foram vistos durante o treinamento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Quais são alguns exemplos de problemas que podem ser abordados com um agente baseado em aprendizado supervisionado?

A

Um agente baseado em aprendizado supervisionado pode ser usado para resolver problemas de classificação, como classificar e-mails como spam ou não spam, ou problemas de regressão, como prever o preço de uma casa com base em suas características.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Com relação os problemas abordados por agentes baseados em aprendizado supervisionado, identifique as diferençasdiferencas dos problemas de regressão e classificação

A
  • Regressão: traça uma linha que passe mais perto de todos os pontos, busca prever um valor numérico contínuo para uma variável de saída, e tem saída contínua. Ex.: [0,1]
  • Classificação: traça uma linha onde se separa os ‘tipos, buscando atribuir uma entrada a uma das várias classes pré-definidas. Ex.: gato ou cachorro
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Como um agente baseado em aprendizado supervisionado toma decisões?

A

Um agente baseado em aprendizado supervisionado toma decisões fazendo previsões com base nos dados de entrada e nas informações aprendidas durante o treinamento. Ele escolhe a saída que tem a maior probabilidade de estar correta com base nas informações disponíveis.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Quais são algumas limitações de um agente baseado em aprendizado supervisionado?

A

Algumas limitações de um agente baseado em aprendizado supervisionado incluem a necessidade de dados rotulados para treinamento, a falta de capacidade de lidar com dados ausentes ou ruidosos e a falta de capacidade de aprender novos conceitos que não estão presentes nos dados de treinamento.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Sobre busca de hipóteses, como encontrar a hipótese correta?

A

Para encontrar a hipótese correta se usa o processo indutivo, onde se tenta ajustar diversas hipóteses até encontrar uma consistente

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

O que é overlifting? Qual o tradeoff em relacao a isso?

A

Quando acontece um ajuste excessivo no modelo e ele acaba não generalizando quanto deveria.

O tradeoff se relaciona a ter um espaco de hipotese grande o suficiente (expressivo) para incluir a hipótese ótima, mas não tao grande ao ponto de levar ao overlifting (muita complexidade)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

O que é espaço de hipóteses?

A

Contém todas as funções possíveis, é importante que seja expressivo (para conter a solução ótima) mas não ao ponto de ser complexo (e causar overlifting)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

O que é um problema realizável? E qual o problema com isso?

A

O problema de aprendizado realizável é aquele onde o H (espaco de hípoteses) contém a função verdadeira;
O problema é que antecipar essa informação é praticamente impraticável.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Navalha de Ockham

A

Princípio filosófico que afirma que, entre duas explicações igualmente boas para um fenômeno, a mais simples é a melhor.

Consistência ( hipótese muito consistente pode não generalizar) vs simplicidade (é importante que a hipótese seja simples)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Qual o objetivo do aprendizado supervisionado?

A

Encontrar a hipótese ótima h*
Que mais se aproxime da função verdadeira

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

O que é o treinamento em aprendizado supervisionado?

A

O treinamento busca ajustar o modelo aos dados do dataset.
Ele busca moinimizar o erro entre as previsões do modelo e a real saída

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Quais são as abordagens de treinamento?

A
  • Árvore de decisão
  • Redes Neurais
19
Q

O que seria uma árvore de decisão?

A

A árvore de decisão representa uma função (uma hipótese)
Cada nó é uma feature/um atributo e quanto mais próximo da raiz, mais importante

20
Q

Qual o processo de inducão em árvores de decisão?

A

O processo de indução consiste em criar várias árvores e encontrar a árvore consistente e consisa para representar um conjunto de exemplos (dataset)

Problema é que para N atributos, serão 2^(2ⁿ)

21
Q

O que é decision-tree-learning

Com relação as árvores de decisão

A

Algoritmo que constrói uma árvore de decisão a partir de um conjunto de dados de treinamento.

Escolhe atributos mais importantes para dividir o problema em subproblemas, que são então resolvidos recursivamente.

22
Q

Casos de recursão do decision-tree-learning

A
  • Temos só exemplos positivos/negativos: done
  • Exemplos mistos: continua a busca
  • Sem mais exemplos: retorna a classe predominante no nó pai
  • Sem mais atributos/features: retorna a classe predominante
23
Q

Verdadeiro ou falso: Decision-tree-learning sempre entrega a melhor solução

A

Falso - o método pode não entregar a melhor solução, ainda que gere boas soluções

24
Q

Como escolher os atributos em Decision Tree Learning?

A

A ideia é escolhera atributos que façam a divisão dos exemplos da forma mais próxima a esperada possível.

Atributo perfeito: aquele que divide todos os exemplos em dois conjuntos (positivo e negativo, por exemplo)

Entropia é uma forma de escolher os atributos. É baseada na incerteza e usada no método importance no algoritmo, escolhe o atributo que diminui ao máximo a incerteza

25
Q

Essemble Learning, o que é?

A

É uma forma de combinar hipóteses/modelos parar melhorar a precisão e o desempenho do modelo final.

Podemos fazer isso através do boosting e do baggie

26
Q

Boosting - Essemble Learning

A

Novos modelos são treinados para corrigir a deficiencia de outros
Cria árvores recursivamente, a saída de uma é a entrada de outra

27
Q

Boostrap Agreggation (baggie) -Essemble Learning

A

Cada modelo é treinado com um subconjunto aleatório de dados, treina modelos de forma independente.

Random Forest: método para criar diversas árvores diferentes e selecionar o melhor resultado através de consenso

28
Q

Definição de Hipóteses

A

As hipóteses são modelos ou aproximações da função f(x) que são usados para fazer previsões em novos dados.

29
Q

O que é Busca de Hipóteses

A

Processo de encontrar a hipótese ótima que melhor se ajusta aos dados de treinamento e é capaz de generalizar bem para novos dados.

30
Q

O que é classificação no aprendizado supervisionado?

A

A classificação no aprendizado supervisionado é um tipo de aprendizado de máquina em que o objetivo é prever uma variável categórica ou discreta.

31
Q

O que é regressão no aprendizado supervisionado?

A

A regressão no aprendizado supervisionado é um tipo de aprendizado de máquina em que o objetivo é prever uma variável contínua.

32
Q

O que é o processo indutivo?

A

O processo indutivo é uma abordagem para criar hipóteses e teorias a partir de observações e exemplos específicos.

33
Q

Como funciona o processo indutivo?

A

O processo indutivo envolve tentar construir ou ajustar várias hipóteses até encontrar uma que seja consistente com os exemplos observados.

34
Q

O que é uma hipótese consistente?

A

Uma hipótese consistente é aquela que pode explicar os exemplos observados e prever novos exemplos com precisão.

35
Q

Qual é a importância do processo indutivo na aprendizagem de máquina?

A

O processo indutivo é fundamental na aprendizagem de máquina, pois é usado para criar modelos e algoritmos de aprendizagem a partir de dados, permitindo que as máquinas possam aprender e tomar decisões com base nesses dados.

36
Q

Por que é importante definir o espaço de hipóteses?

A

Definir o espaço de hipóteses é importante para limitar a complexidade do modelo e evitar overfitting, que ocorre quando o modelo é muito complexo e se ajusta demais aos dados de treinamento.

37
Q

Como escolher o espaço de hipóteses adequado para um problema específico?

A

A escolha do espaço de hipóteses adequado depende do tipo de problema e da quantidade e qualidade dos dados disponíveis. É necessário encontrar um equilíbrio entre a capacidade do modelo e a complexidade para obter um bom desempenho.

38
Q

Todas as máquinas de Turing podem ser usadas como espaço de hipóteses?

A

Sim, todas as máquinas de Turing podem ser usadas como espaço de hipóteses. No entanto, quanto maior a expressividade do espaço de hipóteses, maior será a complexidade do modelo e o risco de overfitting.

39
Q

Qual é o tradeoff entre expressividade e complexidade no espaço de hipóteses?

A

O tradeoff entre expressividade e complexidade no espaço de hipóteses refere-se à relação entre a capacidade do modelo de representar funções complexas e a simplicidade do modelo. Quanto mais expressivo o espaço de hipóteses, mais complexo será o modelo e maior será o risco de overfitting.

40
Q

Como a expressividade do espaço de hipóteses se relaciona com a linearidade, polinomialidade e máquina de Turing?

A

A expressividade do espaço de hipóteses aumenta na seguinte ordem: linear < polinomial < máquina de Turing. Ou seja, quanto mais complexas as funções que o modelo pode representar, maior é a expressividade do espaço de hipóteses.

41
Q

Como a complexidade do espaço de hipóteses se relaciona com a linearidade, polinomialidade e máquina de Turing?

A

A complexidade do espaço de hipóteses aumenta na seguinte ordem: linear < polinomial < máquina de Turing. Ou seja, quanto mais complexas as funções que o modelo pode representar, maior é a complexidade do espaço de hipóteses.

42
Q

Como funciona o treinamento supervisionado?

A

No treinamento supervisionado, o modelo é ajustado aos dados de treinamento, que incluem entradas e saídas conhecidas. O modelo faz previsões com base nas entradas e os resultados são comparados com as saídas conhecidas. O erro é calculado e usado para ajustar os parâmetros do modelo.

43
Q

O que é a entropia em uma árvore de decisão?
R: A entropia em uma árvore de decisão é uma medida de incerteza ou desordem nos dados. A entropia é calculada para cada atributo e usada para determinar a ordem em que os atributos são selecionados para criar a árvore.

A