9. Machine Learning Flashcards

1
Q

Qual a diferença entre aprendizado de máquina e aprendizado profundo?

A

Aprendizado de máquina = algoritmos cujo desempenho melhora à medida que são expostos a mais dados = capacidade de aprender sem ser explicitamente prigramado

Aprendizado profundo = tipo de aprendizado de máquina em que um software é capaz de treinar a si mesmo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Qual a diferença entre os inputs e output da programação tradicional para o aprendizado de máquina?’

A

Tradicional = input de regras para output de resultados

Machine learning = input de resultados para output de regras

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Como o output do aprendizado de máquina são regras, isso quer dizer que o algoritmo dará de output um código-fonte?

A

Não.
Ele criará regras estatísticas, um modelo matemático, não em código.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quais são as duas etapas do machine learning? Qual é a mais custosa?

A
  1. Treinamento (a mais custosa)
  2. Inferência
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Para o tratamento de dados categóricos (azul, vermelho e verde), tratá-los como 1, 2, 3 pode dar qual problema? Como corrigir isso?

A

Problema = o sistema pode interpretar que a cor 2 vale o dobro da 1, por exemplo.

Para isso, usa-se variável dummy com n-1 colunas (0-1), (1-0) e (0-0)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

Qual o problema clássico na identificação de transações fraudulentas? Como solucionar? E os riscos de cada solução?

A

Problema = classes desbalanceadas = há muito mais dados de transações normais do que fraudulentas, de forma que se o algoritmo chutar verdadeira ele acertará com muita precisão

Soluções = undersampling das normais (podem causar overfitting), oversampling das fraudulentas (pode dar padrões que nãorefletem a realidade), trocar a métrica para F-score ou curva ROC

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Flashcard para ver o modelo de matriz de confusão na galeria

A

Dar nota 3 ao visualizar

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Como é chamado o erro do tipo I?

E o erro do tipo II?

A

Tipo I = falso positivo

Tipo II = falso negativo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Qual é a diferença de uso da precisão e da sensibilidade?

A

Precisão = quero evitar falso positivo (erro tipo I) = mercado de ações, onde um falso-positivo te faz perder dinheiro = vai dar muito falso negativo

Sensibilidade = quero evitar falso negativo (erro tipo II) = teste de covid = vai dar muito falso positivo

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Qual técnica de aprendizado de máquina serve para fazer sugestões de compra como “quem comprou isso também comprou isso”

A

Regras de associação

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Entre as regras de associação, qual a diferença entre o suporte (prevalência) e a confiança (força)?

A

Suporte/prevalência = frequência = com que frequência os itens X e Y são comprados juntos

Confiança/força = probabilidade = se X for Comprado, qual a probabilidade de Y também ser comprado?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

A regressão logística é usada para que tipo de aprendizado supervisionado?

A

Para CLASSIFICAÇÃO (e não para regressão) -> Pois há variáveis categóricas nela

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Redes neuras feed foward são usadas para que tipo de aprendizado de máquina?

A

Aprendizado SUPERVISIONADO

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Qual a unidade básica de uma rede neural artificial?

A

O perceptron

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Quais são as quatro etapas do fluxo de processo de aprendizado de máquina para modelos preditivos?

A

Pré-processamento -> aprendizado (construção do algoritmo) -> avaliação -> predição

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Que método divide o conjunto de dados em k subconjuntos e usa 1 conjunto para testar e os outros para treinar, com o modelo testado k vezes, cada vez com um subconjunto diferente de teste?

A

Método k-fold

17
Q

Qual a relação entre viés e variância?

A

Inversamente proporcional

Ou seja, se quiser reduzir a variância, aumenta-se o viés

18
Q

Flashcard para ver o gráfico Complexidade do modelo X erro de predição. Visualizar na galeria

A

Dar nota 3 e seguir

19
Q

Qual o nome da técnica que junta todos os modelos de aprendizado de máquina? Para que serve?

A

Bagging = reduz a variância (sem aumentar o viés) = resolve overfitting

Boosting = reduz o viés (sem aumentar a variância) = resolve underfitting

20
Q

O que o bagging é o boosting reduzem?

A

Bagging = reduz a variância e resolve overfitting

Boosting = reduz o viés e resolve underfitting

21
Q

O que a Técnica de early stopping faz? O que evita?

A

Interrompe o treinamento de um modelo quando a precisão parar de melhorar -> evita o overfitting

22
Q

O que a Técnica de data aumentation faz com o conjunto de dados de imagens?

A

Faz cópias das imagens originais e aplica nelas pequenas transformações (esfumaçam, cortam, põem em PB, zoom, colocam filtros…), aumentando a base de dados de treinamento

23
Q

A taxa de sensibilidade numa curva ROC mede a taxa de falsos positivos?

A

Não.
A sensibilidade é a taxa de verdadeiros positivos

24
Q

Qual a categoria de aprendizagem em que um software interage com um ambiente dinâmico, como, por exemplo, veículos autônomos?

A

Aprendizagem por reforço

25
Q

Em uma curva ROC, o ponto que aperfeiçoa a sensibilidade em função da especificidade está próximo ao canto superior esquerdo? Por quê?

A

Sim
Pois é o ponto mais distante do classificados aleatório

26
Q

Quais são os eixos X e Y de um gráfico ROC?

A

Eixo X = falsos positivos

Eixo Y = verdadeiros positivos

27
Q

Um conjunto de dados contém 10000 observações, cada uma com 10 variáveis. A análise de componentes principais (PCA) sobre esses dados apontou que a primeira componente principal é dada por w. O que podemos dizer sobre a variância dos dados?

A

Que a variância é máxima na direção dada por W.

A variância é máxima na direção dada pela primeira componente principal.

Var (1CP) > Var (2CP) > Var (3CP)…

28
Q

Como calcular a precisão e a sensibilidade de um modelo?

A

Precisão = número de verdadeiros positivos / número de positivos previstos (a coluna toda)

Sensibilidade = número de verdadeiros positivos / VP+FN (a linha toda)

29
Q

Qual a mais conhecida função de ativação de redes neurais?

A

A da sigmoide: 1 / 1 + e ^ -z