9. Machine Learning Flashcards
Qual a diferença entre aprendizado de máquina e aprendizado profundo?
Aprendizado de máquina = algoritmos cujo desempenho melhora à medida que são expostos a mais dados = capacidade de aprender sem ser explicitamente prigramado
Aprendizado profundo = tipo de aprendizado de máquina em que um software é capaz de treinar a si mesmo
Qual a diferença entre os inputs e output da programação tradicional para o aprendizado de máquina?’
Tradicional = input de regras para output de resultados
Machine learning = input de resultados para output de regras
Como o output do aprendizado de máquina são regras, isso quer dizer que o algoritmo dará de output um código-fonte?
Não.
Ele criará regras estatísticas, um modelo matemático, não em código.
Quais são as duas etapas do machine learning? Qual é a mais custosa?
- Treinamento (a mais custosa)
- Inferência
Para o tratamento de dados categóricos (azul, vermelho e verde), tratá-los como 1, 2, 3 pode dar qual problema? Como corrigir isso?
Problema = o sistema pode interpretar que a cor 2 vale o dobro da 1, por exemplo.
Para isso, usa-se variável dummy com n-1 colunas (0-1), (1-0) e (0-0)
Qual o problema clássico na identificação de transações fraudulentas? Como solucionar? E os riscos de cada solução?
Problema = classes desbalanceadas = há muito mais dados de transações normais do que fraudulentas, de forma que se o algoritmo chutar verdadeira ele acertará com muita precisão
Soluções = undersampling das normais (podem causar overfitting), oversampling das fraudulentas (pode dar padrões que nãorefletem a realidade), trocar a métrica para F-score ou curva ROC
Flashcard para ver o modelo de matriz de confusão na galeria
Dar nota 3 ao visualizar
Como é chamado o erro do tipo I?
E o erro do tipo II?
Tipo I = falso positivo
Tipo II = falso negativo
Qual é a diferença de uso da precisão e da sensibilidade?
Precisão = quero evitar falso positivo (erro tipo I) = mercado de ações, onde um falso-positivo te faz perder dinheiro = vai dar muito falso negativo
Sensibilidade = quero evitar falso negativo (erro tipo II) = teste de covid = vai dar muito falso positivo
Qual técnica de aprendizado de máquina serve para fazer sugestões de compra como “quem comprou isso também comprou isso”
Regras de associação
Entre as regras de associação, qual a diferença entre o suporte (prevalência) e a confiança (força)?
Suporte/prevalência = frequência = com que frequência os itens X e Y são comprados juntos
Confiança/força = probabilidade = se X for Comprado, qual a probabilidade de Y também ser comprado?
A regressão logística é usada para que tipo de aprendizado supervisionado?
Para CLASSIFICAÇÃO (e não para regressão) -> Pois há variáveis categóricas nela
Redes neuras feed foward são usadas para que tipo de aprendizado de máquina?
Aprendizado SUPERVISIONADO
Qual a unidade básica de uma rede neural artificial?
O perceptron
Quais são as quatro etapas do fluxo de processo de aprendizado de máquina para modelos preditivos?
Pré-processamento -> aprendizado (construção do algoritmo) -> avaliação -> predição
Que método divide o conjunto de dados em k subconjuntos e usa 1 conjunto para testar e os outros para treinar, com o modelo testado k vezes, cada vez com um subconjunto diferente de teste?
Método k-fold
Qual a relação entre viés e variância?
Inversamente proporcional
Ou seja, se quiser reduzir a variância, aumenta-se o viés
Flashcard para ver o gráfico Complexidade do modelo X erro de predição. Visualizar na galeria
Dar nota 3 e seguir
Qual o nome da técnica que junta todos os modelos de aprendizado de máquina? Para que serve?
Bagging = reduz a variância (sem aumentar o viés) = resolve overfitting
Boosting = reduz o viés (sem aumentar a variância) = resolve underfitting
O que o bagging é o boosting reduzem?
Bagging = reduz a variância e resolve overfitting
Boosting = reduz o viés e resolve underfitting
O que a Técnica de early stopping faz? O que evita?
Interrompe o treinamento de um modelo quando a precisão parar de melhorar -> evita o overfitting
O que a Técnica de data aumentation faz com o conjunto de dados de imagens?
Faz cópias das imagens originais e aplica nelas pequenas transformações (esfumaçam, cortam, põem em PB, zoom, colocam filtros…), aumentando a base de dados de treinamento
A taxa de sensibilidade numa curva ROC mede a taxa de falsos positivos?
Não.
A sensibilidade é a taxa de verdadeiros positivos
Qual a categoria de aprendizagem em que um software interage com um ambiente dinâmico, como, por exemplo, veículos autônomos?
Aprendizagem por reforço
Em uma curva ROC, o ponto que aperfeiçoa a sensibilidade em função da especificidade está próximo ao canto superior esquerdo? Por quê?
Sim
Pois é o ponto mais distante do classificados aleatório
Quais são os eixos X e Y de um gráfico ROC?
Eixo X = falsos positivos
Eixo Y = verdadeiros positivos
Um conjunto de dados contém 10000 observações, cada uma com 10 variáveis. A análise de componentes principais (PCA) sobre esses dados apontou que a primeira componente principal é dada por w. O que podemos dizer sobre a variância dos dados?
Que a variância é máxima na direção dada por W.
A variância é máxima na direção dada pela primeira componente principal.
Var (1CP) > Var (2CP) > Var (3CP)…
Como calcular a precisão e a sensibilidade de um modelo?
Precisão = número de verdadeiros positivos / número de positivos previstos (a coluna toda)
Sensibilidade = número de verdadeiros positivos / VP+FN (a linha toda)
Qual a mais conhecida função de ativação de redes neurais?
A da sigmoide: 1 / 1 + e ^ -z