P2.1 Flashcards
Machine Learning
Área de estudo que dá aos computadores a habilidade de aprenderem sem ser explicitamente programados
Well posed Learning Problem
Um programa de computador aprende de uma experiência com respeito a uma classe de tarefas e uma medida de performance se sua performance na execução medida melhora com sua experiência.
Aprendizado Supervisionado
Observa se alguns pares de exemplos de entrada e saída de forma a aprender uma função que mapeia a entrada para a saída.
Aprendizado Não Supervisionado
O agente reconhece padrões nos dados de entrada mesmo sem nenhum feedback de saída.
Aprendizado por Reforço
O agente recebe uma série de reforços, recompensas ou punições, calculadas com base no ambiente.
Estado
Conjunto de características que descrevem o ambiente.
Função de recompensa
Feedback do ambiente sobre o comportamento do agente.
Função de transição
Indica em qual estado o agente está.
Política de ações
Função que modela o comportamento do agente.
Função valor dos estados
Expressa se um determinado estado é bom ou ruim em termos das recompensas e da política de ações.
Função valor das ações
Indica a soma das recompensas a obter.
Fases do Aprendizado Supervisionado
○ Treinamento
§ Apresenta-se exemplos ao sistema;
§ O sistema “aprende” a partir dos exemplos.
§ O sistema modifica gradualmente os seus parâmetros para que a saída se aproxime da saída desejada.
○ Utilização/Teste
§ Novos exemplos jamais vistos são apresentados ao sistema
§ O sistema deve generalizar e reconhecê-los.
Overfitting
Erro baixo sobre os exemplos de treinamento, porém elevado para os exemplos de teste
Underfitting
Erro elevado na fase de treinamento.
Teoria do Aprendizado Computacional
Qualquer hipótese que é consistente com um conjunto suficientemente grande de exemplos é pouco provável de estar seriamente errada.