T6 Flashcards
Quais foram as conclusões das experiências de Thorndike?
- a aprendizagem faz-se por tentativa e erro: não há estratégia mas sim ensaios
- a aprendizagem é gradual: a resposta correta é adquirida progressivamente
- a aprendizagem é motivada: obter algo
O que é a lei do exercício de Thorndike?
As conexões entre uma situação e uma resposta são intensificadas pelo exercício, ou seja, quanto mais ensaios, mais forte é a conexão da resposta (mais tarde, achou que esta lei só se verificava na presença da lei do efeito)
O que é a lei do efeito de Thorndike?
O comportamento bem sucedido ou com resultados agradáveis para o animal (incluindo o homem) tendem a ser repetidos, enquanto que os que têm resultados desagradáveis, tendem a desaparecer.
O que é o Condicionamento Operante?
Expressão introduzida por Skinner para caracterizar um procedimento experimental em que se associam comportamentos e consequências.
Skinner defendia que as consequências de um comportamento eram mais importantes do que qualquer estímulo que o precedesse.
O que é o Reforço? Que tipos existem?
Consequência que segue um comportamento (acontecimento) que AUMENTA a probabilidade do
comportamento ser repetido. O reforço encoraja, pois, o comportamento e diminui a variabilidade do mesmo.
- Positivo: algo agradável que é adicionado à situação (e.g., comer doce)
- Negativo: algo desagradável é removido da situação (e.g., não há TPC; evitar um choque)
- Contínuo: todas as respostas recebem reforço
- Intermitente (ou parcial): só algumas respostas recebem reforço. Ex: jogo do azar
O que é uma Punição? Que tipos existem?
Uma consequência (acontecimento) que se segue a um comportamento que DIMINUI a probabilidade de que esse comportamento seja repetido.
- Positiva: algo desagradável é adicionado à situação (e.g., um choque)
- Negativa: algo agradável é removido da situação (e.g. não come sobremesa)
O que é um reforço secundário?
São estímulos condicionados aos primários que, mesmo não sendo diretamente de importância biológica para o indivíduo, são um meio de se conseguir alimentos e outras satisfações ligadas à sobrevivência. Tornam-se reforçantes através da
associação com reforços mais básicos. Enquanto os primários conduzem, a uma satisfação intrínseca, os
secundários são “aprendidos” (ex. dinheiro para os humanos, boas notas).
O que são estímulos discriminativos?
Os estímulos externos podem funcionar como estímulos que permitem ao agente saber se vai ou não ser reforçado. Ex: se se acender uma luz verde e o pombo carregar num pedal, recebe alimento; na presença da luz vermelha, mesmo que emita a resposta, não recebe alimento.
- Luz verde –> Estímulo discriminativo positivo (E+);
- Luz vermelha –> Estímulo discriminativo negativo (E-).
O que é um comportamento supersticioso?
Organismo aprende “incorretamente” que um comportamento produz um certo resultado.
Exemplo: entrei no exame com o pé direito e tive boa nota.
O que é a extinção operante?
O procedimento de extinção consiste na suspensão do reforço de uma resposta condicionada. A extinção ocorre de forma gradual.
No início:
- Aumenta a frequência da resposta
- Aumenta a variabilidade da resposta
- Surgem respostas emocionais: irritação, frustração etc
Que tipos de programa ou escala de proporção de reforço existem?
– Escalas de razão fixa: são necessárias várias respostas antes de atribuição de reforço. Por exemplo,
reforço ao fim de 5 respostas . Prémio ao fim de 5 MB
ou trabalho pago à peça
– Escalas de razão variável: tem de passar um certo número de respostas antes do próximo reforço, mas esse número varia (às vezes, 5, outras, 10 etc).
Ex: slot-machines
O que é programa ou escala de intervalo? Que tipos existem?
Programa ou escala de intervalo
Caracteriza-se pelo facto do reforço não ser aplicado, imediatamente, após a emissão de uma resposta esperada, mas depois de um certo tempo arbitrado pelo experimentador (ou por quem esteja a condicionar alguém).
Tipos:
- Reforço de Intervalo Fixo:
Refere-se à presença de reforço em intervalos previamente definidos . Ex: pagamento ao fim mês
O tempo decorrido entre a produção de uma resposta e a aplicação do reforço é sempre o mesmo. Se um estudante sabe que um professor dá testes de oito em oito dias, ele só começará a estudar, provavelmente, nas vésperas do 8º dia;
- Reforço de Intervalo Variável:
Refere-se à presença de reforço em intervalos não fixos, sendo impossível, por parte do indivíduo, fazer qualquer previsão – comida é dispensada a cada dez segundos mas rato tem de estar a carregar na alavanca à aproximação do tempo. Leva a registo de resposta muito baixo; ex: pesca;
Qual o padrão mais resistente à extinção?
- O mais resistente à extinção é o padrão de razão variável;
- Em seguida, o de intervalo variável;
- Nos programas de razão ou de intervalos fixos, a extinção é mais rápida.
O que é Shaping/Reforço de aproximações sucessivas/Moldagem?
A moldagem converte um padrão de respostas complexo, numa sequência de segmentos simples de comportamentos. Através do reforço seletivo em cada
etapa, conduz à aquisição do comportamento desejado.
Qualquer comportamento complexo (e.g., cão a dar a pata) é aprendido em pequenos passos.
O que é Chaining (cadeia, sequência)? Porque é diferente de shaping?
Chaining: Pode ensinar-se uma competência, encadeando várias etapas. Por exemplo ao ensinar o abecedário, primeiro ensina-se o A, depois o B e assim
sucessivamente até ao Z. Uma competência complexa implica uma série de comportamentos relacionados,
no qual cada um é a base para o seguinte. Ex: fazer contas.
Enquanto no shaping é possível “voltar atrás” se uma aproximação ainda for muito complexa para o agente, no chaining só se avança efetivamente para o próximo
passo da sequência quando todos os passos anteriores estiverem dominados.