Tema 4
APRENDIZAJE INSTRUMENTAL
Psicología del AprendizajeCurso 2007-08Prof. L.AguadoFacultad de PsicologíaUniversidad Complutense de Madrid
* Contingencia instrumental
* Conducta instrumental
* Reforzador
* Estímulo discriminativo
APRENDIZAJE INSTRUMENTAL
Conceptos básicos
CONDUCTA
ESTÍMULO
CONDUCTA ELICITADA
* conducta provocada por estímulos
-->conducta refleja
-->respuestas condicionadas
CONDUCTA
CONSECUENCIA
-presentación de un reforzador
-retirada de un reforzador
-no presentación de un reforzador esperado
-fortalece conducta
-debilita conducta
CONDUCTA INSTRUMENTAL
-controlada por sus consecuencias
Tipos de reforzadores
Según su valor motivacional / afectivo
-positivos --- aproximación
-negativos --- evitación
Según su origen
-reforzadores primarios (incondicionados)
-reforzadores secundarios (condicionados)
Estímulos discriminativos
Positivos (Ed+)
Estímulo --> conducta --> refuerzo
No estímulo --> conducta --> no refuerzo
Negativos (Ed-)
Estímulo --> conducta --> no refuerzo
No estímulo --> conducta --> refuerzo
Positivos (Ed+)
Estímulo --> conducta --> refuerzo
No estímulo --> conducta --> no refuerzo
Negativos (Ed-)
Estímulo --> conducta --> no refuerzo
No estímulo --> conducta --> refuerzo
Caja de Skinner
Discos de respuesta y presentación de estímulos
Picoteo /
Presión de palanca
Picoteo /
Presión de palanca
RECOMPENSA!
(comida)
NO RECOMPENSA!
Ed+
Ed-
Estímulos discriminativos
aproximaciónRECOMPENSA!
(atención)
NO RECOMPENSA!
(rechazo)
Ceño fruncido
Estímulos discriminativos
sonrisa
aproximación
Ed+
Ed-
Recompensa
Omisión Refuerzo negativo
Clasificación de las variedades de aprendizaje instrumental
(contingencias instrumentales)
Valor del reforzador
Positiva
(conducta-->reforzador)
Negativa
(conducta-->no reforzador)
apetitivo aversivoContingencia
conducta-reforzador
Castigo
Procesos básicos del aprendizaje instrumental
* adquisición
-efectos de la demora de las consecuencias
* extinción
-efecto del refuerzo parcial
* control de estímulos : -generalización y discriminación
Aprendizaje instrumental en la caja-problema de Thorndike
Curva de adquisición
Aprendizaje instrumental: efecto del refuerzo del balbuceo infantil
Aprendizaje instrumental en bebés (Rovee-Collier)
Aprendizaje instrumental: efectos de la magnitud y la demora de la recompensa
Efecto del refuerzo parcial sobre la extinción
Ensayos de extinción
* Principios teóricos básicos
1) el valor otorgado a una consecuencia determina su capacidad reforzante
2) el valor de una consecuencia está determinado por su:
-magnitud
-demora
-probabilidad
3) “función de demora”: la capacidad reforzante de una consecuencia decrece a medida que aumenta la demora conducta-->consecuencia
* Principios teóricos básicos
1) el valor otorgado a una consecuencia determina su capacidad reforzante
2) el valor de una consecuencia está determinado por su:
-magnitud
-demora
-probabilidad
3) “función de demora”: la capacidad reforzante de una consecuencia decrece a medida que aumenta la demora conducta-->consecuencia
DEMORA DE LA RECOMPENSA, AUTOCONTROL E IMPULSIVIDAD (1)
•Definiciones conductuales
• impulsividad como control por las consecuencias inmediatas
• autocontrol como control por las consecuencias demoradas
•Definiciones conductuales
• impulsividad como control por las consecuencias inmediatas
• autocontrol como control por las consecuencias demoradas
Conducta Consecuencia inmediata Consecuencia demoradaIr al dentista Ansiedad, dolor… (-) Evitación de problemas dentales (+)Comer alimentos altos en grasa Placer sensorial (+) Riesgo de infarto (-)Estudiar Actividad no preferida (-) Aprobar (+)
Conducta Consecuencia inmediata Consecuencia demoradaIr al dentista Ansiedad, dolor… (-) Evitación de problemas dentales (+)Comer alimentos altos en grasa Placer sensorial (+) Riesgo de infarto (-)Estudiar Actividad no preferida (-) Aprobar (+)
* Problemas de autocontrol
* baja tolerancia a la demora de la gratificación
* impulsividad
* Problemas de autocontrol
* baja tolerancia a la demora de la gratificación
* impulsividad
DEMORA DE LA RECOMPENSA, AUTOCONTROL E IMPULSIVIDAD (2)
* El autocontrol como un problema de elección
conducta consecuencia inmediata consecuencia demorada
conducta A dolor (-) evitación de problemas dentales(+)
(ir al dentista)
conducta B evitación del dolor (+) problemas dentales (-)
(no ir al dentista)
DEMORA DE LA RECOMPENSA, AUTOCONTROL E IMPULSIVIDAD (3)
Momento de la 1ª consecuencia
positiva
Neg / pos
neutra
Pos / neg
Neg
Momento de evaluación de la consecuencia
0
+
-
1 semana2 semanas3 semanas
DEMORA DE LA RECOMPENSA, AUTOCONTROL E IMPULSIVIDAD (4)
Un modelo gráfico de la teoría
Probabilidad
de
autocontrolPunto de
indiferencia
DEMORA DE LA RECOMPENSA, AUTOCONTROL E IMPULSIVIDAD (5)