Psicología aprendizaje

62
Psicología del Aprendizaje ___________________________________________________________________________________ ___________________________________________________________________________________ Psicología del Aprendizaje 1. Psicología del Aprendizaje. Revisión Histórica Darwin, Romanes, Morgan Tendencias Innatas de Respuesta no constituyen aprendizaje (reflejo, instinto, maduración, desarrollo) Definición de Aprendizaje Definición de Psicología del Aprendizaje 2. Procesos Preasociativos. Habituación proceso de aprendizaje preasociativo de carácter negativo Sensibilización proceso de aprendizaje preasociativo de carácter positivo Teorías de Habituación y Sensibilización Teoría de la Depresión Sináptica Kandel Teoría Dual o de los Dos Procesos Groves y Thompson Teoría del Proceso Oponente Solomon 3. Procesos Asociativos. Condicionamiento Clásico (CC). Procesos básicos del CC Modalidades experimentales Factores que influyen en la eficacia del CC Variables o Parámetros del EI EC Compuestos Naturaleza de la RC Condicionamiento al Miedo Supresión Condicionada. Contigüidad v/s Contingencia de los Estímulos experimento de Rescorla. Inhibición Condicionada v/s Extinción Métodos para producir Condicionamiento Inhibitorio Métodos de Medición de la Inhibición Condicionada Fuerza del Condicionamiento Efecto del Bloqueo – Modelo Rescorla-Wagner: Sorpresividad del EI – Predicción de la Adquisición – Predicción del Sombreado Condicionamiento Operante (CO) o Instrumental. Principales elementos estímulo discriminatico – respuesta instrumental – consecuencia o estímulo consecuente Principales Métodos de Investigación Operante libre – Ensayos discretos Medición de la Conducta Instrumental Contingencias Operantes Antcedentes Históricos Ley del Efecto (Thorndike) – Ley del Reforzamiento (Skinner) Con troversias Teóricas Thorndike – Tolman – Skinner Procedimiento de Moldeamiento (shaping) o de aproximaciones sucesivas Tipos de Reforzadores primarios – secundarios – sociales Contingencias y Tipos de Estímulos positiva – negativa, aversivo – apetitivo Procedimientos Operantes Reforzamiento positivo – reforzamiento negativo – castigo tipo I – castigo tipo II Programas de Reforzamiento Continuo (PRC) – Parcial o Intermitente (RF – RV – IF – IV) Extinción - habituación - aprendizaje no asociativo - sensibilización - Aprendizaje - condicionamiento clásico - aprendizaje asociativo - condicionamiento instrumental u operante - aprendizaje social (Bandura) - vicario EI RI N (EI+EC) RI EC RC E R C E = estímulo antecedente R = conducta C = consecuencia

Transcript of Psicología aprendizaje

Page 1: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Psicología del Aprendizaje 1. Psicología del Aprendizaje.

Revisión Histórica Darwin, Romanes, Morgan Tendencias Innatas de Respuesta no constituyen aprendizaje (reflejo, instinto, maduración, desarrollo) Definición de Aprendizaje Definición de Psicología del Aprendizaje

2. Procesos Preasociativos.

Habituación proceso de aprendizaje preasociativo de carácter negativo Sensibilización proceso de aprendizaje preasociativo de carácter positivo Teorías de Habituación y Sensibilización

Teoría de la Depresión Sináptica Kandel Teoría Dual o de los Dos Procesos Groves y Thompson Teoría del Proceso Oponente Solomon

3. Procesos Asociativos.

Condicionamiento Clásico (CC). Procesos básicos del CC Modalidades experimentales Factores que influyen en la eficacia del CC Variables o Parámetros del EI EC Compuestos Naturaleza de la RC Condicionamiento al Miedo Supresión Condicionada. Contigüidad v/s Contingencia de los Estímulos experimento de Rescorla. Inhibición Condicionada v/s Extinción Métodos para producir Condicionamiento Inhibitorio Métodos de Medición de la Inhibición Condicionada Fuerza del Condicionamiento Efecto del Bloqueo – Modelo Rescorla-Wagner: Sorpresividad del EI

– Predicción de la Adquisición – Predicción del Sombreado Condicionamiento Operante (CO) o Instrumental.

Principales elementos estímulo discriminatico – respuesta instrumental – consecuencia o estímulo consecuente

Principales Métodos de Investigación Operante libre – Ensayos discretos Medición de la Conducta Instrumental Contingencias Operantes Antcedentes Históricos Ley del Efecto (Thorndike) – Ley del Reforzamiento (Skinner) Con troversias Teóricas Thorndike – Tolman – Skinner Procedimiento de Moldeamiento (shaping) o de aproximaciones sucesivas Tipos de Reforzadores primarios – secundarios – sociales Contingencias y Tipos de Estímulos positiva – negativa, aversivo – apetitivo Procedimientos Operantes Reforzamiento positivo – reforzamiento negativo – castigo tipo I –

castigo tipo II Programas de Reforzamiento Continuo (PRC) – Parcial o Intermitente (RF – RV – IF – IV) Extinción

- habituación - aprendizaje no asociativo

- sensibilización

- Aprendizaje - condicionamiento clásico

- aprendizaje asociativo - condicionamiento instrumental u operante

- aprendizaje social (Bandura) - vicario

EI RI N (EI+EC) RI EC RC

E R C E = estímulo antecedente R = conducta C = consecuencia

Page 2: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Programas de Tasas de Respuestas Reforzamiento diferencial de tasas bajas (RDB) – Reforzamiento diferencial de tasas altas (RDA) – Programa concurrente – programa encadanado – programa tipo yugo – programa concurrente encadenado

Conducta de Elección simple – Conducta de Elección Compleja Autocontrol Experimento de Rachlin y Green – Teoría de Ainslie y Rachlin Técnicas de Autocontrol compromiso – discriminación de estímulos – distracción -

autoreforzamiento Control Aversivo: Reforzamiento Negativo conducta de escape/evitación

Teoría de los Dos Procesos los dos procesos presentes – problemas de la teoría de los dos procesos

Teoría de Un Factor Teoría Cognitiva Controlabildiad Aplicaciones Terapéuticas

Control Aversivo: Castigo variables que influeyen en la efectividad del castigo I – desventajas del castigo I – aplicaciones terapéuticas del entrenamiento por omisión

Control de Estímulos control de estímulos/discriminación – generalización del estímulo – tipos de entrenamientos discriminativos – gradientes de generalización – trabajo de Jenkins y Harrison

Interacción Condicionamiento Clásico y Operante Rol del CO en el CC Rol del CC en el CO Moderna Teoría de los Dos Proceso – EEC’s

Page 3: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 1

Introducción dentro del amplio campo de fenómenos que estudia la psicología, el aprendizaje se transforma en el fenómeno que

permite elevar al nivel de ciencia a esta disciplina. el aprendizaje representa la forma en que los organismos logran aprovechar su experiencia con el entorno para adaptarse

a él. Revisión Histórica

Principales personajes que marcaron la historia de la Psi del Aprendizaje: Charles Darwin (1809-1882) - planteó la revolucionaria idea de que tanto la mente como el cuerpo evolucionaban, y que la inteligencia del

ser humano y la del animal se diferenciaban más por el grado que por la naturaleza. - los animales presentaban formas de actividad mental; además, los rasgos emocionales e intelectuales del ser

humano presentaban una continuidad con las especies de las que descendían. - estas ideas chocaron violentamente con la teoría aceptada hasta ese entonces: la discontinuidad esencial de

las especies. - con las publicaciones “El Origen de las Especies” (1859) y “La Expresión de las Emociones en el Hombre y en

los Animales” (1872) logró ser escuchado y afectó a la comunidad científica de su época. - con estas ideas, él impulsó el estudio del comportamiento animal (Psi comparada) justificó el uso de

animales en investigación, porque la información obtenida a partir de ellos podía servir para proporcionar información importante sobre la naturaleza humana.

- otra de las ideas de Darwin se relaciona con la selección natural. constitución física individuos mejor dotados sobrevivirían capacidad de aprender la herencia dotaría a algunos individuos de mayor flexibilidad, y cuanto mayor

fuese ésta, con mayor efectividad los factores ambientales producirían la conducta apropiada. - el fin último del ser humano es mantener la especie y para ello se adapta a través de los cambios

conductuales. George John Romanes (1848-1894) - sucesor intelectual en el estudio de la mente animal. - preparó una compilación de hechos, en cierta forma anecdóticos, que fueron publicados bajo el título

“Inteligencia Animal” (1882). - afirmaba que los únicos pensamientos y sentimientos que el ser humano podía conocer eran los propios; sin

embargo, era posible sospechar las actividades mentales de otras personas y animales. - si otra conducta era similar a la nuestra, se podía deducir que existía una actitud mental parecida. - la dificultad surgía cuando se trataba de seres muy diferentes, en donde las analogías de conducta no

siempre reflejaban experiencias mentales análogas. - el aprendizaje era el criterio decisivo para discriminar la existencia o no de una mente animal si había

elección entre varias respuestas, habría aprendizaje. C. Lloyd Morgan (1852-1936) - figura central de la transición de lo anecdótico a un estudio experimental de la inteligencia animal

experimentos informales (o trabajos semi-experimentales), mediante una atenta observación de las reacciones de los animales.

- defendió la investigación sistemática y aconsejó suma prudencia al tratar de interpretar la conducta animal. - rechazó lo anecdótico y el antropomorfismo nunca se debía interpretar un acto como resultado de un

ejercicio de una facultad psíquica más elevada, en tanto se pudiera interpretar como el resultado de otra que se hallara por debajo de la escala psicológica.

- se interesó por lo innato y lo adquirido en la conducta animal. - explicó el aprendizaje en términos de asociaciones que se producen por ensayo-error - intentó integrar la psicología humana y animal, aunque entendía que la psicología comparada era el hermano

menor de la psicología humana. - él es el punto de partida de la orientación “psicológica” de la psicología animal experimental.

desde la publicación de los primeros textos de Darwin, seguidos de Romanes y fortalecidos por Morgan, pasan al

menos 50 años, finalizando el siglo XIX, e ingresando al siglo XX con una psicología científica que intenta encontrar regularidades en el comportamiento animal que puedan ser trasladadas al comportamiento humano.

el aprendizaje es el fenómeno seleccionado para ser estudiado, porque da cuenta de las potencialidades que la herencia ha entregado a los diversos organismos, en interacción con el entorno o ambiente en el que se desenvuelven.

herencia y ambiente interactuando en la producción del fenómeno del aprendizaje.

Antropomorfismo: creencia que atribuye a la divinidad la figura y las cualidades humanas.

Page 4: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Psicología del Aprendizaje (como disciplina) y Aprendizaje (como fenómeno) psicología del aprendizaje diversas aproximaciones y definiciones dependiendo del momento.

para los primeros estudiosos, la psicología del aprendizaje equivalía a toda la psicología; era un modo de entender la psicología.

aprendizaje las definiciones se han sucedido desde las más reduccionistas hasta las más amplias, las que han ampliado, también, el campo de la psicología del aprendizaje

El aprendizaje es un constructo hipotético no se lo puede observar directamente, sino que sólo observamos sus manifestaciones, es decir, observamos comportamientos y conductas que permiten inferir que hubo aprendizaje. En psicología, un constructo hipotético debe ser definido conceptual y operacionalmente. La definición operacional implica variables independientes, variables intervinientes y variables dependientes.

Tendencias Innatas de Respuesta frente a la interrogante sobre ¿qué es el aprendizaje? es un cambio en la conducta. existen otros fenómenos ≠ al aprendizaje que también pueden producir cambios Tendencias Innatas de Respuesta:

1. reflejo: la relación más sencilla entre ambiente y organismo cambio en una respondiente (respuesta automática) que ocurre en presencia de un estímulo adecuado. Ej.: retirar la mano del fuego. Los reflejos se pueden condicionar a través de la asociación. Tres leyes de la conducta refleja que implican cambios en la respondiente: ley del umbral: existe un rango de intensidades, por debajo del cual no se presentará ninguna respuesta, y por

encima del cual siempre se presentará una respuesta. ley de intensidad y magnitud: al aumentar la intensidad del estímulo educidor aumenta la magnitud del

respondiente educido. ley de la latencia: al aumentar la intensidad de un estímulo educidor, disminuye el tiempo entre el principio del

estímulo educidor y el inicio de la respondiente. Algunos de los reflejos más primitivos (parte del equipamiento genético de los seres humanos recién nacidos) son: reflejo de búsqueda o implantación: al acariciar la mejilla de un recién nacido, éste gira su cabeza hacia ese

lado y succiona el pecho materno. reflejo de succión: el recién nacido chupa todo lo que toca su boca. reflejo prensil: al acariciar las palmas de las manos o plantas de los pies de un recién nacido, éste las cierra

firmemente. reflejo moro: frente al miedo, el recién nacido extiende brazos y piernas, arquea su espalda y extiende el cuello.

2. instinto: Pautas de Acción Fija (PAF) relación más compleja, en la que participan mayor nº de conexiones neuronales que en la conducta refleja, pero que, al igual que ésta, constituye una respuesta estereotipada específica de una especie. Son productos de una reacción, cuyas condiciones observables es necesario buscar en el organismo y en el medio. Ej.: instinto sexual, defensa de las crías, la curiosidad. Se caracteriza por: la secuencia estereotipada de conducta es realizada por todos los miembros de una especie en una situación

particular. se realiza correctamente, sin error, desde la primera vez. los instintos están guiados por un impulso, por un estado de desequilibrio que genera tensión, la que produce

el drive para la acción. la conducta instintiva responde a estímulos específicos que actúan como señales. se desarrolla en ausencia de los modos habituales del aprendizaje. es transmitido por herencia y no se basa en ninguna experiencia vivida. los instintos son automáticos y tienen una misión, bien definida. no se pueden condicionar

3. maduración: proceso que guía y limita la conducta de los Seres Humanos. forma en que la herencia sigue funcionando después del nacimiento, delimitando potencialidades a través de

una sucesión particular de etapas de desarrollo características de la especie. el crecimiento es el principal competidor del aprendizaje en términos de modificador de conductas si una sucesión conductual madura a pasos regulares, independiente de la práctica que se haya realizado

la conducta se ha desarrollado por maduración y no por aprendizaje. hay niños que pueden omitir pasos en el proceso madurativo, sin que por ello se altere la secuencia madurativa

ni su desarrollo posterior. 4. desarrollo: no es más que la interacción de madurez y aprendizaje.

cuando ocurre una modificación conductual que ha requerido de un piso de crecimiento para que el sujeto aprenda, se dice que ha alcanzado un cierto nivel de desarrollo.

el desarrollo posee áreas que son: - desarrollo físico - desarrollo cognitivo - desarrollo afectivo-social

por otro lado, el desarrollo humano se puede dividir en las siguientes etapas: - niñez (prenatal – neonatal – infancia temprana – edad preescolar – edad escolar) - edad juvenil o adolescencia

Page 5: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Psicología del Aprendizaje (como disciplina) y Aprendizaje (como fenómeno) (cont.) hay definiciones teóricas y fácticas:

- definiciones teóricas: intentan conocer la verdadera naturaleza del aprendizaje. Entre ellas están: fisiológicas intentan encontrar el sustrato neurológico o bioquímico de los mecanismos del aprendizaje. cognitivas enfatizan en los procesos mediacionales o intervinientes entre el estímulo y la respuesta.

- definiciones descriptivas u orientativas: no poseen un compromiso con una tradición psicológica específica. definen aprendizaje como la adquisición de conocimiento a través de la experiencia, sin matizar qué se entiende

por conocimiento o por experiencia. - definiciones fácticas u operacionales: relacionan el aprendizaje con acontecimientos observables en el mundo

físico. Ej: Kimble (1961) define aprendizaje como un cambio relativamente permanente en la potencialidad de la

conducta, que ocurre como resultado de la práctica forzada. esta definición es operacional ya que reconoce:

- variable independiente la práctica - variable dependiente cambios en la conducta - ambas son razonablemente observables y medibles - el aprendizaje sería la variable intercurrente (o interviniente) no observada, que conecta estos 2 conjuntos

de fenómenos observables.

El aprendizaje es un cambio relativamente permanente en la conducta, producto de la interacción del organismo con su medio ambiente, y que genera cambios a nivel del sistema nervioso central.

cambio de la conducta el comportamiento se modifica (se hace otra cosa) relativamente permanente se puede extinguir, se puede olvidar (pero no se puede desaprender) medio ambiente es todo lo que no es el sistema en referencia (el objeto de estudio); es fundamental para los

procesos de aprendizaje; no hay aprendizaje si no hay interacción con el ambiente. variable independiente el medio ambiente (el estímulo) variable dependiente la conducta

momentos en el desarrollo de la psicología del aprendizaje:

1er. momento (1910-1930) estudio del condicionamiento. - época en que el asociacionismo abarcaba la totalidad de los fenómenos psicológicos - período del conductismo clásico (1910 – 1930) - la psicología del aprendizaje era el estudio científico de procedimientos que producen modificaciones en la

conducta, y el análisis de los resultados que produce exponer a los organismos a esos procedimientos. - hoy se sabe que el condicionamiento es una forma limitada o especial de aprendizaje, aquel procedimiento que

muestra las características esenciales de otros aprendizajes más complejos. 2º momento (1930-1950) la psicología del aprendizaje estuvo caracterizada por la confrontación entre teoría,

métodos y contenidos. - era el área de la psicología encargada de la construcción de una teoría capaz de sistematizar los fenómenos y

leyes que regulan el aprendizaje. 3º momento (1960) la psicología del aprendizaje sufrió una importante crisis debido, entre otros, a la inclusión de

los procesos cognitivos mediacionales en el condicionamiento y los límites biológicos del aprendizaje. Años 70 se produce una cognitivización de la psicología del aprendizaje.

- este nuevo enfoque rechaza que el aprendizaje se exprese exclusivamente en términos conductuales. - el aprendizaje es considerado en términos de estructuras internas. - el interés prestado a los cambios conductuales se hará exclusivamente por el valor que posean como índices de

procesos internos. - el condicionamiento pasa de ser un proceso automático a ser un proceso integrado y transformado por

estructuras cognitivas.

El paradigma cognitivo cuestionó mucho de lo establecido hasta ese momento por la psicología del aprendizaje:

1. la relación de contigüidad que postulaba el condicionamiento como requisito para el condicionamiento o aprendizaje asociativo fue sustituido por la relación de contingencia entre estímulos. Desde esta perspectiva, el condicionamiento se caracteriza en términos de una relación causal global y no en una relación puntual de contigüidad (condicionamiento a estímulos compuestos).

2. el papel del reforzamiento como segundo requisito para el aprendizaje o como fortalecedor de conexiones E-R (el automoldeamiento que, utilizando un principio de condicionamiento clásico, logra instalar una operante).

3. el supuesto de la generalidad o universalidad de las leyes del aprendizaje estudiados en un número limitado de especies animales.

4. el supuesto de la pasividad del organismo

Page 6: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Psicología del Aprendizaje (como disciplina) y Aprendizaje (como fenómeno) (cont.)

Otro tema importante a considerar en la Psi del Aprendizaje las restricciones biológicas en el aprendizaje en los inicios de la psicología del aprendizaje, se optó por estudiar otras especies, basados en la creencia que ciertas

capacidades del aprendizaje eran comunes, por lo menos, a todos los vertebrados superiores. se mantenía la idea de un proceso o mecanismo general de aprendizaje, común a todas las especies y situaciones

(fundamentado en el principio de la continuidad biológica). ello llevo a un interés por el estudio comparativo de las capacidades del aprendizaje por un largo período. etólogos y psicólogos de orientación biológica comenzaron a afirmar que cada especie poseía capacidades de

aprendizaje adaptadas a las exigencias impuestas por su ambiente. las leyes del aprendizaje se mostraban determinadas por la conducta específica de la especie.

Algunos hallazgos: 1. el principio de equipotencialidad no existe para todas las especies:

no todos los estímulos y todas las respuestas son igualmente asociables (Ej: aversiones gustativas). los organismos nacen con ciertas tendencias innatas para asociar determinados estímulos con sus

consecuencias (especialmente si las consecuencias son vitales para los sujetos). 2. las respuestas de evitación (no recibir o alejarse de estímulos desagradables, aversivos o atemorizantes), tal como

eran estudiadas en laboratorios, no eran operantes simples y arbitrarios. para que fueran eficaces, se debía elegir entre las que formaban parte del repertorio defensivo natural,

específico de la especie. la respuesta de evitación debía ser una respuesta para la cual el organismo estuviera preparado.

3. en el condicionamiento instrumental (operante), las respuestas varían en cuanto a su capacidad de asociación con diversos reforzadores. Ej: las palomas están preparadas para picotear (teclas) y así obtener comida, incluso cuando no exista

contingencia entre picoteo y comida. por lo tanto, la biología colocaba límites a cierto tipo de condicionamientos especializaciones adaptativas. las leyes del aprendizaje debían considerar los factores biológicos. las distintas asociaciones dependen de la especie animal y de los estímulos y reforzadores utilizados.

En este contexto, el campo de la Psicología del Aprendizaje considera: el estudio de las formas de aprendizaje (no sólo condicionamiento) de una especie determinada. toma en cuenta las restricciones que impone la biología (formas de aprendizaje que le son propias) incluye las variables cognitivas (en relación con la aceptación de perspectivas teóricas y metodológicas nuevas. considera la participación activa del sujeto en el proceso de aprendizaje.

Por lo tanto, considerando todo lo anterior podemos definir para efectos de este curso: Psicología del Aprendizaje estudio científico de todos los procedimientos a través de los cuales se adquiere,

mantiene y/o modifica una conducta, considerando los límites que impone la especie, así como las variables mediacionales que pudieran participar en ellos.

Aprendizaje cambio relativamente permanente en la potencialidad de la conducta, el que ocurre como resultado

de la experiencia del organismo en relación con aspectos de su ambiente. Este cambio no puede ser explicado con fundamentos en las tendencias innatas de respuesta, la maduración o estados del organismo, sean estos de carácter transitorio (drogas, fatiga), o permanente (lesiones cerebrales).

lo anterior implica:

1. el aprendizaje es un cambio implica la adquisición o debilitamiento de cualquier pauta de respuesta, sea ésta conveniente o inconveniente.

2. es relativamente permanente los cambios producidos en la respuesta, en cualquier dirección, no se pierden fácilmente con el descanso o falta de práctica.

3. en la potencialidad de la conducta a través del aprendizaje el organismo adquiere la capacidad de ejecutar ciertos actos, aún cuando a veces esta capacidad puede permanecer latente, y su expresión en el cambio de la conducta no sea inmediata.

4. ocurre como resultado de la experiencia efecto de la estimulación ambiental sobre el organismo. 5. excluye las modificaciones conductuales producto de conducta refleja, tropismos, instintos o cualquier conducta

específica de la especie.

Page 7: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 2: Procesos Preasociativos: Habituación

Introducción en su interacción con el medio ambiente, los diversos organismos realizan constantes ajustes para adaptarse a los

cambios que se manifiestan en éste. para adaptarse a estos cambios, el ser humano utiliza su experiencia de modo de responder a tales modificaciones

responde de acuerdo con lo que ha aprendido a través de la interacción permanente que ha mantenido entre sí y su ambiente físico y social.

el aprendizaje es el proceso mediante el cual la conducta, o la potencialidad de la conducta se modifica a causa de la experiencia.

procesos preasociativos aluden a un fenómeno intermedio entre los cambios conductuales, producto de tendencias innatas de conducta y el aprendizaje por asociación propiamente tal.

Procesos Preasociativos la conducta refleja no es invariable, sino que muestra una considerable capacidad de modificación. una operación tan simple como la repetición del estímulo elicitante muestra que la conducta resultante puede modificarse,

disminuyendo o aumentando su intensidad. Proceso de habituación cuando la repetición del estímulo produce una disminución en la tendencia de responder. Proceso de sensibilización cuando la repetición del estímulo produce un aumento en la tendencia a responder. el estudio de los fenómenos de habituación y sensibilización entra en el ámbito de estudio de la psicología del aprendizaje. estos procesos son anteriores al aprendizaje asociativo no se produce asociación entre estímulos o

representaciones de estímulos son procesos preasociativos o no-asociativos (una modalidad del proceso de sensibilización denominado pseudocondicionamiento, se puede considerar como precursor del condicionamiento, que es un proceso asociativo).

el estudio de la habituación y de su interacción con sensibilización, ha producido un gran desarrollo teórico y experimental la investigación de las bases biológicas de la habituación y la sensibilización abre un camino prometedor para el conocimiento de las bases biológicas de aprendizajes superiores.

los hallazgos obtenidos en el estudio de estos procesos se están aplicando exitosamente en áreas tan dispares como la psicología de la educación, la psicopatología y la modificación de conducta, entre otras.

Procesos Decrementales Habituación habituación disminución en la fuerza de una respuesta tras la presentación repetida del estímulo que provoca dicha

respuesta. habituación proceso de aprendizaje preasociativo de carácter negativo.

- aprendizaje porque se produce un cambio en la conducta como resultado de la experiencia (la repetición del estímulo).

- preasociativo porque no hay adquisición o establecimiento de ningún tipo de asociación (se presenta un sólo estímulo).

- de carácter negativo el organismo no aumenta su repertorio conductual, sino que aprende a no hacer algo: aprende a evitar la reiteración de respuestas que carecen de valor adaptativo o funcional.

ejemplos las personas que viven cerca de aeropuertos, paso de trenes, posta central, etc.; ruidos de alarmas de autos, la violencia.

la habituación y la sensibilización pueden ser definidas en dos niveles: 1. como un proceso hipotético, o inferido, al cual se recurre para explicar los cambios conductuales (disminución en la

fuerza, o frecuencia de la respuesta). 2. como un fenómeno definido operacionalmente, en términos de estímulo y respuesta. Se hace referencia a las

operaciones que deben efectuarse, así como al cambio conductual resultante de dichas operaciones.

Valor Adaptativo de la Habituación los individuos y sus organismos están expuestos sin cesar a una multitud de estímulos y es evidente que no podemos

responder a todos ellos, de lo contrario, nuestra conducta sería desorganizada, caótica y, en último extremo, inviable. los procesos de habituación y de sensibilización contribuyen a organizar y dirigir la conducta, seleccionando los

estímulos a los que finalmente responderemos. los procesos de habituación ayudan a reducir la reactividad a los estímulos superfluos supone:

- un enorme ahorro de energía. - le permite al organismo reaccionar con mayor eficacia ante estímulos verdaderamente relevantes.

el proceso de habituación es tan fundamental para la adaptación del organismo al medio, que se da prácticamente en todos los sistemas de respuesta y en todo el reino animal, desde los protozoos hasta los seres humanos.

Habituación, Adaptación Sensorial y Fatiga no siempre que se detecta una disminución de la respuesta tras la repetición del estímulo que la suscita debe atribuirse a la

habituación, ya que pueden intervenir otros mecanismos diferentes que producen este mismo efecto conductual. Esto es lo que ocurre en los fenómenos de adaptación sensorial y fatiga.

adaptación sensorial disminución de la respuesta ante el estímulo elicitante porque los órganos receptores sensoriales se vuelven parcial y transitoriamente insensibles a la estimulación (ej.: dejar de sentir un olor muy intenso y persistente).

Page 8: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Habituación, Adaptación Sensorial y Fatiga (cont.) fatiga pérdida de intensidad o desaparición de la respuesta ante un estímulo elicitante debido a que los músculos que

intervienen en su producción no pueden reaccionar debido al cansancio. la habituación es distinta a la adaptación sensorial y a la fatiga.

- en la adaptación sensorial la respuesta disminuye o desaparece, porque no se produce impulso nervioso en los receptores sensoriales o este impulso es muy débil.

- en la fatiga la respuesta disminuye o desaparece porque los músculos son incapaces de responder. - en la habituación el organismo disminuye su respuesta, aunque sea perfectamente capaz de percibir el estímulo

y de efectuar los movimientos musculares requeridos por la respuesta.

Habituación a Corto y a Largo Plazo en la habituación hay 2 dos tipos de efectos temporales bien diferenciados:

- habituación a corto plazo la habituación que se produce cuando se repite con mucha frecuencia el estímulo elicitante, utilizando intervalos temporales muy breves este efecto de la habituación se disipa rápidamente, cuando se deja de presentar durante un cierto tiempo el estímulo habituador.

- habituación a largo plazo el efecto puede persistir durante muchos días este tipo de habituación se produciría fundamentalmente cuando se dejan intervalos temporales muy largos entre las sucesivas presentaciones del estímulo habituador.

estos 2 tipos de habituación han sido muy bien descritos en un experimento sobre la habituación de la respuesta de sobresalto en ratas efectuado por Leaton en 1976

Medida de la Habituación A grandes rasgos, las medidas de la habituación de la respuesta se pueden dividir en 2 grupos:

1. medidas de cambio absoluto: una es el número de presentaciones del estímulo que son necesarias para alcanzar algún criterio de

habituación. otra es la magnitud media de la respuesta, a lo largo de una serie de ensayos de habituación. quizás la técnica más utilizada para evaluar la habituación consiste en analizar la magnitud de la

respuesta, a lo largo de una serie de ensayos mediante un análisis de la varianza este método no suministra información sobre la habituación en cada individuo, pero proporciona resultados acerca de los efectos del tratamiento sobre el cambio en la magnitud de la respuesta, a lo largo de las presentaciones repetidas del estímulo.

algunos autores han empleado una medida basada en la diferencia en amplitud de respuesta entre el primer y el último ensayo o bloques de ensayos.

otros han utilizado el nivel final de respuesta (tras los ensayos de habituación) después de establecer que no había diferencias entre los grupos en la fase de pre-habituación.

2. medidas de cambio relativo: son calculadas como la razón del nivel de respuesta respecto a su nivel inicial, después de un número fijo

de ensayos. ejemplo si la primera presentación de un ruido de 100 decibeles suscita una respuesta electrodérmica

de 0,8 micromhos, y después de 10 ensayos se elicita una respuesta de electodérmica de 0,4 micromhos, la habituación relativa detectada será de 0,5 micromhos, resultante al dividir 0,4 micromhos finales/0,8 micromhos iniciales.

necesariamente, el mismo cambio proporcional (o relativo) produce un cambio absoluto mayor en sujetos con niveles iniciales de respuesta más altos que para aquellos sujetos con niveles más bajos.

Propiedades de la Habituación 1. Especificidad Estimular

a. la habituación ante un estímulo parece depender de las características específicas del estímulo un cambio en una característica del estímulo dará lugar a la ausencia de habituación la disminución de la respuesta ocurre sólo ante el estímulo habituador o ante estímulos muy similares a éste a medida que se modifican las características del estímulo habituador, va disminuyendo la habituación.

2. Generalización del Estímulo a. la habituación de la respuesta, que inicialmente ocurre ante un estímulo específico, se extiende a otros semejantes. b. generalización la transferencia de la habituación desde un estímulo a otros estímulos nuevos, pero

similares. c. esta propiedad resulta altamente adaptativa, porque la información registrada se vuelve útil para el futuro ante la

presencia de estímulos similares este aprendizaje se transfiere a otras situaciones similares que demandan un mismo tipo de respuesta.

d. cuanto mayor sea la especificidad ante un estímulo, menor será la generalización hacia otros similares y viceversa.

3. Habituación “bajo cero” a. los efectos del entrenamiento en habituación pueden proseguir aun cuando la respuesta haya

desaparecido, o bien haya alcanzado un nivel estable de habituación el aprendizaje puede ocurrir aunque no se detecte cambio en la conducta observable.

b. se denominó a este fenómeno “bajo cero”, porque ocurre cuando, al presentar el estímulo repetidamente, la respuesta no es observable por haber alcanzado un nivel completo de habituación el nivel “cero” de respuesta dependerá del tipo de medida de respuesta que se utilice.

Page 9: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Propiedades de la Habituación (cont.) 4. Recuperación Espontánea

a. si tras la habituación de la respuesta se omite durante algún tiempo el estímulo habituador, la respuesta tiende a aparecer al presentar de nuevo dicho estímulo su significado sería equivalente al olvido.

b. Se retiene parte del aprendizaje inicial. 5. Re-aprendizaje

a. cuando se efectúan series repetidas de entrenamiento en habituación y recuperación espontánea, la habituación de la respuesta se produce cada vez más rápidamente.

6. Deshabituación a. consiste en que una respuesta, ya habituada, vuelve a aparecer si se presenta un estímulo nuevo o intenso,

al mismo tiempo o inmediatamente antes que el estímulo habituador. b. la inclusión de un estímulo nuevo o intenso, una vez habituada la respuesta, restablece inmediatamente en el

estímulo habituador su capacidad original de elicitar la respuesta. 7. Curso Temporal de la Habituación

a. Durante el entrenamiento en habituación, las disminuciones de la respuesta de ensayo a ensayo son más amplias al principio, pero posteriormente se vuelven más pequeños conforme avanza el entrenamiento.

Parámetros de la Habituación 1. Intensidad del Estímulo

a. la habituación de la respuesta está inversamente relacionada con la intensidad del estímulo cuanto más débil es el estímulo, más rápida y/o más pronunciada es la habituación de la respuesta.

b. los estímulos fuertes puede que no produzcan habituación significativa. 2. Intervalo Estimular

a. el tiempo que transcurre entre las presentaciones sucesivas del estímulo habituante constituye, junto con la intensidad del estímulo, otro de los parámetros más importantes de la habituación su efecto es bastante complejo, porque el resultado final depende del intervalo entre presentaciones del estímulo durante el entrenamiento de habituación, además del espaciamiento de los estímulos durante la fase de prueba.

b. más rápida y más pronunciada será la habituación, siempre que el intervalo se mantenga constante en todas las fases.

3. Número de Presentaciones del Estímulo Habituante a. mientras más veces se presente el estímulo habituante, mayor será la tasa de habituación conseguida

cuanto mayor sea el número de veces que el organismo es expuesto al estímulo habituante, mayor será el tiempo requerido para la desaparición de la habituación.

4. Complejidad y Duración del Estímulo a. la duración del estímulo no parece afectar la habituación sin embargo, existe evidencia de que cuando

aumenta la complejidad del estímulo, la habituación a estímulos de corta duración es más lenta que ante aquellos de mayor duración.

b. se observa una cierta tendencia que apunta a que, mientras mayor sea la complejidad, más lenta será la habituación.

5. Valor Señalizador a. la manipulación del valor de la señal mediante instrucciones para atender especialmente, para ignorar un estímulo,

o para contar estímulos, ejerce sólo un efecto débil sobre la amplitud de las primeras respuestas, pero no en las medidas de la habituación.

b. cuanto más natural sea un estímulo, más lenta será la habituación y con más facilidad se recuperará la respuesta, en comparación con la respuesta suscitada por un estímulo artificial o poco natural.

Resumen

- habituación - aprendizaje no asociativo

- sensibilización

- Aprendizaje - condicionamiento clásico

- aprendizaje asociativo - condicionamiento instrumental u operante

- aprendizaje social (Bandura) - vicario el organismo está dotado de una capacidad de aprender que permite reducir la capacidad de escuchar esta gran

estimulación ambiental y nos dota de una capacidad de aprender y poder concentrarnos en diferentes actividades que estemos llevando a cabo.

los tipos de aprendizaje más simples son los aprendizajes no asociativos.

Page 10: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 3: Procesos Preasociativos: Sensibilización Procesos incrementales Sensibilización sensibilización incremento más o menos permanente de una reacción innata por efecto de su estimulación

repetida. este proceso produce el mismo efecto sobre la respuesta que la habituación, pero en sentido contrario en la habituación

de disminución de la respuesta y en la sensibilización de incremento la similitud entre ambos procesos está dada por el hecho que ambos fenómenos aparecen frente a la repetición de un estímulo elicitante.

sensibilización proceso de aprendizaje preasociativo de carácter positivo. - aprendizaje porque se produce un cambio en la conducta como resultado de la experiencia (la repetición del

estímulo). - preasociativo porque no se efectúa ningún tipo de asociación entre estímulos. - de carácter positivo porque se produce un enriquecimiento del comportamiento (aumento en la frecuencia y/o

magnitud de la respuesta) como consecuencia de la experiencia (repetición del estímulo).

Valor Adaptativo de la Sensibilización cuando se presenta un estímulo suficientemente intenso o significativo, lo más beneficioso para el organismo es responder

rápida y potentemente, y si en las repeticiones posteriores se aprecia que dicho estímulo no resulta perjudicial, entonces la respuesta irá disminuyendo progresivamente. De este modo, el contacto inicial con estímulos nocivos, o potencialmente peligrosos, prepara (sensibiliza) al organismo para responder con mayor eficacia ante las presentaciones futuras de dicho estímulo.

ejemplo un soldado que se encuentra en el frente de batalla en un principio, como el ruido lejano de las bombas no iba seguido de consecuencias perjudiciales para él, lo más adaptativo era no responder, lo que le permitía llevar una vida más relajada e, incluso, poder dormir tranquilo. Posteriormente, cuando percibe el enorme peligro de las bombas reacciona cada vez con mayor potencia y rapidez, ya que ello le proporcionará más posibilidades de sobrevivir.

Tipos de Sensabilización sensibilización Incremental:

- en la medida que se repite el estímulo elicitante, la reacción innata experimenta un aumento en su frecuencia y magnitud, la que va acompañada de una disminución de su latencia umbral.

pseudocondicionamiento: - la sensibilización también puede manifestarse en forma de nuevas respuestas ante estímulos que no están

previamente preparados para elicitarlas o producirlas (estímulos neutros), sin que se hayan producido asociaciones entre estos estímulos y los estímulos que de verdad pueden producir estas respuestas.

- como las respuestas que producen los estímulos neutros son muy parecidas a las respuestas condicionadas, fueron denominadas respuestas pseudocondicionadas y el proceso responsable, pseudocondicionamiento.

- el pseudocondicionamiento requiere la presencia de dos estímulos: un estímulo previamente neutral, que inicialmente no produce la respuesta que más tarde va a provocar, y un estímulo, con valor motivacional aversivo, que elicita la respuesta que posteriormente, después de presentarlo repetidas veces, va a ser también producida por el estímulo previamente neutro, aunque no se hayan efectuado operaciones de emparejamiento entre ambos estímulos.

- esta respuesta es calificada como pseudocondicionada, porque no se debe al establecimiento de asociaciones entre ambos estímulos.

Propiedades de la Sensibilización 1. Curso temporal de la sensibilización

a. la teoría dual sostiene que la sensibilización tiene efectos a corto plazo, porque aparece básicamente durante las primeras presentaciones del estímulo y decae en los ensayos siguientes.

b. en cambio, la habituación, tendría efectos a más largo plazo, siendo más duradera que la sensibilización. 2. Especificidad y generalización de la sensibilización

a. la sensibilización es menos específica para el estímulo que la habituación la habituación refleja cambios en la respuesta innata ante un estímulo específico, mientras que la sensibilización constituye un incremento en la tendencia a responder ante muchos estímulos.

b. cuando un organismo llega a sensibilizarse ante un estímulo, su reactividad aumentará para una amplia variedad de otros estímulos completamente diferentes.

3. Modulación condicionada facilitadota a. se refiere al incremento en la respuesta suscitada por el estímulo sensibilizador, cuando éste se

administra en presencia de un EC que ha sido previamente asociado con un EI de carácter aversivo. b. puesto que el EC, por vía del condicionamiento clásico, ha adquirido las propiedades motivacionales y

sensibilizantes del EI, parece lógico pensar que la presentación del EC tendrá un efecto sensibilizante sobre el organismo.

Page 11: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Parámetros de la Sensibilización la determinación de las condiciones bajo las cuales la presentación repetida de un estímulo elicitante puede producir

incremento o disminución de la respuesta elicitada, constituye uno de los objetivos prioritarios en el estudio de estos procesos, tanto por razones prácticas, como para evaluar el potencial predictivo de las diversas teorías de la habituación y sensibilización.

1. Intensidad del Estímulo la cantidad y la duración de la sensibilización están directamente relacionadas con la intensidad del

estímulo además, en altas intensidades, la sensibilización está directamente relacionada con la frecuencia del estímulo.

2. Intervalo Estimular el intervalo entre las presentaciones del estímulo determina su frecuencia de presentación la frecuencia

de un estímulo hace referencia al número de veces en que se presenta dicho estímulo durante un tiempo determinado.

considerando que la presentación repetida del estímulo elicitante puede activar tanto los procesos de sensibilización como de habituación, a menudo será difícil predecir cuál será el efecto conductual de los cambios de intensidad y frecuencia del estímulo para una situación concreta.

Teorías de Habituación y Sensibilización de acuerdo con las teorías E-R (estímulo-respuesta), la habituación se debería a un descenso en la transmisión en algún

punto en la vía que conecta el estímulo y la respuesta. la teoría de la depresión sináptica de Kandel, la teoría de los dos procesos de Groves y Thompson y la teoría del

proceso oponente, comparten este punto de vista. 1. Teoría de la Depresión Sináptica:

- la habituación se produce porque la repetición del estímulo elicitante produce un declinamiento en la eficacia de transmisión a lo largo de la vía que conecta el estímulo con la respuesta.

- en el lado opuesto, la teoría asume que la habituación puede ser afectada por un proceso de sensibilización cuando un estímulo nuevo y potente es presentado inmediatamente antes que el estímulo habituado.

2. Teoría Dual Groves y Thompson - intenta explicar los efectos que la repetición de un estímulo ejerce sobre la conducta que elicita. - postula la existencia de dos variables no observables, o constructos hipotéticos, que interactúan para determinar el

nivel final de respuesta ante un estímulo que se repite. - postula que todo estímulo que provoca una respuesta conductual tiene dos propiedades neurofisiológicas

distintas: elicita en una vía específica una respuesta, y afecta al “estado” del organismo.

- los procesos de habituación ocurren en el “sistema E-R” el sistema E-R es la vía más corta, a través del sistema nervioso central, que recorre el impulso nervioso desde que es suscitado por el estímulo hasta que se produce la respuesta (dicha vía vendría a equivaler al “arco reflejo”).

- los procesos de sensibilización ocurren en el “sistema de estado” el sistema de estado se refiere al nivel general de excitación, de activación, de arousal, o de tendencia a responder del organismo; el sistema de estado no es una entidad o constructo simple, sino un conjunto de diversos factores que influyen sobre la excitabilidad general o tendencia a responder del organismo.

- el sistema de estado determina la predisposición del organismo a responder. - el sistema E-R le capacita para dar respuestas específicas ante estímulos concretos. - estos dos procesos, la vía E-R y el sistema de estado, no son excluyentes, sino que deben interactuar en algún

momento anterior a la vía nerviosa común que produce respuesta. 3. Teoría del Proceso Oponente Solomon y colab.

- intenta explicar un amplio número de reacciones emocionales en organismos superiores intactos explica qué pasa con las respuestas afectivas que tenemos frente a un estímulo.

- Patrón Temporal de la Respuesta Emocional: el punto de partida de esta formulación se encuentra en la descripción del patrón temporal que exhibe

una respuesta emocional al ser elicitada por un estímulo. cualquier estímulo incondicionado (EI), o cualquier reforzador operante, es un suceso complejo, con

diversas propiedades emocionales, sensoriales y conductuales.

antes de la habituación después de la habituación

esta teoría explica la adicción a los deportes extremos, a las drogas, y las conductas adictivas en general (para evitar los

síntomas de abstinencia).

Page 12: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 4

PONER DEFINICIONES EI; RI; etc. de la clase 3

Teoría del proceso Oponente el proceso “a” y el proceso “b” esta teoría postula que, como el ser humano siempre busca la homeostasis, en cada reacción frente a un hecho

estimular (proceso a), se gatilla un proceso oponente (proceso b) para compensarlo y lograr el equilibrio. la presentación de un estímulo elicitante de emoción suscita inicialmente lo que denominaron proceso primario o “proceso

a”, que es el responsable de la respuesta emocional inicial (reacción afectiva primaria). el proceso “a”, activa un proceso oponente, proceso “b”, que origina la reacción emocional contraria, que se

opone y suprime la fuerza afectiva del proceso a. la presentación del estímulo activador de la emoción (en el dibujo, la presentación del estímulo comienza en el área gris)

suscita de inmediato una reacción emocional intensa, del mismo signo que el valor afectivo del estímulo, que rápidamente alcanza su punto máximo (La Reacción Afectiva Primaria). Esta reacción intensa va seguida de una fase de adaptación durante la cual la respuesta emocional decae gradualmente hasta alcanzar un nivel de equilibrio en el que se estabiliza la intensidad de la reacción emocional suscitada por el estímulo (Nivel Estable señalado en el dibujo). Cuando se retira el estímulo (donde termina el área gris), el estado emocional se transforma rápidamente en una post-reacción afectiva primaria, decae pasando por debajo del nivel de línea base en poco tiempo, luego, lentamente el estado emocional del sujeto retorna a la línea base original.

antes de la habituación después de la habituación

en contraste con los procesos “a”, se piensa que los procesos “b” son lentos y están cargados de inercia, apareciendo

así con 3 características distintivas: 1. presentan relativamente una larga latencia o tiempo de reacción. 2. son lentos para establecerse en su máxima amplitud. 3. son lentos para decaer después de que el estímulo haya desaparecido y el proceso a haya cesado.

puesto que el proceso “b” es un proceso oponente, debe tener una cualidad afectiva opuesta a la del proceso “a”. cuando el estímulo se presenta por primera vez, el proceso a se desencadena inmediatamente, lo que conlleva que la

reacción emocional primaria alcance su máximo rápidamente a continuación se activa el proceso b y empieza a contrarrestar el efecto del proceso a, lo que se traduce en una disminución de la intensidad de la reacción emocional primaria.

una vez que los procesos a y b, han desplegado su máxima intensidad durante la presentación del estímulo, la reacción emocional observable presenta una intensidad constante debido a la ausencia de cambios en la fuerza de los dos procesos antagónicos. Cuando el estímulo se retira, el proceso a se diluye inmediatamente, en cambio, el proceso b persiste todavía durante un tiempo y no tiene ahora nada a que oponerse de este modo, las respuestas emocionales suscitadas por el proceso oponente se manifiestan por primera vez normalmente, estas emociones mostrarán unas características contrarias a las que se observan durante la presencia del estímulo.

postula la existencia de 3 elementos: - el proceso b inicialmente es menos intenso que el proceso a. - el proceso b se intensifica más lentamente que el proceso a, pero alcanza una mayor intensidad. - cuando desaparece el hecho estimular, la intensidad del proceso b disminuye más lentamente que la del proceso

a. El Efecto de Estimulación Repetida la característica esencial de la teoría del proceso oponente es su predicción sobre cómo cambia el patrón de una

respuesta emocional con las presentaciones repetidas del mismo estímulo. la teoría establece que con exposiciones repetidas de un estímulo, la reacción emocional primaria exhibe una especie de

habituación, mientras que al mismo tiempo hay un marcado incremento en el tamaño y la duración de la post-reacción. el proceso a no se altera con la presentación repetida del estímulo. en cambio, el proceso b se fortalece con el uso y se debilita con el desuso. con estimulaciones repetidas, el proceso b surge más rápidamente, aumenta su fuerza máxima y desciende más

lentamente cuando cesa el estímulo.

Page 13: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 4: Procedimientos de Aprendizaje: Condicionamiento Clásico

Condicionamiento Clásico el condicionamiento clásico es uno de los procesos de aprendizaje estudiados y teorizados más tempranamente en

psicología. sus aplicaciones surgieron hace largo tiempo y en la actualidad abarcan múltiples problemas médicos y comportamentales,

los que van desde las fobias hasta el abuso de drogas. el condicionamiento clásico:

- es un método ideado por Ivan Pavlov mediante el cual se asocia un EC con otro EI. - en este procedimiento se presentan 2 estímulos con estrecha proximidad temporal. - el primero, EI (estímulo incondicionado) (Ej: comida), produce un reflejo. - después de un cierto número de ensayos, el segundo estímulo, EC (estímulo condicionado) (Ej: campana), también

adquiere la propiedad de producir un reflejo semejante.

Paradigma del Condicionamiento Clásico

Estímulo incondicionado (EI) es el estímulo que provoca una respuesta de un modo natural, sin ningún tipo de

aprendizaje previo. Puede ser tanto apetitivo como aversivo (Ej.: la comida). Repuesta incondicionada (RI) es la respuesta que se da ante el estímulo incondicionado cuando no ha habido

ningún tipo de adiestramiento o instrucción. Sería la respuesta natural (Ej.: la salivación o secreción de jugos gástricos). La RI no es necesariamente una respuesta no aprendida o refleja al EI

Estímulo neutro es aquel que, al principio del experimento, no guarda relación alguna ni con la respuesta incondicionada ni con el estímulo incondicionado (Ej.: el sonido de la campanilla); no tiene ningún efecto sobre la respuesta esperada antes del condicionamiento.

Estímulo condicionado (EC) es el estímulo neutro, una vez que el experimento se ha repetido un número suficiente de veces, y se ha logrado que ante el estímulo que en principio era neutro, el organismo responda con la respuesta incondicionada.

Respuesta condicionada (RC) es la respuesta que, tras un número suficiente de experimentos, se recibe ante el estímulo condicionado, como resultado de aparear el EC y el EI.

N número de ensayos. el condicionamiento clásico también puede ser entendido como un procedimiento por el cual los organismos pueden

detectar y aprender acerca de la relación predictiva entre señales y eventos importantes. El EC señala al sujeto la forma de prepararse para recibir el evento predecible.

EI RI N (EI+EC) RI EC RC

EC (campana) EI (comida) salivación (RI) salivación (RI)

Procesos básicos del Condicionamiento Clásico 1. Adquisición proceso por el cual la RC incrementa de forma gradual mediante la presentación del EC y del EI

proceso que aumenta la fuerza de la RC. 2. Extinción proceso por el que la RC disminuye como consecuencia de la presentación repetida del EC sin presentación

del EI, reduciendo gradualmente la RC, la que termina por desaparecer requiere de una fase previa de condicionamiento (diferencia esencial con otros procesos en los que también disminuye la respuesta).

3. Recuperación espontánea después de un período de extinción, la RC recupera su fuerza de forma parcial o completa con el paso del tiempo, al volver a presentar el EC para que este fenómeno aparezca después de la extinción y antes de volver a presentar el EC, se debe dejar un período de descanso este fenómeno prueba que en la fase de extinción no desaparece por completo la asociación entre el EC y el EI.

4. Generalización proceso en que la RC queda conectada con otros estímulos similares al EC, sin necesidad de que éstos hayan sido emparejados con el EI la RC, en el proceso de generalización, nunca llega a alcanzar el nivel de la RC ante el EC original.

5. Discriminación complementaria al proceso de generalización, debido a que se eliminan las respuestas ante otros estímulos que se habían producido con dicho fenómeno, lo que mantiene sólo la RC ante el EC original.

6. Inhibición proceso por el cual la RC disminuye. Existen variadas formas de inhibición: inhibición externa es el paso en que la RC desaparece debido a la presentación de un estímulo nuevo que

aparece durante la fase de adquisición. inhibición condicionada se refiere al proceso en que el EC se convierte en un estímulo inhibitorio y, por lo

tanto, no aparece la RC. inhibición latente es la preexposición al EC, lo que dificultará el condicionamiento posterior, cuando se

empareje este EC con el EI. 7. Desinhibición mediante este proceso, la RC recupera parte de su fuerza debido a la presentación de un estímulo

nuevo durante la fase de extinción, por lo tanto, la presencia de un estímulo novedoso altera la extinción de la RC. 8. Relación Temporal EC-EI se refiere a cómo se presentan estos 2 estímulos, si juntos o separados, y cuál de los 2 se

presenta primero en un condicionamiento clásico tradicional el EC va antes que el EI.

Page 14: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Modalidades Experimentales se puede clasificar los distintos procedimientos para estudiar el condicionamiento clásico teniendo en cuenta:

- la significación motivacional del EI. - la naturaleza interna o externa de los estímulos. - la relación entre el EC y el EI.

la significación motivacional del EI atendiendo al carácter motivacional del EI, se puede distinguir entre estímulos apetitivos, aversivos y neutros.

- apetitivo positivo, de recompensa. condicionamiento salivar en perros

EC estímulos de tipo auditivo como el sonido de una campana, timbre, etc. EI distintos tipos de comida. RI salivación. RC la medida de la RC ha sido la cantidad de saliva secretada.

automoldeamiento (auto-shaping) porque aparentemente el animal moldea su propia conducta. este tipo de condicionamiento ha sido ampliamente discutido, puesto que implica respuestas

motoras de carácter direccional, que se incluyen dentro de las respuestas voluntarias, discutiéndose si se trata de una forma de condicionamiento clásico o de condicionamiento operante.

experimento de Brown y Jenkins utilizaron un procedimiento de condicionamiento clásico e instauraron una respuesta operante en las palomas.

EC la iluminación del disco. EI presentación de la comida. RC picoteo del disco (no la respuesta de salivación).

- aversivo negativo, de defensa, tiene propiedades negativas. EI descarga eléctrica. RI flexión del miembro que recibe la descarga (defensa). EC luz el aversivo es más resistente a la extinción que el apetitivo en algunos casos, se consigue en un solo

ensayo. en esta clase de condicionamiento aparecen una serie de cambios vegetativos en el organismo que se

pueden medir como RC (defensiva), tasa cardiaca, respiración, etc. condicionamiento aversivo gustativo:

EC solución con sabor a sacarina (un alimento preferido por las ratas). EI radiaciones gamma que producían malestares como mareos y náuseas. se observó una clara aversión a la sacarina, debido a que las ratas habían asociado el malestar

posterior a las radiaciones con el sabor de la sacarina. el aprendizaje de aversión al sabor cuestiona la necesidad de contigüidad en el condicionamiento

clásico, ya que el EC (sabor) y el EI (estímulos propioceptivos de malestar), pueden estar separados por varias horas; sin embargo, igual ocurre aprendizaje, es decir, hay condicionamiento clásico.

características: las aversiones gustativas se suelen adquirir en un único ensayo, siendo difícil su extinción

lo mismo ocurre en el condicionamiento del miedo. el intervalo entre el EC (sabor) y el EI (malestar) es de, incluso, varias horas. la relación de pertenencia entre estímulos hay pares de estímulos que son más

fácilmente asociables entre sí, o bien, qué estímulos específicos se asocian con ciertos estímulos específicos (ej.: estímulos gustativos se relacionan mejor con los estímulos interoceptivos de malestar gástrico que con estímulos exteroceptivos visuales o auditivos).

la medida del condicionamiento se efectúa sobre una conducta operante (ej.: beber agua azucarada) y no sobre la conducta resultante del condicionamiento clásico o RC, que son las náuseas o vómitos que tiene el animal el aprendizaje de aversión al sabor desempeña un papel esencial en la selección de la comida, puesto que evita la ingestión de alimentos tóxicos.

teorías que tratan de explicar el condicionamiento aversivo gustativo: Teoría de la Interferencia Concurrente Revusky (1971)

la asociación entre estímulos ocurre sólo en el caso que no existan otros estímulos presentes durante la demora, los que impedirían o dificultarían la asociación.

si la asociación no se produce, es por exceso de información. la proximidad temporal es uno de los factores importantes del condicionamiento: el EC

más cercano al EI es el que produce la RC. en este condicionamiento es poco probable que un animal consuma otro alimento durante

horas, por tanto, se produce el aprendizaje con una larga demora, producto de la ausencia de interferencia concurrente.

Teoría del Aprendizaje de Seguridad Chalet y Rozin (1971) todo organismo sometido a este tipo de experimentos aprende a alcanzar un estado de

seguridad aprendida. si un animal, después de ingerir un alimento tiene malestar, desarrolla aversión a ese

alimento. la seguridad adquirida le permite ingerir aquellos alimentos que aumentan su

supervivencia y rechazará alimentos nocivos.

Page 15: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Modalidades Experimentales (cont.) - neutral

condicionamiento de orden superior el condicionamiento de orden superior está formado por condicionamientos de 2° orden, 3° orden,

etc. en la fase de condicionamiento de 1er orden, el primitivo estímulo neutro se empareja con un EI,

convirtiéndose en un EC1.

- Fase 1: EC1 EI RI y comienza a aprenderse la RC - Fase 2: EC1 EC2 está la RC, que se da frente al EC1 - Fase 3 (testeo): EC2 aparece la RC frente a este estímulo que no se ha pareado directamente con un EI

en el de 2° orden (fase 2), el EC1 ocupa el lugar del EI, por lo que el EC1 sirve de refuerzo a un

nuevo EC2 de 2° orden en esta fase de condicionamiento de 2° el nuevo EC, EC2 (sonido), se asocia con el EC1 (luz) que está actuando de EI.

el emparejamiento del EC1 más el EC2 es suficiente para que el EC2 adquiera las propiedades motivacionales y elicitadoras semejantes a las del EC1, provocando una RC2 similar a la RC1, pero de menor magnitud e intensidad y menos persistente.

precondicionamiento sensorial es un tipo de condicionamiento en 4 fases. Fase 1 se asocian 2 estímulos neutros -aunque no estén condicionados aún, los

denominaremos EC- (EC1 y EC2), éstos son biológicamente débiles, sólo provocan respuesta de orientación.

Fase 2 se empareja uno de estos estímulos (EC2) con un EI. Fase 3 se presenta el EC2 para medir el condicionamiento normal y esperable. Fase 4 se presenta el EC1 que sólo se utilizó en la Fase 1 para observar si también aparece la

RC. Este es el testeo del pre-condicionamiento sensorial, propiamente tal.

- Fase 1 - Precondicionamiento: EC1 EC2 no hay RI - Fase 2 - Condicionamiento Clásico: EC2 EI hay RI y se aprende la RC - Fase 3 - Testeo del C.C.: EC2 Aparece la RC - Fase 4 - Testeo del Prec. Sensorial: EC1 Aparece la RC a pesar de que nunca se asoció con el EI.

si en la primera fase el sujeto ha asociado el EC1 con el EC2, en la última fase debe mostrar la

RC ante el EC1, aunque nunca se haya relacionado con el EI. este condicionamiento indica que los organismos son totalmente capaces de aprender a asociar 2

estímulos inocuos, teniendo la peculiaridad que se produce asociación sin necesidad de que ninguno de los estímulos neutros en la primera fase se asocie con un EI y, por ello, con ninguna RC manifiesta.

este tipo de condicionamiento necesita pocos ensayos y requiere la presentación del EC1 y EC2. la naturaleza Interna o Externa de los Estímulos esta clasificación se hace en función de la forma en que se

administra la estimulación. - condicionamiento exteroceptivo cuando el EC y/o el EI son estimulaciones externas al organismo. - condicionamiento interoceptivo el EC y/o el EI se aplican directamente en el interior del organismo. - según Razran podríamos tener 4 modelos de condicionamiento:

intero - interoceptivo (cuando ambos estímulos son internos) intero - exteroceptivo (EC interno, EI externo). extero - interoceptivo (EC externo, EI interno). extero - exteroceptivo (EC y EI externos). Ejemplos de estimulación:

EC interoceptivo suero. EC exteroceptivo luz, sonido. EI interoceptivo irrigación intestinal. EI exteroceptivo descarga eléctrica, comida, agua

la relación entre el EC y el EI - son las relaciones de señal entre el EC y el EI, donde el primero señaliza la ocurrencia o la ausencia del segundo. - condicionamiento excitatorio el EC indica una alta probabilidad de ocurrencia del EI, es decir, una

contingencia positiva entre el EC y el EI el estímulo excitatorio (EC+) se convierte en un estímulo que evoca una RC, pues señaliza la ocurrencia del evento incondicionado.

- condicionamiento inhibitorio un EC señala la ausencia de un EI, provocando una inhibición de la RC (EC-) implica una relación de contingencia negativa entre el EC y el EI existe una mayor probabilidad de que el EI no ocurra cuando está el EC.

Page 16: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 5: Procedimientos de Aprendizaje: Condicionamiento Clásico Factores que Influyen en la Eficacia del Condicionamiento Clásico (CC)

1. Intervalo o Relaciones Temporales entre el EC y el EI - el intervalo entre estímulos es el tiempo trascurrido entre la aparición del EC y la del EI. - la velocidad del condicionamiento depende del intervalo temporal entre estímulos. - los intervalos cortos entre EC y EI favorecen el condicionamiento intervalo corto: menor de 1 minuto resulta

progresivamente más difícil el condicionamiento a medida que el intervalo se alarga. a) Condicionamiento Simultáneo:

el EC y el EI aparecen juntos el EC comienza a actuar a la vez o una fracción de segundos antes; prácticamente empiezan y terminan a la vez.

es un condicionamiento o tipo de relación temporal entre un EC y un EI. Pavlov definió como condicionamiento simultáneo: el intervalo entre ambos estímulos es de hasta 5

segundos. b) Condicionamiento Demorado o Diferido:

el EC aparece antes que el EI y dura por lo menos hasta que aparece el EI, y puede persistir incluso cuando el EI ha terminado hay un momento en que el EC se presenta junto con el EI cuando termina el EC continúa el EI sólo.

existen 2 tipos: condicionamiento de demora corta el EC precede al EI por un tiempo menor a 1 minuto. condicionamiento de demora larga el EC está presente mucho más tiempo, entre 5 y 10 minutos

antes de la presentación del EI. el condicionamiento de demora corta es el más eficaz para producir condicionamiento.

c) Condicionamiento de Huella o Vestigial: el EC aparece y desaparece antes de comenzar el EI, dejando un intervalo vacío llamado intervalo de

huella, donde no actúa ninguno de los dos estímulos. en términos Pavlovianos Huella: huella mnémica, hay un recuerdo existe aprendizaje, pero es menos

eficaz que el demorado corto, por el concepto de contigüidad cuando ambos estímulos se presentan juntos en el tiempo, entonces se aprende mejor acá se presentan juntos, pero no en estrecha contigüidad.

existen 2 tipos: huella corta cuando el intervalo en que ambos estímulos no están presentes es menor a 1 min. huella larga cuando el intervalo en que ambos estímulos no están presentes sea mayor de 1 min.

d) Condicionamiento hacia atrás, Retroactivo o Retrógrado: el EI se presenta antes que el EC, comienza y termina antes que aparezca el EC, invirtiéndose las relaciones

temporales normales, es muy difícil de conseguir. algunos autores plantean que no se trata de condicionamiento o aprendizaje, porque cuestiona los principios

de contigüidad y de contingencia. sería un pseudocondicionamiento porque no se sabe si realmente, el sujeto responde al EI o al EC

eventualmente el sujeto solamente estaría respondiendo al EI por presentarse primero. es el menos eficaz.

e) Condicionamiento al Tiempo: cuando el intervalo temporal representa al EC, presentando el EI a intervalos regulares, produciéndose con el

paso del tiempo la RC justo antes de la aparición del EI. para comprobar si se ha producido condicionamiento, se omite el EI y se comprueba la magnitud de la RC.

- para no olvidar:

el condicionamiento de demora corta puede considerarse el más eficaz. el condicionamiento de huella es generalmente menos eficaz que el demorado. el condicionamiento simultáneo y el hacia atrás, producen un condicionamiento inferior a los procedimientos

demorado y de huella. el condicionamiento retrógrado es un pseudocondicionamiento. el condicionamiento simultáneo no es un condicionamiento adecuado no podríamos decir que es una

relación eficaz para producir aprendizaje. - explicaciones del efecto del intervalo entre estímulos:

hipótesis de la huella Pavlov la contigüidad entre la excitación neuronal que produce la presentación del EC y la del EI

explica el condicionamiento la actividad neuronal varía de intensidad mientras dura, llegando a un punto máximo y decreciendo a medida que actúa el estímulo.

Hull propuso que el intervalo óptimo entre ambos estímulos es de 500 milisegundos, porque la huella neuronal alcanza su valor máximo sobre los 450 milisegundos.

otros trabajos lo sitúan entre 200 y 2000 milisegundos dependiendo del organismo, del tipo de respuesta condicionada, de la modalidad sensorial, de la intensidad del EC, y de la especie con la que se trabaja.

tiene que coincidir el período de actividad de la huella del EC con la presentación del EI lo que explica adecuadamente los condicionamientos proactivos que varían en función del intervalo entre estímulos, pero no explica los fenómenos del condicionamiento aversivo gustativo e incluso del condicionamiento retroactivo.

interferencia concurrente propone que no existe una limitación temporal para la asociación entre EC y EI. la única condición necesaria es que durante el intervalo de demora no ocurra ningún hecho o estímulo

que interfiera con el condicionamiento al EC.

Page 17: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Factores que Influyen en la Eficacia del Condicionamiento Clásico (CC) (cont.) 2. Contigüidad espacial entre el EC y el EI

- las variaciones en la contigüidad espacial entre estímulos puede afectar la relación temporal. - si el EC (luz) se coloca cerca del EI (comida), habrá menos demora entre ambos estímulos que si están separados,

lo que da lugar a que la contigüidad temporal y espacial interactúen. 3. Similitud entre el EC y el EI

- si los dos estímulos que van a asociarse son de la misma dimensión, el condicionamiento es mucho más rápido. - la semejanza referida a la duración o transcurso temporal de los estímulos que igualmente favorece al

condicionamiento. - esto explicaría que en el condicionamiento aversivo gustativo se asocien con más facilidad sabores y enfermedad

que otros estímulos. 4. Relevancia o Pertenencia entre el EC y el EI también llamada “pertinencia”

- ciertos EC se asocian con mayor facilidad a determinados EI, mientras que otros estímulos lo hacen con mayor dificultad.

- Rozin y Chalet se explican esta situación debido al hecho de que existe una predisposición genética para la asociación selectiva de ciertos EC y EI o especialización adaptativa del aprendizaje.

- otras explicaciones de la relevancia se basan en que determinados EI favorecen que determinadas claves se atiendan más.

- otras la explican a través de los efectos de la experiencia previa. 5. Preexposición al EC y al EI Hipótesis de la Irrelevancia Aprendida

- la preexposición del EC y del EI de forma no correlacionada retrasa el condicionamiento posterior. - cuando se presenta de esta forma, antes del condicionamiento, el sujeto aprende que estos estímulos no están

relacionados y que son mutuamente irrelevantes, no existiendo relación entre ellos lo que perjudica el posterior aprendizaje.

- la irrelevancia aprendida refleja un fracaso en la asociación como consecuencia de la experiencia previa de independencia.

- cuando se trata de una preexposición al EC se denomina Inhibición Latente. 6. Intervalo de Ensayos (entre ensayos)

- el intervalo de tiempo que transcurre de un ensayo de condicionamiento a otro dentro de la misma sesión experimental equivale a hablar en aprendizaje de práctica masiva versus práctica distribuida.

- Marx proponía que los intervalos entre ensayos más bien largos eran más efectivos para establecer el condicionamiento que los intervalos cortos intervalos entre 5 y 20 seg. producían peor condicionamiento que entre 20 y 35 seg.

- el intervalo entre estímulos tiene que ser más corto que el intervalo entre ensayos. - Hull esto es necesario debido a que cuando el organismo responde a una RC, durante un período es incapaz de

responder otra vez, apareciendo el fenómeno de inhibición reactiva si se utilizan intervalos muy cortos entre ensayos, no alcanza a desaparecer la inhibición reactiva, obteniéndose RC débiles, lo que no ocurre cuando el intervalo entre ensayos es mayor.

- Cooper la adquisición de la respuesta depende de la duración del período de no refuerzo, más que del propio intervalo EC – EI lo que determina la velocidad de adquisición es la duración del intervalo entre ensayos en relación a la duración del ensayo, y que ambos son factores críticos del condicionamiento.

Variables o parámetros del EI Intensidad del EI

- la fuerza de la RC aumenta en función de la intensidad del EI, pero solamente hasta ciertos límites. - el EI puede denominarse reforzador, porque su presentación aumenta la probabilidad o fuerza de la RC. - el condicionamiento clásico requiere la presentación de EI relevantes y que provoquen respuestas reflejas fuertes,

aunque si somos estrictos en la definición de condicionamiento clásico (aprendizaje de relaciones entre estímulos) el carácter motivacional del EI no sería tan importante.

Duración del EI - resultados contradictorios algunos trabajos experimentales proponen que la RC no tiene relación con la duración

del EI, y otros que sí la tiene. - un EI de larga duración podría producir un nivel de impulso fuerte y así una mejor RC. - también podría producir habituación (o bien adaptación en el órgano sensorial) y tener con ello un efecto negativo,

es decir ser menos efectivo como EI. Novedad del EI preexposición al EI

- si el EI es muy familiar para el sujeto, el condicionamiento se realiza más lentamente que si el EI es novedoso preexposición al EI.

- el grado de retraso en el condicionamiento dependerá del número de veces que se expone el EI sin el EC, produciéndose mayor retraso a mayor número de presentaciones no señaladas del EI.

- Hipótesis de la Interferencia Asociativa dado que el EI no es señalado por ningún EC durante la preexposición, puede quedar asociado a claves contextuales, de forma que el contexto se transforma en el EC.

Tipo de EI - la RC depende del tipo de EI que se utiliza la forma de la RC se asemeja a la RI provocada por el EI.

Page 18: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Variables o parámetros del EI (cont.) Probabilidad del EI en relación al EC contingencia

- cuando la contingencia es CERO, es decir, la probabilidad de que el EI aparezca en presencia del EC es igual a la probabilidad de que aparezca en ausencia del EC NO HAY condicionamiento el EC no señaliza nada, pues la probabilidad de que ocurra el EI es igual cuando está el EC y cuando no está.

- para que haya condicionamiento se requiere que la contingencia sea distinta de cero positiva o negativa.

Variables o parámetros del EC Intensidad del EC

- el EC debe ser lo suficientemente intenso para provocar la RC, pero no debe ser de una fuerza excesiva, porque provocaría respuestas incompatibles con la RC.

- cuanto más intenso sea un estímulo, comparándolo con aquellos a los que se está acostumbrado, mejor captará la atención, más sobresaldrá del trasfondo ambiental y mejor se condicionará.

- los EC más intensos son más fáciles de discriminar de los estímulos contextuales se discriminan mejor y tienen mayor probabilidad de asociarse al EI.

Duración del EC - los EC cortos producen mayor RC. - en la mayoría de los experimentos, los EC son de corta duración y están bien definidos tanto en su comienzo como

en su final se denominan estímulos fásicos. - los estímulos que están presentes durante toda la sesión y que son de larga duración también suelen

condicionarse al EI se denominan estímulos contextuales. - los estímulos contextuales se condicionan cuando no hay otro estímulo condicionado que permita al sujeto predecir

el EI de forma precisa. Novedad del EC preexposición al EC

- si el EC es muy familiar para el sujeto, el condicionamiento se realiza más lentamente que si el EC es novedoso. - los organismos que son expuestos antes del condicionamiento al EC aprenden la RC más despacio. - este fenómeno de preexposición al EC se denomina inhibición latente este es un fenómeno duradero y

diferente de la inhibición condicionada, porque no dota al estímulo de propiedades inhibitorias. Tipo de EC

- la naturaleza del EC afecta a la magnitud de la RC tras el emparejamiento EC-EI. - Pavlov planteó que cualquier estímulo neutro emparejado con el EI adquiere la capacidad de elicitar la RC este

estímulo tendría que ser biológicamente más débil que el EI con el que se asociaría. - actualmente, las investigaciones indican que determinados estímulos se asocian con mayor facilidad con ciertos EI

cuando se utilizan EC motivacionalmente significativos y no neutros, el condicionamiento se hace más lento, debido a que en un primer momento se ha asociado un EI apetitivo con un EC, y éste ha adquirido ciertas propiedades motivacionales. Si posteriormente se asocia este mismo EC (que ya no es neutro) con otro EI aversivo para que se produzca condicionamiento, el sujeto debe contrarrestar los efectos opuestos producidos por el condicionamiento anterior.

Valor informativo del EC contingencia - según la definición de CC, según la cual un organismo aprende acerca de la relación predictiva entre señales y

eventos importantes, la información es el parámetro más importante del CC cuanto mayor es el valor informativo del EC, más fuerte la RC.

- el valor informativo está dado por contingencias distintas de cero y lo “informativo” es respecto al EI el EC informa respecto de la probabilidad de ocurrencia del EI (si ocurre o no).

EC Compuestos cuando el EC tiene más de un componente EC formados por 2 componentes distintos presentados simultáneamente o

por 2 intensidades distintas. Sumación

- la RC de varios componentes supera a la correspondiente respuesta del componente más fuerte. - ejemplo EC1 (luz) + EI (descarga eléctrica) y EC2 (sonido) + EI (descarga eléctrica), y después presentamos

EC1 +EC2 (simultáneamente) + EI, la probabilidad y la intensidad de la RC es mayor que la RC a cada EC por separado.

EC1 (luz) EI (descarga eléctrica) EC2 (sonido) EI (descarga eléctrica) EC1 +EC2 EI * aquí se da una RC mayor (simultáneamente)

Configuración.

- si se empareja un EC compuesto con un EI, sólo el EC compuesto adquiere control sobre la RC, porque actúa como gestalt condicionamiento configuracional.

- demuestra que el organismo responde al patrón estimular como un todo y no responde a los componentes estimulares aislados.

- esta configuración adquiere características que le permiten provocar una respuesta independientemente de la capacidad de cada componente para producirla.

- características especiales: es más lento por lo que requiere mayor número de ensayos. es más resistente a la extinción

Page 19: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

EC compuestos (cont.) para que se produzca es indispensable que los componentes aislados no adquieran control sobre la RC

(no siempre se produce este condicionamiento, debido a que cualquier experiencia previa del organismo con alguno de los componentes por separado afecta al aprendizaje, pudiendo impedirlo totalmente).

Ensombrecimiento overshadowing - si un EC está compuesto por 2 elementos que difieren mucho en intensidad, el elemento débil no consigue control

sobre la RC sólo el elemento fuerte adquiere poder. - si se presentan simultáneamente 2 estímulos de distinta intensidad, el estímulo más fuerte ensombrece al más

débil, mientras que el mismo estímulo, si se presenta solo, podría condicionarse. Bloqueo

- es un fenómeno de condicionamiento debido al condicionamiento previo de uno de los componentes, no a una diferencia en la intensidad de los elementos.

- el condicionamiento previo de un componente bloquea el condicionamiento del otro elemento. - con este fenómeno se comprueba que la simple contigüidad no es condición suficiente para producir el

condicionamiento.

Naturaleza de la RC: la ejecución: actualmente no existe una única explicación satisfactoria de la ejecución en el condicionamiento clásico. la primitiva teoría que explicaba la ejecución, fue la teoría de la sustitución de estímulos, pero no se cumplía en todos los

condicionamientos, por ello han aparecido explicaciones alternativas Identificación (Naturaleza) y Medida de la RC

- la medición de la RC se realiza a través de una serie de parámetros los más usuales son la amplitud y la latencia.

- dependiendo del tipo de condicionamiento también se utilizan otros índices como el período de reclutamiento, número de ensayos, frecuencia, resistencia a la extinción, etc.

- el período de reclutamiento es el tiempo que transcurre entre la iniciación de la respuesta y su máxima amplitud, o dicho de otra manera, el tiempo que demora la RC en alcanzar su máxima intensidad.

Teorías de Ejecución en el Condicionamiento Clásico

1. Teoría de la Sustitución de Estímulos - el punto de vista tradicional del CC parte del supuesto de que las RC y las RI son equivalentes, aunque

paramétricamente la RI tiene mayor amplitud. - según esta postura, el CC se sustenta en la teoría de la sustitución de estímulos, según la cual el EC actúa como

un sustituto del EI provocando similares o idénticas respuestas, porque al emparejar el EC con el EI se transfiere al EC la capacidad elicitadora que tiene el EI.

- Pavlov suponía que existen conexiones innatas a nivel neurológico entre EI y RI, luego del procedimiento de condicionamiento cuando se presenta el EC se estimula el centro neurológico del EI desde este punto de vista la RC y la RI serían funcionalmente similares.

- actualmente se ha puesto de manifiesto que los mecanismos neurológicos que intervienen en el condicionamiento son mucho más complejos de lo que propone esta teoría.

- los enfoques más actuales admiten que los organismos aprenden por asociación EC-EI, pero formando una representación o imagen del EI, y el EC provoca la RC por su asociación con la representación del EI, activando esa representación llega a provocar las mismas respuestas que el EI.

- la dificultad de esta teoría aparece cuando la RI y la RC son diferentes. 2. Condicionamiento Preparatorio y Consumatorio

- Konorski (1967) diferenció por primera vez estos dos tipos de condicionamiento. - las respuestas preparatorias son actividades de búsqueda (ej.: la orientación hacia la comida). - las respuestas consumatorias son respuestas de realización o de ejecución (ej.: comer). - las respuestas condicionadas preparatorias dirigen al sujeto hacia estímulos positivos o lo alejan de estímulos

aversivos son expresiones de carácter general como agitación, excitación, acercamiento, etc. - estas respuestas reflejan las propiedades motivacionales del EI y el valor afectivo general del reforzador. - el condicionamiento preparatorio depende de la asociación entre el EC y los atributos motivacionales del EI o las

reacciones emocionales frente a él. - las respuestas consumatorias son específicas, precisas para cada EI particular, como picotear, salivar, lamer,

tragar, parpadear dependen de la naturaleza específica del EI las respuestas están provocadas por el contacto del sujeto con el EI.

- el condicionamiento consumatorio depende de una asociación con los atributos sensoriales específicos del reforzador.

- la teoría de la sustitución rige para la conducta consumatoria. 3. Teoría de la Respuesta Condicionada Compensatoria

- este tipo de condicionamiento permite explicar por qué algunas RC y RI son distintas y opuestas. - la RC es opuesta y compensatoria a la RI generada por el EI es decir, si un EI provoca una RI (ej.: aumento de

la tasa cardíaca) los EC no van a generar una RC equivalente a esa RI, si no que los EC van a gatillar una RC que es opuesta -distinta- a la RI (ej.: disminución de la tasa cardiaca).

- este condicionamiento se produce, independientemente de que nosotros queramos o no el sujeto no hace nada especial, ni deja de hacer nada, para que esto ocurra.

- si la presentación de ambos elementos (EC EI) continúa, la RC va a compensar efectivamente los efectos de la RI, hasta hacer parecer como que la RI ya no se da esto explica la tolerancia a la droga, bajo esta teoría.

- sin embargo, si la droga se aplica en un contexto o situación donde no están presentes los EC, entonces, no habrá un efecto compensador para la RI, y ésta aparecerá nuevamente en toda su magnitud note, que no es que la RI hubiese desaparecido, sino que era el efecto de los EC y la respectiva RC compensatoria, lo que hacía parecer como que no hubiese RI (esta se encontraba compensada por la RC).

Page 20: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 6: Condicionamiento Clásico al Miedo y Contingencia Condicionamiento al Miedo este condicionamiento al miedo tiene importancia por sus implicaciones clínicas, pero también debido a que muestra cómo

es posible el condicionamiento emocional (algunas fobias, por ejemplo). el procedimiento de condicionamiento al miedo se realiza como sigue:

el EI aversivo más utilizado para trabajar con ratas es la descarga eléctrica. el EC puede ser una luz o un tono recuerde que el EC tiene que ser relevante (pertinente) con respecto al EI un

estímulo como “sabor” u “olor” no se condicionará al miedo. la respuesta de miedo se puede medir por la intensidad del sobresalto, por el llanto, o por la interferencia del miedo en una

respuesta (operante) que se esté realizando antes de que se presente el EC este procedimiento se llama Supresión Condicionada.

a este condicionamiento, en ocasiones, se le denomina Respuesta Emocional Condicionada (REC). sin embargo, dado que no sólo hay respuestas emocionales condicionadas de miedo, sino también respuestas

emocionales de placer, utilizaremos el término de condicionamiento al miedo para referirnos a este tipo de condicionamiento, en que existe un EI aversivo y una RI que es una respuesta emocional de miedo.

utilizaremos el término supresión condicionada para referirnos a la medición de tal condicionamiento, donde se mide la supresión de una respuesta operante frente a un EI aversivo.

la supresión condicionada es una medición indirecta del condicionamiento al miedo no se mide directamente el miedo, sino cómo interfiere éste en la emisión de una conducta.

lo que se mide directamente es la ejecución de una respuesta (operante): el número de veces que se ejecuta inferimos el miedo a partir de la menor emisión de esta conducta una vez que se ha realizado el procedimiento de condicionamiento.

este procedimiento fue ideado por Estes y Skinner (1941) y desde ahí se ha continuado utilizando exitosamente.

EI aversivo RI de miedo EC neuto originalmente EI aversivo EC RC de miedo

- donde, el EI produce o gatilla naturalmente, sin necesidad de aprendizaje, la RI de miedo.

- luego de relativamente pocas pareaciones del EC con el EI (con un procedimiento, por ejemplo, de demora larga), el EC gatilla la RC (aprendida) de miedo.

Supresión Condicionada este procedimiento consta de 3 etapas donde, normalmente, la 2 y 3 se van traslapando:

1. establecimiento de la línea base se enseña una respuesta (operante) y se establece una línea base (punto de partida) para una respuesta que el organismo realice.

esta medición es esencial, debido a que al final mediremos la cantidad de supresión de la respuesta (cuánto se suprime), por lo tanto, necesitamos tener un punto de comparación y, por supuesto, necesitamos que el organismo, efectivamente, realice la conducta.

2. condicionamiento al miedo una vez establecida la respuesta operante, comenzamos el condicionamiento clásico que nos interesa se presenta el EC seguido por el EI. Puede ser una relación temporal de “demora corta” o de ”demora larga”, siendo ésta ultima más utilizada, con una presencia del EC antes del EI de 3 minutos. El intervalo entre ensayos suele ser entre 15 a 30 minutos.

3. supresión condicionada en esta etapa se comienza a medir la interferencia que ocurre en la respuesta operante cuando se presenta el EC (normalmente, esta etapa comienza junto con la 2, por lo cual la respuesta operante va disminuyendo gradual, aunque rápidamente, a medida que va ocurriendo el condicionamiento al miedo).

el progreso del condicionamiento al miedo se evalúa en términos de cuánto la rata deja de apretar la palanca en presencia del EC que está condicionado aversivamente.

si la rata efectivamente se condicionó al miedo, esperaremos que deje de apretar la palanca y que, por lo tanto, el número de respuestas frente al EC sea menor que en la fase 1. La rata puede llegar a apretar “cero” vez la palanca frente al EC, lo cual es una supresión total de la respuesta condicionada al miedo y, por lo tanto, un éxito total en el condicionamiento.

si la rata no se condicionó al EC, entonces el número de respuestas de apretar la palanca será igual (en promedio) al establecido en la línea base la rata no aprendió o no hubo condicionamiento al miedo.

si presentamos cualquier EC, no condicionado a la rata, antes de hacer el condicionamiento al miedo, lo que ocurre es que la conducta de apretar la palanca se desorganiza un poco y, por lo tanto, se reduce, sin embargo, al cabo de un rato, el organismo se habitúa a ese estímulo y continúa con su conducta. Sin embargo, si se condiciona el EC con el EI aversivo que produce miedo, el aprendizaje emocional es muy rápido, normalmente en 3 a 5 ensayos si el EI tiene una intensidad eficaz se podrá observar que el EC interfiere totalmente con la respuesta operante de apretar la palanca.

la respuesta emocional condicionada al miedo interfiere con la operante dado que la paralización (quedarse congelado) es una respuesta de defensa específica de la especie en la ratas sin embargo, el condicionamiento al miedo es específico al EC con el cual se trabajó. Si el EC desaparece, rápidamente se reinstaura la conducta operante.

para medir este condicionamiento se utilizan las medidas anteriores (número de respuestas) y se llevan a una fórmula que se llama Tasa de Supresión Condicionada una razón entre el número de respuestas dadas frente al EC y el número total de respuestas dadas, tanto frente al EC como en el nivel de línea base:

Page 21: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Supresión Condicionada (cont.) Respuesta frente al EC Tasa de Supresión (TS) = ---------------------------------------------------------------

Respuestas al EC + Respuestas Línea Base

si el condicionamiento es totalmente exitoso, tendremos una supresión total el nivel o número de respuestas, al final del procedimiento, será “cero”, con lo cual la fórmula quedaría como sigue (suponiendo un línea base de 50):

TS = 0/(0+50) = 0 la tasa de supresión es cero este es el valor mínimo que la TS puede alcanzar. si el condicionamiento es totalmente ineficaz, tendremos un nivel de respuestas o un número de respuestas, al final del

procedimiento, que será igual a 50, dado que éste es el número de respuestas máximo (en promedio) que la rata da en un tiempo determinado; es el nivel estable de respuestas; suponiendo una línea base de 50, la fórmula sería:

TS = 50/(50+50) = 0,5 la tasa de supresión es 0,5 este es el valor máximo que la TS puede alcanzar. los valores mínimos y máximos que la TS puede alcanzar son, respectivamente, 0 y 0,5 toda tasa de supresión

condicionada queda entre estos dos valores.

en el gráfico se puede observar que el número de respuestas va disminuyendo, por lo tanto, en el quinto ensayo, donde la

TS es casi cero, el nivel de condicionamiento alcanzó su punto máximo. en este procedimiento de condicionamiento al miedo, la significación motivacional del EI, es aversiva, en el

sentido de que el EI es aversivo, por lo tanto las respuestas incondicionadas tendrán relación con la defensa o el ataque, dependiendo del desarrollo evolutivo de la especie.

Contigüidad v/s Contingencia de los Estímulos Pavlov determinó que lo esencial para producir condicionamiento era la contigüidad la cercanía temporal y espacial de

los estímulos creía que el condicionamiento simultáneo debía ser el más efectivo. sin embargo, el condicionamiento simultáneo fue el primero en cuestionar el concepto de “contigüidad” como algo que

ocurre “junto a” este procedimiento mostraba que la contigüidad no era suficiente para producir aprendizaje en este caso, existe contigüidad y aún así no hay aprendizaje.

el procedimiento más efectivo para producir condicionamiento es el de demora corta, por lo cual el concepto de contigüidad quedó referido a la cercanía entre el EC y el EI, donde el EC debía preceder al EI por unos segundos (más allá de cinco segundos y menos de 1 minuto).

otro experimento que cuestionó el concepto de contigüidad fue el condicionamiento de aversión al sabor en este tipo de condicionamiento el EI no sigue al EC sino hasta varias horas después y aún así se produce aprendizaje esto indica que la contigüidad no es necesaria para producir aprendizaje en este caso, no hay contigüidad y aún así hay aprendizaje.

Condicionamiento simultáneo hay contigüidad y no hay aprendizaje cuestionó suficiencia de la contigüidad. Cond. aversivo al sabor no hay contigüidad y sí hay aprendizaje cuestionó necesidad de la contigüidad.

entonces ¿qué se necesita para que el aprendizaje ocurra? correlación (en CC) comparar dos probabilidades en una correlación de CC se compara la probabilidad de que el

EC y el EI aparezcan juntos, versus la probabilidad de que el EI y el EC aparezcan separados. en este caso, “juntos” no quiere decir simultáneo o juntos temporalmente, en un sentido estricto de contigüidad, sino que se

refiere sencillamente a que, en ese ensayo aparecen ambos estímulos, independientemente del arreglo temporal que haya entre ellos. Es decir, si dos estímulos no aparecen juntos, quiere decir que aparecen separados más allá del tiempo y el espacio, aparecen separados en el sentido de que, en cada ensayo, aparece uno y no el otro.

si la probabilidad de que ocurra el EI junto con el EC es igual a 1 todas las veces que aparezca el EC, aparecerá el EI. si la probabilidad de que ocurra el EI en ausencia del EC (separados) es 0 el EI nunca aparecerá con el EC. si comparamos las probabilidades de que el EI aparezca junto al EC o no, se tiene:

- la probabilidad de que el EC y el EI aparezcan juntos es 1. correlación positiva perfecta

- la probabilidad de que los EC y EI aparezcan separados es 0. en la vida real rara vez tenemos correlaciones positivas perfectas, más bien nos encontramos con correlaciones positivas y

punto la probabilidad de que el EI y el EC aparezcan juntos es grande, y mayor que 0, pero no necesariamente 1. aunque en el mundo real las relaciones entre los estímulos son inciertas y variables, en general, podemos detectar

probabilidades y por lo tanto predecir en base a ellas esta capacidad de predecir en base a probabilidades tiene una gran importancia adaptativa, especialmente cuando se puede predecir que algo aversivo no ocurrirá.

en términos técnicos las 2 probabilidades a comparar se expresan como sigue: - p(EI/EC) se lee “probabilidad de que ocurra el EI dado que ocurrió el EC”. - p(EI/-EC) se lee “probabilidad de que ocurra el EI dado que el EC no ocurrió”.

Page 22: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Contigüidad v/s Contingencia de los Estímulos (cont.) correlación negativa probabilidad de que se de el EI en ausencia del EC es mayor que en presencia del EC será una

correlación negativa perfecta, cuando, en todos los ensayos, el EI aparece solo (es decir el EC y el EI aparecen totalmente separados).

si en lugar de usar el término correlación, utilizamos el término “contingencia”, podremos entender que cuando hablamos de contingencia nos estamos refiriendo a una comparación entre dos probabilidades:

- contingencia positiva (una correlación positiva) cuando la probabilidad de que el EI ocurra dado que ocurrió el EC, es mayor que la probabilidad de que el EI ocurra en ausencia del EC.

p(EI/EC) > p(EI/-EC) el EC se vuelve un EC excitatorio (EC+) cuando un EC+ (estímulo condicionado excitatorio) tiene una contingencia positiva con un EI, el

organismo es capaz de predecir que el EI ocurrirá. - contingencia negativa (correlación negativa) cuando la probabilidad de que el EI ocurra dado que no ocurrió el

EC, es mayor que la probabilidad de que el EI ocurra dado que ocurrió el EC. p(EI/- EC) > p(EI/EC) el EC se vuelve un EC inhibitorio (EC-) cuando un EC- (estímulo condicionado inhibitorio) tiene una contingencia negativa con un EI, el

organismo, frente a ese EC-, es capaz de predecir que el EI no ocurrirá. - contingencia cero (correlación cero o ausencia de correlación) cuando ambas probabilidades son iguales.

p(EI/EC) = (EI/- EC) no hay aprendizaje el organismo no aprende nada respecto al valor señal del EC el EC no informa

nada respecto al EI. cuando un EC tiene una contingencia cero con un EI, el organismo, frente a ese EC, no aprende a

predecir nada. en la vida real las correlaciones no son perfectas es la capacidad del organismo para detectar estas correlaciones

imperfectas lo que determina su aprendizaje. Experimento de Rescorla supresión condicionada con ratas:

- muestra cómo la comparación entre 2 probabilidades genera aprendizajes diferentes. - deja establecido el término “Contingencia” y cómo es éste y no la contigüidad la que explica el aprendizaje en el

condicionamiento clásico. para Rescorla el término contingencia es esencial:

- es la contingencia entre estímulos y no la contigüidad la que determina el aprendizaje. - la contingencia da cuenta, además, del Valor Señal de los estímulos condicionados. - la contingencia da cuenta de la importancia de que el EC señalice la llegada o no del EI. - esta señalización ocurre sólo en base a probabilidades que el organismo es capaz de detectar. - que 2 estímulos estén cerca (contigüidad) no basta, ni es necesario lo que es necesario, es que haya

una relación de señal, donde el EC informe algo respecto del EI. - esta señalización se dará siempre y cuando exista cierta experiencia del organismo con los EC y EI respectivos

(aprendizaje), de manera que pueda estimar ciertas probabilidades basadas en los hechos y, por tanto, predecir el EI con mayor o menor exactitud, a partir de la ocurrencia de un EC

entonces, ¿qué se necesita para que el aprendizaje ocurra? - que exista una correlación o contingencia entre los estímulos. - esta contingencia puede ser positiva o negativa, jamás cero. - si la contingencia es positiva hay un condicionamiento excitatorio. - si la contingencia es negativa hay un condicionamiento inhibitorio. - si la contingencia es cero (no existe) no hay aprendizaje.

Comparación de Probabilidades

P (EI/EC) > P(EI/-EC) P (EI/EC) < P(EI/-EC) P (EI/EC) = P(EI/-EC)

Contingencia Positiva Negativa Cero Tipo de condicionamiento

Excitatorio Inhibitorio No hay

Qué tipo de EC es EC+ EC- --- Relación de señal Positiva Negativa --- Qué señaliza el EC La ocurrencia del EI La ausencia del EI No señaliza nada

Page 23: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 7: Condicionamientos Excitatorios e Inhibitorios

Inhibición Condicionada v/s Extinción (correlaciones negativas) inhibición condicionada es el condicionamiento donde el sujeto no da una respuesta (inhibe su respuesta)

debido a que el EC- (estímulo condicionado inhibitorio) señaliza la no ocurrencia del EI. - este aprendizaje es esencial para la supervivencia, debido a que nos entrega momentos de “alivio” y “descanso”

cuando sabemos que algo aversivo no viene (aunque también nos puede entregar momentos de “desilusión” o, incluso, de “angustia” cuando sabemos que algo “apetitivo” no viene).

- este tipo condicionamiento fue conceptualizado, por primera vez, por Iván Pavlov, pero ha sido reconceptualizado. - la principal diferencia con las conceptualizaciones modernas es que Pavlov no tomó en consideración la

contingencia. - Pavlov observó que, en ocasiones, el EC lograba “inhibir” la RC de salivación del perro esto ocurría cuando,

luego de un condicionamiento excitatorio (EC EI), presentaba repetidamente el EC en ausencia del EI. - extinción procedimiento, donde la RC va disminuyendo gradualmente hasta desaparecer, producto de la

presentación repetida del EC. - Pavlov supuso que durante el proceso de extinción, el perro aprendía a inhibir la respuesta, estableciendo así

cierta simetría entre el proceso de condicionamiento y la extinción, al igual que existe una simetría a nivel de impulsos nerviosos que “excitan” o “inhiben” respuestas sin embargo, actualmente, la evidencia muestra que el aprendizaje que ocurre durante la extinción es distinto al que ocurre en el condicionamiento o aprendizaje inhibitorio la naturaleza del condicionamiento inhibitorio y de la extinción es distinta (la extinción tampoco es un “desaprendizaje del CC previo).

- extinción ≠ inhibición condicionada ≠ olvido ≠ habituación en todos hay desaparición o un decremento de la respuesta.

- en el olvido la RC deja de darse sólo por el efecto del paso del tiempo, no existe ninguna manipulación del EC; una vez realizado el condicionamiento o aprendizaje, deja de presentarse el EC la falta de respuesta es explicable por la ausencia del EC.

- en la extinción el EC se presenta sistemáticamente hasta que se produce la extinción de la respuesta (RC). - en la habituación la respuesta decrece frente al estímulo, sin embargo aquí jamás hubo un condicionamiento

previo asociación EC EI; sólo existe un estímulo (en el sentido de que no se asocia a ningún otro). - Pavlov propuso un procedimiento especial para lograr que un estímulo, originalmente neutro, llegara a inhibir una

conducta refleja, es decir, para lograr condicionamiento inhibitorio Método Standard de Pavlov. él supuso que si un EC+ se podía extinguir y convertir en EC-, entonces también se podía lograr que un

estímulo neutro se condicionara inhibitoriamente. - Método Diferencial otro procedimiento para lograr condicionamiento inhibitorio. - Método de Contingencia Negativa 3er. método para logra condicionamiento inhibitorio considera la

contingencia y sus correlaciones. - los métodos Standard de Pavlov y Diferencial tienen una correlación negativa perfecta y contingencia negativa - el método de Contingencia Negativa tiene correlación negativa, pero no perfecta.

Métodos para producir Condicionamiento Inhibitorio

1) Método Standard de Pavlov implica el uso de dos EC (un sonido y una luz) y de 2 fases o etapas. en la fase 1 el perro recibe un condicionamiento excitatorio entre un sonido y la comida hasta que aprende que el

sonido predice la llegada de la comida y da una RC estable de salivación. en la fase 2 se mezclan dos tipos de ensayos: excitatorio e inhibitorio.

- en el ensayo excitatorio el perro siempre recibe la comida precedida del EC+, igual que en la primera fase. - en el ensayo inhibitorio se le presentan conjuntamente el sonido y la luz; en este ensayo nunca aparece la

comida.

después de algunas repeticiones de estos ensayos, donde el segundo tipo de ensayo se intercala al azar (no se

presenta todas las veces), el perro aprende que después del estímulo sonido-luz no viene la comida, por lo tanto, inhibe su respuesta de salivación frente al estímulo compuesto por el sonido y la luz.

el diseño de este procedimiento con un ensayo inhibitorio con dos estímulos (un EC+ y un EC-) es debido a que Pavlov supuso que para que hubiese condicionamiento inhibitorio era necesario que el organismo “esperara” el EI debía haber un EC+ que gatillara activamente la RC; que produjese la expectativa del EI si se presentaba un EC- y ausencia de EI, el organismo aprendería a “inhibir” su respuesta de salivación.

a pesar de que Pavlov reconoce la necesidad de que exista una “expectativa” por parte del sujeto, pensaba que el condicionamiento sólo podía ocurrir en respuestas reflejas por lo que él no consideraba que el individuo tuviera un rol activo en este aprendizaje.

tampoco consideraba el rol informativo del EC como señalizador de un evento (EI). Robert Rescorla entregó al sujeto un rol mucho más activo, donde compara probabilidades y establece relaciones

de contingencia y de valor señal entre los estímulos.

Page 24: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Métodos para producir Condicionamiento Inhibitorio (cont.) 2) Método Diferencial

este método es parecido al de Pavlov; sin embargo, recoge las investigaciones acumuladas que indican que el contexto (ambiente físico o claves contextuales) puede servir como EC+ y, por lo tanto, puede servir para generar la expectativa necesaria para condicionar inhibitoriamente un estímulo; no se necesita un EC+ explícito.

se realizan dos ensayos: un ensayo que es excitatorio y el otro que es inhibitorio. - en el ensayo excitatorio se presenta una luz (o cualquier otro estímulo neutro) para condicionarla

excitatoriamente (EC+). - en el ensayo inhibitorio se le presenta un tono (o cualquier otro estímulo neutro) para condicionarlo

inhibitoriamente (EC-). el EI puede ser comida, una descarga eléctrica o cualquier otro estímulo que provoque una fuerte RI el EC+ debe

indicar la presencia del EI. al finalizar el experimento el organismo salivará (si el EI fue comida) frente al EC+ y no lo hará frente al EC-.

3) Contingencia Negativa:

al reconceptualizar el condicionamiento clásico como un aprendizaje de relaciones entre eventos (aprendizaje de relaciones de señal, basadas en la comparación de probabilidades), Rescorla creó un procedimiento para producir condicionamiento inhibitorio, basado únicamente en la contingencia entre los eventos.

para producir condicionamiento inhibitorio basta hacer un arreglo de contingencias tal, que la probabilidad de que el EI y el EC- se den juntos sea menor que la probabilidad de que aparezcan separados p(EI/EC) < (EI/-EC).

el EI sigue al EC- 1 vez entre 5 (suponiendo que la huella en los otros casos no alcanza a ser efectiva) o sea una

probabilidad igual a 0,2; en cambio la probabilidad de que aparezca el EI en ausencia del EC (cuando el EC no ocurre) es de 4 entre 5 o sea una probabilidad de 0,8 sólo conociendo esas probabilidades, podemos predecir, con certeza, que va a ocurrir un condicionamiento inhibitorio.

el concepto de contingencia se refiere a las correlaciones entre dos probabilidades: a) la probabilidad de que ocurra el EI dado que ocurrió el EC (dos estímulos) b) la probabilidad de que ocurra el EI dado que no ocurrió el EC (separados)

la correlación negativa perfecta ocurre cuando la probabilidad de “A” es cero y la probabilidad de “B” es 1. - en el Método Estándar:

la probabilidad de que la comida aparezca en el ensayo en el que se presenta la luz (EC-) es cero: p(EI/EC) = 0 (probabilidad de comida dado que ocurrió la luz)

la probabilidad de que la comida aparezca en el ensayo en el que no aparece la luz (no EC-) es 1: p(EI/-EC) = 1 (probabilidad de comida dado que no ocurrió la luz. El EI aparece solo)

el resultado es que en el ensayo 1 el perro saliva dado que no ocurrió la luz y sólo está presente el EC+ que le avisa que el EI (comida) viene; en el ensayo 2, en cambio, el perro no saliva dado que ocurrió la luz que informa que el EI no viene.

- en el Método Diferencial: la probabilidad de que la comida aparezca en el ensayo en el que se presenta el tono (EC-) es

cero; nunca aparece el EI después del EC: p(EI/EC) = 0 (probabilidad de la comida dado que ocurrió el tono es igual a cero)

la probabilidad de que la comida aparezca en el ensayo en el que no aparece el tono (no EC-) es 1; el EI se presenta siempre que el tono no ocurre:

p(EI/-EC) = 1 (probabilidad de la comida dado que no ocurrió el tono) el resultado es que en el ensayo 1 el perro saliva dado que no ocurrió el tono y sólo está presente

el EC+ que le avisa que el EI viene; en el ensayo 2 el perro no saliva dado que ocurrió el sonido que le informa que el EI no viene.

- en ambos métodos es respecto al EC- (inhibitorio) que tenemos que comparar las probabilidades. - en estos 2 métodos para producir inhibición condicionada tenemos una contingencia negativa perfecta,

donde la probabilidad de que el EI ocurra después del EC es 0 y la probabilidad de que ocurra solo (en ausencia del EC) es 1.

- esta contingencia negativa produce un condicionamiento de tipo inhibitorio, donde el organismo aprende a predecir la no ocurrencia de un EI sin embargo, al igual que ocurre con la correlación positiva perfecta, en la vida real no tenemos correlaciones negativas perfectas entre los eventos (estímulos) la correlación más bien tiende a ser positiva o negativa.

Page 25: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Métodos para producir Condicionamiento Inhibitorio (cont.) se destacan 3 elementos imprescindibles para que ocurra condicionamiento inhibitorio:

- la ocurrencia de un EI (experiencia con el EI). - un contexto excitatorio. - contingencia negativa.

en una contingencia negativa necesariamente ocurre el EI y por ende, necesariamente, el contexto se condicionará excitatoriamente.

en el procedimiento de contingencia negativa no existe la utilización de un EC+ explícito esto se debe a que, durante el procedimiento de condicionamiento, el organismo tiene experiencia con el EI, entonces las claves (estímulos) contextuales se convierten en EC excitatorios.

al hablar de “contexto” no se quiere decir que todas las claves presentes se van a condicionar excitatoriamente en general, se condicionan ciertos elementos relevantes y estos juegan el rol de EC+.

estos EC+ son centrales para que el organismo tenga la expectativa de que el EI viene y por lo tanto aprenda que, bajo ciertas circunstancias, el EI no viene es decir, se condicione inhibitoriamente, en virtud de una contingencia negativa (el EI aparece un mayor número de veces sin el EC, que con éste).

un estímulo se convertirá en EC- si este estímulo condicionado señala confiablemente la ausencia de un EI en un contexto en el cual, en otros casos, se espera que ocurra.

Métodos de Medición de la Inhibición Condicionada ¿cómo podemos llegar a determinar que el organismo, activamente, inhibe su conducta debido a que predice la no

ocurrencia de un EI y no simplemente a que no predice nada? en el caso del condicionamiento excitatorio, podemos observar una conducta, la cual se da frente a un EC que predice la

llegada de un EI, ya sea apetitivo (acercamiento) o aversivo (rechazo). sin embargo, frente a un EC que predice la no ocurrencia de un EI, el organismo no se comporta (respuesta condicionada

clásica (la conducta que el organismo inhibe es la conducta emocional o aquella condicionada clásicamente, por ejemplo, la respuesta de salivación)) por lo tanto, ¿cómo medimos esta no-conducta, opuesta a la respuesta excitatoria?

para medir el condicionamiento inhibitorio, surgen 3 métodos: a. Sistema de Respuestas Bidireccionales.

- relativamente fácil de hacer cuando logramos identificar tendencias de respuestas opuestas, lo cual es habitual en respuestas fisiológicas las respuestas fisiológicas cambian en direcciones opuestas a partir de una línea base

- algunos ejemplos de estas respuestas bidireccionales, a partir de un nivel o línea base, son el ritmo cardíaco, la respiración y la temperatura.

- también existen casos en que las conductas son bidireccionales a partir de un punto; los organismos pueden acercarse o alejarse de un estímulo, pueden aumentar o disminuir el nivel de respuestas de apretar la palanca.

- ello se puede observar una vez que el organismo ejecuta la conducta a un nivel estable. - dada una línea base, podemos observar y medir si el organismo frente a un EC excitatorio (EC+)

cambia su conducta en una dirección, y si, frente a un EC inhibitorio (EC-) la cambia en dirección contraria.

- se ha utilizado la técnica de supresión condicionada para obtener respuestas condicionadas bidireccionales.

- sin embargo, la simple observación de una respuesta frente un EC- opuesta a la dada frente a un EC+, puede no ser suficiente para concluir que hay un condicionamiento inhibitorio.

- es necesario asegurarse de que la forma de la respuesta se debió, efectivamente, al manejo de contingencia realizado, es decir a la relación negativa entre el EC y el EI.

- en ocasiones, en el condicionamiento de aversión al sabor, la simple presentación de un sabor distinto (EC) produce un aumento de la preferencia por ese sabor.

- en el condicionamiento inhibitorio al sabor (donde el EC- señaliza la ausencia de EI, por lo tanto de malestar) debemos asegurarnos de que el aumento de la preferencia por el sabor inhibitorio (EC-) sea mayor a la observada frente a ese sabor simplemente por ser diferente al condicionado aversivamente.

- los grupos de control nos permiten, entre otras, esta importante verificación. b. Prueba de Estímulo Compuesto o Sumación de estímulos el más usado

- cuando la respuesta inhibitoria no cambia en una dirección opuesta a la excitatoria, entonces podemos tener dos interpretaciones frente a la no emisión de la conducta, por ejemplo, salivar.

- si retomamos el condicionamiento Standard realizado por Pavlov, donde en el ensayo inhibitorio, EC+/EC-, nunca se presentaba la comida, entonces, una posibilidad es que la luz se haya vuelto un estímulo condicionado inhibitorio, lo cual, en principio satisface la definición pavloviana de un EC- (su presencia reduce la RI que, en otra circunstancia se daría).

- sin embargo, otra posibilidad es que el perro no haya aprendido nada de la luz por sí misma, sino sólo de la luz con el sonido (del estímulo compuesto).

- si fuese así, el perro trataría a la luz sola como un estímulo totalmente nuevo -sin propiedades inhibitorias-.

- entonces para determinar si la luz ha adquirido propiedades inhibitorias es necesario probar la luz en otro contexto; es decir, con otro EC+ en lugar del sonido.

- fue el mismo Pavlov, quien reconociendo este problema, diseñó un método de prueba o de medición del condicionamiento inhibitorio para ello, luego de hacer el método de condicionamiento inhibitorio estándar, condicionó excitatoriamente un tercer estímulo, un estímulo táctil aplicado a la pierna del perro.

- si se aplica un test de sumación con éxito (es decir, con los controles adecuados se obtienen los resultados esperados), se puede decir con confianza que el EC- es realmente inhibitorio, independientemente del EC+ con el que se le presente.

Page 26: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 8: xxx

Métodos de Medición de la Inhibición Condicionada (cont.) c. Prueba de Retardo de la Adquisición.

- si un EC-, efectivamente, inhibe una respuesta, quiere decir que será más difícil condicionarlo para activar dicha respuesta, que un estímulo que no ha tenido un condicionamiento inhibitorio previo.

- el condicionamiento inhibitorio se mide por el tiempo que tarda un EC- en convertirse en un EC+. - La adquisición de una RC excitatoria respecto de un EC- (donde ya existe condicionamiento inhibitorio)

debería ser más lenta porque el condicionamiento excitatorio debe primero anular las propiedades inhibitorias del EC para que se observe la RC.

Page 27: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 8: ¿Qué determina la Fuerza del Condicionamiento?

¿Qué determina la Fuerza del Condicionamiento? efecto del bloqueo por mucho tiempo fue aceptado que aquello que permitía el aprendizaje asociativo era la contigüidad EC-EI y que lo que

hacía fuerte un aprendizaje de este tipo era la frecuencia de las pareaciones EC-EI es decir, cuántas veces se pareaban el EC con el EI a mayor frecuencia, mayor fuerza asociativa.

“efecto bloqueo” (Kamin) es el experimento que cuestionó la ley de la frecuencia de las pareaciones, que pone además, en entredicho a la ley de contigüidad (su suficiencia).

el experimento original de Kamin fue con un test de supresión condicionada en ratas. el diseño experimental fue el siguiente:

- se tomaron dos grupos de ratas, uno fue el grupo de bloqueo (experimental) y el otro fue el grupo control. - en la primera fase del experimento, el grupo de bloqueo recibió una serie de ensayos donde se pareaban L EI. - al final de la fase, este grupo tenía una fuerte RC (clásicamente). - en la segunda fase, se le presentaba LT EI del mismo modo que en la fase uno, sólo que L y T eran

presentados al mismo tiempo, antes del EI. - en la fase de prueba se evaluaba la fuerza de la RC frente a T, en extinción, es decir, sin el EI. - al grupo control se le hizo exactamente lo mismo, con la gran diferencia de que en la fase uno no se le presentó

ningún estímulo, por lo tanto, en la segunda fase era la primera vez que el grupo tenía experiencia con L, T y el EI. - es importante también, destacar que ambos grupos recibieron el mismo número de pareaciones en la segunda

fase, es decir, ambos tenían la misma frecuencia con T y el EI.

Grupo Fase 1 Fase 2 Fase de Prueba Resultados Experimental o de bloqueo L EI LT EI T T no elicita RC Control --- LT EI T T elicita RC

- el resultado fue que en el grupo experimental, T no sólo no generó una fuerte RC, sino que ni siquiera elicitó la RC. - Kamin propuso que L de algún modo bloqueó el condicionamiento posterior de T con el EI.

la conclusión es la ley de la frecuencia es insuficiente para predecir la fuerza de un condicionamiento. debemos conocer también, qué otros estímulos están presentes en la situación y qué historia de aprendizaje tienen esos

otros estímulos. al terminar la fase 1, con el grupo experimental, L es bastante confiable en informar acerca de la ocurrencia de la descarga. el agregar T en la fase 2, no hace que el sujeto aumente su capacidad de predecir la llegada de la descarga eléctrica es

decir, el estímulo T es redundante en información respecto al EI, no entrega información nueva. este experimento sugiere que no habrá condicionamiento si el estímulo no agrega ninguna información nueva

acerca del EI. por otro lado, para el grupo control, tanto L como T son nuevos en la fase 2, por lo tanto, ambos entregan información

valiosa respecto a la llegada del EI, la cual sería impredecible de otro modo en este grupo, Kamin ha verificado que existe RC frente a L y T por separado.

Kamin propuso el término “sorpresividad” para describir la variable que determina el aprendizaje. Sorpresividad indica el nivel de sorpresa que causa el EI al aparecer frente al sujeto según Kamin, el

organismo aprendía sólo si el EI era sorpresivo si el EI no era sorpresivo, entonces no había aprendizaje. dicho de otro modo, T no se asociaba porque el EI era total y confiablemente predicho por L, por lo tanto no había sorpresa

en la ocurrencia del EI. fueron Rescorla y Wagner quienes llevaron el concepto de “sorpresividad” un poco más lejos, formulando un

modelo matemático para predecir la fuerza del cambio asociativo producido en cada ensayo, hasta el condicionamiento total.

Modelo Rescorla-Wagner Sorpresividad del EI el modelo Rescorla-Wagner permite predecir el tipo de aprendizaje que ocurrirá y la fuerza que éste tendrá. en primer lugar predice que, dadas ciertas probabilidades, en el curso del Condicionamiento Clásico puede ocurrir una de 3

cosas: 1. el EC puede volverse más excitatorio. 2. el EC puede volverse más inhibitorio. 3. el EC puede no tener cambios en el aprendizaje.

podríamos predecir el tipo de aprendizaje (excitatorio, inhibitorio o ninguno) que ocurrirá, comparando las expectativas del sujeto respecto al EI con lo que realmente ocurre.

también se puede predecir la fuerza asociativa del EC con el EI porque el modelo de Rescorla-Wagner asume que la fuerza de la asociación está indicada por el tamaño del evento incondicionado.

es decir, cuando el aprendizaje se ha completado (la asíntota ha llegado a su punto máximo), la fuerza de la asociación estará directamente relacionada con el tamaño o la intensidad del EI.

Rescorla y Wagner supusieron que el nivel -monto- de fuerza asociativa que un EI puede tolerar en la asíntonta, depende del tamaño del EI su tamaño nos indica el monto de la fuerza asociativa que puede tolerar (soportar o producir).

en el gráfico siguiente podemos ver distintas curvas de aprendizaje (cada una representa una asociación EC EI) ellas tienen diferentes velocidades y fuerzas de aprendizaje (asíntotas).

si asumimos que el tamaño del EI puede variar entre 0 y 12 (eje Y), entonces, la fuerza asociativa máxima que el EC podría alcanzar sería de un valor cercano al valor del EI respectivo (12 - 8,5 – 6,5).

el aprendizaje más rápido es el de la línea rosada; el de mayor fuerza asociativa es el de la línea verde; el aprendizaje más lento es el representado por la línea amarilla.

Page 28: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Modelo Rescorla-Wagner Sorpresividad del EI (cont.)

Tamaño, Fuerza Asociativa y Sorpresividad del EI el modelo Rescorla-Wagner relaciona los conceptos de tamaño del EI y de fuerza asociativa y los integra utilizando

el concepto de sorpresividad, señalado por Kamin, con el objetivo de predecir, matemáticamente, la fuerza del condicionamiento en cada ensayo.

el modelo define: sorpresividad la discrepancia o la diferencia entre lo que el organismo espera (expectativa) y lo que realmente ocurre.

λ “Lambda” significará la asíntota de la fuerza asociativa que un EI puede provocar, sostener o tolerar, con un estímulo refleja el monto del evento ocurrido o tamaño del EI.

Vsum es la fuerza asociativa de todos los EC presentes en el ensayo (puede ser 1 o varios si se presentan estímulos compuestos) es una medida de la expectativa del sujeto respecto al tamaño del EI.

ambos eventos, λ y Vsum, son variables intervinientes que no pueden observarse directamente, lo que sí podemos observar es el tamaño de la RC, el cual aumenta y aumenta hasta acercarse a una asíntota.

dado que el modelo asume que la RC está directamente relacionada con Vsum, lo que se representa es el cambio total en la fuerza asociativa de cada EC con su EI a través de los ensayos.

el valor máximo que la asíntota del aprendizaje puede alcanzar está dado por el valor máximo que el EI correspondiente puede sostener (o de su tamaño) las expectativas del sujeto serán más y más cercanas a lo que realmente ocurre a medida que transcurre el condicionamiento o aprendizaje.

Entonces, el modelo Rescorla-Wagner predice que en cada ensayo, el tipo de condicionamiento dependerá del nivel de sorpresividad del EI o de la discrepancia entre lo que se espera y lo que realmente ocurre.

dicho, en términos matemáticos se establecerá una diferencia entre dos cantidades: λ y Vsum. gracias al modelo Rescorla-Wagner, podremos establecer predicciones respecto al monto de cambio en la fuerza

asociativa (de cada EC) que se produce en cada ensayo: - si λ > Vsum el EC se vuelve más excitatorio. - si λ < Vsum el EC se vuelve más inhibitorio. - Si λ = Vsum el EC no tiene cambios en su fuerza asociativa.

el modelo predice que el monto de cambio asociativo para cada ensayo será proporcional a la discrepancia entre λ y Vsum, o sea a la Sorpresividad del EI mientras más sorpresivo el EI o mientras mayor sea la discrepancia entre λ - Vsum, mayor será el cambio en la fuerza asociativa del EC (aumento o disminución).

el cambio en la fuerza asociativa también depende de la saliencia del EC si en un ensayo hay dos estímulos, uno fuerte y el otro débil, habrá un cambio mayor en la fuerza asociativa del estímulo más fuerte. a esta saliencia la denotaremos como “K” porque se mantiene constante a través de los ensayos y puede ir entre 0 y 1.

Resumen de Conceptos

Evento Ocurrido λ

Evento Esperado Vsum

Nivel de Sorpresividad del EI / Discrepancia Aprendizaje

Grande Pequeño λ > Vsum: el EI está predicho por debajo de su real tamaño λ. La fuerza asociativa total de los ECs presentes en el ensayo no es lo suficientemente grande para señalar el real tamaño del EI.

Cambio Excitatorio

Pequeño Grande λ < Vsum: el EI está predicho por sobre su real tamaño λ. La fuerza asociativa total de los ECs presentes en el ensayo es más grande que el EI que efectivamente llega, el cual, en general, no llega.

Cambio Inhibitorio

Pequeño/Grande Pequeño/Grande λ = Vsum: el EI está bien predicho por el EC. No hay dado que no es posible medir, realmente, la máxima fuerza asociativa que un EI puede alcanzar, ni tampoco la fuerza

asociativa del EC, al hacer las predicciones del cambio asociativo, se le asignará valores arbitrariamente. lo interesante es que, a pesar de que asignamos valores arbitrarios es posible predecir el cambio y la dirección en la fuerza

asociativa del EC, es decir el monto y tipo de aprendizaje en cada ensayo.

Page 29: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Resumen de Conceptos (cont.)

supongamos que realizamos un procedimiento de supresión condicionada donde utilizamos una descarga eléctrica de 1mA

como EI y supongamos que la máxima fuerza asociativa que este EI puede provocar es λ = 100.

Prediciendo la Adquisición la etapa de adquisición si utilizamos un solo EC (luz) Vsum=0 en el primer ensayo la fuerza asociativa de la luz es cero porque no ha habido

ningún aprendizaje previo con la luz. la discrepancia entre λ y Vluz es 100 (λ – Vluz) = (100 – 0) = 100 la discrepancia es máxima y dado que λ > Vluz, el

condicionamiento será excitatorio. el modelo establece que el monto del aprendizaje, en cada ensayo, será proporcional a la discrepancia o sorpresisividad, y

esta proporción depende de la saliencia de la luz asumamos que esta luz en particular tiene una saliencia K = 0,2 en cada ensayo en el cual esté presente la luz, el

cambio Vluz será igual al 20% de la discrepancia entre (λ – VI). el monto de aprendizaje, o cambio asociativo de la luz, en el primer ensayo será Δ Vluz = 0,2 * (100–0) = 20 unidades. en el ensayo 2 la luz parte con una fuerza asociativa de 20 unidades (Vluz=20) Δ VI = 0,2 * (100–20) = 16 unidades

el cambio asociativo de la luz ocurrido en el segundo ensayo es de 16 unidades. en el ensayo 3 se Vluz = 36 (20+16) , Δ VI = 0,2 * (100–36) = 12,8 la fuerza asociativa de la luz es de 12,8

unidades

el monto de cambio en los sucesivos ensayos (señalado con la flecha) va disminuyendo cada vez más y éste es

proporcional a la discrepancia entre λ – Vsum (señalada con paréntesis de llave) mientras menor la discrepancia, menor el cambio asociativo.

Existe una discrepancia de 100 en el primer ensayo, por ende el cambio asociativo será el mayor de todos los ensayos, 20 unidades.

para el ensayo 10, la discrepancia será sólo de 13,4, por lo cual el incremento en el cambio asociativo del EC será sólo de 2,7 unidades.

por otra parte, el valor asociativo del EC comienza en cero, sin embargo para el ensayo 10 se habrá elevado a 89,3 y en los sucesivos ensayos estará cada vez más cerca de la asíntota de 100.

si bien los valores de λ y K son arbitrarios, la forma general de la curva de adquisición predicha por el modelo, será siempre la misma, no importa los valores utilizados esto significa que el modelo predice que los incrementos iniciales en la fuerza asociativa de Vsum, serán los más grande y se irán haciendo cada vez más y más pequeños a medida que se acerquen a la asíntota.

Ensayo Lamda Vsum (VI) Discrepancia Cambio (∆VI) 1 100 0 100 20 2 100 20,0 80,0 16 3 100 36,0 64,0 12,8 4 100 48,8 51,2 10,2 5 100 59,0 41,0 8,2 6 100 67,2 32,8 6,6 7 100 73,8 26,2 5,2 8 100 79,0 21,0 4,2 9 100 83,2 16,8 3,4 10 100 86,6 13,4 2,7 11 100 89,3 10,7 2,1 12 100 91,4 8,6 1,7

Page 30: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Prediciendo el fenómeno de Sombreado veremos cómo el modelo predice los cambios asociativos para 2 estímulos presentes en cada ensayo (Vsum = VI + Vs). Pavlov descubrió un fenómeno al que llamó sombreado o sombreamiento:

- este experimento consiste en un estímulo compuesto de 2 estímulos de diferentes intensidades: uno fuerte y el otro débil.

- después de algunos ensayos de pareamientos, el estímulo intenso elicita una fuerte RC y el débil elicita una débil RC, si es que elicita alguna del todo.

- en esta situación, no es que el EC débil sea demasiado pequeño para producir una RC, ya que si se parea por si sólo con el EI, rápidamente es capaz de generar una RC sin embargo, cuando se presenta con un estímulo más intenso, éste parece enmascarar o sombrear al más débil.

diferencia entre bloqueo y sombreamiento en el bloqueo hay un aprendizaje previo con uno de los estímulos, en cambio en el sombreamiento no hay experiencia previa con los estímulos.

supongamos que usamos la misma luz anterior como VI, con una saliencia de K=0,2 y un sonido muy fuerte como Vs, con una saliencia K=0,5. En el primer ensayo, Vsum = VI + Vs = 0 ya que no hay experiencia previa con ninguno de los estímulos, por lo tanto, la discrepancia es 100 λ - Vsum = 100 - (0+0) = 100

- en el ensayo 1 ambos estímulos cambian con velocidades distintas, dependiendo de su saliencia (K). Δ VI (cambio de VI en el primer ensayo) = 0,2 * (100 - 0) = 20 Δ Vs (cambio de Vs en el primer ensayo) = 0,5 * (100 - 0) = 50

- por lo tanto, después del primer ensayo, la fuerza asociativa total de ambos estímulos es 70 y la discrepancia se habrá reducido a 30:

Vsum = 20 + 50 = 70 λ - Vsum = 100 - 70 = 30

- en el ensayo 2 el incremento para cada uno de los estímulos será: Δ VI = 0,2 * (30) = 6 Δ Vs = 0,5 * (30) = 15

- el incremento total de Vsum, es decir, de ambos estímulos, en este segundo ensayo es de 21: Vsum = 6 + 15 = 21

- de este modo, al finalizar los dos ensayos la fuerza asociativa de ambos estímulos es 91 y la discrepancia se habrá reducido a 9:

Vsum = 70 + 21 = 91 λ - Vsum = 100 - 91 = 9

- observe la rapidez de este aprendizaje o del acercamiento de la fuerza asociativa de Vsum al valor de la asíntota (λ = 100), aunque nunca alcance, exactamente tal valor.

- al décimo ensayo, los valores asociativos para cada estímulo serán aproximadamente: VI = 28,6 Vs = 71,4

- por lo tanto, el total de la fuerza asociativa para ambos estímulos será cercano a 100 Vsum = 28,6 + 71,4 = 100. - si comparamos los valores de ambos estímulos en el ensayo 10, podemos ver que el tono ha acaparado casi toda

la fuerza asociativa posible para esos dos estímulos (71,4), por lo tanto, el modelo predice que la luz nunca pasará de las 30 unidades de fuerza asociativa.

- esto es justamente lo que ocurre, la luz genera una RC débil y nunca logrará generar un EC más fuerte que el sonido ya que la sorpresisividad del EI provocará una asociación más poderosa con el estímulo más fuerte.

- la predicción anterior se basa en que el modelo establece que aún existiendo 20 estímulos presentes (EC) en un condicionamiento excitatorio, el total de sus fuerzas asociativas no puede nunca exceder el valor de λ, el cual es el valor máximo de fuerza asociativa que el EI puede tolerar.

Resumen el modelo permite predecir los cambios en la fuerza asociativa EC-EI en cada ensayo. los fundamentos para esto son que el EI tiene que ser sorpresivo para producir cambios; si no hay sorpresa, no hay

aprendizaje. debido al rol fundamental del EI, y al cambio en su nivel de sorpresividad que en cada ensayo va disminuyendo, esta teoría

se enmarca dentro de las que consideran la reducción del EI como lo fundamental para explicar la reducción del cambio en la fuerza asociativa a través del condicionamiento.

otras teorías explican la reducción del cambio en la fuerza asociativa a través del condicionamiento, con hipótesis centradas en la reducción de la capacidad del EC para sociarse con el EI “teorías de reducción del EC”.

en la actualidad, ambos tipos de teoría son importantes en la explicación complementaria de fenómenos. aún faltan esquemas o paradigmas unitarios que expliquen el condicionamiento clásico.

Page 31: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 9: Condicionamiento Operante

Introducción el condicionamiento operante abre la puerta a la idea de un organismo activo al momento de aprender, que es capaz de

predecir las consecuencias que podrá tener su conducta y en base a eso organizar y regular su propio comportamiento.

el ambiente sigue siendo un aspecto crucial para determinar lo que se aprende algunos teóricos han llegado ha plantear que si cambiamos las consecuencias de una conducta podríamos modificar cualquier comportamiento.

sin embargo, la investigación también nos ha demostrado que existen algunas restricciones para que se cumpla este planteamiento teóricamente correcto.

procedimiento donde el organismo (y el ser humano que es lo que más nos interesa) se va haciendo cada vez más activo y participativo en el proceso de aprender.

Condicionamiento Instrumental condicionamiento operante procedimiento en el cual un organismo aprende de las consecuencias que opera su

comportamiento en el ambiente aprendemos de las consecuencias que tiene nuestra conducta. si conducimos a exceso de velocidad (sabiendo que no debemos hacerlo) y este comportamiento no recibe sanción alguna,

lo más probable es que esta forma de conducir se repita ya que la consecuencia que obtuvimos fue positiva, esto es, llegamos rápido al lugar donde nos dirigíamos, y nadie nos infraccionó.

condicionamiento operante = condicionamiento instrumental = aprendizaje por consecuencias. E. Thorndike es el padre del condicionamiento instrumental.

Condicionamiento Operante y sus principales elementos el paradigma básico del condicionamiento operante es la relación entre 3 elementos un estímulo antecedente, una

respuesta y un estímulo consecuente: A – B – C

antecedente conducta consecuencia (estímulo (operante o (apetitiva o discriminativo) instrumental) aversiva)

E R C E R E

a pesar de ser 3 los elementos, en general el Condicionamiento Operante o Instrumental se define considerando sólo 2

el aprendizaje de relaciones entre la conducta y los estímulos que la siguen (porque estos 2 elementos constituyen la relación central de la tríada).

en el condicionamiento instrumental se fortalece la relación entre el estímulo y la respuesta E – R paradigma del condicionamiento instrumental “las conductas están determinadas por sus consecuencias”. la conducta operante o instrumental es todo comportamiento que permite al organismo operar sobre el

ambiente y obtener lo que necesita, o bien evitar o escapar de un peligro. se dice que una conducta es instrumental cuando su realización tiene alguna consecuencia para el individuo que la realiza

la conducta es un instrumento en la consecución de ciertos objetivos. el estímulo discriminativo o antecedente (o estímulos delta E∆)

- estímulo de aparición anterior a la respuesta instrumental asociado a un cambio en la probabilidad de la consecuencia una vez realizada la respuesta.

- es el estímulo (refuerzo o castigo) que señaliza la consecuencia discrimina cuando viene o no el refuerzo o castigo.

- forma parte de la situación ambiental o el contexto en que se encuentra el sujeto; del conjunto de estímulos presentes, alguno o algunos señalan una mayor o menor probabilidad de que la respuesta sea seguida por la consecuencia.

- un estímulo será discriminativo si la probabilidad de que la respuesta sea seguida por la aparición de la consecuencia cuando está presente es distinta de la probabilidad de que sea seguida por la consecuencia cuando está ausente.

- un estímulo va a ser discriminativo si y sólo si se realiza la conducta si la conducta no se realiza no es un estímulo discriminativo.

- el estímulo alfa (Eα) es aquel que señaliza que no viene la consecuencia. la respuesta instrumental:

- conducta modificable por sus consecuencias la única forma de saber si una respuesta es instrumental o no es someterla a condicionamiento y observar si cambia.

- cualquier respuesta realizable "voluntariamente" y cuya realización genere suficiente retroalimentación sensorial como para ser perceptible puede ser modificada por sus consecuencias.

- la conducta “opera” en el medio tiene un efecto en el medio conducta operante - la conducta tendrá consecuencias que debilitarán o reforzarán la conducta.

Page 32: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Principales Métodos de Investigación 1. Método de Operante Libre

- el sujeto puede realizar la conducta operante en cualquier momento y cuántas veces lo desee. - la duración de cada ensayo no es importante, sino más bien la ocurrencia de la relación respuesta-consecuencia. - esta situación se estudia en una caja diseñada especialmente para medir conductas de modo continuo “Caja de

Skinner”. - Caja de Skinner se trata de una caja en una de cuyas paredes se encuentra algún objeto cuya manipulación

constituye la respuesta instrumental (en el caso de una caja para ratas se trata de una palanca que puede presionarse hacia abajo, en el caso de palomas de un disco que puede ser picoteado) debajo de este objeto hay un comedero en el que puede caer un comprimido de alimento procedente del exterior de la caja, la caja lleva incorporado un pequeño parlante y una lámpara para que una luz o un sonido puedan actuar como estímulos discriminativos.

2. Método de Ensayos Discretos - la respuesta operante puede realizarse sólo una vez en cada ensayo a diferencia del método anterior, cada

ensayo es importante, y se mide en términos del tiempo máximo que se le da al organismo para que ejecute la conducta.

- si el organismo no ejecuta la conducta, se saca al organismo de la situación y se considera finalizado el ensayo. - esta situación se estudia con corredores rectos, “T” o “L”, con laberintos radiales de 8 corredores o brazos o con

laberintos clásicos, pero simples. - corredor recto se trata de un pasillo recto de longitud variable con una caja en cada extremo; en uno de ellos

(caja de salida) se coloca al animal al comienzo del ensayo un "muro" elevable permite el acceso al resto del corredor, que la rata recorre hasta llegar al otro extremo, en el otro extremo hay otro "muro" que al elevarse permite el acceso a la caja meta donde se coloca la comida.

tanto en la caja de Skinner como en el corredor recto, el sujeto dispone de una única posible relación de respuesta-

consecuencia (apretar la palanca o recorrer el laberinto respectivamente). sin embargo, cuando se quiere estudiar cómo se escoge entre varias posibilidades de “consecuencias”, se dispone la

situación de modo que el sujeto pueda “elegir” entre al menos dos opciones (2 palancas, 2 cajas metas). a este tipo de situación, en la cual el sujeto dispone de 2 o más respuestas alternativas y cada una de ellas está asociada a

diferentes consecuencias se le conoce como situación de elección (puede ser estudiada con cualquiera de los dos métodos anteriores).

Condicionamiento Operante y sus principales elementos (cont.) el estímulo consecuente consecuencias:

- estímulo que sigue a la respuesta puede ser cualquier cambio perceptible por el sujeto (aparición o desaparición de algo).

- una condición necesaria para que el condicionamiento instrumental se manifieste conductualmente es que el estímulo consecuente tenga carácter motivante para el individuo (sea apetitivo o aversivo).

- puede ser un refuerzo o un castigo: refuerzos estímulo que aumenta la probabilidad de que la conducta se repita en el futuro. castigos estímulo que disminuye la probabilidad de que la conducta se repita en el futuro.

- un refuerzo o un castigo puede serlo para una persona y para otra no además, para una misma persona, un refuerzo o un castigo va a serlo en un momento y en otro no.

- tanto el refuerzo como el castigo son eventos o estímulos.

Medición de la Conducta Instrumental al ser repetidamente seguida por la consecuencia, la respuesta instrumental se modifica en algún aspecto. la medición de este cambio permite inferir el aprendizaje que el procedimiento ha producido. la medida de la conducta instrumental dependerá de la situación experimental específica. corredor recto:

- velocidad con que el animal lo recorre. - tiempo que tarda en iniciar la carrera. - porcentaje de ensayos en que el animal llega al final del corredor.

laberinto en "T": - grado de preferencia del animal por uno de los dos brazos, es decir, la proporción de veces que escoge uno de

los brazos del total de ensayos. caja de Skinner:

- tasa de respuestas o promedio de respuestas por minuto, para lo que generalmente se utiliza el Registro Acumulativo de Respuestas.

- el registro acumulativo de respuestas es un aparato desarrollado por el mismo Skinner en el que una plumilla va dibujando un trazo sobre un rollo de papel que está constantemente en movimiento. Cada vez que el sujeto realiza una respuesta, la plumilla se desplaza hacia arriba sin retorno a una pequeña longitud fija, esto va produciendo pequeños escalones de una misma altura justo en el momento en que se emite la respuesta. El desplazamiento vertical de la plumilla indica la frecuencia acumulada de respuestas hasta ese momento, el desplazamiento horizontal indica el tiempo transcurrido, la pendiente muestra la velocidad con que se está respondiendo o la tasa de respuestas. Si se produce una pausa, el registro es horizontal. La tasa de respuesta se indica por la pendiente del registro acumulativo. Por otra parte, la pendiente del registro acumulativo se puede calcular como: distancia vertical / distancia horizontal.

Page 33: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Términos Básicos en la Medición de las Conductas Operantes tasa de respuesta es el número de respuestas del organismo en un tiempo determinado número de respuestas /

tiempo línea base de respuesta la tasa espontánea de una respuesta antes de comenzar el proceso de condicionamiento

medida pre-experimental. extinción es el decremento en la tasa de respuesta operante producto del retiro del evento apetitivo que previamente

era contingente a esa respuesta operante. Diseños básicos de Investigación en Psicología Conductual diseño Intersujetos Multigrupo consiste en aplicar un entrenamiento diferente en algún aspecto a cada uno de los

distintos grupos y compararlos en cuanto al aprendizaje que alcanzan. diseño Intrasujeto o N = 1 comparación de dos o más entrenamientos dentro de un mismo sujeto.

Contingencias Operantes lo que define un procedimiento como instrumental es el que se disponga una relación entre cierta respuesta y cierto

estímulo “contingencia” puede ser positiva o negativa, y es análoga al concepto de contingencia revisado en el condicionamiento clásico es una comparación entre dos probabilidades:

1. la probabilidad de que se de un estímulo dado que se ejecutó la conducta o respuesta p(E/R) 2. la probabilidad de que se de un estímulo dado que no se ejecutó la conducta p(E/No R)

contingencia positiva cuando la probabilidad de obtener el estímulo habiendo realizado la conducta es mayor que la

probabilidad de obtenerlo sin haberla realizado p(E/R) > p(E/No R) contingencia negativa cuando la probabilidad de conseguir el estímulo es mayor si no se realiza la conducta que

realizándola p(E/R) < p(E/No R)

Page 34: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 10: Antecedentes Históricos del Condicionamiento Operante

Introducción una de las formas más obvias de motivar una conducta es recompensándola. sin embargo, si es tan obvio que podemos modificar una conducta con recompensas ¿por qué, en muchas ocasiones,

es tan difícil cambiar la conducta? claramente la simple entrega de recompensas no es suficiente para lograr la modificación conductual. se requiere un conocimiento de qué es lo que modifica y mantiene una conducta para poder manejarla efectivamente y

producir los efectos deseados.

Antecedentes Históricos Thorndike Ley del Efecto

- Edward Thorndike (1898, 1911) fue el primer estudioso acerca de cómo las consecuencias pueden modificar la conducta que no es refleja o automática (como es el caso de las respuestas en el CC).

- este investigador utilizaba unas cajas “problemas” diseñadas especialmente para sus estudios algunas cajas eran simples, el animal sólo tenía que ejecutar una respuesta, en otros casos se debían ejecutar tres respuestas.

- Thorndike interpretó la realización de la primera conducta de escape como un logro accidental. - a medida que iban ocurriendo más y más ensayos, el animal disminuía el tiempo requerido para salir de la caja. - a esta demora Thorndike la llamó latencia de escape monto de tiempo que un organismo requería para

salir en un ensayo. - Thorndike atribuyó este mejoramiento a un fortalecimiento de la relación entre el estímulo de la caja (E) y la

respuesta (R) que el organismo hacía es decir a un fortalecimiento de la conexión E-R. - “E” se refiere a cada uno de los estímulos relevantes, presentes en la caja y necesarios para escapar y “R” se

refiere a cualquier conducta que permite abrir la puerta. - Ley del Efecto:

“siendo todo lo demás igual, de todas las respuestas hechas por un animal en una determinada situación, aquellas que son seguidas por una satisfacción respecto a los deseos del animal, se conectarán firmemente con la situación, de modo que cuando vuelva a ocurrir, esas respuestas serán más probables”.

la relación E–R se fortalece si va seguida de un evento satisfactorio. “siendo todo lo demás igual, a aquellas respuestas seguidas por molestia o incomodidad respecto a los

deseos del animal, se les debilitará la conexión con esa situación, de modo que cuando vuelva a ocurrir, esas respuestas serán más improbables. Mientras más fuerte sea la satisfacción o la incomodidad, más profundo será el fortalecimiento o debilitamiento de la conexión”.

la relación E–R se debilita si va seguida de un evento no satisfactorio. - lo satisfactorio es aquello que el animal no hace nada por evitar, sino más bien por obtener y mantener. - lo insatisfactorio todo aquello que el animal evita o abandona. - la conceptualización de los términos ha sido cambiada o redefinida; sin embargo, Thorndike hizo 2 grandes aportes

con su estudio sistemático de las conductas de escape: 1. cambió el problema de cómo el animal aprende, desde el reino de la especulación hacia el reino del

estudio científico. 2. sintetizó sus hallazgos en el principio mencionado la Ley del Efecto.

Skinner Ley del Reforzamiento - reformula la Ley del Efecto e introduce el concepto de consecuencia Ley del Reforzamiento. - Ley del Reforzamiento:

lo que se fortalece es la conducta, pero debido a las consecuencias que tiene pone el énfasis en la relación R-C.

si una conducta va seguida de una consecuencia apetitiva aumenta la probabilidad de que dicha conducta se repita en el futuro.

si una conducta va seguida de una consecuencia aversiva disminuye la probabilidad de que dicha conducta se repita en el futuro.

Controversias Teóricas

a) ¿se aprende una conexión asociación o una expectativa? - Thorndike

propuso que con la consecuencia satisfactoria (la comida y el escape) lo que se asociaba era la relación entre los estímulos presentes en la caja en el momento de emitir la conducta de escape y esa conducta de escape.

serían los mismos estímulos de la caja los que elicitarían la respuesta de escape. - Tolman

formuló una propuesta cognitiva diciendo que, en realidad, el animal no es que fuese “ciegamente” activado para dar una respuesta, sino más bien, el animal generaba, producto de los ensayos exitosos, la expectativa de que su respuesta de escape abriría la puerta y alcanzaría la comida.

- Skinner no consideró ni la opción de Thorndike, ni la opción más cognitiva de Tolman (por considerarla irrelevante

en términos explicativos). consideró que era la comida o el resultado “satisfactorio” lo que fortalecía, no la conexión entre los

estímulos antecedentes y la respuesta sino que fortalecía la relación entre la respuesta y la consecuencia misma (conexión R-C o R-E).

sin embargo, reconoció la importancia de los estímulos antecedentes como discriminativos para la emisión de la conducta.

Page 35: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Controversias Teóricas (cont.) - el debate era si se aprendía una asociación E-R o una expectativa respecto de las consecuencias

hasta hoy no existe una respuesta única a este debate. - no se necesita una expectativa consciente (meta) para que una determinada consecuencia modifique la

conducta de un organismo. - independientemente de que se forme o no una asociación R-E, hoy el procedimiento operante se entiende como

un procedimiento donde la relación se da entre las respuestas y sus consecuencias. b) ¿es una Recompensa o un Reforzador?

- Thorndike dio la connotación de recompensa al evento “satisfactorio” diciendo que era algo que el animal no

hacía nada para evitar incluso hacía cosas para obtener y preservar. por lo tanto, podemos usar el mismo evento satisfactorio en otra situación y deberíamos esperar que la

conducta aumente. - actualmente los teóricos prefieren usar el término reforzador para referirse a ese evento que, cuando se

presenta contingentemente a una respuesta, aumenta la probabilidad de ocurrencia de esa conducta en el futuro. - recompensa:

sólo implica un estímulo “agradable”. no es visible o, en todo caso, no es directamente accesible al animal hasta que éste haya tenido el

comportamiento deseado. - reforzador:

es una definición relacional implica una relación con la respuesta, porque tiene que ser presentado cuando la respuesta se da.

sin embargo, esta definición no es teleológica (con finalidad) no implica ninguna búsqueda o expectativa por parte del animal.

está disponible de inmediato y el animal no puede saber qué comportamiento le ha permitido conseguirlo

Un cambio en el método experimental de la caja problema a la caja de Skinner: Thorndike usó cajas problemas para estudiar la conducta de gatos y perros. otros autores utilizaron laberintos para el estudio de las conductas de ratas. si bien los primeros laberintos mimetizaban los laberintos que se dibujan para que los niños tracen una línea hasta una

meta, pronto éstos resultaron muy difíciles para el estudio de conductas simples en ratas, por lo cual se simplificaron paulatinamente hasta llegar a los laberintos T, o aquellos que simplemente constan de un pasillo largo con una caja meta al final.

el instrumento utilizado dependerá del tipo de tarea que se quiera estudiar los laberintos de brazos radiales son una buena opción cuando se estudia memoria.

Skinner Caja de Skinner (o caja operante) el paso que cambió la investigación conductual - modificó y automatizó la entrega de comida. - Se preguntó ¿por qué no, simplemente, poner al animal en una caja y enseñarle una conducta que pudiese repetir

continuamente, sin necesidad de ponerlo y sacarlo en cada ensayo? se desarrolla un nuevo paradigma a partir de un nuevo enfoque en la medición de la conducta.

Procedimiento de Moldeamiento (shaping) o de aproximaciones sucesivas en la caja de skinner, para asegurarse de que la rata verá y se comerá el pellet tan pronto como se lo entreguen, se hace

un procedimiento de entrenamiento al comedero. este entrenamiento consiste en que cada vez que la comida es entregada, el dispensador emite un ruido de máquina

este sonido produce una respuesta de orientación, por lo que pronto la rata aprende a acercarse al comedero cuando el sonido se produce (el sonido se produce antes de que la rata vea la comida y se la pueda comer).

cuando la rata ha aprendido que el ruido señaliza el pellet, comienza el proceso de Moldeamiento propiamente tal que consiste en entregar la comida cada vez que la rata emite una conducta que se acerca a la que se quiere lograr.

esto se hace por aproximaciones sucesivas es necesario dividir la conducta meta en sub-componentes. en el proceso de creación y desarrollo de esta caja de Skinner y sus objetivos, están las bases del condicionamiento

operante la relación operacional entre la conducta y su consecuencia. con esta caja se pueden estudiar diferentes variables que pueden afectar la conducta la demora en la entrega de la

comida, la periodicidad en la entrega de la comida, el cambio en el tipo de estímulo que la rata recibe (descarga eléctrica por ejemplo), etc.

todo ello con el beneficio de tener una unidad medible de conducta (la operante), de tener un control de las variables independientes y de tener un registro continuo de la conducta.

moldeamiento es un aprendizaje de conductas meta a través de reforzamientos o aproximaciones sucesivas es un reforzamiento de aproximaciones sucesivas a la conducta meta.

a través de estas aproximaciones sucesivas se enseñan conductas operantes.

Page 36: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Condicionamiento Operante (cont.) el nuevo paradigma R E

- Skinner definió a la conducta relacionada con consecuencias como conducta operante en el sentido de que la conducta opera en el medio produciendo un efecto en él.

- esto no quiere decir que el organismo busque producir ese efecto, ni que tenga una responsabilidad “moral” en ese efecto necesariamente.

- este “operar” en el ambiente puede explicarse a través de un ejemplo donde la consecuencia está lejos de ser “producida” por quien emite la conducta, si bien eso es lo que pareciera.

- si la conducta A de la mujer de un hombre golpeador, es seguida de una golpiza, eso no significa que la conducta A “produjo” la consecuencia en el sentido de que la conducta A sea la “culpable” de la agresión del hombre. Sin embargo, dado que el hombre es “golpeador”, esa consecuencia (la golpiza), sí es contingente (está correlacionada) a la conducta A y afectará su emisión en el futuro, disminuyéndola.

- la relación de causalidad entre la conducta A y la consecuencia es funcional, no intencional. - esta relación entre la respuesta y la consecuencia (R E) es la diferencia fundamental entre el CC del CO. - en el CC la relación de contingencia es entre dos eventos EC EI

no se requiere la conducta del organismo para la entrega del EI. - en el CO la relación de contingencia es entre la R y los estímulos consecuentes R E.

el estímulo que se entrega o se retira, experimentalmente, depende de la emisión de la conducta si el organismo no emite la conducta, la consecuencia no se producirá (ya sea entrega o retiro del evento).

Tipos de Reforzadores - reforzador es un evento que, cuando se presenta (se entrega) contingentemente a una respuesta, aumenta la

probabilidad de ocurrencia de esa conducta en el futuro. - si bien reforzador no es lo mismo que evento apetitivo, dado que éste último tiene una acepción más amplia -puede

ser entregado o retirado- por simplicidad puede considerarlo como un evento apetitivo. - si queremos aumentar la conducta de un organismo, tenemos que identificar los posibles reforzadores para

lograrlo. - reforzadores primarios:

son estímulos que no requieren un entrenamiento especial para ser efectivos. en general, son necesarios para la supervivencia, pero también pueden ser reforzadores sensoriales

ambos son efectivos desde el nacimiento. reforzadores sensoriales estímulos cuyos efectos físicos parecen estar relacionados, en gran medida,

con los receptores y nervios involucrados en su detección, pero que no tienen efecto en el metabolismo general una de sus características es la entrega de variedad al ambiente perceptual.

Ej.: agua, comida el animal que tenía la capacidad de asociar su conducta con la obtención de estos estímulos tenía mayores probabilidades de sobrevivir y obtener comida en el futuro se hacía más probable que, el gen que establecía la comida como reforzador, se transmitiera a las futuras generaciones

Ej.: “mirar hacia afuera de la sala experimental” estimulación visual. - reforzadores secundarios:

adquieren sus propiedades reforzantes a través de la experiencia o aprendizaje. Ej.: el dinero, la palabra “bien”. adquieren sus propiedades reforzantes a través de asociaciones con un reforzador primario. estudio de John Wolfe los chimpancés aprendían el “valor” de fichas de diferentes colores y si alguna

de ellas dejaba de ser cambiable por uvas, éstas perdían su valor: a los chimpancés ya no les interesaba trabajar por ellas.

se puede observar que la relación entre las fichas y la obtención de uvas es una relación de señal la capacidad de reforzador de la ficha puede ser adquirida por CC.

la relación está sometida a los mismos principios, aún cuando, este aprendizaje posee una característica especial no igualada en el CC la característica de la relación es que el reforzador secundario se parea, y de hecho es muy útil hacerlo y se promueve que así sea, con una gran diversidad de reforzadores primarios, porque esto lo hace aplicable a un amplio rango de situaciones.

- reforzadores sociales: estímulos cuyas propiedades reforzantes derivan de la conducta de otros miembros de la misma

especie. incluye conductas como orgullo, caricias, afecto, atención, rechazo. tienen un poco de primarios y secundarios Ej.; una simple sonrisa puede reforzar la conducta de un

bebé de 3 meses (lo cual indica que sería primario); por otro lado, existen otros reforzadores sociales que pueden adquirir y aumentar sus propiedades reforzantes si se asocian con otros reforzadores, incluso extinguirse si dejan de asociarse con ellos (serían secundarios).

aunque el reforzador social pueda tener una base innata, la experiencia juega un rol importante. la razón más fuerte para tratarlos como reforzadores de categoría distinta a los dos primeros señalados

anteriormente, es su importancia práctica este tipo de reforzadores son los más comunes en nuestra vida diaria, aún cuando son bastante subestimados en su importancia en el control de la conducta.

Caso de Aplicación - modificación de la conducta de Ann a partir de un reforzador social (Allen, Hart, Buell, Harris y Wolf). - método utilizado línea base de conducta - intervención (reforzador social) - cambio a las condiciones originales

de refuerzo - intervención (reforzador social). - los autores destacaron que la conducta de Ann era producto de la “atención” de los adultos. - dado que la atención era un reforzador social poderoso para esta niña, los profesores estaban reforzando las

mismas conductas que querían eliminar. - el programa de los autores incluyó un cambio en las contingencias de reforzamiento dejar de prestar atención a

Ann cuando ésta estaba sola y, en cambio, comenzar a prestar atención a ella cuando hacía las conductas que los profesores esperaban que hiciera: compartir, conversar y jugar con los otros niños, es decir, que pusieran atención a la interacción social de Ann con los otros niños.

Page 37: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 11: Procedimientos de Condicionamiento Operante y Programas de Reforzamiento

Introducción programas de reforzamiento procedimientos utilizados en la modificación de la conducta. ejemplo el método de aproximaciones sucesivas o moldeamiento es un método que se basa en una relación

determinada entre la conducta y la consecuencia (una contingencia positiva) y en la entrega de un tipo de evento en particular (uno apetitivo).

Skinner la relación entre la conducta y la consecuencia modifica la probabilidad de ocurrencia de la conducta en el futuro.

sin embargo, la relación R E no es tan sencilla; puede que la conducta esté controlada, además, por otras contingencias que pueden modificar la “intención” de futuras conductas.

Entonces, hay tipos de contingencias que pueden controlar nuestra conducta y tipos de estímulos que pueden encontrarse (o no) en cada una de ellas.

Contingencias y tipos de Estímulos la contingencia es la relación entre la conducta y las consecuencias. normalmente, al emitir conductas en el diario vivir, éstas tienen consecuencias, de mayor o menor trascendencia. existe una contingencia positiva o relación positiva entre la conducta y su consecuencia, cuando la conducta es

seguida por un evento o estímulo el estímulo se presenta después de que se ha emitido la conducta. existe una contingencia negativa o relación negativa entre la conducta y la consecuencia, cuando la conducta es

seguida por el retiro o la ausencia total de un evento o estímulo el estímulo se retira tan pronto el organismo emite la conducta, o bien nunca se presenta, precisamente debido a que el organismo emitió la conducta.

tanto en una contingencia positiva como en una negativa, el estímulo que se retira o no se presenta, respectivamente, puede ser de 2 tipos:

- aversivo (desagradable) - apetitivo (agradable).

por lo tanto, los resultados en la conducta dependerán: - de la contingencia. - del tipo de estímulo que se presenta o se retira contingentemente a la conducta.

Procedimientos Operantes considerando las posibles contingencias y los posibles estímulos que se pueden utilizar, hay 4 procedimientos (que

utilizan el condicionamiento operante) posibles de modificación conductual. son sistematizaciones del uso de los refuerzos y castigos para aumentar o disminuir la probabilidad de ocurrencia de una

conducta. Contingencia Positiva:

Presentación Contingencia Negativa:

Retiro del estímulo después de la conducta

Estímulo Apetitivo Reforzamiento Positivo - la conducta es seguida por la entrega de

un evento apetitivo.

La conducta….aumenta

Castigo Tipo II o Entrenamiento por Omisión

- la conducta es seguida por el retiro de un evento apetitivo.

La conducta….disminuye

Estímulo Aversivo Castigo Tipo I - la conducta es seguida por la entrega de

un evento aversivo.

La conducta….disminuye

Reforzamiento Negativo o Entrenamiento de Escape-Evitación

- la conducta es seguida por el retiro de un evento aversivo.

La conducta….aumenta

los castigos son más eficaces (en términos de rapidez) en modificar la conducta. las conductas que se refuerzan con reforzamiento negativo se llaman conductas de escape (cuando el estímulo aversivo ya

está presente) o evitación (cuando se previene la ocurrencia del estímulo aversivo). En un análisis: 1. identificar cuál es la conducta operante que se quiere modificar.

2. identificar el estímulo (refuerzo o castigo). 3. definir si se entrega o retira el estímulo.

Ejemplos: reforzamiento positivo: una persona confía algún “secreto” a un amigo y éste le responde con empatía y reconocimiento

de su valor como persona; en este caso, la conducta instrumental de “contar un secreto” recibe un evento apetitivo, por lo cual es probable que la conducta de “desahogo” se repita en el futuro con ese amigo.

reforzamiento negativo: un individuo toma una aspirina y esto es seguido por el término del dolor de cabeza; en este caso, el individuo, escapa al evento aversivo (dolor de cabeza) con la conducta instrumental de tomar la aspirina; en otros casos se puede evitar completamente el evento aversivo.

castigo tipo I: un niño pequeño recibe una burla por llevar su “tuto” a la casa de su amigo; en este caso, la conducta operante de “llevar el tuto” fue seguida de un evento aversivo, la burla, por lo cual es altamente probable que el niño no vuelva a mostrar su “tuto” fuera de casa o que lo abandone del todo.

castigo tipo II: a un adolescente se le quita parte de su “mesada” por haber llegado tarde; en este caso, el joven seguramente intentará llegar más temprano la siguiente vez, porque su conducta de llegar tarde fue seguida por el retiro de algo agradable.

Page 38: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Entrega del Refuerzo hay otros aspectos que son cruciales en el manejo de contingencias:

1. la contigüidad entre la respuesta y la consecuencia la demora entre la conducta y la consecuencia (resultado). 2. qué tan frecuentemente se entrega o se retira el estímulo después de que se ha emitido la conducta tiene que

ver con los programas de entrega del estímulo. 1. Importancia de la demora R consecuencia:

- la demora en la entrega de la consecuencia, luego de que se ha emitido la conducta, produce efectos devastadores en el aprendizaje, dependiendo de la especie.

- en las ratas, una demora del refuerzo de 64 segundos produce un nivel de aprendizaje muy bajo comparado con una demora de 2 a 4 segundos.

- en el ser humano la demora en la entrega del refuerzo puede ser mayor a 64 segundos dependiendo de la tarea. - el efecto de la demora puede ser minimizado si se introducen reforzadores secundarios. - por ejemplo, con las ratas, si a los 3 segundos de emitida la conducta se entrega un reforzador secundario, eso

permite que la demora de 64 segundos del reforzador primario, no tenga un efecto detrimental en el aprendizaje. - en el caso del ser humano, los reforzadores secundarios cumplen el mismo efecto: una buena nota a mitad del

ramo es un reforzador importante para seguir aprendiendo hasta la aprobación del curso. 2. Programas de Reforzamiento:

- Skinner por accidente descubrió que la conducta podía ser reforzada por diferentes criterios, cuando en uno de sus experimentos dejó programada la entrega del reforzador (un dispensador de pellet) cada un minuto, en lugar de hacerlo frente a cada respuesta, porque si no, no le alcanzaría para todo el fin de semana.

- cuando regresó al laboratorio el lunes, se encontró con dos agradables resultados: sus pellet aún duraban y podrían hacerlo mucho más. las ratas continuaban respondiendo. incluso luego de algunas interrupciones iniciales lo hacían a una tasa bastante estable.

a partir de entonces Skinner se dedicó a investigar la influencia, en la conducta, de diferentes criterios para reforzar una conducta.

programas de reforzamiento criterios o reglas que determinan cómo y cuando una respuesta será seguida de una consecuencia.

estos diferentes programas de reforzamiento producen diferentes patrones de respuestas. Programa de Reforzamiento Continuo (PRC) entregar un refuerzo cada vez que el organismo emite la respuesta; es

el programa más simple. Programa de Reforzamiento Parcial sólo algunas de las veces que emitimos la conducta nos llegua el reforzador lo

más común en la vida real (los niños no obtienen un regalo cada vez que hacen su tarea, el vendedor no logra una venta cada vez que negocia con un cliente).

Programas de Reforzamiento

Programa de Reforzamiento Continuo (PRC):

- el refuerzo se entrega siempre que se realiza la conducta. - se utilizan para enseñar conductas operantes nuevas (crear operante) si esperamos que el organismo perciba

una relación causal entre su nueva conducta y su consecuencia, tenemos que reforzarla cada vez que aparece. - en un moldeamiento hay que utilizar un PRC.

Programa de Reforzamiento Parcial: - el refuerzo se entrega cada cierto tiempo o cada cierta cantidad de veces de realización de la conducta. - se utilizan para mantener una conducta operante (respuesta) ya aprendida o adquirida (mantener operantes). - los programas parciales o intermitentes más estudiados son: - Programa de Razón la entrega de refuerzo depende enteramente de la emisión de un número determinado de

conductas. - Programa de Intervalo la entrega del refuerzo depende de la cantidad de tiempo transcurrido después de la

última respuesta reforzada.

Page 39: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Programas de Reforzamiento (cont.) Programas de Razón Fija (RF):

- se recibe un refuerzo después de un número fijo de conductas el reforzador será entregado sólo si el organismo emite un número n de respuestas correctas, donde “n” es el número de la razón.

- Ej.: en un programa de RF20, el organismo será reforzado después de cada 20 respuestas correctas un RF1 es equivalente a un programa de reforzamiento continuo (PRC).

- hay pausas en la tasa de respuesta por reforzamiento. después de que el organismo se ha familiarizado con el programa exigido, el organismo desarrolla un

patrón de conducta característico de este programa de “conducta-no conducta”, es decir, después de cada reforzamiento se produce una pausa en el responder, la cual es llamada pausa postreforzamiento.

posteriormente, esta pausa es seguida por un elevado número de respuestas (tasa alta de respuestas) que se mantiene, en forma estable, hasta que se entrega el reforzador nuevamente.

el tamaño promedio de las pausas postreforzamiento se incrementa a medida que lo hace el monto de respuestas exigidas para la entrega del reforzador (la razón).

sin embargo, si las razones son muy grandes, el organismo comienza a agregar otras pausas, en momentos distintos a las pausas postreforzamiento esto se conoce como “ratio strain” (estrés por exigencia de respuestas).

la pausa postreforzamiento se verá influida por el tamaño del refuerzo, o si se le entrega refuerzo antes de la sesión de entrenamiento.

- genera tasas de respuestas no tan altas, pero fijas. - distintas especies tienen características conductuales similares. - Ej.: metas que se le ponen a los vendedores; trabajadores a los que les pagan por una cantidad de productos.

si a un trabajador le pagan cada 100 piezas trabaja rápida y establemente hasta que completa el set de 100, los anota y luego se toma un descanso (pausa postreforzamiento) de unos pocos minutos conversando o fumando, y luego vuelve a comenzar su siguiente set el trabajador no necesita una gran supervisión para que trabaje, ni tampoco para que acorte sus descansos.

- este programa entrega reforzadores en proporción al número de respuestas que el organismo da esto es suficiente para mantener la conducta.

sin embargo, el tamaño del refuerzo no influye en la estabilidad de la respuesta, el organismo continuará respondiendo rápida y establemente después del reforzador.

si el tamaño del refuerzo es grande, el promedio de las pausas se hace más pequeño y si se le da el refuerzo antes de la sesión, la pausa es más larga.

Programas de Razón Variable (RV): - el refuerzo se entrega después de un número variable (que está en un rango) de conductas realizadas. - Ej.: un RV10 indica que, en promedio, el sujeto recibirá un reforzador por cada 10 respuestas, pero el número

exacto de respuestas requerido en cada ensayo puede variar enormemente (1, 2, 10, 19, 40). - no tienen pausas postreforzamiento

en ocasiones se dice que no las hay, pero eso no es enteramente correcto. la pausa ocurre cuando el sujeto se fatiga o se sacia. cuando el número de respuestas promedio exigido no es muy alto, se pueden encontrar ciertas pausas

postreforzamiento, pero más breves. la causa intuitiva puede ser que, dado que no sabemos cuantas respuestas más tendremos que dar para

que se de el próximo reforzador, existe una pequeña probabilidad de que si damos unas pocas respuestas más, ocurra el reforzador nuevamente, por lo cual nos mantenemos intentando.

- genera tasas de respuesta altas y estables. - Ej.: las máquinas de monedas en los casinos y los juegos de azar:

1. las oportunidades de ganar de alguien son proporcionales al tiempo que pasa jugando. 2. el número de respuestas necesarias para recibir el siguiente reforzador es incierto. es la combinación de estas características lo que hace tan “adictivo” el juego es tan fuerte la influencia

de este programa de reforzamiento en la conducta que eso no permite que el jugador “analice” que, en realidad, las probabilidades de ganar están en su contra.

Programas de Intervalo Fijo (IF): - el reforzador depende de la conducta del sujeto y del intervalo de tiempo. - cada cierto tiempo fijo se obtiene el refuerzo, independiente de la conducta que el sujeto realice. - se reforzará la primera respuesta que se emita después de que haya pasado un monto de tiempo fijo desde la

última respuesta reforzada. - Ej.: en un IF60 segundos, después de que se la ha entregado el primer reforzador, comienza a cronometrarse el

tiempo si el organismo emite la conducta antes de que se cumpla el tiempo, no recibe refuerzo (tampoco tiene consecuencias el que no emita la conducta) después de que se cumplen los 60 segundos, el reforzador se vuelve disponible y, a partir de ese momento, si el organismo emite la conducta recibe el reforzador sólo lo recibirá si emite la conducta después de terminado el intervalo de 60 segundos mientras el reforzador está disponible, el cronómetro se ha detenido hasta que el sujeto da la respuesta y se le entrega el reforzador, luego de lo cual comienzan a cronometrarse unos nuevos 60 segundos.

- tienen pausas por reforzamiento de hecho, no se realiza ninguna conducta hasta que se cumple el tiempo. se observa una pausa postreforzamiento, al igual que en el programa de RF, sin embargo, después de

esta pausa, el organismo no comienza a responder tan rápida y establemente como en el de RF, sino gradualmente, hasta cuando se acerca el tiempo del siguiente reforzador, donde comienza a responder rápida y establemente.

- genera un patrón de respuesta típico llamado festón. como ningún organismo tiene un sentido del tiempo tan perfecto, lo usual es que comiencen a emitir

muchas conductas un poco antes de cumplirse el intervalo de tiempo. - Ej.: los sueldos fijos, el pago por hora, el cumpleaños; el lavavajilla y máquinas programables, en general.

Page 40: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Programas de Reforzamiento (cont.) Programas de Intervalo Variable (IV):

- el reforzador depende de la conducta del sujeto y del intervalo de tiempo. - el refuerzo se recibe de acuerdo a un tiempo variable (que ésta en un rango) el intervalo de tiempo varía de

reforzador a reforzador. - Ej.: en un programa IV60 segundos, el tiempo entre la entrega de un reforzador y la disponibilidad del siguiente

reforzador puede ser de 6, 300, 40, etc. segundos. el primer reforzador se entrega cuando el organismo hace la primera respuesta correcta y a partir de ahí se comienza a cronometrar el tiempo el cronómetro que mide el intervalo de tiempo se detiene cuando el reforzador se vuelve disponible y hasta que el organismo emite la conducta y recibe el reforzador en ese momento se comienza a cronometrar el siguiente intervalo.

- no hay pausas por reforzamiento: - mantiene altas tasas de respuesta y estables y continuas en el tiempo:

si el organismo se mantiene respondiendo a una tasa estable es probable que reciba el reforzador tan pronto se hace disponible y, por lo tanto, el cronómetro se mantiene andando todo el tiempo, con lo cual produce mayor cantidad de refuerzo.

sin embargo, una tasa muy alta de respuestas, no producirá mayores tasas de reforzamiento, porque hay un monto máximo de reforzadores que el organismo puede recibir en un intervalo de tiempo.

la cantidad de reforzadores que un organismo reciba no depende totalmente de él, el tiempo es una limitación.

- Ej.: el transantiago (la frecuencia de las micros es variable), chequear el correo de internet.

Extinción es el procedimiento donde la conducta instrumental del organismo, previamente reforzada, es seguida por la

ausencia del reforzador. el resultado de este procedimiento es que la conducta instrumental, comienza gradualmente a disminuir hasta desaparecer

casi completamente. en este procedimiento se observa una recuperación espontánea de la respuesta extinguida luego de transcurrido cierto

tiempo sin embargo, la magnitud y la frecuencia de la recuperación de la respuesta instrumental es cada vez menor si, cuando ocurre la conducta, ésta no es reforzada.

¿cómo influirán los programas de reforzamiento en el curso de la extinción (PRC, RF, RV, IF, IV)? la resistencia a la extinción término utilizado para referirse a la persistencia en continuar respondiendo, a pesar de

que ya no se obtenga reforzador. si bien existen distintas variables que influyen en el proceso de extinción, una de las más decisivas es el programa de

reforzamiento previo utilizado con el sujeto. - PRC resistencia a la extinción es más débil

el sujeto deja de responder rápidamente al comenzar un proceso de extinción si previamente ha recibido reforzador frente a cada una de sus respuestas.

- programas parciales o intermitentes mayor resistencia a la extinción es decir, cuando sólo se han reforzado algunas conductas hay mayor resistencia a la extinción de la

conducta efecto de extinción del reforzamiento parcial. efecto emocional que produce la extinción la frustración.

- PRC la reacción emocional es más fuerte - programa parcial la respuesta emocional de frustración es menos intensa.

por lo tanto, una forma de disminuir la frustración y de aumentar la resistencia a la extinción es utilizando un programa parcial, donde los reforzadores sean entregados sólo frente a algunas respuestas.

Resumen los procedimientos operantes generan y mantienen las conductas. si queremos implantar una conducta nueva ésta debería establecerse a través de reforzamiento positivo con una técnica

de moldeamiento donde el reforzador se de cada vez que se emite la conducta definida para esa etapa de aprendizaje PRC.

no basta reforzar una conducta continuamente para que ésta se mantenga. si queremos que la conducta perdure en el tiempo, es necesario cambiar el PRC a un programa de reforzamiento parcial,

cualquiera de los cuales produce conductas más resistentes a la extinción y una mayor tolerancia a la frustración que el PRC.

Page 41: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 12: Programas especiales de Reforzamiento

Introducción ¿Qué es más importante, en el CO, la contigüidad o la contingencia? en lo que respecta a la entrega del reforzador no sólo existen los programas simples de reforzamiento, sino también

existen reglas especiales donde se busca generar, directamente, altas tasas de respuestas o bajas tasas de respuestas. - programas concurrentes donde, no interesa sólo cómo responde el organismo frente a una modalidad de

entrega del reforzador, sino qué determina la conducta de elección frente a dos programas simples de reforzamiento que ocurren al mismo tiempo, es decir, concurrentes.

- cadena de programas donde el primero de ellos entrega un reforzador secundario que señaliza el acceso a un segundo programa que sí entrega un reforzador primario.

- programas que combinan la concurrencia de dos programas simples y el encadenamiento. pueden crearse tantas reglas o programas de reforzamiento como la creatividad del investigador lo permita. los programas anteriores, como el concurrente y el concurrente encadenado, permiten el estudio de las conductas de

elección y la comprensión de ciertas variables influyentes. aun cuando estamos lejos de conocer el por qué de estas elecciones complejas de la vida real, el estudio de conductas

simples y complejas, en el ámbito de laboratorio, ha permitido entender el rol de los programas de reforzamiento y de las características del reforzador.

Programas de Tasas de Respuestas tasa de respuesta indica un número de respuestas en un tiempo determinado los programas simples de reforzamiento generan un patrón de tasas de respuestas, en virtud del arreglo temporal

que conllevan o del número de respuestas que exigen sin embargo, no exigen una determinada tasa de respuesta. exigen, explícitamente, una tasa de respuesta para la entrega del reforzador no sólo exigen que se dé una cantidad

de respuestas, sino además, que se den en un tiempo definido. a estos programas se les conoce como Programas de Tasas de Respuestas. suponga que un sujeto responde según los intervalos mostrados más abajo:

tiempo interrespuesta (TIR) el tiempo entre las respuestas; se usa como una propiedad de la respuesta que se quiere obtener se dice que una respuesta tiene una TIR de 1 segundo, 2 segundos, etc.

Programas de Reforzamiento Diferencial de Tasas Bajas (RDB): - la respuesta es reforzada sólo si ha transcurrido un intervalo de tiempo mínimo desde la última respuesta. - en un RDB de 5 seg. el reforzador ocurre sólo después de que han transcurrido 5 segundos desde la última

respuesta cada vez que el organismo da una respuesta, el cronómetro comienza de cero si esa respuesta fue dada antes del tiempo exigido (3 segundos), el cronómetro comienza de cero y el organismo quedará sin reforzador por más tiempo (mínimo, los 5 segundos restantes, más los 3 segundos anteriores) si el organismo pudiera hacer una estimación del tiempo exacta, podría dar una respuesta cada 5 segundos, lo que equivale a una tasa de respuestas de 12 por min esta es la tasa de respuesta máxima posible para este programa de RDB (si es mayor, obtiene menos reforzadores) con lo cual obtendría un máximo de 12 reforzadores en 1 minuto.

- si responde antes no recibe reforzador y más tiempo pasa sin que reciba reforzador. - este programa promueve tasas bajas de respuestas.

Programas de Reforzamiento Diferencial de Tasas Altas (RDA): - la respuesta es reforzada sólo si se presenta antes de transcurrido un intervalo de tiempo desde la última

respuesta. - en un RDA de 5 seg. el reforzador ocurre sólo si la respuesta se presenta antes de 5 seg. desde la última

respuesta si el organismo da una respuesta justo cada 5 segundos, su tasa de respuesta será de 12 por minuto (esta es la tasa de respuesta mínima exigida en este programa) el organismo no será reforzado si su tasa de respuesta es más baja que eso si el organismo aprende a dar más respuestas en 5 seg., optimiza la entrega de reforzadores si el organismo da 3 respuestas cada 5 seg., puede obtener 3 reforzadores en 5 (36 por minuto).

- este programa promueve tasas de respuestas altas. - en la vida real, una cadena de montaje es un ejemplo de tasas de reforzamiento diferencial, donde lo que

determina la tasa de respuestas es la velocidad de la cadena: si el individuo responde más lento (montando piezas) no se le refuerza y puede ser despedido RDA. si responde muy rápido, puede ser castigado socialmente, porque la presión social entrega un programa

de RDB (el grupo se “enoja” y lo demuestra, si el individuo termina más productos que el resto).

Page 42: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Otros Programas Programa Concurrente combinan dos o más programas simples de alguna manera. sus características son las siguientes:

1. al organismo se le presentan dos o más opciones a “operar”. 2. el organismo es libre de cambiarse de una opción a otra tanto como quiera ya que ambas implican potenciales

entregas de reforzadores. 3. ambos programas están activos al mismo tiempo, cada uno con su propia exigencia conductual.

- en estos programas es posible determinar el nivel de preferencia del organismo por cada uno de los programas

presentados, ya sea midiendo la tasa de respuesta frente a cada operando o el tiempo que ocupa el organismo respondiendo en cada uno de los operandos.

Programa Encadenado el sujeto debe completar el requerimiento de 2 o más programas simples, en una secuencia fija, donde cada

programa es señalado por un estímulo diferente. sus características son las siguientes:

1. el organismo sólo tiene la opción de un programa a la vez y tiene que realizar ese programa para llegar a la opción del siguiente y así hasta llegar al reforzador primario mientras más programas se le exijan antes de llegar al reforzador primario, más se debilita la respuesta.

2. el organismo no es libre de cambiarse de un programa a otro porque sólo hay uno a la vez. 3. los programas se van activando en secuencia al lograrse el requerimiento de respuestas del primer programa se

activa el segundo cada programa está asociado a un estímulo distinto. 4. cada programa de la cadena presenta el patrón de respuesta característico de ese programa (ej.: un programa

IF10 seg.-RF15, el IF presentará el patrón de festón característico de este tipo de programa y el RF presentará el patrón con pausas, propio del programa RF).

Programa Tipo Yugo (en conjunción) son 2 programas simples, en los que el sujeto debe completar el requerimiento de ambos programas para obtener

el reforzador. Programa Concurrente Encadenado se combinan los programas concurrente y el encadenado. El sujeto primero tiene que elegir entre dos estímulos que llevan, cada uno, a un programa de reforzamiento (cadena) y al

cumplir con el requerimiento de este último programa reciben el reforzador primario. en esta combinación, al comienzo, cuando el organismo debe elegir entre dos estímulos, a diferencia de un programa

concurrente simple, el organismo no puede cambiarse de un estímulo a otro una vez que el organismo elige uno de los estímulos, adquiere un compromiso, en el sentido de “obligación”, y debe continuar hasta cumplir con el programa que se requiere de acuerdo a la opción elegida, en orden a obtener el reforzador primario si se cambia, sólo retarda el reforzador.

Page 43: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Conducta de elección simple el programa concurrente implica una elección entre 2 eventos (A o B), los cuales tienen programas de reforzamiento

distintos. en la vida diaria, nosotros estamos eligiendo continuamente entre cosas que dan lugar a diferentes reforzamientos y con

diferentes programas. en el laboratorio esta conducta fue estudiada por Herrnstein con palomas, utilizando un programa concurrente. la elección favorita:

- a Herrnstein le interesó más saber acerca de la etapa de mantenimiento de la conducta, una vez que las palomas conocían los programas de reforzamiento, que acerca de la etapa de adquisición.

¿una vez que el organismo ha aprendido todo lo que puede sobre la situación de elección, cómo distribuirá sus conductas?

¿cuál será su elección favorita?

- a partir de sus experimentos, Herrnstein formuló su conocida Ley de la Igualación:

“En una elección dual, la proporción de respuestas dirigidas hacia una de las opciones iguala la proporción de reforzadores derivados de esa opción”.

- esta ley, se resume en la ecuación siguiente:

- en esta ecuación, el lado izquierdo representa la tasa relativa de respuesta en la opción 1, donde R1 es el número

de respuestas dirigidas a la opción 1 y R2 es el número de respuestas dirigidas a la opción 2. - el lado derecho de la ecuación representa la tasa relativa de reforzadores obtenidos con la opción 1, donde r1 es el

número de reforzadores obtenidos con la respuesta-opción 1, r2 es el número de reforzadores obtenidos con la respuesta-opción 2.

- Condiciones para la Ley de Igualación en ocasiones existen ciertas desviaciones que han llevado a especificar las condiciones necesarias para que se cumpla la

ley de la igualación: 1. independencia de las dos alternativas de respuestas (en el programa tipo yugo no se cumple esta opción.) 2. que no sea difícil para el organismo ir de una opción a otra. 3. que las respuestas a cada uno de los programas sean idénticas salvo por el hecho de que, eventualmente,

serán reforzadas por programas distintos. con todo, la ley de la igualación no explica el mecanismo de elección que subyace a la elección, sólo describe cómo se da

el proceso en el sentido de que el organismo elegirá o dará mayor cantidad de respuestas en aquella opción cuyo programa le permita obtener la mayor cantidad de reforzadores.

Conducta de Elección Compleja en casos de la vida real no siempre podemos optar por uno u otro programa a cada momento Ej.: afiliarmos a una AFP

o Isapre, compra de un auto o casa. - una vez que hemos elegido, de alguna manera, estamos comprometidos con la opción elegida y con la entrega de

reforzadores que esa opción implica. en laboratorio se han investigado situaciones análogas, simplificadas, en las que el organismo al elegir, toma una opción

de compromiso de la cual no puede deshacerse los programas con los que se estudian estas elecciones complejas se llaman Programas de Reforzamiento Concurrentes Encadenados:

- en estos programas, el organismo hace una opción de compromiso en el eslabón inicial, eligiendo uno de dos estímulos presentes en ese eslabón.

- cada uno de estos estímulos está asociado (encadenado) a un programa. - al elegir, en el eslabón inicial, el organismo activa el programa respectivo y luego de cumplir el requisito de este

programa (del eslabón terminal) puede obtener, recién, el reforzador primario. - la conducta de elección en estos programas se mide por la proporción con que el organismo elige un estímulo u

otro durante el eslabón de elección inicial. - la investigación ha mostrado que, en general, la conducta de elección está determinada por las características

de reforzamiento (tamaño, calidad, tasa del reforzador) encontradas en el eslabón terminal. - los sujetos preferirán aquella opción que los conduzca al programa que les entregue la mayor cantidad de

reforzadores, los más grandes o los de mejor calidad.

Page 44: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Conducta de Elección Compleja (cont.)

Resumen la conducta instrumental está fuertemente determinada por el tipo de programa utilizado. ciertos programas simples de reforzamientos producen ciertos patrones típicos de respuesta. además, existen programas que aumentan la probabilidad de que los organismos elijan estímulos o eventos

asociados a ellos, especialmente en situaciones de elección compleja, donde no es tan sencillo cambiar de un estímulo o evento a otro.

Page 45: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 13: Autocontrol

Introducción el autocontrol puede ser estudiado con un tipo de programa de reforzamiento operante. el estudio de la conducta de autocontrol partió con el famoso estudio de Rachlin y Green, al relacionarla con la conducta

de elección. la teoría de Ainslie-Rachlin intenta explicar la conducta de autocontrol como una conducta de elección.

Autocontrol en el campo de la psicología conductual, “fuerza de voluntad” y autocontrol son diferentes.

- fuerza de voluntad se refiere a la “facultad anímica por la que el hombre se decide a obrar de un modo o de otro”, o bien tiene la acepción de “libre albedrío o libre determinación”, con lo cual queda fuera del ámbito de la ciencia que, por definición excluye elementos metafísicos y es determinista.

- autocontrol si bien existe cierta polémica por lo de “auto”, se ha logrado una operacionalización del término y un estudio científico del mismo.

¿cómo una persona puede tener autocontrol si, de acuerdo con la teoría de la conducta, nuestra conducta está determinada por el medio ambiente?

- el autocontrol no significa que el individuo puede controlar su conducta a partir de su propia iniciativa y sin influencia del medio.

- autocontrol significa que el individuo puede manejar las contingencias de su medioambiente -cambiar el medioambiente- de modo tal que genere un aumento en la probabilidad futura de la conducta.

autocontrol es la capacidad de elegir un evento apetitivo grande, que tardará en llegar, en lugar de un evento apetitivo más pequeño, pero inmediato (o bien, en su opuesto, es la capacidad de elegir un pequeño evento aversivo inmediato en lugar de uno grande más adelante).

la definición operacional no incluye la conducta que se quiere definir, el autocontrol, sino que se define de acuerdo cómo opera en el medio (elección de eventos) no definimos autocontrol diciendo que es el control de la propia conducta.

los elementos o las variables incluidas en esta definición son el tiempo y el tamaño de la recompensa (o del dolor), ambos presentes en el momento de hacer la elección.

a pesar de lo sencillo de la definición operacional de autocontrol, las personas involucradas en elecciones de corto y largo plazo, no siempre son capaces de optar por la recompensa mayor, optando muchas veces por una recompensa menor, pero inmediata.

la capacidad de autocontrol es algo que se puede adquirir, aprender, si logramos manejar las contingencias que controlan la conducta de elección.

¿qué hace que nuestra elección cambie de un momento a otro?.

Experimento de Rachlin y Green en este experimento sobre la conducta de elección, los autores incluyeron 2 variables independientes: el tiempo y el

tamaño de la recompensa. numerosos experimentos avalaban la hipótesis de que mientras más grande la recompensa más elegida sería la alternativa

conducente a dicha recompensa. sin embargo, si la recompensa pequeña era entregada casi inmediatamente y la más grande con cierta demora, las

palomas elegirían invariablemente la recompensa más pequeña, pero inmediata.

en vista de lo anterior, estos autores, decidieron variar el monto de tiempo en el cual el organismo tenía acceso a los

eslabones terminales antes de llegar a elegir entre una luz verde o roja, sería necesaria una espera que los autores variaron entre 0,5 y 16 segundos (demora en T segundos).

el procedimiento era el siguiente: - en el eslabón inicial (con A y B) a la paloma se le exigían 25 respuestas de picoteo a cualquiera de las dos luces,

es decir, la paloma podía dar 15 en uno y 10 en otro, lo importante era dónde daba el picotazo número 25, porque eso determinaba el programa que se activaba (A o B).

- con la opción A podía acceder a una recompensa pequeña en un tiempo menor y con la opción B sólo podía acceder a la recompensa final grande en un mayor tiempo.

Page 46: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Experimento de Rachlin y Green (cont.)

los resultados mostraron que mientras más corto era el tiempo de demora T entre el eslabón inicial y el eslabón final,

mayor era la preferencia que las palomas mostraban por la luz roja (opción A); la elegían sobre 95% de las veces conducta de elección simple.

con una demora breve, la paloma prefería el lado A y una vez elegido, era casi seguro que elegía la luz roja con la recompensa pequeña e inmediata.

por otra parte, si el tiempo de demora T entre el eslabón inicial y los finales se acercaba a los 16 segundos, las palomas tendían a elegir la opción B, siendo elegida casi exclusivamente cuando la demora T era de 16 segundos cuando se interponía un tiempo de demora mayor, para la elección que se debía hacer en el eslabón final, la paloma optaba, desde el comienzo, por la recompensa grande.

en otras palabras, cuando la paloma elegía A, esa elección era producto de un arreglo de contingencia tal (tiempo T pequeños) que no había compromiso, es decir, la paloma tenía la posibilidad de elegir, nuevamente, entre una luz roja y una verde donde, mayoritariamente, elegía la roja; recompensa pequeña e inmediata.

sin embargo, con otro arreglo de contingencias (aumento del tiempo T), la paloma hacía un compromiso inicial eligiendo B y mostraba la capacidad de demorar la gratificación en este caso, dado que eligió B, no había opción más tarde de elegir la recompensa pequeña, ya que sólo se presentaba la luz verde; la recompensa grande.

los autores interpretaron estos resultados como autocontrol, sin embargo, destacan que en realidad no es “auto” en el sentido de que no son las palomas las que arreglan las contingencias, sino el experimentador.

Teoría de Ainslie y Rachlin ¿por qué las elecciones del organismo cambian? esta teoría intenta explicar este cambio de preferencias que se da en

el tiempo, en estas conductas de elección compleja. son dos momentos en el tiempo donde el valor de un evento sobre el otro se invierte y es lo que hace que la

decisión cambie. supuestos de la teoría:

1. el valor del reforzador decrece a medida que la demora entre la elección y la llegada del reforzador se incrementa.

a medida que se aumenta la demora entre el momento de la elección (T2, T1) y la llegada del reforzador en T final, el valor del reforzador disminuye.

el valor del reforzador pequeño también decrece a medida que se agranda el tiempo entre la posibilidad de acceder a él y el momento de la elección (T2, T1).

para entender este supuesto, mire cada barra y su respectiva línea de valor descendente, por separado.

Page 47: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Teoría de Ainslie y Rachlin (cont.) 2. el individuo va a elegir el reforzador que tenga el valor más alto en el momento de la elección.

si en T1 comparamos el valor del reforzador pequeño y el reforzador grande, el segundo nos parecerá mayor que el primero esto es porque aún estamos lejos de la posibilidad de ambos reforzadores.

en T2 tenemos el reforzador pequeño más cerca (más accesible), por lo que su valor se hace mayor que el del reforzador grande y entonces elegimos ese reforzador inmediato.

si nos ubicamos lejos del reforzador, tendremos una mejor “perspectiva” de los valores reales de los reforzadores y elegiremos el más grande.

en cambio, si nos acercamos al reforzador más pequeño tendremos una “distorsión” en el valor de los reforzadores y elegiremos el inmediato, porque nos parece de mayor valor.

la elección cambia producto de la proximidad del reforzador por lo tanto, los sujetos sólo muestran autocontrol gracias al arreglo de contingencias entre la conducta de elección y la entrega del reforzador.

cuando el tiempo entre la elección inicial y la llegada de los reforzadores era máximo (16 segundos) las palomas elegían, mayormente, la recompensa más grande la evaluación del valor de los reforzadores era "correcta" y podían demorar la gratificación.

las palomas lograban demorar la gratificación adquiriendo un compromiso eligiendo desde el comienzo la tecla B de modo de activar exclusivamente la recompensa demorada, pero más grande.

sin embargo, este compromiso es producto de las contingencias ambientales, pues si el tiempo entre los eslabones era menor, las palomas tenían una “perspectiva errónea” y valoraban más el reforzador pequeño e inmediato (de la opción A), eligiéndolo mayoritariamente con un tiempo T pequeño, las palomas no mostraban capacidad de demorar la gratificación.

los autores plantean que cuando existen contingencias de compromiso explícitamente presentadas, no se podría hablar de “auto” control, ya que éstas se le ofrecen al sujeto como estrategias que toma o deja: si las toma hay autocontrol y si no, el autocontrol no aparece.

- en este sentido autocontrol podría estar haciendo referencia a que el sujeto es capaz de controlar su propia conducta (lo cual no es aceptado por los autores), en contraposición a la conducta controlada por el ambiente.

de acuerdo con lo anterior, el autocontrol es “auto” sólo cuando el individuo crea y maneja las estrategias de compromiso respecto a las conductas que está buscando controlar haciendo arreglos de contingencias especiales para asegurar el mantenimiento de la elección “correcta”.

Técnicas de Autocontrol las personas que creen que carecen de “fuerza de voluntad”, en realidad sólo carecen del conocimiento de cómo aplicar las

estrategias apropiadas. compromiso:

- entendido como un cambio en las contingencias ambientales y no como “querer algo con todas nuestras fuerzas”. - implica dificultar el cambio de elección cuando nos veamos enfrentados al reforzador pequeño e inmediato. - ¿por qué es tan importante el compromiso inicial? porque es lo que permite que la elección no cambie. - existirá autocontrol toda vez que se hagan arreglos de compromiso tales que no exista la opción de que el sujeto

invierta sus preferencias (cambie su elección). discriminación de estímulos:

- discriminar estímulos significa que las respuestas se dan frente a un estímulo específico y no frente a otros. - este estímulo específico se llama estímulo discriminativo (Ed) cuando está presente señaliza que la respuesta

que se de irá seguida de un reforzador o de ausencia de él (o bien, en su opuesto, señaliza que la respuesta irá seguida, o no, de un evento aversivo).

distracción: - realizar actividades distractoras para lograr esperar el reforzador grande y no optar por el pequeño, pero inmediato. - en un estudio, Kanfer y Seidner encontraron que los individuos podían tolerar mejor un dolor físico cuando se

distraían mirando unas diapositivas, especialmente si ellos tenían el control de la situación. - esto depende de la capacidad de concentración e imaginación de cada uno.

autoreforzamiento: - una de las principales razones por las cuales el reforzamiento a veces no resulta es por la demora entre la

conducta y la llegada del reforzador muchas veces, el medio ambiente ni siquiera entrega el reforzador. - una forma de mejorar esta situación es que el mismo individuo se entregue el reforzador. - las personas, incluso los niños, aprenden a darse reforzadores de modo consistente. - el autoreforzamiento ha probado ser, incluso, más efectivo que el reforzamiento externo.

Desarrollo del Autocontrol parece ser que el autoreforzamiento es una conducta que en sí misma puede ser reforzada, como es el caso de los

niños lo central está en el manejo de contingencias que se haga para que luego, la conducta de autocontrol se refuerce a sí misma.

este punto se puede observar en el manejo de contingencias hecho por algunas sociedades, lo cual da lugar a conductas de autocontrol que no se sueñan en otras sociedades más “impulsivas” Ej.: el pago de pasaje en un bus de locomoción colectiva esto implica un aprendizaje de valores y conductas determinado por las contingencias culturales.

Resumen el autocontrol es una conducta de elección definida operacionalmente que no tiene nada de mágico, ni de fuerza interna (o

de voluntad). no se necesita una inteligencia mayor de las palomas, ratas o monos, lo que se requiere es que existan contingencias de

compromiso explícitamente arregladas por un experimentador o bien diseñadas por los propios interesados, para que las elecciones tomadas no se cambien en situaciones donde el valor relativo de los reforzadores se distorsiona.

el autocontrol implica una conducta que puede ser adquirida y desarrollada a lo largo de la vida.

Page 48: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 14: Control Aversivo: Reforzamiento Negativo

Introducción muchas veces el término “reforzamiento negativo” es confundido con el de “castigo”:

- el reforzamiento negativo resulta, siempre, en un aumento de la conducta. - los castigos implican, siempre, una disminución de la conducta.

¿por qué incluir el reforzamiento negativo en el apartado de “control aversivo”? porque el organismo tendrá que haber recibido o estar recibiendo un evento aversivo cuando, gracias a su conducta, logra eliminar ese estímulo desagradable.

si el ojo inexperto ve que un supuesto “castigo” no reduce o elimina una conducta, esto puede deberse a que se esté mal utilizando el procedimiento o a que la conducta está siendo reforzada de modo encubierto por eventos no observables o no obvios.

Reforzamiento Negativo: Conducta de Escape/ Evitación este procedimiento de reforzamiento negativo queda claramente ejemplificado en un experimento “tipo”, diseñado por

Solomon y Wynne. trabajaron con perros a los cuales ponían en una caja de salto que estaba dividida en dos compartimentos. los dos compartimentos se dividían por una barrera lo suficientemente alta para que implicase tener que saltarla para ir

hacia el otro lado. además, había una ampolleta en cada compartimento, la cual era encendida de acuerdo a ciertos arreglos experimentales. el suelo era una plataforma de metal a través de la cual se podía entregar un estímulo aversivo, la descarga eléctrica. las sesiones partían con las luces de ambos compartimentos iluminadas. en el primer ensayo se apagaba sólo la luz del compartimento en el que estaba el perro. a los 10 segundos de oscuridad comenzaba la descarga eléctrica y, una vez que el perro saltaba al otro compartimento, se

daba por finalizado el ensayo y se prendía la luz. luego de un intervalo interensayo se volvía a apagar la luz del lado en el que estaba el perro y comenzaba un nuevo

ensayo. Cada sesión incluía 10 ensayos.

El Escape y la Evitación los autores midieron el tiempo de respuesta de los perros a través de los ensayos y descubrieron que, en un comienzo, los

perros tardaban más de 10 segundos lo más que podían hacer los perros era escapar de la descarga eléctrica una vez que ya la sentían en las patas.

es decir, en un comienzo, la oscuridad no le señalizaba nada al perro porque no había aprendizaje aún. en los ensayos posteriores, los perros comenzaron a saltar cada vez más rápido cuando el compartimento se quedaba

oscuro por el quinto ensayo, aproximadamente, saltaban antes de los 10 segundos de la llegada de la descarga, con lo cual lograban evitar totalmente el estímulo aversivo así, muchos perros nunca más experimentaron la descarga eléctrica, no obstante, la conducta se mantuvo.

en teoría, la conducta de los perros se mantiene por reforzamiento negativo, lo cual significa que el retiro del evento aversivo refuerza la conducta esto resulta absolutamente comprensible para el caso del escape, donde el perro experimenta el evento aversivo y escapa de él.

pero: - ¿cómo se mantiene la conducta de evitación, si el perro no vuelve a tener contacto con el evento aversivo, dado

que lo evita totalmente? - ¿cómo se refuerza la conducta de evitación si no hay retiro de la descarga eléctrica, dado que la evita? - ¿cómo se refuerza esa conducta? - ¿cuál es la diferencia esencial entre el aprendizaje de escape y el de evitación?

Teoría de los Dos Procesos Mowrer y Schoenfeld formularon la pregunta de otro modo, la cual se conoce como la paradoja de la evitación:

- ¿cómo la no ocurrencia de un evento (la descarga) puede servir como reforzador de una respuesta de evitación?

este punto de controversia llevó a la formulación de una importante teoría la teoría de los dos procesos. la teoría plantea que los dos procesos presentes en el aprendizaje de evitación son el condicionamiento clásico y

el condicionamiento operante.

- la respuesta incondicionada que produce una descarga eléctrica es el miedo el perro cuando reciba la descarga eléctrica responderá automáticamente con miedo.

- la oscuridad se convierte en señalizador de la ocurrencia de la situación desagradable (EI) se convierte en estímulo excitatorio aversivo luego de los primeros ensayos el perro comenzó a responder con miedo frente a la oscuridad del compartimento, la cual señalizaba la inminente llegada de la descarga eléctrica a los 10 segundos de oscuridad se convirtieron en un EC+ aversivo.

Condicionamiento Clásico EI RI EC RC EI = shock eléctrico RI = miedo EC = oscuridad RC = miedo

Condicionamiento Operante A - B - C A (antecedente) = miedo (condicionamiento clásico al miedo) B (conducta operante) = saltar C (consecuencia) = alivio

Page 49: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Teoría de los Dos Procesos (cont.) la respuesta de miedo tiene varias características: sudor, taquicardia, aceleramiento de la respiración, etc. son

desagradables Mowrer razonó que cualquier respuesta “operante” que redujese o eliminase esos correlatos fisiológicos, sería reforzante para esa respuesta.

la respuesta de evitación se vería reforzada porque esa respuesta elimina o quita el estímulo condicionado (EC+) que activa el miedo se escapa al EC para evitar el miedo.

en el experimento anterior, la conducta operante del perro es el salto, ésta conducta se vería reforzada por la eliminación de la oscuridad.

lo que permite mantener la conducta operante, a pesar de la ausencia del estímulo aversivo, es la presencia de ambos condicionamiento (CC y CO) lo que hace que no se extinga la conducta es la conducta operante.

el condicionamiento operante es efectivo para evitar la extinción del condicionamiento clásico.

Los Dos Procesos Presentes el condicionamiento clásico explica el miedo frente al EI y luego frente a la oscuridad. el condicionamiento operante explica la mantención de la respuesta operante de saltar a pesar de que paradójicamente,

la respuesta no retira el evento aversivo de la descarga eléctrica, dado que la conducta misma hace que no lo reciba. en la teoría de los dos procesos la respuesta de evitación que estamos analizando no sería, en realidad, una respuesta

de evitación de la descarga eléctrica, sino una respuesta de escape al EC+ que elicita el miedo esto elimina la paradoja anterior respecto a la contingencia entre la respuesta y el resultado, donde la respuesta de salto se mantenía a pesar de que no se retiraba ningún estímulo aversivo.

la reconceptualización es que el organismo sí escapa de un evento aversivo que es eliminado y este evento es la oscuridad y este resultado es lo que refuerza la conducta operante.

muchas investigaciones han apoyado esta teoría algunos experimentos han encontrado que incluso el miedo generado por un EC+ puede afectar la conducta de evitación frente a otros estímulos.

también se puede entrenar a que un EC señalice la ausencia de una descarga eléctrica y se convierta en EC- (inhibitorio) a este tipo de señal se le denomina señal de seguridad.

incluso algunos teóricos (Weisman y Litner) han propuesto una variación a la teoría de los dos procesos llamada Hipótesis de Señal de Seguridad el organismo busca señales de seguridad, aun cuando esta señal no anteceda a la conducta de evitación esta hipótesis plantea que al ejecutar la conducta de evitación, cualquier evento que le sigue es un evento apetitivo que refuerza positivamente la tarea de evitación porque señaliza un período libre del evento aversivo.

- por ejemplo, la luz en el compartimiento la cual hacía que el perro salte, se convierte en un reforzador (entrega del evento apetitivo una vez ejecutada la operante) de la conducta de salto y a la vez señaliza un período de seguridad de que no habrá una descarga eléctrica (EC-).

otra teoría que se sustenta en el reforzamiento positivo es la Teoría de la Relajación (Danny) que postula que la relajación que sigue a la respuesta de evitación es un reforzador positivo para la respuesta de evitación y esto sería lo que mantiene la conducta.

estas dos teorías (Hipótesis de Señal de Seguridad y Teoría de la Relajación), que postulan el reforzamiento positivo, por supuesto eliminan la paradoja de la conducta de evitación, porque ésta se daría sólo cuando consideramos a la conducta de evitación como sustentada en el reforzamiento negativo.

Problemas con la Teoría de los Dos Procesos 1. uno de los problemas es respecto de la relación entre el miedo y la respuesta de evitación se supone que, una vez

que se ejecuta la respuesta operante, el miedo disminuiría. - es decir, si bien en un principio, frente al EC+ se activaría la respuesta emocional y aumentaría la tasa cardiaca y

otros signos de miedo, luego, al eliminar el EC+ aversivo, se produciría un descenso de todos esos signos fisiológicos, dado que, la teoría de los dos procesos postula, precisamente, que es esa reducción lo que resulta reforzante (reforzamiento negativo) existe evidencia de que eso es así.

- también existen experimentos cuyos resultados contradicen la teoría Black encontró que la tasa cardiaca continuaba incrementando luego de la respuesta de evitación.

2. un segundo tipo de problema es que la teoría predice que la respuesta de evitación se mantiene por la eliminación del EC+ aversivo por lo tanto, el miedo debería estar presente cada vez más o, a lo menos, no disminuir, dado que su reducción es lo que refuerza la conducta operante de evitación.

- sin embargo, hay una línea de hallazgos que muestran que los síntomas de miedo comienzan a disminuir a medida que transcurren los ensayos.

- volviendo al experimento de los perros, los autores encontraron que los canes mostraban cada vez menos signos de temor frente a la oscuridad si bien en un comienzo los perros gemían, se orinaban y se sacudían al comenzar la oscuridad (EC), una vez que fueron adquiriendo experticia y aprendían a saltar antes de la ocurrencia del choque eléctrico, tales signos de miedo desaparecían.

- ¿por qué el miedo disminuye al aumentar el entrenamiento de evitación? una posibilidad es que el organismo aprenda a controlar su ambiente y eso reduce el temor.

- sin embargo, esto no elimina el problema que se genera para la teoría de los dos procesos, la cual supone que es la reducción del miedo -en ese ensayo- lo que mantiene la conducta de evitación, pero si no hay miedo, ¿qué vamos a reducir?

3. el último problema es que no explica la resistencia a la extinción de la conducta de evitación. - usando el experimento de Solomon y Wynne, si el organismo escapa al EC+ que señaliza la llegada del choque

entonces el EC no se volverá a encontrar con el EI, lo cual implica un procedimiento de extinción (presentación del EC en ausencia del EI) si el EC oscuridad ya no está asociado al EI, el miedo a la oscuridad disminuirá (RC) gradualmente después de algunos ensayos de evitación donde finalmente no habrá miedo.

- de acuerdo con la teoría de los dos procesos si no hay miedo, la respuesta de evitación no se dará y el sujeto recibirá de nuevo el choque eléctrico y la RC de miedo se adquirirá nuevamente.

Page 50: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Problemas con la Teoría de los Dos Procesos (cont.) - en seguida, producto del miedo, comienzan las respuestas de evitación y con ellas el proceso de extinción

del miedo a la oscuridad una vez más. - así, la teoría predice que habría un patrón cíclico para la respuesta de evitación. - sin embargo, los experimentos desconfirman esta predicción, con lo cual queda por explicar la resistencia

a la extinción que presenta la conducta de evitación.

Teoría de Un Factor según esta teoría no es necesario suponer que el evento reforzador de la conducta de evitación es la reducción

del miedo (EC) el reforzamiento de esta conducta es simplemente el proceso operante de evitar la descarga eléctrica (EI).

Herrnestein provee de una serie de experimentos donde no existe ningún evento que señalice la llegada de la descarga eléctrica, por lo tanto, no hay ningún EC que elicite miedo del cual escapar.

Sidman la tarea de evitación de Sidman, es uno de los experimentos “tipos” que provee evidencia a favor de la teoría de un Factor.

- desarrolló un sistema para que el organismo no tuviera ninguna señalización de que el EI venía. - sin embargo, el problema fue que en sus experimentos él entregaba los choques a intervalos regulares por lo que

el organismo podía predecir el paso del tiempo, con lo cual el paso del tiempo se podía convertir en un EC aversivo que señalizaba la llegada del EI con esta lógica, la teoría de los dos procesos seguía siendo válida.

Herrnestein y Hineline diseñaron un experimento donde el organismo no pudiera predecir el intervalo entre descargas eléctricas.

- utilizaron un programa de tiempo al azar (RT), pero donde la probabilidad de ocurrencia del choque variaba según si el organismo había emitido o no la conducta.

- los autores descubrieron que: a. los animales aprendían la conducta de evitación aún cuando no había ningún EC que informara sobre la

llegada del choque. b. para aprender esta conducta, los animales tienen que ser sensibles a las tasas promedio de choque

eléctrico, de acuerdo con la emisión previa de la respuesta. entonces sería la reducción en la tasa de choque eléctrico lo que reforzaría la conducta de evitación y no se

necesitaría recurrir a la eliminación de un EC como reforzador. así, la Teoría de Un Factor:

- niega la paradoja de la evitación descrita en un comienzo. - explica la resistencia a la extinción de la conducta de evitación diciendo que el sujeto no logra discriminar

ningún cambio en las condiciones que se le presentan durante el proceso de extinción. si el experimentador desactiva la descarga eléctrica, para el sujeto es exactamente igual él evita la descarga eléctrica

por lo tanto, da lo mismo que la descarga esté o no activada, él igual no la va a recibir mientras siga ejecutando la conducta.

la diferencia con el programa IV es que en éste el experimentador sabe la secuencia de los diferentes intervalos ocurridos en la sesión y esta secuencia se repite en otras sesiones.

aunque el organismo no puede llegar a predecirla, en teoría podría, por lo cual el programa de RT es más confiable para los objetivos de este experimento.

Teoría Cognitiva desarrollada por Seligman y Johnston posee cierto parecido con el modelo Rescorla-Wagner respecto al

condicionamiento clásico los 2 eventos más importantes del modelo Rescorla-Wagner son: el tamaño del EI y la expectativa del sujeto respecto al tamaño de este EI y que el aprendizaje ocurre sólo cuando hay discrepancia entre la expectativa y lo que ocurre.

la Teoría Cognitiva propone que el sujeto va a aprender una conducta de evitación siempre y cuando exista una discrepancia entre su expectativa y lo que ocurre realmente.

según los autores existen dos expectativas en las tareas de evitación: a) una expectativa acerca de la consecuencia de responder. b) una expectativa acerca de la consecuencia de no responder.

en el primer ensayo el animal no tiene ninguna expectativa respecto a si el choque va a ocurrir o no si el responde o deja de responder.

en ensayos subsecuentes, comienza a generar la expectativa de que si no responde ocurrirá el choque y de que si responde el choque no ocurrirá.

una vez que el organismo ha aprendido estas expectativas, su conducta no cambiará a menos que una de las dos expectativas no se cumpla.

lo que ocurre normalmente, es que el organismo da la respuesta y no le llega el choque lo cual es coherente con la expectativa que ha formado y eso mantiene la conducta.

en el proceso de extinción el organismo no llega a saber que ahora la situación ha cambiado y que el choque no llegará. el proceso de extinción y de cambio en la conducta puede comenzar sólo si el organismo tiene la oportunidad de

encontrarse con una inconsistencia cuando, por error, distracción, etc., no da la respuesta y no recibe choque sólo entonces puede aprender la nueva contingencia.

un cambio conductual puede ocurrir también si el organismo es obligado a “no dar la respuesta” y a experimentar el cambio de la contingencia: la ausencia del choque.

esta relación entre “no dar la respuesta y no recibir la descarga” es inconsistente con sus expectativas por lo cual, también en este caso, comienza la extinción a este procedimiento se le denomina bloqueo de respuesta o inundación.

Page 51: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Conclusiones acerca de las teorías aún queda mucho por investigar para llegar a determinar cuál de las tres teorías explica mejor la conducta de evitación y su

resistencia a la extinción. la teoría de los dos procesos tiene la debilidad de que no puede explicar cómo se mantiene una conducta de

evitación cuando no hay ningún estímulo que provoque miedo tampoco logra explicar por qué la extinción de la conducta de evitación es tan lenta, si es que ocurre.

las otras dos teorías fallan al decir que el miedo no juega ningún rol en la conducta de evitación, porque el miedo sí es un componente importante de esta conducta, aunque quizá no necesario.

en resumen, hoy se acepta que el miedo sí juega un rol importante en las conductas de evitación, aunque puede que el miedo no sea necesario como lo plantea la teoría de los dos procesos.

Variable que afecta el Aprendizaje de la Conducta de Evitación Controlabilidad Seligman y sus colegas creen que los animales pueden desarrollar una expectativa de carácter más general respecto de la

situación en la cual están y que esta expectativa puede generalizarse a otras situaciones esta expectativa es que su conducta tiene poco o ningún efecto en el ambiente “desamparo aprendido” (DA).

Seligman diseñó un experimento cuyas conclusiones fueron que el entrenamiento inicial de descargas incontrolables hacía que los perros desarrollaran la expectativa de que su conducta no tenía ningún efecto en las consecuencias aversivas que ellos recibían y que luego, llevaban esta expectativa, o desamparo, a la situación nueva de la caja de salto, lo que conduciría a un déficit en la capacidad de aprender nuevas conductas y a un déficit en la ejecución de las nuevas conductas.

Maier y Seligman propusieron que el desamparo aprendido consta de 3 elementos principales: a. déficit motivacional el sujeto pierde el interés por intentar controlar los eventos de su ambiente o persiste poco

se rinde fácilmente. b. déficit cognitivo la habilidad para aprender de las propias experiencias se ve desmedrada aunque tengan

una nueva situación donde podrían escapar o evitar el evento aversivo, los sujetos no logran aprender o lo hacen muy lentamente.

c. déficit emocional una serie de síntomas que aparecen una vez que el sujeto ha sido expuesto a una situación aversiva inescapable (ej.: úlcera, inapetencia, aumento de la presión sanguínea, etc.).

cuando los estímulos son incontrolables e impredecibles se produce desamaparo atendido. la incontrolabilidad tiene que ver con la efectividad de la conducta operante. la impredecibilidad tiene que ver con la efectividad de la señalización del EC. para que haya desamparo aprendido deben estar presente estos 2 elementos incontrolabilidad e impredecibilidad.

Aplicaciones Terapeúticas inundación:

- independientemente de cómo sea explicado, existe evidencia de que el bloqueo de la respuesta es efectivo para cambiar la conducta del organismo.

- el bloqueo de la respuesta se refiere a cuando obligamos al organismo a no responder (bloqueamos la respuesta) para que observe que las contingencias han cambiado y que, ahora, no recibirá la descarga eléctrica. se obliga al organismo a experimentar la no ocurrencia del EI en un contexto en que se esperaba que ocurriera.

- este procedimiento se llama también inundación porque se “inunda” al sujeto del EC aversivo, que normalmente viene antes el EI, pero que ahora viene seguido de nada.

- este procedimiento es muy parecido al tratamiento de Desensibilización Sistemática (DS) para tratar las fobias, con la diferencia que la inundación no trabaja con “jerarquías” de eventos aversivos.

- este método ha sido cuestionado en términos prácticos y éticos. - entre la DS y la inundación parece más recomendable la DS. Sin embargo, si ésta no ha sido efectiva y se tiene el

consentimiento del paciente y las debidas precauciones, la terapia de Inundación puede resultar muy útil. tratamiento para la depresión:

- Seligman sugirió que el fenómeno del desamparo aprendido podía extrapolarse a lo que le ocurría a muchos pacientes sugirió que aquello que ayudara a los animales a aprender la nueva contingencia entre su respuesta y los resultados, también podría ayudar a las personas a salir de la depresión.

- aspectos esenciales del tratamiento: 1. lo esencial, de acuerdo con Seligman es poner al sujeto en una situación donde no pueda fallar, de

modo que vaya aprendiendo gradualmente la expectativa de que la propia conducta ejerce cierto control sobre las consecuencias.

2. el desamparo aprendido puede ser prevenido con lo que Seligman llama “inmunización” consiste en que el sujeto, antes de ser expuesto a situaciones incontrolables, tenga la experiencia con situaciones de escape/evitación controlables esta experiencia con choques escapables bloquea la aparición del DA (es como si al organismo se le entrenara a tolerar la frustración).

3. un elemento importante en terapia será entregar elementos de seguridad o eventos que permitan predecir el evento aversivo que viene.

experimentos posteriores a los de Seligman han mostrado que una variable esencial para que los choques incontrolables produzcan el DA, es la impredictibilidad del evento aversivo.

sin embargo, el DA no se desarrolla si el grupo que recibe las descargas incontrolables recibe, después de ellas, tres segundos de oscuridad que le señalan que, al menos por un momento, no habrá EI.

nótese que la oscuridad es un evento que viene después del EI, sin embargo, aún así es efectiva en proveer cierto momento de “seguridad” que impide el desarrollo del DA.

Page 52: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 15: Control Aversivo: Castigo

Introducción castigo es la presentación de un estímulo aversivo o retiro de un estímulo apetitivo, que disminuyen la probabilidad de

repetición de la conducta en el futuro. las diferentes contingencias de castigo (I y II) producen un decremento en la conducta, que puede ser respecto a

una conducta deseada o no deseada, especialmente en la vida real, donde las contingencias no son arregladas con objetivos específicos.

el estímulo es dependiente del sujeto receptor del castigo y del tiempo en que se presenta. si tenemos un mejor conocimiento de estas contingencias de castigo y de sus resultados, podremos, en el momento en que

realicemos una intervención conductual, trabajar con respeto, evaluar la situación, los objetivos, las opciones que tiene la persona y ser más efectivos como agentes de cambio.

Castigo I este procedimiento de control conductual implica una contingencia positiva frente a la conducta se presenta el evento

aversivo. el resultado conductual (la disminución de la conducta) fue cuestionado en un comienzo por Skinner la conclusión de

Skinner fue que el castigo no era efectivo, que sólo producía una “supresión temporal” de la respuesta. para Thorndike tampoco resultó convincente que el castigo produjese resultados conductuales exactamente opuestos al

reforzamiento positivo. ¿qué ocurre cuando, luego de la entrega de un evento apetitivo frente a una conducta (reforzamiento positivo), éste se

elimina? - en ese momento, no se hizo un experimento así. - actualmente, muchos experimentos muestran que la conducta tenderá a extinguirse, especialmente si el evento

apetitivo se presentó con un programa de refuerzo continuo. por lo tanto, es de esperar que ocurra lo mismo (pero en sentido opuesto) en el caso en que el evento aversivo se

remueva. independientemente del valor moral del castigo, éste sí puede ser efectivo. el castigo es un modificador conductual efectivo y produce efectos mucho más rápidos.

¿El Castigo (I) es lo opuesto al Reforzamiento (positivo)? a partir del experimento de Skinner, el efecto del castigo era considerado como algo “temporal”. sin embargo, muchos investigadores encontraron resultados que dieron una explicación a estos efectos temporales. Boe y Church mostraron que con descargas fuertes, la supresión de la respuesta duraba mucho más tiempo, aún

después de remover el evento aversivo. éste y otros experimentos, mostraron que la supresión de la respuesta no sólo es temporal, sino que, en algunos

casos, puede ser bastante permanente. el término “supresión” de la respuesta generó cierta polémica hasta que Estes lo definió excluyentemente como “el

decremento de una respuesta donde no hay contingencia entre la respuesta y la consecuencia”, como es lo que ocurre en el Condicionamiento al Miedo.

así, el término supresión se reserva para cuando la reducción de la respuesta es producto de la no contingencia entre la respuesta y el evento aversivo que recibe el organismo.

de acuerdo con lo anterior, un evento aversivo puede producir un “decremento general” en la conducta de un organismo, por lo tanto aún queda la pregunta:

- ¿la contingencia entre la respuesta y la consecuencia puede lograr algo más específico que eso? Si. sólo mencionaremos un ejemplo donde se responde afirmativamente a esa pregunta. Schuster y Rachlin experimento con palomas los resultados indicaron que la fuerza de la contingencia respuesta-

descarga determinaba el nivel de reducción de la respuesta. - en el grupo con la contingencia de castigo en la luz izquierda, la respuesta a esa luz disminuyó considerablemente,

en cambio en el otro grupo, con la no-contingencia en la luz derecha, no se observaron cambios en el nivel de respuesta.

estos estudios muestran que la contingencia de castigo hace algo más que causar una “disminución general de la actividad” lo que hace es causar una disminución considerable en la frecuencia de una conducta determinada.

se puede decir que el castigo sí es opuesto al reforzamiento positivo: - la entrega de un evento aversivo sí produce un decremento en la respuesta (opuesto a lo que produce el

reforzamiento positivo). - este efecto sí puede ser prolongado, tanto como se mantenga la contingencia con el evento aversivo (lo mismo

ocurre en el caso del reforzamiento positivo).

Variables que influyen en la efectividad del Castigo I Azrin y colaboradores han contribuido a señalar las variables más importantes en la efectividad del castigo:

1. Intensidad. 2. Modo en que se presenta: cambios en la intensidad. 3. Inmediatez del castigo. 4. Programa de castigo. 5. Motivación para responder. 6. Disponibilidad de conductas alternativas.

hay que ser rigurosos en la aplicación del castigo y en la consideración de las variables que influyen en su efectividad para conseguir que el castigo sea 100% efectivo; de lo contrario se estaría siendo negligente.

Page 53: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Variables que influyen en la efectividad del Castigo I (cont.)

2. Intensidad. - Boe y Church la intensidad del shock aplicado estaba relacionada directamente con la duración de la reducción

de la respuesta mientras más intenso hubiese sido el shock, más permanente era la reducción de la respuesta operante cuando la intensidad del shock era de nivel medio, la respuesta se recuperaba más rápido.

- a mayor intensidad, mayor efectividad del castigo. 3. Modo en que se presenta: cambios en la intensidad.

- se refiere no sólo a la intensidad, sino a la habituación que se produce frente a un estímulo aversivo si éste es suave.

- se debe aplicar la intensidad adecuada desde el comienzo del condicionamiento no es efectivo ir aumentando gradualmente la intensidad.

- Azrin y Holz recomiendan que si se quiere efectos duraderos en la reducción de la conducta, se debe comenzar con descargas intensas desde el comienzo.

- eventos aversivos de intensidad baja o media que luego se cambian a intensidades más fuertes, pueden servir para inocular al sujeto contra niveles más intensos de ese mismo evento.

- a menos que se quiera enseñar “tolerancia a la frustración”, el evento aversivo debe ser aplicado a su máxima intensidad desde la primera vez.

4. La contigüidad en el castigo. - así como en el reforzamiento positivo, el evento apetitivo más efectivo es aquél que es presentado contiguamente

a la respuesta, en el castigo, el evento aversivo más efectivo es aquél que es entregado cercano en el tiempo a la respuesta.

- mientras más inmediato el evento aversivo, mayor es la reducción de la respuesta - la contigüidad (espacial y temporal) es esencial en la efectividad del castigo si se quiere reducir una conducta el

castigo debe ser contiguo. 5. Programa de castigo.

- al igual que en el reforzamiento positivo, en el castigo, el evento aversivo no requiere aparecer cada vez que se emite la respuesta.

- Azrin y Holz concluyeron que la forma más efectiva de reducir una conducta es utilizando un programa de castigo continuo más que uno intermitente.

- mientras más pequeño el programa de castigo de RF, más grande la reducción de la respuesta. - estudios muestran que el patrón que muestran los programas de castigo, son exactamente los opuestos a los

mostrados por los programas de reforzamiento: cuando un programa de reforzamiento particular produce un patrón de respuesta acelerado, el

programa de castigo análogo, produce un patrón de respuesta desacelerado. cuando el programa de reforzamiento produce un patrón de respuesta “conducta–no conducta”, el

programa de castigo produce un patrón de respuesta “no conducta–conducta”. 6. Motivación para responder.

- la efectividad del castigo está inversamente relacionada con la intensidad de la motivación del sujeto a responder.

- mientras mayor es la motivación del sujeto, menor es la efectividad del castigo. - esto está muy determinado por variables específicas del sujeto. - en general, los estudios de castigo se hacen con organismos que han sido entrenados con reforzamiento positivo

en primera instancia la conducta del organismo es seguida por un evento apetitivo, generalmente comida. - estrategia posible a utilizar cuando se necesite un mayor impacto del castigo sin aumentar su intensidad

descubrir qué reforzador está manteniendo la conducta y enseguida disminuir el valor de ese reforzador. 7. Disponibilidad de conductas alternativas.

- el castigo es mucho más efectivo cuando al sujeto se le entrega otra opción para obtener el reforzador. - si vamos a castigar una conducta debiéramos proveer una conducta alternativa para que el sujeto obtenga el - reforzador; de lo contrario, a pesar del castigo, el sujeto seguirá emitiendo la única conducta que le entrega un

reforzador. - la reducción de la conducta indeseable es aún más efectiva si la conducta alternativa es incompatible con

la conducta indeseada (Ej.: cooperar en lugar de competir). - a la base de la disminución de una conducta está la intención de que aumente otra conducta; por lo tanto, lo lógico

es presentar un reforzamiento para la conducta que se quiere aumentar.

Desventajas en la utilización del Castigo I Efecto provocado por el castigo 1. el castigo de una conducta inapropiada no necesariamente fortalece la ocurrencia de una conducta apropiada y en

ocasiones puede llevar a una reducción de la conducta en general Ej.: si se castiga a un niño por jugar agresivamente, el niño puede dejar de jugar totalmente con otros niños.

2. el uso del castigo puede producir distintas emociones displacenteras (miedo, rabia, ansiedad, resistencia, agresividad) estas emociones pueden:

- interferir con la habilidad de atender o aprender de la situación si el “drive” (carga, energía) emocional es muy alto y la tarea es difícil, el nivel de la ejecución se ve afectado.

- condicionarse con otros estímulos presentes en la situación aversiva (condicionamiento clásico). uno de los estímulos que puede asociarse con el evento aversivo es el mismo estímulo frente al cual el

sujeto es castigado por responder (Ej.: los ejercicios de matemáticas). - condicionarse con la persona que administra el castigo o agente castigador (Ej.: el profesor).

esta asociación emocional (aprendida por quien es castigado), inhabilita a la persona que castiga para enseñar otras conductas que sí son adecuadas.

esto debido a que quien es castigado, evita al agente castigador, no dando la oportunidad de relacionarse con él respecto a otras conductas.

3. el uso del castigo muchas veces, genera conductas disruptivas e indeseables como la agresividad.

Page 54: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Desventajas en la utilización del castigo I Efecto provocado por el castigo (cont.) 4. el castigo se puede convertir en un evento discriminativo es decir, además de tener propiedades aversivas, el

evento castigador, a veces, señaliza la disponibilidad de otro estímulo, ya sea apetitivo o aversivo (Ej.: cuando la única forma de obtener reforzador es en la condición donde la respuesta es castigada).

5. el agente castigador puede convertirse en un evento discriminativo respecto al castigo y por lo tanto reducir la conducta sólo en presencia del agente castigador o de la situación en particular.

- Ej.: no sobrepasar la velocidad en presencia de carabineros. - el problema con esto es que el castigo demandaría el monitoreo continuo de la conducta del individuo, lo cual es

“prácticamente” imposible. - sin embargo, esto no ocurre con el reforzamiento positivo, probablemente porque es el mismo individuo quien está

interesado en mostrar cuando lo ha hecho “bien” y así recibir el reforzador. 6. cuando una conducta conlleva castigo, muchas veces, genera la intención de hacer trampa. 7. el castigo puede reforzar a la persona que administra el castigo.

- el castigo, normalmente tiene un efecto inmediato en el cese de la conducta no deseada, por lo tanto, su uso tiene un efecto de reforzamiento negativo (retiro del evento aversivo -la conducta desagradable-), lo cual puede llevar a un aumento no sólo de la conducta misma de castigar, sino a un aumento de la severidad del castigo.

8. el problema ético de su aplicación si una conducta puede ser controlada con reforzamiento positivo no se debería utilizar el castigo.

Conclusión sobre el uso del Castigo si bien en términos éticos no es deseable la aplicación del castigo I, existen ocasiones en que puede ser la única forma

de terminar con conductas socialmente desagradables o que involucran algún riesgo para el sujeto mismo (Ej.: las autodestructivas de algunos autistas o psicóticos).

dar una “reprimenda verbal”, de forma adecuada, puede ser muy efectiva y no tiene la misma connotación aversiva que un golpe (Ej.: un regaño adecuado es uno que está centrado en la retroalimentación, en explicar las implicaciones que tiene la conducta no deseada, en vez de ridiculizar, avergonzar, atemorizar, etc.).

O’Leary y colaboradores señalaron que dado que, normalmente las reprimendas se dan en público, en la sala de clases, o delante de sus hermanos, el niño además del regaño recibe atención y esto último es un estímulo altamente reforzante.

- sin embargo, si un profesor regañaba al niño que producía disturbios, privadamente, sin que otros niños escucharan, la conducta no deseada se reducía considerablemente.

- esto tenía aún más efecto si el profesor combinaba lo anterior con reforzadores positivos entregados en el aula de clases (ejemplo: “muy buen trabajo”).

diversos autores señalan que el castigo es eficaz, pero debe ser utilizado con cuidado y teniendo en cuenta el objetivo final la formación del individuo involucrado, lo cual es válido para hospitales, cárceles, colegios, ambientes laborales.

Aplicaciones Terapéuticas del Entrenamiento por Omisión este procedimiento de retiro de un evento apetitivo, es fácil de incorporar a cualquier programa de economía de fichas

así como las fichas se pueden ganar si el individuo ejecuta las conductas deseadas, también se le pueden quitar fichas si emite conductas no deseadas.

- este método donde se pierden fichas, dinero o algún otro estímulo apetitivo es llamado costo de respuesta.

- el costo de respuesta ha sido ampliamente utilizado en prisiones, hospitales y en colegios. el otro método correspondiente a este procedimiento es el llamado tiempo-fuera.

- consiste en que si el sujeto realiza la conducta no deseada, es removido de la situación donde se entrega un evento apetitivo (o bien se le presenta una situación de tiempo-fuera).

- el tiempo-fuera ha sido muy efectivo con niños con conducta agresiva o disruptiva en la sala de clase. - Drabman y su colega utilizaron tiempos-fuera como castigo (II), para conductas agresivas y para la conducta de

pararse de la silla, en una sala con niños emocionalmente perturbados. estos dos métodos mencionados aquí, han sido muy utilizados en la sala de clase y en terapia, especialmente porque,

como dijimos antes, no revisten la presentación de ningún estímulo aversivo.

Page 55: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 16: Control de Estímulos Introducción fue Watson el primero en mencionar la importancia de los estímulos que preceden a las conductas. él pretendía que la ciencia de la psicología alcanzase un nivel de predicción tal que, entre otras cosas, conociendo la

naturaleza y el tipo de estímulo, los psicólogos pudiesen señalar la conducta que le seguiría. actualmente se sabe que estos estímulos antecedentes tienen una gran importancia en el control de la conducta. esto es así en la etología (estudio de la conducta de los animales en su ambiente natural), donde el estímulo antecedente

es llamado: - en el condicionamiento clásico “estímulo señal” “EC” - en el condicionamiento operante “estímulo discriminativo”.

estímulos antecedentes en el condicionamiento operante los estímulos que están presentes cuando se refuerza o se castiga una conducta.

si el padre regaña a su hijo, esto ocurre en cierta situación, con ciertos estímulos e incluso puede haber habido ciertos estímulos que le han servido como “indicios” al niño para saber que el padre lo iba a regañar.

estas claves que dan “indicios” pueden llegar a controlar la aparición -o no- de la respuesta. en muchas situaciones de la vida real la presencia de estos estímulos no es tan obvia, pero siempre existen. todas las conductas están controladas por los estímulos que nos indican cuándo es adecuado emitir una conducta

(recibiremos refuerzo) y cuándo es inadecuado hacerla (recibiremos castigo). esto que se aprende de manera tan sutil se conoce como:

- en psicología social “socialización” - en psicología conductual “control de estímulos”.

Definiciones Centrales el control de estímulos y la generalización de respuestas son dos conceptos íntimamente relacionados. el control de estímulos respecto a una conducta operante es la respuesta diferencial frente a los distintos

estímulos presentes. - si frente a nosotros hay tarjetas con distintos colores, nosotros no llamamos “rojo” a todas las tarjetas. - nuestra operante de nombrar el color rojo -correcto- se da frente a cierta longitud de onda emitida por un objeto y

no frente a otra (con condiciones de luz, de capacidad, etc., normales). - en este caso entonces, podemos decir que nuestra conducta está bajo el control de los estímulos de “color”.

esa respuesta diferencial a los estímulos nos indica que la persona está discriminando los estímulos presentados. esta discriminación no siempre se logra; sin embargo, cuando se logra podemos decir que la persona presenta

discriminación de estímulos responde de forma diferente a los diferentes estímulos. control de estímulos y discriminación de estímulos son dos formas de llamar al mismo proceso. lograr el proceso de discriminar frente a los distintos estímulos no es una tarea fácil intervienen factores relacionados

con los estímulos y factores relacionados con el individuo u organismo en cuestión. si el organismo responde de forma similar a distintos estímulos, es decir, se observa el mismo nivel de conducta frente a

estímulos diferentes, se dice que existe generalización del estímulo.

Control de Estímulos / Discriminación este concepto queda bien ilustrado con un experimento que hizo Reynolds con palomas para conocer bajo qué

estímulo quedaba el control de la conducta es decir, cuál era el estímulo que la paloma discriminaba como señalizador del reforzador.

los resultados fueron que para una de las palomas, su conducta quedó bajo el control del estímulo “triangulo blanco” y para la otra, su conducta quedó controlada por el “círculo rojo”.

dado que se utilizó reforzamiento positivo, el estímulo discriminativo (ED) lo definimos como aquel que le señaliza al organismo la posibilidad de obtener un reforzador si emite la conducta.

de acuerdo con los resultados, para una de las palomas, el ED es el triángulo y para otras el círculo, es decir, las palomas emitían la conducta frente al ED que adquiría su control.

por otro lado, este experimento nos permite darnos cuenta de que no es fácil predecir bajo qué estimulo quedará el control de la conducta cuando los estímulos son complejos (tienen más de una dimensión, como color y forma).

Generalización del Estímulo Guttman y Kalish hicieron un experimento donde entrenaron a unas palomas a picotear una luz amarilla lo “amarillo”

correspondía a una longitud de onda específica y objetiva, por tanto esa fue la variable independiente que manipularon y la unidad de medida el nanómetro el entrenamiento se hizo con reforzamiento positivo después del picoteo la paloma recibía comida.

los resultados revelan un gradiente de generalización bastante simétrico (pero no exactamente simétrico). - las palomas dieron la mayor cantidad de respuestas frente a la luz que había sido reforzada directamente, en

cambio, frente a las luces que iban pareciéndose cada vez menos, daban cada vez un menor número de respuestas.

a esto, se le conoce como gradiente de generalización y se podría definir como el decaimiento de la respuesta instrumental a medida que los estímulos presentados se diferencian del estímulo utilizado en el entrenamiento original.

Page 56: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Generalización del estímulo (cont.)

Evaluación del Fenómeno estos gradientes de generalización son una forma de medir el control del estímulo sobre la conducta, porque nos

entrega información sobre un fenómeno que podemos evaluar desde dos perspectivas: a. lo sensible que es el individuo a las variaciones de una de las características del estímulo o, en general, a las

variaciones del ambiente. b. las características del estímulo es decir, el gradiente nos indica cuán diferente tiene que ser el estímulo

para que el organismo deje de responder o responda considerablemente menos. control del estímulo:

- el control del estímulo se relaciona con las características del estímulo (y por lo tanto, de la situación), pero también con características del organismo.

- la línea del gráfico para un caso donde la paloma da la misma cantidad de respuesta frente a los distintos colores sería como sigue:

- la pendiente de este gradiente nos señala hasta qué punto la característica del estímulo, a lo largo de su

dimensión, controla la conducta de los organismos. - si se compara ambos gráficos, se puede obtener una gran cantidad de información sólo sabiendo que son

gradientes de generalización. mientras más agudo el gradiente, mayor control de estímulos; y mientras más plano, menor grado de

discriminación a lo largo de la característica del estímulo.

Tipos de Entrenamientos Discriminativos a. Entrenamiento no diferencial:

- es aquel donde el estímulo particular con el que se experimenta está presente, tanto en ensayos reforzados como en ensayos no reforzados.

b. Entrenamiento diferencial simple: - es un entrenamiento donde se utiliza un solo estímulo discriminativo en relación al cual se da el reforzador si la

conducta es emitida (ED). - si el estímulo no está presente en el ensayo no hay reforzador.

Page 57: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Tipos de Entrenamientos Discriminativos (cont.) c. Entrenamiento discriminativo simultáneo (diferencial):

- es un entrenamiento donde, al mismo tiempo (en ensayos alternados al azar o en el mismo ensayo), se le presenta al organismo, un estímulo que señaliza la llegada de un reforzador si se emite la respuesta operante y se le presenta otro que, aún emitiendo la conducta operante, no recibe reforzador.

- el primer estímulo se conoce como ED y al segundo como EΔ (estímulo delta).

- estímulo delta es el estímulo que, explícitamente, señala la no-ocurrencia de un reforzador, aun cuando el

organismo emita la conducta. d. Entrenamiento de discriminación sucesiva (diferencial):

- es cuando se hace primero un entrenamiento de discriminación con un estímulo frente al cual se entrega reforzador y luego, al estar bien entrenado con ese ED, se introduce un segundo estímulo frente al cual no se entrega reforzador (EΔ).

e. Entrenamiento intradimensional: - es el tipo de entrenamiento donde el ED y el EΔ vienen del mismo continuo o dimensión. Ej.: colores.

- este último entrenamiento puede implicar cualquiera de los 3 tipos anteriores, porque su nombre sólo denota si los estímulos presentados pertenecen, o no, a un mismo continuo/dimensión y no se refiere a cómo se presentan los estímulos.

el condicionamiento clásico es parte del operante, pero no viceversa.

- en el CO: ED = E+ señaliza la llegada de “algo” (reforzador apetitivo o aversivo) si se emite la conducta.

adquiere propiedades excitatorias EΔ = E- señaliza la ausencia de “algo” (apetitivo o aversivo) si se emite la conducta.

adquiere propiedades inhibitorias - en el CC:

EC+ señaliza la ocurrencia del EI.

¿Qué causa los gradientes de generalización? ¿por qué el reforzamiento frente a un estímulo produce que se dé la respuesta frente a otros estímulos que no han recibido

el reforzador? - recuerde que el gradiente se obtiene en extinción: el E+ ya no es reforzado y los otros estímulos son nuevos,

nunca se han presentado antes. la primera respuesta la entregó Pavlov

- cuando encontró que se producía una generalización de la respuesta frente a otros estímulos no utilizados en el entrenamiento y planteó que este gradiente de generalización era un producto colateral del proceso de condicionamiento operante.

- lo explicó fisiológicamente, diciendo que era una “expansión de la excitación a través de las neuronas” (hoy se sabe que eso no es correcto).

- una implicación aún vigente a partir de su teoría los gradientes serían innatos (inherentes al sistema nervioso).

la segunda hipótesis fue propuesta por Lashley y Wade - suponen que un requisito esencial para que se dé el gradiente de generalización, es que haya un

entrenamiento de discriminación explícito sin este entrenamiento, el gradiente sería plano. - proponen que los gradientes serían aprendidos y producto de la experiencia.

Page 58: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

El trabajo de Jenkins y Harrison Jenkins y Harrison hicieron un entrenamiento para mostrar cómo la experiencia previa influye quisieron verificar si

el entrenamiento discriminativo es esencial o no, para producir el gradiente de generalización típico. entrenaron a 2 grupos de palomas: A y B

GRUPOS ENSAYOS 1ª FASE 2ª FASE TIPO GRADIENTE G

A: entrenamiento discriminativo no diferencial

• Luz encendida • Tono de 1000 Hz

Tonos de distintas frecuencias en Extinción.

G.G. plana, como en el gráfico 2.

B: entrenamiento de discriminación diferencial simple

Luz encendida Tono de 1000 Hz

Tonos de distintas frecuencias en Extinción.

G.G. típico, como el del gráfico 1.

Luz encendida No tono

al grupo A ni el tono ni la luz le señalizaba nada respecto a la entrega del reforzador. para el grupo B el tono era lo único que señalizaba la presencia del reforzador, siempre que se ejecutase la conducta si

no había tono, ese ensayo no era reforzado. la discriminación se testeó en una segunda fase, presentando diferentes frecuencias del tono, en extinción. se elaboraron gradientes de generalización para ambos grupos y se pudo observar que si no había entrenamiento

diferencial explícito, no había discriminación de estímulos (el gradiente obtenido era un gradiente plano). sin embargo, se han encontrado gradientes de generalización sin necesidad de entrenamiento diferencial. en síntesis, no podemos saber si la experiencia es o no necesaria para que un organismo exhiba control de

estímulos a lo largo de una de sus dimensiones. sin embargo, estamos ciertos de que la experiencia sí moldea (da forma a) diferentes gradientes de generalización,

desde lo más planos hasta los más agudos. Variables que afectan la discriminación

a. características del estímulo: - se refiere a las características que hacen “saliente” a un estímulo (la forma, el color, la relación con otros

estímulos que le rodean, la intensidad, el peso, el volumen, etc.). - aquello que “llama la atención” de un estímulo no depende únicamente del estímulo, por lo tanto, en los estudios de

discriminación, en general, siempre se toma en cuenta al organismo que se está estudiando. b. la capacidad sensorial del organismo:

- esto afecta en el sentido de que “determina la forma en que el ambiente se aparece ante el organismo”. - el presentar ciertos estímulos con ciertas características no significa que todos los organismos vayan a responder

del mismo modo frente a ese estímulo, incluso con entrenamiento el organismo debe ser “sensible” a la característica o a la dimensión que tiene el estímulo; de otro modo, no habrá discriminación.

c. la experiencia del organismo: - actualmente se sabe que esta variable influye, pero cuándo lo hace, no está muy claro. - algunos estudios muestran que cuando se hace un entrenamiento intradimensional, el organismo provee

gradientes de generalización más agudos en cambio, cuando se hace un entrenamiento no diferencial, los gradientes tienden a ser más planos.

Aplicación práctica casi todos los casos de modificación conductual implican discriminación de estímulos y/o generalización, de

algún modo. aplicación de esta técnica, la discriminación de estímulos, para la cura del insomnio. aplicación de estímulos discriminativos para la modificación conductual es respecto a la conducta de estudio.

- en casi todos los lugares de estudio las probabilidades de “estudiar” son bajas no hay estímulos que “produzcan” la conducta de estudio.

- Fox realizó un entrenamiento con estudiantes universitarios: dio la indicación, a cada alumno, de estudiar al menos parte de una hora libre al día, el ramo más difícil para

ellos. este estudio debía ser hecho en el mismo lugar cada día donde sólo estuviese el material correspondiente al

ramo, y no usar ese lugar para ninguna otra actividad. si el estudiante notaba que comenzaba a divagar, a inquietarse o a aburrirse, debía leer una página más y

salir inmediatamente de la sala. el objetivo de este tratamiento era asociar esa sala y ese tiempo en particular, sólo con la conducta de

estudio de ese ramo y convertirlos en estímulos fuertes y potentes para la conducta de estudio. los otros estímulos (su habitación, la bilioteca en general, el jardín, etc.) no eran discriminativos dado que

estaban asociados con muchas otras conductas que competían con la conducta de estudio y ganaban. al principio los estudiantes lo encontraron difícil y se salían antes de la hora, pero con el progreso del

entrenamiento fueron mejorando sus notas considerablemente. en este experimento los resultados fueron metodológicamente confusos en términos de que se manipularon

otras variables además del control de estímulos, tales como las técnicas de estudio, por lo tanto no sabemos si los resultados se deben exclusivamente al proceso de discriminación, puede que no.

sin embargo, queda claro, por otras evidencias también que si se combinan diferentes técnicas de modificación conductual (auto-reforzamiento, técnicas de estudio) es posible mejorar considerablemente el rendimiento académico.

Page 59: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Clase 17: Interacción Condicionamiento Clásico y Operante

Introducción el condicionamiento clásico y el condicionamiento operante son 2 procesos de aprendizaje fácilmente diferenciables a nivel

conceptual. - CC el aprendizaje de relaciones entre estímulos. - CO el aprendizaje de una relación entre la conducta y sus consecuencias.

sin embargo, en un nivel práctico existe interacción entre ellos: - por una parte, podría ser que las respuestas clásicamente condicionadas recibiesen “refuerzo” y, por lo tanto,

hubiese una contingencia instrumental en el aprendizaje clásico. - por otro lado, las respuestas operantes no ocurren en el vacío, se dan en presencia de ciertos estímulos que

se vuelven importantes en la medida que adquieren control sobre la conducta. considerar:

- lo importante que puede ser un estímulo discriminativo para que el organismo tenga la opción de aprender a evitar totalmente el evento aversivo, sin ese estímulo, el organismo a lo más puede escapar.

- los estímulos discriminativos controlan la conducta operante señalizando la posibilidad de obtener reforzador si se emite la conducta.

ambos ejemplos tienen en común que la respuesta operante está precedida o acompañada por ciertos eventos que son informativos para el animal respecto a la ocurrencia de eventos apetitivos o aversivos frente a esos eventos antecedentes, el organismo tiene la opción de emitir o no, la conducta, dependiendo de la información entregada.

esta señalización por parte de los estímulos antecedentes, es el elemento que corresponde a la asociación clásica involucrada en el operante.

Rol del CO en el CC la idea a la base es cómo podría “instrumentalizarse” la respuesta condicionada clásica es decir, cómo el EI podría

actuar como “reforzador” sobre la respuesta condicionada clásicamente, además de ser el evento con el que se asocia el EC en el CC.

el reforzamiento instrumental se podría dar en el CC de 2 maneras (utilizaremos el condicionamiento de Pavlov para señalarlas):

a. si una vez presentada la campana la RC de salivación aparece antes que la comida, entonces la comida podría actuar como “reforzador” de esa RC y hacerla más probable en el futuro: habría una “instrumentalización” de la conducta en relación a una “consecuencia”.

b. la segunda forma es que la RC de salivar modifique al EI, o sea la comida, y la haga más eficaz como EI la conducta se vuelve “instrumento” para la eficacia del EI, y este EI “mejorado”, a su vez, refuerza la conducta de salivar.

las técnicas utilizadas para estudiar esta interacción están relacionadas con los 2 puntos anteriores: 1. eliminan la posibilidad de que la RC sea reforzada por la presencia del EI (la saliva) 2. modifican el EI del modo que lo podría hacer la RC, pero sin permitir que la RC lo modifique.

independientemente de las técnicas utilizadas, los resultados de las investigaciones muestran que el reforzamiento instrumental no es necesario para producir el aprendizaje entre eventos que ocurre durante el CC el CC puede mantenerse como un paradigma de aprendizaje independiente al CO el CO no afecta a la asociación clásica.

Rol del CC en el CO la participación del CC en el CO es mucho más compleja que al revés. en los experimentos no es posible separar ambos condicionamientos como cuando se estudia el rol del CO en el CC

porque siempre que se ejecuta una conducta operante hay estímulos presentes estímulos antecedentes. en el siguiente dibujo se visualiza dónde se produce la interacción entre la asociación clásica y la operante.

la asociación clásica está representada por la flecha segmentada, la cual muestra que la respuesta operante (R),

inevitablemente, se dará en un contexto (E), en un lugar con ciertos estímulos. por lo tanto, cualquiera sea la consecuencia de la conducta (C), ésta se “emparejará” con los estímulos

antecedentes. esto no quiere decir, necesariamente, que la asociación clásica se va a formar (es decir, que va a haber aprendizaje), pero

sí significa que el potencial para que esa asociación se forme está presente. si la respuesta es seguida por un reforzador (flecha serpenteada), este reforzador tiene el potencial de asociarse

con los estímulos antecedentes (flecha segmentada), los cuales están presentes al momento de emitirse la conducta (flecha recta).

a continuación un mapa temático:

Page 60: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Rol del CC en el CO (cont.)

Moderna teoría de los Dos Procesos Relación CC – CO

a. en cada entrenamiento de CO se desarrolla un EEC que motiva la respuesta operante. b. el (o los) EC(s) clásicamente provoca un EEC. c. si se presenta el EC clásicamente (fase b), el EEC provocado por ese EC modificará la tasa de

la conducta operante (interacción entre CC y CO). Rescorla y Solomon propusieron un modelo de interacción entre el CC y el CO basado en ideas ya conocidas, como

por ejemplo, aquella que dice que existen dos procesos a la base de la conducta de evitación (Mowrer, Teoría de los Dos Procesos) y la idea de que el CC contribuye al nivel de motivación general del animal.

esas ideas originales, se modificaron para dar lugar a la Moderna Teoría de los Dos procesos postula que el condicionamiento clásico provee de un Estado Emocional Central (EEC) que depende del tipo de EI que se haya utilizado.

la teoría no predice qué respuesta (operante) concreta va a emitir el sujeto porque un estado, por ejemplo de tristeza no conduce invariablemente a única respuesta (por ej.: llorar).

pero esta teoría sí predice que el Estado Emocional Central gatillado por el EC influye o afecta la tasa de emisión de la respuesta operante que se esté ejecutando.

Desde el comienzo si un organismo está ejecutando una respuesta operante, ésta tendrá una consecuencia Ej.: bajar la palanca y entrega

de comida, como consecuencia. en estas condiciones la rata puede aprender que la caja misma (estímulo antecedente) le señaliza la opción de recibir

comida.

la teoría plantea que cuando se está entrenando a la rata a apretar la palanca hay muchos estímulos presentes que

pueden condicionarse clásicamente y convertirse en estímulos discriminativos para la entrega del reforzador (Ej.: olores, colores de las habitaciones, pausas de tiempo, ruidos, etc.).

estos estímulos, producto de su asociación con el estímulo que se recibe como consecuencia, generan un EEC que motivan la conducta operante.

cuando la rata ya está emitiendo conductas operantes establemente se sigue con el CC explícito: - se selecciona una luz para condicionarlo, de modo explícito como EC con el EI comida (el mismo tipo de estímulo

que usó para el CO previo. la luz señaliza la ocurrencia/llegada de la comida. la luz es un EC+ apetitivo (estímulo condicionado excitatorio apetitivo) ya que señaliza la llegada de algo

agradable para el organismo. la emoción gatillada por ese EC+ apetitivo probablemente sea “alegría” o “esperanza” (de que llegará la

comida). Interacción de los 2 aprendizajes emocionales anteriores (del CC y del CO):

- cuando la rata está ejecutando su conducta de apretar la palanca y recibiendo comida y se le presenta la luz que se ha asociado clásicamente la tasa de la conducta de apretar la palanca aumentará debido al tipo de EEC provocado por el EC “luz”.

- si la rata está en la misma caja cada vez que aprieta la palanca y recibe el reforzador el EEC provocado por la caja, será de “alegría/esperanza” si además, la rata ha sido condicionada clásicamente con una luz y comida, entonces la luz provocará también un EEC que será “alegría/esperanza”.

- dado que se utilizó comida tanto en el CC, como en el CO el EEC será el mismo tanto para la motivación de la conducta operante como para el aprendizaje generado en el CC la influencia del CC en la conducta operante será en la misma dirección que la motivación que tiene esa conducta.

- al presentarle a la rata el EC+ luz (EEC: “esperanza”), mientras está apretando la palanca (EEC: “esperanza”), ella aumentará la tasa de esa conducta operante pues los EEC son compatibles.

Page 61: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

EEC Aprendido durante el CO (fase a) reforzamiento positivo:

- durante la primera fase (a), el organismo mientras ejecuta la conducta, los estímulos del medio se condicionan o, al menos, potencialmente pueden condicionarse con las consecuencias que recibe la conducta.

- los estímulos de la caja se volvieron discriminativos para la conducta de bajar la palanca, al señalarle la probabilidad de reforzador una vez ejecutada esta conducta.

- durante el reforzamiento positivo, surgiría un EEC parecido a “esperanza”. reforzamiento negativo:

- una rata, después de recibir algunas descargas eléctricas, aprende que si aprieta la palanca evita la descarga eléctrica su conducta es contingente con el retiro de un evento aversivo la conducta de apretar la palanca aumenta.

- durante el reforzamiento negativo, es muy probable que la rata haya adquirido un EEC de “miedo” frente a la situación experimental de la caja y apenas sea puesta en la caja comience a ejecutar su conducta operante de evitación.

EEC Provocados por el EC Clásicamente (fase b) los estados emocionales (EEC) posibles de provocar por un EC, de acuerdo a la Moderna Teoría de los dos Procesos son:

- si un EC+ ha adquirido sus características excitatorias debido a su asociación con un EI de tipo apetitivo este EC+ señalizará la ocurrencia de un EI agradable el EEC producido por el EC+ será de “esperanza”.

Ej.: la luz en la caja para la rata. - si un EC+ ha adquirido sus características excitatorias, debido a su asociación con un EI de tipo aversivo

este EC+ señalizará la ocurrencia de un EI aversivo el EEC provocado por el EC+ será de “miedo/temor”. Ej.: una noticia (EC+) que le informe que viene un terremoto.

- si un EC- ha adquirido sus características inhibitorias, debido al tipo de asociación con un EI de tipo apetitivo este EC- señalizará la no ocurrencia de un EI apetitivo el EEC producido por el EC- será de “desilusión/decepción”.

Ej.: usted espera a su amado este fin de semana que viene y un telegrama le avisa que no pudo encontrar pasajes

- si un EC- ha adquirido sus características inhibitorias, debido al tipo de asociación con un EI de tipo aversivo este EC- señalizará la no ocurrencia de un EI aversivo el EEC producido por el EC- será de “alivio”.

Ej.: usted teme que lo que arroje el examen sean malas noticias y el doctor le dice que todos los exámenes están bien

las emociones señaladas en el cuadro son sólo hipótesis metafóricas respecto a los EEC probables y connotan el “tono”

emocional que despierta el EC respectivo no implica que describan exactamente lo que sentimos en una situación con estímulos de ese tipo.

Interacción entre el EEC provocado por el EC y el generado durante el CO (fase c) si el EC se presenta entonces, mientras el organismo está ejecutando una respuesta instrumental, ¿cuál será el efecto, en

la respuesta instrumental, del EEC gatillado por el EC? la teoría predice que la tasa instrumental disminuirá o aumentará en función de la interacción entre el EEC creado

durante el entrenamiento instrumental (fase a) y el EEC creado por el EC (aprendido en la fase b) durante la ejecución de la conducta operante (fase c).

si el EC produce un estado emocional que es compatible con el estado emocional generado por la conducta instrumental (el que motiva la respuesta instrumental) la respuesta instrumental aumentará.

- Ej.: en el caso de Sniffy el EC+ generaba un EEC compatible con el estado emocional subyacente al reforzamiento positivo utilizado en la fase “a” el ECC era de esperanza.

- dado que las dos emociones son compatibles, lo que esperaríamos es que la conducta instrumental aumente, pues es como si el estado emocional provocado por el EC se sumara al estado emocional que motiva la conducta instrumental.

si el EC produce un estado emocional que es incompatible u opuesto al estado emocional generado por la conducta instrumental (el que motiva la respuesta instrumental) la respuesta instrumental disminuirá.

- Ej.: en el caso de Ringo durante el reforzamiento negativo aprendió un EEC de “miedo” frente a los estímulos discriminativos de la caja que le señalaban la probabilidad de una descarga eléctrica, la cual Ringo evitaba apretando la palanca.

- si mientras Ringo ejecuta la conducta de apretar la palanca, se le presenta un EC- que ha sido asociado con una descarga eléctrica, el EEC generado es “alivio”.

- el “miedo” y el “alivio” son EEC opuestos (son tonalidades afectivas opuestas), incompatibles lo más probable es que haya una disminución de la conducta (dejar de apretar la palanca).

la Moderna Teoría de los dos Procesos predice que los resultados conductuales dependen de los EEC que entran en juego en el momento en que se está ejecutando la respuesta operante (estos EEC provienen del CO y del CC; fase a y b respectivamente).

Page 62: Psicología aprendizaje

Psicología del Aprendizaje ___________________________________________________________________________________

___________________________________________________________________________________

Resumen

la supresión condicionada fue el primer resultado empírico que apoyó a esta teoría. después de ella se han realizado numerosas investigaciones para confirmar las predicciones de esta teoría estudios de

Transferencia de Control el nombre hace referencia al hecho de que el control conductual se transfiere al estímulo condicionado clásicamente, el cual es el que interfiere con la respuesta operante.

las etapas o fases de estos estudios de transferencia: 1. Fase 1 entrenamiento de una respuesta operante con reforzamiento positivo o negativo. 2. Fase 2 condicionamiento clásico donde hay ausencia o presencia de un EI. 3. Fase 3 transferencia de control mientras el organismo ejecuta su operante se le presenta periódicamente

el EC de la fase 2 para evaluar su efecto en la tasa de la conducta instrumental. las investigaciones (la parte empírica) no encuentran un apoyo total a los casos donde los estímulos incondicionados de la

fase 1 y 2 son del mismo tipo (ambos apetitivos o ambos aversivos, celdas 3, 4, 5, 6 del cuadro 2). si los EI son idénticos (comida en ambos casos) las predicciones de esta teoría se cumplen, si no lo son (comida en un

caso y agua en otro: ambos apetitivos, pero no idénticos), las predicciones no siempre se cumplen, los hallazgos son contradictorios.

la Moderna Teoría de los Dos Procesos explica y, por lo tanto predice muy exitosamente, los casos en los cuales, para cada condicionamiento (fase 1 y fase 2), se utiliza un EI con propiedades afectivas opuestas (uno aversivo y el otro apetitivo, por ejemplo comida y descarga eléctrica), celdas 1, 2, 7, 8 del cuadro 2.

donde la Moderna Teoría de los dos Procesos falla existe otra teoría que da cuenta de lo que ocurre en esos casos la Teoría Mecanismo rm-rs.