Upload
rukia-sakakibara-nobunaga
View
537
Download
1
Embed Size (px)
Citation preview
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Condicionamiento Instrumental: Condicionamiento Instrumental: Fundamentos Fundamentos
Domjan, captulo 5.
Condicionamiento clsico:
Estmulo Estmulo
Conducta Conducta
Conducta instrumental
Condicionamiento instrumental:
Conducta Conducta
Consecuencia Consecuencia
Conducta Conducta
La conducta produce la consecuencia. Pero la consecuencia afecta a la conducta posterior.
Fernando Blanco; 2007
1
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Clever Hans
2x3=...
Thorndike: las cajas-problema
-Aprendizaje por ensayo y error. -Latencias progresivamente ms cortas: el animal aprende.
Conducta: Conducta: tirar de la cuerda tirar de la cuerda
Consecuencia: Consecuencia: la puerta se abre la puerta se abre
Repetir Repetir la conducta la conducta
Asociacin Respuesta-Estmulo
Fernando Blanco; 2007
2
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Thorndike: las cajas-problema
Ley del Efecto (Thorndike): -Una conducta aparece en presencia de un estmulo (por ejemplo, la caja problema en s), y es seguida de una consecuencia satisfactoria (salir de la caja). -Se fortalece la asociacin entre ese estmulo y esa conducta (asociacin E-R). Por eso se repite la conducta. CUIDADO: la asociacin es entre la conducta y el estmulo que est presente al producirla.
Ensayo Discreto vs. Operante Libre
Ensayo discreto: Ej: Cajas-problema, Laberintos. Slo se da una respuesta instrumental en cada ensayo.
Fernando Blanco; 2007
3
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Ensayo Discreto vs. Operante Libre
Ensayo discreto: Ej: Cajas-problema, Laberintos. El experimentador decide cundo puede responder el animal.
Medimos la LATENCIA: tiempo que tarda en abandonar la caja de salida (en el laberinto) o en dar la respuesta correcta (caja-problema). Medimos la VELOCIDAD DE LA CARRERA (en el laberinto).
Ensayo Discreto vs. Operante Libre Operante Libre (Skinner): Ej: presin de palanca en la caja de Skinner. El animal decide cundo responde, y puede hacerlo una y otra vez. Unidad de respuesta = operante. Capa operante produce un efecto en el ambiente, que hace que la respuesta aparezca con ms o con menos frecuencia en el futuro.
Fernando Blanco; 2007
4
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La caja de Skinner
NOTA: NO es este Skinner
La otra caja de Skinner Sueo: sociedad perfeccionada gracias a la ciencia de la conducta. Aplicacin radical del conductismo. ...y mucha malinterpretacin por parte de la prensa).
Fernando Blanco; 2007
5
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Ensayo Discreto vs. Operante Libre Operante Libre (Skinner): Medimos la tasa de ocurrencia de la respuesta operante. Ej: 8 pulsaciones de la palanca por minuto. Cuanto ms probable es la conducta, mayor tasa de respuesta. Segn la ley del efecto, una conducta seguida de una consecuencia positiva aumenta su tasa de ocurrencia.
Ensayo Discreto vs. Operante Libre Definiendo el reforzador: Reforzador = Todo aquel estmulo que: 1. Aparezca como consecuencia de una conducta. 2. Provoque que esa conducta se haga ms frecuente en el futuro. Problemas: Definicin circular. No puedo predecir si un estmulo ser un reforzador.
Fernando Blanco; 2007
6
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Ensayo Discreto vs. Operante Libre
La conducta operante puede no aparecer en el repertorio original del animal. Entonces: Moldeamiento: Reforzamiento de conductas cada vez ms parecidas a la conducta meta. Cada conducta reforzada se hace ms probable. Se trabaja por fases.
Moldeamiento:
Escojo siempre la conducta ms parecida a la meta para ser reforzada. Al reforzar una conducta, la hago ms probable.
Conducta meta
Primer set de conductas
Segundo set de conductas
Tercer set de conductas
Fernando Blanco; 2007
7
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Moldeamiento:Lo mejor para entender el moldeamiento es HACERLO (Sniffy).Gracias al Gracias al moldeamiento, moldeamiento, podemos ensear a podemos ensear a Sniffy a pulsar una Sniffy a pulsar una palanca para obtener palanca para obtener comida. comida. Gracias al Gracias al moldeamiento, yo puedo moldeamiento, yo puedo ensear al investigador a ensear al investigador a que me d comida por que me d comida por pulsar una palanca. pulsar una palanca.
Moldeamiento:
Palomas jugando al ping-pong gracias al moldeamiento.
Fernando Blanco; 2007
8
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Procedimientos de condicionamiento instrumental
Estimulacin
ContingenciaPositiva Negativa
Apetitiva Reforzamiento Positivo
Entrenamiento De Omisin Reforzamiento Negativo: Escape, Evitacin
Aversiva
Castigo
Procedimientos de condicionamiento instrumental
Estimulacin
ContingenciaPositiva Negativa
Apetitiva Reforzamiento PositivoConducta Consecuencia apetitiva. Hace que la conducta se haga ms frecuente (ms tasa de respuesta). Ej: Premios
Aversiva
Fernando Blanco; 2007
9
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Procedimientos de condicionamiento instrumental
Estimulacin
ContingenciaPositiva Negativa
Apetitiva
Conducta Consecuencia aversiva. Hace que la conducta se haga menos frecuente (suprime conductas).
Aversiva
Castigo
Procedimientos de condicionamiento instrumental
Estimulacin
ContingenciaPositiva Negativa
Apetitiva
Entrenamiento De OmisinAversivaConducta NO Consecuencia apetitiva. Hace que la conducta se haga menos frecuente (menos tasa de respuesta). Ej: Castigado sin postre!
Fernando Blanco; 2007
10
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Procedimientos de condicionamiento instrumental
Estimulacin
ContingenciaPositiva Negativa
Apetitiva
Conducta NO Consecuencia aversiva. Hace que la conducta se haga ms frecuente (ms tasa de respuesta). Ej: Hacer caso a un no que llora porque no te deja dormir.Con este ltimo siempre metemos la pata. Recordemos que aumenta la tasa de respuesta, igual que el refuerzo positivo.
Aversiva
Reforzamiento Negativo: Escape, Evitacin
Procedimientos de condicionamiento instrumental
Escape / EvitacinEscape Estimulacin aversiva
R
Conducta Estimulacin aversiva La estimulacin aversiva se detiene si se da la conducta
Fernando Blanco; 2007
11
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
Procedimientos de condicionamiento instrumental
Escape / EvitacinEvitacin Conducta
R
Estimulacin aversiva La estimulacin aversiva no se inicia si se da la conducta
La respuesta instrumental Normalmente: El reforzamiento produce conductas estereotipadas, reduce la variabilidad de la conducta.Conductas variadas Reforzamiento Conductas estereotipadas
Pero tambin es posible reforzar la variabilidad. Con lo que aumentamos la variabilidad de la conducta mediante reforzamiento. (Ej: Slo recompenso al animal cuando lleva a cabo un patrn de respuestas novedoso).
Fernando Blanco; 2007
12
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La respuesta instrumental Pertinencia. Por su naturaleza, hay estmulos que se asocian mejor con otros. En el condicionamiento clsico:
Mal condicionamiento
EC: SABOR
EI: DESCARGA
La respuesta instrumental Pertinencia. Por su naturaleza, hay estmulos que se asocian mejor con otros. En el condicionamiento clsico:
Buen condicionamiento
EC: SABOR
EI: Enfermedad
Fernando Blanco; 2007
13
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La respuesta instrumental Pertinencia. Por su naturaleza, hay estmulos que se asocian mejor con otros. Tambin en el condicionamiento instrumental. Debe haber cierta correspondencia entre la respuesta y el reforzador. Pero recordemos: El reforzador se define por su efecto sobre la conducta (decamos que era una definicin circular). No sabemos seguro si un estmulo servir como reforzador de una conducta en concreto.
La respuesta instrumental Pertinencia. Sujeto: Pez macho. Respuesta: Gesto de morder. Reforzador: Aparicin de otro pez macho.
Respuesta: morder
Reforzador: macho
Fernando Blanco; 2007
14
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La respuesta instrumental Pertinencia. Sujeto: Pez macho. Respuesta: Gesto de morder. Reforzador: Aparicin de un pez hembra. No hay buen condicionamiento
Respuesta: morder
Reforzador: hembra
La respuesta instrumental Pertinencia. Morder: conducta agresiva. La practican los machos con otros machos. Cuando el reforzador es un macho: el condicionamiento es bueno. La respuesta morder tiene que ver con el reforzador.
Estoy que echo Estoy que echo chispas. Dnde est chispas. Dnde est mi rival? Que me lo mi rival? Que me lo como! como!
Fernando Blanco; 2007
15
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La respuesta instrumental Pertinencia. Cuando el reforzador es una hembra: El gesto de morder no es una respuesta adecuada para ser reforzada con acceso a una hembra. Por otro lado: Si la conducta que quiero reforzar es el baile de cortejo, entonces sucede justo al revs (mejor que el reforzador sea el acceso a una hembra). Ha de haber cierta relacin entre la respuesta y el reforzador.
La respuesta instrumental Pertinencia.Aqu lo vemos: El acceso a una hembra es el reforzador adecuado para la conducta del baile de cortejo.
Respuesta: cortejo
Reforzador: hembraEstudias o Estudias o trabajas, liiinda? trabajas, liiinda?
Fernando Blanco; 2007
16
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La respuesta instrumentalCmo predigo si una conducta es apropiada para reforzarla con un reforzador en concreto? Una ayuda son los Sistemas de conducta (ver captulo 4).
Cuando tiene hambre, se activa el sistema de conducta de alimentacin (buscar comida). Estas conductas (olfatear, excavar...) forman parte del sistema de alimentacin y en esta condicin de privacin se hacen ms frecuentes.
Conductas del animal en su estado natural: 20% Erguirse 20% Limpiarse 20% Rascarse 20% Excavar 20% Olfatear
Conductas del animal con hambre (privado de comida): 30% Erguirse Las conductas 2% Limpiarse del sistema de 3% Rascarse alimentacin se 30% Excavar refuerzan mejor 35% Olfatear con comida.
El reforzador instrumental Cantidad y calidad del reforzador: Afecta a la cantidad e intensidad de la respuesta. Reforzador cuantioso y de calidad e intensa. Respuesta frecuente
Qu pasa si la cantidad o la calidad del reforzador varan a lo largo del experimento? Lo predice el modelo de Rescorla & Wagner. Cambios en el reforzador = ms sorpresa (positiva o negativa).
Fernando Blanco; 2007
17
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
El reforzador instrumental
Trabajo
Trabajo ms
Comparo lo que tena antes con lo que tengo ahora
Trabajo
Trabajo menos
El reforzador instrumental
Trabajo
Trabajo ms
El contraste es importante. Trabajo MUCHO ms
Trabajo
Fernando Blanco; 2007
18
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
El reforzador instrumental
Contraste positivo: Recompensa mala Recompensa regular Contraste negativo: Recompensa muy buena Ej: nio rico.
++RC.
Recompensa buena
--rc.
Estoy acostumbrado a tenerlo todo Richie Rich
La relacin respuesta - reforzador instrumental
Contigidad temporal: El reforzador sigue inmediatamente a la respuesta. Contingencia: El reforzador sigue a la respuesta y slo a la respuesta. Entonces podemos decir que tienen una relacin causal. La respuesta es la causa del reforzador. Puede haber contigidad sin contingencia y contingencia sin contigidad.
Fernando Blanco; 2007
19
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La relacin respuesta - reforzador instrumental
Contigidad temporal: El condicionamiento es mejor si la demora es corta (mucha contigidad). Explicacin: el animal no sabe qu conducta ha sido reforzada. Reforzamiento no contiguo: R1 Tiempo R2 R3 R4 Reforzador
?
La relacin respuesta - reforzador instrumental
Contigidad temporal: El condicionamiento es mejor si la demora es corta (mucha contigidad). Explicacin: el animal no sabe qu conducta ha sido reforzada. Reforzamiento contiguo: R1 Tiempo Reforzador R1
Fernando Blanco; 2007
20
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La relacin respuesta - reforzador instrumental
Contigidad temporal: A veces no es posible presentar el reforzador inmediatamente despus de la conducta. Maneras de resolver esa situacin: 1- Usar un reforzador condicionado o secundario.
La relacin respuesta - reforzador instrumental (Es el mismo estmulo que har de reforzador)
EC
EI
EI R1 EC
En vez del reforzador, presento el EC que estaba asociado con el reforzador.
Tiempo Ahora s hay contigidad
Fernando Blanco; 2007
21
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La relacin respuesta - reforzador instrumental
Contigidad temporal: A veces no es posible presentar el reforzador inmediatamente despus de la conducta. Maneras de resolver esa situacin: 1- Usar un reforzador condicionado o secundario. 2- Marcado. Un estmulo aparece tras las respuestas correctas (que son las que se reforzarn) y tras las incorrectas. As el animal sabe qu conducta es la que se va a reforzar (marca la respuesta que es importante de cara a obtener el reforzador).
La relacin respuesta - reforzador instrumental
Contingencia respuesta-reforzador: La entrega del reforzador depende de la ejecucin de la respuesta. No hay reforzador si no hay respuesta. Es tan importante como la contigidad. Mejor que estn las dos.
Fernando Blanco; 2007
22
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La relacin respuesta - reforzador instrumental
Supersticin (Skinner) Experimento: Entrega de comida independiente de la conducta (cada 15 segundos). No hay contingencia, por tanto, entre conducta y reforzador. Resultado: Aparecen conductas extraas en las palomas. Las palomas se comportan como si estas conductas controlaran la administracin del reforzador.
La relacin respuesta - reforzador instrumental Supersticin (Skinner)
R1
R2
Reforzador
R3
R4 R2 R2
Tiempo
Reforzamiento Reforzamiento accidental o accidental o adventicio. adventicio.
La conducta previa al La conducta previa al reforzador NO tiene reforzador NO tiene contingencia con el contingencia con el reforzador, pero s tiene reforzador, pero s tiene contigidad,por puro azar. contigidad, por puro azar.
Esa conducta que por Esa conducta que por azar ha sido contigua al azar ha sido contigua al reforzador se hace ms reforzador se hace ms frecuente en el futuro. frecuente en el futuro.
Al ser ms frecuente, es Al ser ms frecuente, es ms probable que ms probable que vuelva a ser reforzada vuelva a ser reforzada accidentalmente. accidentalmente.
Fernando Blanco; 2007
23
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La relacin respuesta - reforzador instrumental Supesticin (Skinner)Este mecanismo puede explicar las supersticiones humanas.
La relacin respuesta - reforzador instrumental Indefensin aprendida (Seligman)Ingredientes para hacer un experimento de indefensin aprendida:
Pared bajaGato (No hace falta que sea un gato espacial)*
Lado seguro
Es por tanto un procedimiento de Escape.
*Nota: el experimento original usaba perros
Descargas
Fernando Blanco; 2007
24
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La relacin respuesta - reforzador instrumental Indefensin aprendida (Seligman)En la segunda fase, hacemos un cambio en la jaula experimental:
Pared inaccesible
Al subir la altura de la pared que separa los dos lados, el pobre gato queda confinado en el lado de las descargas.
La relacin respuesta - reforzador instrumental Indefensin aprendida (Seligman)Por ltimo, volvemos a poner la pared a la altura inicial:
Ya no quiero saltar, esto no tiene remedio! La vida es injusta.
Pared baja de nuevo
El gato ni siquiera intenta saltar: INDEFENSIN APRENDIDA
Fernando Blanco; 2007
25
Aprendizaje y Conducta. Tema 5. Condicionamiento Instrumental: Fundamentos
La relacin respuesta - reforzador instrumental Indefensin aprendida (Seligman) La exposicin a estimulacin aversiva incontrolable ha producido inactividad (como no puedo controlar lo que me pasa, no tiene sentido intentar cambiarlo). La indefensin aprendida se relaciona con la depresin. Puede ser debido a un dficit atencional. Tiene, por lo tanto, 3 tipos de consecuencias: motoras (inactividad), cognitivas (distorsiones cognitivas, falta de atencin), y emocionales (depresin).
Hasta aqu llegamos, Muchas gracias!
Diapositivas de Fernando Blanco, 2007Pgina web: http://www.labpsico.com/pers/blanco/FernandoBlanco.htm
Fernando Blanco; 2007
26