155

Click here to load reader

Aprendizaje resumen jc cabrera temas 1-9

Embed Size (px)

Citation preview

Page 1: Aprendizaje  resumen jc cabrera temas 1-9

PSICOLOGIA

PRINCIPIOS DE

APRENDIZAJE Y CONDUCTA

Juan Carlos Cabrera ValderramaCádiz 2009-2010

Descargado del campus, http://campus.felizmente.info

Page 2: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 3: Aprendizaje  resumen jc cabrera temas 1-9

1

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera - 2009/2010

Antecedentes históricos- Desarrollo histórico del estudio de la mente.- Desarrollo histórico del estudio de los reflejos.

El amanecer de la nueva era- La cognición comparada y la evolución de la inteligencia.- Neurología funcional.- Modelos animales de la conducta humana.- Modelos animales y robótica.

Definición de aprendizaje:- La distinción entre aprendizaje y ejecución.- El aprendizaje y otras fuentes de cambion conductual.- Diferentes tipos de mecanismos causales.

Aspectos metodológicos del estudio del aprendizaje- El aprendizaje como ciencia experimental.- La perspectiva de proceso general en el estudio del aprendizaje.

Uso de animales no humanos en la investigación sobre aprendizaje- Razones del uso de animales no humanos en la investigación sobre aprendizaje.- Los animales de laboratorio y la conducta normal.- El debate público sobre la investigación con animales no humanos.

Descargado del campus, http://campus.felizmente.info

Page 4: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 5: Aprendizaje  resumen jc cabrera temas 1-9

3

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

Antecedentes Históricos

Las aproximaciones teóricas al estudio del aprendizaje tienensus raíces en la filosofía de René Descartes. Antes deDescartes, se pensaba que el comportamiento humano estabaenteramente determinado por la intención consciente y por ellibre albedrío. Descartes reconoció que muchas cosas quehacen las personas son respuestas automáticas a estímulosexternos, aunque no abandonó por completo la idea del librealbedrío y del control consciente. Por tanto, formuló la visióndualista del comportamiento humano conocida como dualismocartesiano: conducta voluntaria controlada por la mente yconducta involuntaria controlada por mecanismos reflejos.

Descartes asume que los estímulos del ambiente externo son la causa de toda conductainvoluntaria. Estos estimulos producen respuestas involuntarias por medio de un circuitoneuronal que incluye al cerebro. Sin embargo, creía que los mismos nervios transmitían lainformación de los órganos de los sentidos al cerebro y del cerebro a los músculos. Estecircuito permitía reacciones rápidas a estímulos exteros ( ejemplo: retirar rápidamente undedo del fogón caliente).

Descartes creía que los animales carecían del libre albedrío y eran incapaces de accionesvoluntarias y conscientes, frente a los seres humanos que se les atribuía una mente o alma.

La mente como una entidad inmaterial, se conectaba al cuerpo a traves de la glándula pineal,cerca del cerebro, por lo que podía tener conciencia de la conducta involuntaria e iniciar las

René Descartes (1596-1650)

Diagrama de dualismo cartesiano. Los órganos sensoriales detectan los eventos del mundo físico. Desde aquí lainformación se trasmite al cerebro. El cerebro está conectado a la mente por medio de la Glándula pineal. La accióninvoluntaria se realiza por un arco reflejo que envía mensajes en primer lugar a los órganos sensoriales al cerebro ydespués del cerebro a los músculos. La acción voluntaria se inicia en la mente, que envía mensajes al cerebro y después alos músculos.

Órganossensoriales

Mundo físico (causade la accióninvoluntaria)

Cerebro

Músculos

Glándulapineal

Acciónvoluntariao involuntaria

Mente

(causa de laacción

voluntaria)

Descargado del campus, http://campus.felizmente.info

Page 6: Aprendizaje  resumen jc cabrera temas 1-9

4

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

acciones voluntarias. Dado que la conducta voluntaria se iniciaba en la mente, ésta podíatener lugar independientemente de la estimulación externa.

El dualismo mente-cuerpo introducido por Descartes dio lugar a dos tradicionesintelectuales, base del estudio del aprendizaje moderno:

1.- El mentalismo, se ocupaba de los contenidos y funcionamiento de la mente.2.- La reflexología, del mecanismo de la conducta involuntaria.

Desarrollo histórico del estudio de la mente.

Los filósofos preocupados por la mente estaban interesados en descubrir qué era la mentey cómo funcionaba. Preguntas similares se plantean los psicólogos cognitivos actuales.

En cuanto al contenido de la mente.

Descartes creía que la mente contenía ideas innatas independientemente de la experienciapersonal. La aproximación filosófica según la cual nacemos con ideas innatas acerca deciertas cosas se denomina innatismo.

Otros filósofos posteriores a Descartes se enfrentaron a la postura nativista, como JohnLocke(1632-1704) creía que las ideas de las personas eran aprendidas directa oindirectamente a través de experiencias posteriores al nacimiento, recibiendo esta elnombre de empirismo.

En cuanto a cómo funciona.

Descartes creia en una mente impredecible y desordenada sin ninguna regla estricta o leyesque pudieran identificar. Mientras que el filósofo Thomas Hobbes ( 1588-1679) fue pioneroen proponer que al igual que los reflejos, la mente operaba de forma predecible y conformea leyes. En concreto propuso la conducta voluntaria estaba gobernada por el principio delhedonismo (las personas tratan de lograr el placer y de evitar el dolor).

Los empiristas británicos propusieron que las sensaciones simples se combinan hasta formarideas complejas por medio de asociaciones. Al oir la palabra coche cuando hemos visto uncoche, se establece asociación con estos atributos de los coches, de manera que estapalabra volverá a activar los recuerdos de los aspectos del coche que hemos experimentadocuando vuelva a oirla. Los empiristas británicos consideraban que tales asociacionesconstituían los ladrillos de la actividad mental y dedicaran un considerable esfuerzo endetallar las Leyes de asociación.

Descargado del campus, http://campus.felizmente.info

Page 7: Aprendizaje  resumen jc cabrera temas 1-9

5

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

Leyes de asociación. Los empiristas británicos aceptaron dos conjuntos de leyes para elestablecimiento de asociaciones:

• Primarias: formuladas por Aristoteles que propuso tres principios,� Contigüidad: si dos eventos ocurren juntos en el espacio o en el tiempo de

forma repetida quedarán asociados. Por ejemplo, si nos encontramos con elolor de la salsa de tomate y de los espaguetis con la suficiente frecuencia,nuestro recuerdo de los espaguetis se activará con el mero olor de la salsa detomate.

� Similitud y contraste: dos ideas se asocian si son similares en algún aspecto(por ejemplo, si las dos son rojas) o si tienen alguna característica contraria(por ejemplo, si una es muy alta y otra muy baja).

• Secundarias: varios filósofos formularon leyes de asociación secundarias, entreellos Tomas Brown(1778-1820) propuso que la formación de asociaciones entredos sensaciones estaba influida por un número de factores, incluyendo laintensidad de las sensaciones y la frecuencia y recencia con que las dos ocurrianconjuntamente. Además, se consideraba que la formación de una asociación entredos eventos dependía del número de asociaciones anteriores en las que cada unode dichos eventos estaba involucrado, y la similitud entre estas asociacionespasadas y la que se forma en el presente.

La investigación empírica de los mecanismos de asociación no comenzaría hasta el siglo XIX,con el trabajo pionero del psicólogo alemán Hermann Ebbinghaus (1850-1909) inventor delas sílabas sin sentido, combinaciones de tres letras sin ningún significado, estudió listasde estas y midió su capacidad de recordarlas bajo diversas condiciones experimentales,permitió comprobar que :

- la fuerza de las asociaciones mejoraba con el entrenamiento.- Las sílabas sin sentido que aparecían juntas en una lista quedaban asociadas con mayor

fuerza que las sílabas que estaban más distantes,- Una sílaba se asocia con mayor fuerza a la siguiente de la lista que a la anterior.

Descargado del campus, http://campus.felizmente.info

Page 8: Aprendizaje  resumen jc cabrera temas 1-9

6

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

Desarrollo histórico del estudio de los reflejos.

Al formular el concepto de reflejo, Descartes hizo una gran contribución a la compresión dela conducta, aunque estaba eqivocado en sus ideas acerca del acto reflejo cuando creia quelos mensajes sensoriales iban de los órganos de los sentidos al cerebro y los mensajesmotores iban del cerebro a los músculos, viajando por los mismo nervios; y cuando pensabaque los nervios eran tubos huecos y su transmisión neuronal involucraba gases a los quedenominó espíritus animales. Suponía que estos espíritus animales, liberados por la glándulapineal, se desplazaban por los tubos neurales y entraban en los musculos hinchandolos yprovocando el movimiento. Por último, Descartes consideraba el movimiento reflejo era decarácter innato y que estaban fijados por la anatomía del sistema nervioso.

Charles Bell (1774-1842) y François Magaendie (1783-1855) mostraron que eran fibrasnerviosas distintas las encargadas de transmitir la información sensorial desde los organossensoriales a SNC (sistema nervioso central) y la información motora, del SNC a losmúsculos.

John Swanmmerdan (1637-1680) en 1669 mostró que el influjo de espiritus animales desdela glándula pineal resultaba innecesario y Francis Glisson (1597-1677) demostró que lascontracciones musculares no se debían a que los músculos se hincharan por un gas.

Descartes y la mayor parte de los filósofos posteriores asumieron que los reflejos eranresponsables únicamente de reacciones sencillas a estímulos externos. Se suponía que unestimulo mayor corresponde a una respuesta más vigorosa. Por ejemplo, si tocamos unfogón, cuanto mayor sea el calor más rápido se retira la mano.

Hasta el s.XIX I.M. Sechenov (1829-1905) propuso quelos estímulos no siempre elicitan respuestas reflejas deforma directa. En algunos casos pueden liberar respuestaque estaba inhibida, cuya fuerza no dependerá de laintensidad del estimulo. Por ejemplo, pequeñas particulasde polvo pueden producir potentes estornudos. Sugirióque formas complejas de comportamiento (acciones opensamientos) que ocurrian en ausencia de estímuloelicitador manifiesto eran de hecho respuestas reflejas.Así, la conducta voluntaria y los pensamientos están enrealidad elicitados por estímulos débiles y apenasvisibles.

Sechenov no tomó en consideración que la conducta delos organismos no permanecía fija e invariable a lo largo

I.M. Sechenov ( 1829-1905)

Descargado del campus, http://campus.felizmente.info

Page 9: Aprendizaje  resumen jc cabrera temas 1-9

7

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

de su vida, sino que se veia alterada por la experiencia. Desde tiempos de Descartes seconsideró las respuestas reflejas como innatas y fijadas de antemano por las conexiones delsistema nervioso y por tanto un estímulo dado elicitaría la misma respuesta a lo largo detoda la vida del individuo.

Pavlov demostró experimentalmente que no todos los reflejosson innatos. Mediante mecanismos asociativos se puedenestablecer nuevos reflejos para los estímulos. Trabajó desdela tradición fisiológica de la reflexología tratanto dedeterminar las leyes de la asociación mediante la investigaciónexperimental .

El análisis de tipo asociativo continua jugando un importantepapel en investigaciones tanto fisiológicas como conductuales,aunque algunos han complementado los mecanismos asociativoscon otro tipo de procesos.

El Amanecer De Una Nueva Era

Los estudios experimentales sobre los principios básicos de aprendizaje se realizanfrecuentemente con animales no humanos y dentro de la tadición reflexológica.

La cognición comparada y la evolución de la inteligencia.

Surge como consecuencia de los escritos de Charles Darwinque atacaba los privilegios que Descartes daba a los humanoscuando asumia que sólo estos poseían mente. En su segundaobra más importante, El origen del hombre, Darwin, argumentóque "el hombre desciende de algún ser más primitivo, a pesarde que por el momento se desconozcan los eslabonesintermedios". Al reclamar la continuiad entre los demásanimales y los humanos, Darwin trató de caracterizar, no sólola evolución de los rasgos físicos, sino tambien la evolución delas capacidades psicológicas o mentales. En su opinión, la mentehumana es producto de la evolución. Sugería que los animalestambién poseen capacidades similares a las humanas inclusocapaces de creer en entidades espitiruales.

Ivan Pavlov (1849-1936)

Charles Darwin (1809-1882)

Descargado del campus, http://campus.felizmente.info

Page 10: Aprendizaje  resumen jc cabrera temas 1-9

8

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

Darwin recopiló evidencias anecdóticas de formas de comportamiento inteligente enanimales, que hoy no satisface los estandares científicos pero que el tema de investigaciónsiguen siendo de máxima actualidad por la posibilidad de seguir la huella de la evolución de lainteligencia por medio de destudios delas capacidades de las diversas especies animales.

George Romanes en su libro inteligencia animal de 1882, sugirió que la inteligencia podríaidentificarse determinando si un animal aprende "a hacer nuevos ajustes, o a modificar losantiguos, de acuerdo con los resultados de su propia experiencia individual". La definió comola capacidad de aprender.

Neurología Funcional.

De acuerdo con el principio del nervismo, las principales funciones fisiológicas estángobernadas por el sistema nervioso (SN). Ivan Pavlov dedicó su vida a investigarlo y granparte a la identificación de los mecanismos neurales de la digestión. El descubrimiento porparte de los britanicos Bayliss y Starling evidenciando el control parcial del páncreas porfactores hormonal y no por factores neurales, hizo que abandonara el estudio de lafisiología del sistema digestivo para investigar los reflejos condicionados. La afirmación dePavlov según la cual los estudios de aprendizaje revelan cómo opera el sistema nervioso esampliamente aceptada por los neurocientíficos contemporaneos. Kandel, por ejemplo, hacomentado que "el principio central de las modernas neurociencias es que todocomportamiento es un reflejo del funcionamiento del cerebro".

El psicólogo del comportamiento es como un conductor que trata de descubrir elfuncionamiento de un vehículo experimental probandolo, en lugar de estudiando el motor.Los estudios conducturales del aprendizaje pueden proporcionar pistas sobre la maquinariadel sistema nervioso. Tales estudios nos informan de la plasticidad potencial del sistemanervioso, de las condiciones en las cuales el aprendizaje puede tener lugar, del mecanismopor el cual persisten las respuestas aprendidas y de las circunstancias en las cuales lainformación aprendida es o no accesible. Al detallar las funciones del sistema nervioso, losestudios conductuales del aprendizaje definen los rasgos u operaciones que deben serexplicados por investigaciones de tipo neurofisiológico.

Descargado del campus, http://campus.felizmente.info

Page 11: Aprendizaje  resumen jc cabrera temas 1-9

9

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

Modelos animales de la conducta humana.

La realización de inferencias sobre el comportamiento humano partiendo de investigacionescon otras especies animales puede ser arriesgada, si se realiza de forma injustificada; ycontrovertida si las razones para la utilización del modelo no se entiende apropiadamente.Los modelos bases suelen ser animales de otras especies como palomas, ratones y ratones,primates.

La utilización de animales como modelo es una herramienta cientifica básica y potente.Permite el estudio de aspectos de la realidad que representan en condiciones sencillas,controladas y económicas. Lo importante del modelo animal es que la caracteristica aestudiar sea similar a las conductas humanas. Por ejemplo, las similitudes entre las ratas ylos humanos en la forma de evitar comidas peligrosas hace que la rata sea un modelo válidopara investigar el aprendizaje de aversión a la comida en humanos.

Dollard y Miller fueron partidarios de una integración en la que los estudios de laboratoriorealizados con animales no humanos se usaran para aislar e identificar los fenómenos quepodrían posteriormente ser estudiados con éxito en personas. La investigación con animalespermite también aumentar nuestra confianza en los datos obtenidos con humanos mediantemétodos de investigación menos rigurosos.

Modelos animales y robótica.

Los modelos animales de aprendizaje y conducta también revisten cierta importancia enrelación a la robótica y a los sistemas de inteligencia artificial. Los robots son máquinascapaces de realizar funciones o tareas específicas. La meta de la robótica es hacermáquinas tan "inteligentes" como sea posible. Al igual que Romanes definió el término"inteligencia" a partir de la capacidad de aprender, los ingenieros actuales contemplan lacapacidad de recordad y aprender a partir de la experiencia como un rasgo importante delos sitemas artificiales "inteligentes". La información sobre las características ymecanismos de tal aprendizaje puede obtenerse a partir de estudios de aprendizajerealizados por animales no humanos. Por ejemplo, en inteligencia artificial se utilizanfrecuentemente mecanismos asociativos para permitir que las respuestas de estos sistemassean modificables por la experiencia.

Descargado del campus, http://campus.felizmente.info

Page 12: Aprendizaje  resumen jc cabrera temas 1-9

10

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

Definición De Aprendizaje.

No hay una definición de aprendizaje universalmente aceptada. Sien embargo, muchosaspectos quedan recogidos en las siguiente afirmación:

El aprendizaje es un cambio duradero en los mecanismos de conducta que implica

estímulos y/o respuestas específicas y que es resultado de la experiencia previa con

esos estímulos y respuestas o con otros similares.

La distinción entre aprendizaje y ejecución.

Siempre que contemplamos evidencia de aprendizaje, observamos la aparición de un cambioen el comportamiento. Es la única forma de saber si el aprendizaje a tenido lugar. Elcomportamiento está determinado por muchos otros factores distintos del aprendizaje.

La ejecución se refiere a las acciones de un organismo en un momento concreto. Laejecución esta determinada por la oportunidad, la motivación y las capacidades sensoriales ymotoras, además del aprendizaje. Por lo que, un cambio de actuación no puede serautomáticamente considerada como una manifestación de aprendizaje.

El aprendizaje y otras fuentes de cambio conductual.

La fatiga o cansancio , entre otros, es un mecanismo que da lugar a cambios de conductaque es excesivamene breve para ser considerados como aprendizaje. Se produce por elesfuerzo físico y provoca una disminución gradual en la fuerza de una respuesta. Este tipode cambio está producido por la experiencia, pero no se considera ejemplo de aprendizajedebido a que la debilitación de la respuesta desaparece si se permite al individuo descansarun rato.

Un cambio en las condiciones estimulares también puede alterar la conducta temporalmente(La luz del cine se enciende de repente, el espectador cambia su comportamiento, y cuandose apaga se vuelve a concentrar en la pelicula). Como tampoco puede considerarseaprendizaje los que implican alteración en el estado fisiológico o motivacional del organismo( el hambre, la sed, cambios en niveles hormonas sexuales, drogas psicoactivas, etc.provocan cambios conductuales transitorios).

En algunos casos, pueden aparecer cambios persistentes en la conducta sin necesidad de laexperiencia con eventos del entorno que requiere la definición de aprendizaje. Destacabelde este tipo es la maduración. Un niño no alcanza un objeto que está en una estantería altahasta que crezca lo suficiente.

Descargado del campus, http://campus.felizmente.info

Page 13: Aprendizaje  resumen jc cabrera temas 1-9

11

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

Diferentes tipos de mecanismos causales.

Las causas pueden ser conceptualizadas de diversas formas o a diferentes niveles deexplicación. Cuatro tipos de causas descritos por Aristóteles.

� Primero , causa eficiente, hace referencia a las condiciones necesarias y suficientespara producir un resultado en la conducta.

� Segundo, causas materiales, cambios en los mecanismos sinápticos; cambios neurales.� Tercera, causas formales son las teorías o modelos de aprendizaje.� Cuarta, causas finales son las explicaciones del aprendizaje que pone énfasis en su

función o utilidad.

Los cientificos de orientación biológica a menudo establecen una distinción entre las causaspróximas o inmediatas del comportamiento y sus causas últimas. Las causas próximas secorresponden con las causas eficientes y materiales de Aristóteles. Las causas últimas secorresponden con las causas finales.

Aspectos Metodológicos Del Estudio del Aprendizaje.

La investigación sobre los procesos de aprendizaje se caracteriza por dos rasgosmetodológicos principales. Uno es consecuencia directa de la definición de aprendizaje yrequiere el uso de métodos de investigación experimentales, en lugar de métodosobservacionales. Los fenómenos del aprendizaje no pueden investigarse sin una metodologíaexperimental. El segundo rasgo metodológico es más una cuestión de preferencia que denecesidad.

El aprendizaje como ciencia experimental.

De los cuatro tipos de causas, los investigadores del aprendizaje han centrado su atenciónen las causas eficiente, materiales y formales. Independientemente del tipo de causa, esteénfasis prescribe que las investigaciones de aprendizaje utilicen una metodologíaexperimental. Las causas no pueden observarse directamente. Tan sólo pueden ser inferidasa partir de los resultados de las manipulaciones experimentales.

En el estudio del aprendizaje, lo que nos interesa es la conducta de organismos vivos, enpresencia y en ausencia de la presunta causa. Hay que comparar las acciones de losindividuos que previamente han sido expuestos al procedimiento en cuestión con las accionesde los individuos que no han sido expuestos a dicho procedimiento. La única forma dedemostrar que la exposición a ese entrenamiento es la causa del cambio conductual

Descargado del campus, http://campus.felizmente.info

Page 14: Aprendizaje  resumen jc cabrera temas 1-9

12

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

estudiado es manipular experimentalmente la presencia y la ausencia de dicha exposición.Por esta razón, el aprendizaje sólo puede estudiarse mediante técnicas experimentales ytiene lugar básicamente en el laboratorio.

La perspectiva de proceso general en el estudio del aprendizaje.

El segundo rasgo metodológico de los estudios de aprendizaje es una perspectiva basada enprocesos generales. Ésta es más una cuestión de preferencia que de necesidad. Sinembargo, al adoptar una perspectiva de proceso general, los investigadores del aprendizajeanimal siguen una antigua tradición científica.

Elementos de la perspectiva de proceso general. La característica más obvia de lanaturaleza es su diversidad. Los cientificos han elegido fijarse en los aspectos comunespara buscar la uniformidad y formular leyes generales con las que organizar y explicar ladiversidad de los eventos del universo. Los investigadores del aprendizaje animal hanseguido esta misma tradición.

Un presupuesto fundamental de la perspectiva de proceso general es que los fenómenosestudiados son el resultado de procesos más elementales. Además, se asume que esosprocesos elementales operan de forma similar independientemente de dónde se encuentren.Por tanto, se asume que la generalidad emerge a nivel de los procesos básicos o elementales.

Los investigadores del condicionamiento y el aprendizaje se han adherido a la perspectivade proceso general desde los comienzos de esta área de estudio en psicología. Se hancentrado en los aspectos comunes de los diversos tipos de aprendizaje y han asumido quelos fenómenos de aprendizaje son producto de procesos elementales que operan de formasimilar en diversas situaciones de aprendizaje.

El presupuesto según el cual las leyes "universales" de la asociación son las responsables delos fenómenos de aprendizaje no excluye que los animales puedan aprender sobre multitudde estímulos, respuestas o que cada especie tenga un ritmo de aprendizaje diferente. Seasume que la generalidad se sitúa en los principios o procesos de aprendizaje; no en elcontenido o en la velociad del mismo. El trabajo del psicólogo del aprendizaje es descubriresas leyes universales.

Implicaciones metodológicas de la perspectiva de proceso general. Si asumimos queexisten principios universales de aprendizaje, entonces deberíamos ser capaces dedescubrir esos principios en cualquier situación en la que el aprendizaje tenga lugar. Portanto, una importante implicación metodológica de la perspectiva de proceso general es quese pueden descubrir los principios del aprendizaje estudiando cualquier especie o sistemade respueta que muestre aprendizaje. Los investigadores han confluido hacia unos

Descargado del campus, http://campus.felizmente.info

Page 15: Aprendizaje  resumen jc cabrera temas 1-9

13

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

paradigmas experimentales estandarizados o convencionales. La mayor parte de los estudiosde aprendizaje se realizan en estos paradigmas. A lo largo de los años se han idoperfeccionando estos paradigmas experimentales convencionales, para ajustarse a laspredisposiciones conductuales de los animales de investigación. Debido a estas mejoras,estas preparaciones experimentales permiten realizar estudios de laboratorio conrespuestas bastante naturales.

Demostración de la generalidad de los fenómenos de aprendizaje. Asumir que existenprocesos elementales de aprendizaje comunes no es lo mismo que demostrar empíricamenteestas similitudes.

La verificación empírica de la existencia de tales mecanismos comunes en diversassituaciones sigue siendo necesaria para construir una explicación verdaderamente generaldel aprendizaje. Una teoría general del aprendizaje no puede verificarse empíricamenteutilizando sólo unos pocos paradigmas experimentales estandarizados. La generalidad delaprendizaje debe probarse realizando estudios de distintas especies y situaciones.

Uso de Animales No Humanos En La Investigación Sobre Aprendizaje.

Gran parte de los experimentos se han realizado con animales no humanos por razonestanto teóricas como metodológicas.

Razones del uso de animales no humanos en la investigación sobre aprendizaje.

Para investigar los fenómenos de aprendizaje se requiere el uso de métodos experimentalesque puedan atribuir la adquisición de una nueva conducta a una experiencia previa enparticular. Este control experimental de la experiencia previa no puede alcanzarse con elmismo grado de precisión cuando se utilizan sujetos humanos que cuando se utilizananimales de labotatorio. Con los animales de laboratorio, los cientificos pueden estudiarcómo se aprende las reacciones emocionale intensas y cómo el aprendizaje interviene a lahora de buscar comida, evitar el dolor o el estrés, o encontrar posible pareja sexual. Con laspersonas, se ven limitados a tratar de modificar las respuestas emocionales inadaptadas unavez que éstas ya han sido aprendidas. Incluso para procedimientos terapéuticos eficaces enel tratamiento de la conducta inadaptada requiere conocer primero los mecanismos por loscuales se aprenden dichas respuestas emocionales, conocimiento que requiere estudios conanimales de laboratorio.

Descargado del campus, http://campus.felizmente.info

Page 16: Aprendizaje  resumen jc cabrera temas 1-9

14

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

Obtener información sobre las bases evolutivas y biológicas del aprendizaje, o cómoevoluciona la cognición y la inteligencia requieren el apoyo o la utilización de animales deinvestigación.

Igualmente el conocimiento de las bases biológicas del aprendizaje necesitan el apoyo de losanimales de laboratorio para desenmarañar cómo aprende y recuerda el sistema nervioso.Los estudios conductuales de aprendizaje realizados con animales son un requisito necesariopara cualquier intento de investigar las bases biológicas del aprendizaje con animales. Laneurociencia tiene que fundamentarse en la ciencia del comportamiento.

Estudiar los procesos de aprendizaje en animales criados en condiciones de control delaboratorio es más simples que hacerlo en personas cuyos ambientes son mucho másvariados y difíciles de describir. El comportamiento de los animales no se ve complicado porlos procesos lingüísticos que juegan un papel tan importante en determinados tipos deconducta humana. Otra ventaja importante es que en la investigación con animales no esnecesario hacer peticiones explícitas a los sujetos. En la investigación con humanos se debeasegurar que los participantes no están influenciados por el deseo de complacer alinvestigador.

Los animales de laboratorio y la conducta normal.

Parece errónea la idea de alguno cuando sugieren que la endogamia y los largos periodos decautiverio de los animales domesticados de laboratorio pueden influir en la conducta normalde estos. De hecho, los animales de laboratorio (ratas) pueden ser preferibles con fines deinvestigación a sus equivalentes salvajes ya que viven en un medio tan "artificial" como el delhumano.

El debate público sobre la investigación con animales no humanos.

Ha habido un gran debate acerca de las ventajas y los inconvenientes de realizarinvestigaciones con animales. Parte del debate se ha centrado en la necesidad de dar untrato humano a los animales. Otros aspectos del debate han centrado los requisitos éticos yque debe cumplir el trato de los animales, en el derecho de los seres humanos abeneficiarse a expensas de los animales y en posibles alternativas a la investigación conanimales.

La ética de la investigación con animales de laboratorio. La preocupación por el bienestarde los animales de laboratorio han dado lugar a la adopción de reglas estrictas para elalojamiento de los animales y para la supervisión de la investigación con animales. En el casode la ciencia que estudia la conducta, siempre se preocupan de ese bienestar ya que no se

Descargado del campus, http://campus.felizmente.info

Page 17: Aprendizaje  resumen jc cabrera temas 1-9

15

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

puede obtener información sobre el aprendizaje y la conducta normales utilizando animalesenfermos o maltratados.

Algunos experimentos conllevan alguna incomodidad, sin embargo, se realizan todos losesfuerzos necesarios para minimizarlos.

¿Qué es un trato "humano" a los animales? Asumiendo que una especie merece el tratoque establezcan las normas oficiales. A menudo se describe como "trato humano" altratamiento que se considera apropiado para los animales de laboratorio.

¿Deben los seres humanos beneficiarse del uso de otros animales? La relación essimbiótica más que unilateral y de explotación. Además, el uso de animales de laboratorio enla investigación representa tan sólo una pequeña parte del uso que otros humanos hacen delos animales domésticos, incluyendo su uso como fuente de alimentación.

Estimaciones del número de animales empleados en avicultura y ganadería

Pollos 7.764.200.000Gallinas ponedoras 303.604.000Pavos 301.251.000Ganado vacuno 59.801.000Cerdos 104.301.000Ovejas y corderos 6.691.000TOTAL AVICULTURA Y GANADERÍA 8.539.848.000

Estimaciones del número de animales empleados en Investigación

Perros 75.429Gatos 26.091Primates 56.381Caballos 217.079Conejos 309.322Animales de granja 159.742Ratas y ratones 7.452.186Otros 150.987TOTAL INVESTIGACIÓN 8.452.186

*Datos de 1997 de EEUU.Porcentaje del total empleado en investigación = 0.099%

Alternativa a la investigación con animales. La creciente preocupación por aspectos éticosde la investigación con animales ha llevado a la búsqueda de técnicas alternativas. Russell yBurch (1959) formularon las "tres R": reemplazamiento de animales por otras técnicas deestudio, reducción del número de animales empeados por técnicas estadísticas yrefinamiento de los procedimientos experimentales para causar menos sufrimiento. Pero enla investigación sobre aprendizaje no es posible la experimentación sin organismos vivos.

Descargado del campus, http://campus.felizmente.info

Page 18: Aprendizaje  resumen jc cabrera temas 1-9

16

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capitulo 1: IntroducciónJuan Carlos Cabrera

Algunas de las técnicas propuestas:

1. Técnica observacionales. Al necesitar los estudios de aprendizaje manipulaccionesexperimentales de la experiencia pasada, las observaciones realizadas sin intervenirsobre los animales no pueden proporcionar información sobre los mecanismos deaprendizaje.

2. Uso de plantas. El aprendizaje no puede estudiarse en plantas, ya que carecen desistema nervioso, imprescindible para el aprendizaje.

3. Cultivo de tejidos. Aunque los cultivos de tejidos pueden revelar las operaciones deprocesos celulares, el funcionamiento del estos procesos celulares dentro del organismointacto sólo puede estudiarse en el organismo intacto. Además, la búsqueda de losmecanismos celulares del aprendizaje requiere una caracterización previa delaprendizaje a nivel conductual.

4. Simulaciones informáticas. Sin los conocimientos precisos sobre la naturaleza de losfenómenos de aprendizaje y de los mecanismos y factores que determinan elaprendizaje, los programadores no pueden realizar una simulación informática. Portanto, la investigación con organismos vivos es un requisito para la simulacióninformática efectiva.

TERMINOS CLAVE

Aprendizaje Cambio duradero en los mecanismos deconducta que implica estímulos y/o respuestasespecíficos y que es resultado de la experienciaprevia con esos estímulos y respuestas o con otrossimilares.

Asociación Conexión entre la representación mentalde dos eventos (dos estímulos o un estímulo y unarespuesta) de forma que la ocurrencia de uno delos eventos activa la representación del otro.

Dualismo Visión de la conducta según la cual lasacciones pueden dividirse en dos categorías:conducta voluntaria controlada por la mente yconducta involuntaria controlada por mecanismosreflejos.

Ejecución Actividades de un organismo en unmomento particular.

Empirismo Corriente filosófica según la cual todas lasideas de la mente tienen su origen en laexperiencia.

Hedonismo Postura filosófica propuesta por Hobbessegún la cual las acciones de un organismo estánenteramente determinadas por la persecución delplacer y la evitación del dolor.

Maduración Cambio en la conducta causado por eldesarrollo físico o fisiológico del organismo enausencia de experiencia con eventos particularesdel ambiente.

Innatismo Postura filosófica según la cual los sereshumanos nacen con ideas innatas.

Nervismo Postura filosófica adoptada por Pavlovsegún la cual todos los procesos conductuales yfisiológicos están regulados por el sistemanervioso.

Reflejo Mecanismo que permite que un eventoespecífico del ambiente elicite una respuestaespecífica.

Sílaba sin sentido Combinación de tres letras (dosconsonantes y una vocal) sin significado.

Descargado del campus, http://campus.felizmente.info

Page 19: Aprendizaje  resumen jc cabrera temas 1-9

17

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

La naturaleza de la conducta elicitada.- El concepto de reflejo.- Pautas de acción modal.- Estímulos elicitantes de las pautas de acción modal.- La organización secuencial de la conducta.

Efectos de la estimulación repetida.- Atención visual en los bebés humanos.- Salivación y evaluación del sabor en humanos.- Respuesta de sobresalto en ratas.

Los conceptos de hatituación y sensibilización.- Adaptabilidad y generalidad de la habituación y la sensibilización.- Diferencias entre habituación y adaptación sensorial y fatiga.- Teoría de proceso dual de la habituación y la sensibilidad.

Características de la habituación y la sensibilización.- Curso temporal.- Especificidad del estímulo.- Efecto de un estímulo externo intenso.

Aplicación a las emociones y la conducta motivada.- Reacciones emocionales y sus efectos posteriores.- La teoría del proceso oponente.- Variaciones en la conducta dirigida a metas.

Descargado del campus, http://campus.felizmente.info

Page 20: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 21: Aprendizaje  resumen jc cabrera temas 1-9

19

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

La Naturaleza de la Conducta Elicitada (pág. 29)

Todos los animales reaccionan a los eventos que tienen lugar en su entorno. Gran parte de laconducta tiene lugar como respuesta a los estímulos; es decir, ocurre de forma elicitada.

El concepto de reflejo.

Un reflejo conlleva dos elementos íntimamente relacionados, un estímulo elicitante y sucorrespondiente respuesta. La respuesta rara vez tiene lugar en ausencia del estímulo.

Estímulo y respuesta es una consecuencia de la organización del sistema nervioso. Losreflejos simples suelen estar mediados por tres neuronas:

- Neurona sentorial o neurona aferente, es activada por un estímulo ambiental ytransmite el mensaje sensorial a la médula espinal.

- Neurona motora o neurona eferente, trasmite el impulso desde la médula espinal queactiva el musculo involuntario en la repuesta refleja.

- Interneural el impulso que comunica las dos neuronas anteriores.

Los circuitos neuronales están dispuestos de tal modo que determinadas neuronassensoriales se conectan al conjunto correspondiente de neurnas motoras, por lo que una

Organización neuronal de los reflejos simples. Los estímulos del entorno activan una neurona sensorial,que trasmite el mensaje sensorial a la médula espinal. En este lugar, el impulso neuronal pasa a unainterneurona, que a su vez dirige el impulso hacia una neurona motora. La neurona motora activa al musculoinvolucrado en el movimiento.

Descargado del campus, http://campus.felizmente.info

Page 22: Aprendizaje  resumen jc cabrera temas 1-9

20

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

determinada respuesta refleja está elicitada únicamente por un conjunto limitado deestímulos. El conjunto formado por neurona aferente, la interneuraona y la neuronaeferente constituyen el arco reflejo.

El arco reflejo representa el númeromínimo de conexiones neuronalesnecesarias para que tenga lugar el actoreflejo, pero pueden verse involucradas esctructuras neuronales adicionales. Por ejemplo, lainformación sensorial puede transmitirse al cerebro, que a su vez puede modificar lareacción refleja de diversas formas.

La mayor parte de los reflejos contribuyen al bienestar delorganismo, constituyen una parte importante del repertorioconductual de los niños recien nacidos y en ocasiones esencial para lasupervivencia, como el reflejo de oclusión respiratoria.

Pautas de acción modal.

Hay respuetas simples comunes en muchas especies, por el contrario, existen otrasespecificas de la propia especie. Por ejemplo, la respuesta de succión provocada por objetossituados cerca de la boca es un rasgo característico de los mamíferos.

A las secuencias de respuestas típicas de especies particulares, tales como las que aparecenen la alimentación de crías, se las denomina pautas de acción modal o PAMs.

Estímulos elicitantes de las pautas de acción modal.

Los rasgos especificos que se requieren para elicitar la conducta reciben colectivamente elnombre de estímulo señal o estímulo desencadenante.

Un estímulo señal o desencadenante essuficiente para elicitar una pauta deacción modal. Sin embargo, unadeterminada pauta de acción puede

estar controlada por varios rasgos del estímulo de forma aditiva. Además, el estímulo queelicita con mayor efectividad la pauta de acción no tiene por qué ser el que ocurra conmayor probabilidad en condiciones naturales.

De hecho experimentos realizados con la gaviota arenquera, demostraron que el color, latextura y el tamaño parecían controlar la conducta de recuperación del huevo de formaaditiva. El atractivo del huevo podía resaltarse haciéndolo más verde, más moteado o más

Arco reflejoEl estímulo provoca una reacción automática.Componentes: Neurona sensorial, interneural, neurona motora.

Son secuencias de conducta específicas de algunas especiesque se desencadenan ante un estímulo determinado(estímulo señal o estímulo desencadenante).

Ej: "Bailes de cortejo".

Descargado del campus, http://campus.felizmente.info

Page 23: Aprendizaje  resumen jc cabrera temas 1-9

21

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

grande. Al optimizar cada una de estasdimensiones se obtenía un objeto queera más efectivo que el natural comoelicitador de la pauta de acción. Estosestímulos inusualmente efectivosreciben el nombre de estímulossupranormales.

La organización secuencial de la conducta.

Las conductas nunca aparecen aisladas sino que forman secuencias. Distinguimos dos tipos:

1.- Conducta apetitiva a los primeros componentes de la secuencia decomportamiento. Sirve para poner al animal en contacto con el estímulo. Por ejemplo,olfatear la comida antes de comerla.2.- Conductas consumatoria a los últimos componentes de la secuencia decomportamiento. Por ejemplo, tragar la comida. Son normalmente más estereotipadas(menos variables) que las conductas apetitivas.

En secuencias de busqueda de comida:

1.- Modo de búsqueda general. Son conductas apetitivas. El sujeto no sabe dóndebuscar comida. Por ejemplo, la ardilla busca un nogal.

2.- Modo de búsqueda focalizada. Tambien conductas apetitiva. El sujeto ya halocalizado espacialmente la fuente de comida, la búsqueda es ahora más restringida.Por ejemplo, la ardillaha encontrado el nogal y comienza a buscar nueces.

3.- Modo de manipulación del alimento. Es la conducta consumatoria. Por ejemplo, laardilla ha obtenido la nuez.

Efectos De La Estimulación Repetida. (pág. 35 del libro)

Descartes pensaba que una respuesta simple elicitada ocurre automáticamente de la mismaforma que se presenta el estímulo elicitada. Cada aparición del estímulo elicitante producirála misma acción refleja. Esto no es así, dado que a menudo aparecen alteraciones en lanaturaleza de la conducta elicitada simplemente como resultado de la presentación repetidadel estímulo elicitante.

Imaginemos que el parámetro más importante es el color azul.Así puede suceder que el huevo artificial más efectivo parainiciar la Pauta de acción modal (PAM) resulta ser muy diferentedel huevo real. Un huevo muy azul que no existe en lanaturaleza, pero que elicita la PAM con más fuerza que los deverdad, lo llamamos estímulo supranormal.

Descargado del campus, http://campus.felizmente.info

Page 24: Aprendizaje  resumen jc cabrera temas 1-9

22

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

Atención visual en los bebés humanos.

Los bebés humanos tienen que aprender muchas cosas sobre el mundo, y una forma esobservar el entorno. Las claves visuales elicitan una respuesta de observación, que puedemedirse por el tiempo que los bebés mantienen sus ojos en un objeto antes de mirar a otraparte.

En un estudio sobre atención visual se tomaron dos grupos de bebés de cuatro meses y seles presentaron diferentes estímulos visuales. Los dos patrones similares a tableros deajedrez; uno de 4x4 y el otro de 12x12. Se presentaron durante 10s., ocho veces enintervalos de 10s.

Los resultados muestran que la atención visual provocada por un estímulo novedoso cambia amedida que el bebé se familiariza con el estímulo. Con el patron 4x4 relativamente sencillo,la atención visual se reduce progresivamente. Con el patrón 12x12 más complejo, la atenciónse incrementó en el segundo ensayo, pero después se redujo también.

Salivación y evaluación del sabor en humanos.

El sabor de la comida elicita la salivación como respuesta refleja. Esto puede observarsetan claramene en las personas como en los perros de Pavlov.

Las personas encuentran el sabor de una comida específica menos placentera cuanto máscomen. Sin embargo, el sabor de una comida distinta es suficiente para restablecer lavaloración hedónica de una comida familiar. Estos hallazgos , del experimento realizado porEpstein, Rodefer, Wisniewski y Caggiula, 1992, suguieren que sobrealimentación puedereducirse no variando la alimentación disponible para su consumo.

Patrón de tablero 4 x 4 Patrón de tablero 12 x 12

Descargado del campus, http://campus.felizmente.info

Page 25: Aprendizaje  resumen jc cabrera temas 1-9

23

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

Respuesta de sobresalto en ratas.

La respuesta de sobresalto es una respuesta defensiva que aparece en muchas especies.Consiste en un salto repentino y una contracción de los músculos de la parte superior delcuerpo, con frecuencia acompañado de una elevación de los hombros.

Davis (1974) estudió la respuesta de sobresalto en dos grupos de ratas. A cada grupo, en unambiente con un sonido suave de 60dB y al otro, algo más fuerte, con 80dB. Ambos gruposrecibieron 100 presentaciones de un tono de 4000 cps en intervalos de 30 segundos. Losresultados fueron una reacción de sobresalto cada vez más débil para el grupo expuesto aambiente 60dB y reacciones de sobresalto cada vez más vigorosas para el grupo expuesto aambiente 80dB.

Los Conceptos De Habituación y Sensibilización. (pág. 39 del libro)

Los estudios descritos anteriormentemuestran que la presentación repetida deun estímulo elicitante puede provocartanto disminuciones como incrementos enla respuesta. Las disminuciones de latendencia a responder producidas por laestimulación repetida recibe el nombretécnico de efecto de habituación. Losincrementos de la tendencia a responder se llaman efecto de sensibilización.

Adaptabilidad y generalidad de la habituación y la sensibilización.

Estamos continuamente bombardeadospor estimulos. Si tuviesemos queresponder a todos nuestra conducta seríadesorganizada y caótica. Los fenómenos

de habituación y sensibilización son el producto final de procesos que ayudan a organizar yfocalizar la conducta en el caótico mundo de estímulos en el que los organismos viven.

Habituación y sensibilización son útiles y necesarias porqueayudan a hacer caso a ciertos estímulos relevantes y a ignorarlos estímulos irrelevantes. De lo contrario, nos moveríamos enun maremágnum estimular poco informativo.

Habituación: La respuesta desciende debido a la estimulaciónrepetida. Ej: Acostumbrarse a vivir cerca de un aeropuerto,cuando los primeros días es una tortura, por el ruido.

Sensibilización: La respuesta aumenta debido a laestimulación repetida. Ej: La primera vez que escuché unaópera no había distinguido el sonido de los clarinetes, ahoraque ya la he oído muchas veces puedo diferenciar ese sonidoclaramente.

Descargado del campus, http://campus.felizmente.info

Page 26: Aprendizaje  resumen jc cabrera temas 1-9

24

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

Diferencias entre habituación y adaptación sensorial y fatiga.

La habituación no es el único efectoque da lugar a una disminución en larespuesta. La adaptación sensorialocurre en los órganos sensoriales (unacegera temporal al pasar de laoscuridad a una luz) y la fatiga de larespuesta tiene lugar en los músculosefectores. Por el contrario, lahabituación y la sensibilizaciónocurren en el sistema nervioso.

En la habituación, el órganismo deja de responder a un estímulo aunque mantiene lacapacidad de percibirlo y de realizar los movimientos musculares requeridos por larespuesta. La respuesta no tiene lugar debido a los cambios en el sistema nervioso bloqueanla transmisión del impulso nervioso de la neuronas motoras.

En los estudios sobre habituación, la adaptación sensorial puede descartarse ya que existeevidencia de que la habituación es específica de la respuesta.

La fatiga también puede descartarse como causa de la habituación por medio de evidenciasque muestra que la habituación es específica del estímulo.

Adaptación sensorial: pérdida de sensibilidad de lsorganos sensoriales ( ej: deslumbrarse por una luz muyfuerte).

¿Cómo distinguirla de la Habituación? La adaptación sensorial...

1. No se debe a una estimulación repetida, como laHabituación, sino a una estimulación demasiado potente.

2. No sucede en el sistema nervioso central, como lahabituación, sino en los órganos sensoriales. No es portanto una forma de aprendizaje.

3. No es específica de la respuesta. Si los órganossensoriales están afectados, todas las respuestasdisminuirán porque los estímulos no son bien captados porlos sentidos. Por el contrario, en la habituación, sólodesciende una respuesta, otras respuestas diferentespueden ser ejecutadas con normalidad.

4. Es un tipo de efecto muy transitorio.

Fatiga: Reducción de la respuesta producida por elcansancio de los músculos involucrados en ella.

¿En qué se parece y en qué se distingue de laHabituación?

1. La fatiga sí puede ser consecuencia de una estimulaciónrepetida, como la Habituación. Ejecutar una mismarespuesta continuamente produce fatiga.

2. Sin embargo, la fatiga no sucede en el sistema nervioso,no es aprendizaje, sino en los músculos que ejecutaríanla respuesta. Un brazo cansado no puede ejecutar larespuesta.

3. La fatiga no es específica del estimulo, como sí lo esla Habituación. En el caso de la Habituación, un cambio enel estímulo devuelve la respuesta normal. Sin embargo, unmúsculo fatigado no puede volver a ejecutar la respuestapor haber cambiado el estímulo presentado.

4. Igualmente es un cambio muy transitorio: sólo hacefalta descansar un rato.

Descargado del campus, http://campus.felizmente.info

Page 27: Aprendizaje  resumen jc cabrera temas 1-9

25

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

Teoría de proceso dual de la habituación y la sensibilidad.

La teoría del proceso dual presupone que los incrementos y disminuciones en la tendencia aresponder a un estímulo son producto de procesos neuronales diferentes: Proceso dehabituación, rovoca una disminución de la tendencia a responder y proceso desensibilización, produce un incremento en la tendencia a responder. Estos procesos no sonexlcuyentes y ambos pueden estar activos al mismo tiempo. El resultado conductual dependede qué proceso sea más fuerte.

En base investigaciones neuropsicológica, losprocesos de habituación y sensibilizacióntienen lugar en diferentes partes de sistemanervioso. La habituación tiene lugar en elsistema E-R, que consiste en el caminoneural más corto que conecta los órganossensoriales activos por el estímulo elicitantey los músculos involucrados en la producciónde la respuesta elicitada ( como el arcoreflejo). Cada presentación de un estímuloelicitante activa el sistema E-R y causa unincremento en la habituación.

Los procesos de sensibilización tienen lugar en el sistema de estado. Este determina latendencia general de un organismo a responder, mientras el sistema E-R permite al animaldar la respuesta específica al estímulo relevante. Los cambios de conducta que tienen lugarpor la repetición de un estímulo refleja la acción combinada de los sistemas E-R y deestado.

Aplicaciones de la teoría del proceso dual. En los ejemplos de habituación ysensibilización, la exposición repentida al patrón ajedrez 4x4 produjo una disminución derespuesta visual de los bebés, posiblemente no provocó mucha activación del sistema E-R,proceso de habituación. El patrón ajedréz 12x12, más complejo, produjo mayor activación y

La teoría del proceso dual integra los dos procesos dehabituación y sensibilización.

Los dos procesos suceden al mismo tiempo: la conductaobservada es el resultado neto de los dos. ¿Quién es másfuerte?

Los dos procesos (habituación y sensibilización) tienen lugar en distintas partes del SN.

El proceso de habituación tiene lugar en el sistema E-R (similar al arco reflejo). Cada presentación de un estímulo activael sistema E-R aumentando la habituación.

El proceso de sensibilización tiene lugar en el sistema de estado (determina la tendencia a responder). Sólo se activa antela presentación repetida de estímulos excitadores (por tanto, no está activo todo el tiempo). Se puede modificar esatendencia mediante drogas o estados emocionales ( ej: el miedo).

La conducta observada será el resultado de la combinación de los dos procesos, por lo tanto depende de cuál de los dos seamás fuerte en un momento dado.

Descargado del campus, http://campus.felizmente.info

Page 28: Aprendizaje  resumen jc cabrera temas 1-9

26

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

activó, no sólo el sistema E-R, sino también el sistema estado. Produjo un incremento en laatención visual después del primera presentación. Sin embargo, el proceso de sensibilizaciónno fue lo suficientemente fuerte para contrarestar completamente los efectos de lahabituación. Como resultado, despues de varios ensayos, la atención visual tambien declinoen respuesta al estimulo 12x12.

La respuesta de sobresalto de las ratas anteriormente comentadas requieren una aplicacióndiferente de la teoría del proceso dual. Cuando se sometió a prueba con ruido ambientalrelativamente suave (60 dB), no había nada que las activara. Por tanto, podemos asumir quelos procedimientos experimentales no produjeron cambios en el sistema estado. Lapresentación repetida de tono elicitador activaba tan sólo el sistema E-R, lo que dio lugar ala habituación de la respuesta de sobresalto.

El resultado contrario tubo lugar cuando fueron puestos en presencia de los 80 dB.Sucesivas presentaciones del tono aparecieron reacciones de sobresalto más enérgicas.Dado que en ambos grupos se utilizó el mismo tono, la diferencia en los resultados no puedeser atribuida al mismo. Debemos asumir que en el segundo grupo, el ruido ambiente intensoincrementó el nivel de activación o la tendencia a respuesta. Esta sensibilización del sistemade estado fue la causa del incremento en la reacción de sobresalto al tono en el segundogrupo.

Implicaciones de la teoría del proceso dual. El sistema E-R se activa siempre que unestímulo elicita una respuesta, mientras que el sistema de estado sólo interviene encircunstancias especiales.

Características de la habituación y la sensibilización. (pág. 45 del libro)

Curso temporal.

Por lo general duran poco tiempo, lo suficiente para ser considerarlos formas deaprendizaje.

Curso temporal de la sensibilización por lo general tienen efectos temporales y suduración depende de la intensidad de los estímulos. Los estímulos más intensos producenmayores incrementos en la tendencia a responder y una sensibilización más persistentes.

Curso temporal de la habituación. La persistencia es variable. En la habituación sedistingue entre habituación a corto plazo (se disipa en segundos o minutos) y habituación a

Descargado del campus, http://campus.felizmente.info

Page 29: Aprendizaje  resumen jc cabrera temas 1-9

27

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

largo plazo (persiste durante muchos días). La recuperación espontánea es la principalcaracterística del efecto de habituación a corto plazo.

Especificidad del estímulo.

Especificidad del estímulo en la habituación. La habituación es específica del estímulo queha sido presentado repetidamente. Una respuesta a un estímulo previamente habituadapuede manifestarse plenamente alterando alguna característica importante del estímulo.Ejemplo, después de habituarse al sabor del limón, la presentación de la lima recupera larespuesta totalmente.

Aunque la habituación es específica de un estímulo, puede darse cierta generalización. Sinos hemos habituado a un determinado sonido del reloj, es posible que tampocorespondamos al sonido de otro reloj que es similar al original. Este fenómeno recibe elnombre de generalización del estímulo de la habituación. A medida que los estímulos sehacen progresivamente diferente, el organismo mostrará una menor habituación o supresiónde la respuesta ante dicho estímulo.

Especificidad del estímulo en la sensibilización.

La sensibilización no es específica del estímulo.Si una animal se sensibiliza por alguna razón,su reactividad se incrementá para toda una variedad de estímulos.

Efecto de un estímulo externo intenso.

La respuesta habituada también puederestablecerse sensibilizando al organismo conla exposición de un estímulo externo. Estefenómeno recibe el nombre dedeshabituación.

Especialidad del estímulo:

- Habituación: Muy específica del estímulo (cambiamos el estímulo y la respuesta).

- Sensibilización: No específica del estímulo. Cuando el animal se sensibiliza (por estados de alerta, miedo, ingestión dedrogas), está hipersensible para casi cualquier estímulo que vaya a presentarse.

Un estímulo intenso puede producir en el animal un estadode sensibilización que recupera la respuesta anteriormentehabituadas: Deshabituación.

Descargado del campus, http://campus.felizmente.info

Page 30: Aprendizaje  resumen jc cabrera temas 1-9

28

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

Aplicación a las emociones y la conducta motivada. (pág. 49 del libro)

La exposición de los cambios producidos por la repetición de un estímulo se ha limitadohasta ahora a respuestas relativamente sencillas. Los estímulos también pueden provocaremociones complejas, tales como amor, miedo, euforia, terror o satisfacción.

Reacciones emocionales y sus efectos posteriores.

Solomon y Corbit (1.074) destacaron dos rasgos llamativos.

• Las reacciones emocionales intensas a menudo constas de dosfase:

- Primero, tiene lugar durante la presentación del estímuloelicitante, y- Segundo, la opuesta se observa cuando el estímulodesaparece.

Por ejemplo, el efecto psicoactivo del alcohol. Una persona sevuelve alegre y relajada, y experiementa sensaciones de cáracter generalmente agradablecuando toma una un vaso de vino. Estas reacciones reflejan el efecto sedante inicial delalcohol. Por el contrario, tras tomar varias bebidas ocurre algo bastante distino. Una vezque el efecto sedante del alcohol se ha disipado, es probable que la persona se vuelvairritable y que experimente dolor de cabeza y náuseas. El efecto sedante y placentero delalcohol da paso a la sensaciones molestas de la resaca.

Cuanto más bebemos másalegres o sedados quedamos ymás intensa es la resacaposteriormente.

• Las reacciones emocionales cambian con la experiencia. La reacción primaria se hace másdébil y su postefecto se hace más fuerte. La habituación de laprimera reacción a la droga se llama tolerancia a la droga, lo quehace referencia a la disminución en la efectividad a una droga conlas exposiciones repetidas.

Solomon y Corbit (1974) destacaron que se producen patrones de reacción emocionalsimilares con otros estímulos emocionales. El amor y el apego, por ejemplo, la habituaciónprimaria va acompañada de un fortalecimiento del postefecto afectivo.

R.L. Solomon

Reacción emocional"positiva": Euforia y

relajación.

Reacción emocional"negativa": Irritabilidad,

agresividad.

Tolerancia a las drogas: habituación a la emociónprimaria que producen.

Descargado del campus, http://campus.felizmente.info

Page 31: Aprendizaje  resumen jc cabrera temas 1-9

29

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

La teoría del proceso oponente.

La teoría del proceso oponente de la motivación se diseño para explicar estos tres rasgoscaracterísticos de las reacciones emocionales:

1. Las reacciones emocinales son bifásicas; a una reacción primaria sigue un postefectoopuesto.

2. La reacción primaria se debilita con la estimulación repetida.3. El debilitamiento de la reaccion primaria va acompañado por un fortalecimiento del

postefecto.

Mecanismos oponentes durante la exposición inicial al estímulo.

La figura 2.16 muestra cómo los procesos primarioy oponente determinan la respuesta iniciales de unorganismo ante un estímulo emocional activador.Cuando el estímulo se presenta por primera vez(panel inferior) el proceso a tiene lugar sin laoposición del proceso b. Esto permite que lareacción emocional primaria alcance su nivel másalto. Después se activa el proceso b y comienza aoponerse al proceso a. Sin embargo, en la primerapresentación del estímulo el proceso b no es losuficientemente fuerte para compensar porcompleto la respuesta emocional primaria, quepersiste mientras está presente el estímuloelicitante. Cuando el estímulo se retira, el procesoa se detiene rápidamente, pero el proceso bpermanece por algún tiempo. En ese momento, no

hay nada que se oponga al proceso b, y la respuesta emocional característica del procesooponente se hace evidente por primera vez. Estas emociones son por lo general opuestas alas que se observan durante la presentación del estímulo.

Esta teoría asume que hay que mantener el equilibro (homeostasis) emocional. Toda emoción primaria, activa un procesooponente de signo contrario para compensarla.

El porceso oponente empieza siendo más débil que el proceso primario (ejemplo, felicidad) pero también aumenta defuerza más rápido que el proceso primario. Por lo tanto, con la estimulación repetida, el proceso oponente se va haciendomás fuerte que el proceso primario ( la tristeza gana a la felicidad). Esto sería Habituación..

Figura 2.16

Descargado del campus, http://campus.felizmente.info

Page 32: Aprendizaje  resumen jc cabrera temas 1-9

30

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

Mecanismos oponentes tras la exposición prolongada al estímulo.

La figura 2.17 muestra cómo funcionan losprocesos primarios y oponentes tras la exposiciónprolongada al estímulo. Un estímulo familiar noelicita reacciones emocionales fuertes, pero elpostefecto afectivo tiende a ser más fuertecuendo termina un estímulo familiar. La teoría delproceso oponente explica este resultadoasumiendo que el proceso b fortalece con laexposición prolongada al estímulo. Elfortalecimiento del proceso b se refleja en variasde sus características: se activa antes tras laaprición del estímulo, su intensidad máxima sehace mayor y tarda más tiempo en decaer tras ladesaparición del estímulo. Por el contrario, seasume que el proceso a pertenece inalterado. Portanto, tras la presentación repetida de un

estímulo, la respuesta emocional primaria queda compensada de forma más efectiva por elproceso oponente. Este fortalecimiento del proceso oponente reduce la intensidad de lasrespuestas emocionales primarias observadas durante la presentación del estímuloemocional activador. También da lugar a un postefecto emocional intenso cuando el estímulose retira.

Motivación y postefecto oponente. Si los efectos placenteros iniciales de una drogapsicoactiva desaparecen en los consumidores habituales ¿por qué continúan tomando ladroga? ¿Por qué se hacen adictos?. La teoría del proceso oponente suguiere que la adiccióna las drogas es principalmente un intento de reducir la aversión producida por el postefectoafectivo de las drogas. Hay dos formas de reducir los postefectos oponetes aversivos.Esperar a que se disipen ( "pasar el mono" , puede tardad mucho tiempo y puede ser muyduro) o tomando de nuevo la droga para reducir más rápidamente los postefectosoponentes. Quedan atrapados, no por el placer directo que obtienen de la droga, sino de lanecesidad de reducir los efectos de la retirada.

Valoración general de la teoría del proceso oponente. La teoría del proceso oponenteresultó muy atractiva cuando se presentó, ya que abarca un amplio rango de situaciones yproporciona una interesante explicación de la tolerancia a las drogas, así como ladependencia y la adicción. Aún está pendiente de probar de forma empírica muchas de suspredicciones en varias situaciones.

Figura 2.17

Descargado del campus, http://campus.felizmente.info

Page 33: Aprendizaje  resumen jc cabrera temas 1-9

31

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

Variaciones en la conducta dirigida a metas.

Responder para escapar de la molestia producida por la retirada de un estímulo es sólo unode los tipos de conducta motivada a dirigir a metas. Un objeto meta gratificante recibe elnombre técnico de reforzador. Las situaciones en la que los organismos respondenrepetidamente para obtener un reforzador muestran muchas de las propiedades comunesde la habituación y la sensibilización.

Ejemplo: El acto de encender un lector de disco ppara escuchar una canción particular. Esmenos problable que encedndamos el lectos si el resultado es siempre la misma canción(habituación), pero esta pérdida de interés es especifica de esa canción repetida(especificidad del estímulo). Además, recuperaremos nuestro interes en la canción origianlsi no la escuchamos durante unos días ( recuperación espontánea). Nuestro interés por lacanción conocida tambien puede establecerse por la exposición a estímulos novedosos, talescomo la excitación de encontrarnos con un amigo (sensibilización)

La habituación y la sensibilización son frecuentes con reforzadores sensoriales comopueden ser las piezas musicales. También tienen lugar fenómenos similares a la habituacióny la sensibilización con objetos meta consumibles, como la comida y el agua. La exposiciónrepetida a la comida, por ejemplo, provocará un descenso de la conducta dirigida a laalimentación. La disminución de la conducta dirigida a alimentos normalmente puedeatribuirse a la reducción del hambre o saciedad, pero también pueden estar involucrados losmecanismos generales de la habituación.

Adicción a las drogas y proceso oponente

Las drogas ( en general, toda sustancia psicoactiva) activan un proceso primario positivo (euforía, "colocón") y también unproceso oponente negativo ("bajón", resaca, "mono") que le sigue después.

1 . Nada más tomar la droga, el proceso primario gana ("colocón").

2. Al retirar la droga, el proceso oponente permanece un tiempo ("bajón").

Con la estimulación repetida, se va haciendo más fuerte el proceso oponente (habituación=tolerancia a la droga). Elusuario de la droga que ha desarrollado tolerancia siente los efectos positivos cada vez menos, y los efectos negativoscada vez más.

A veces, el bajon (proceso oponente) puede durar mucho tiempo y ser inaguantable (eso es "pasar el mono"). Una manera dereducir su duración es volver a tomar la droga para reiniciar el proceso primario. Así se explica la adicción. El adictono acude a la droga por sus efectos positivos, sino para detener los efectos negativos... por un tiempo.

Descargado del campus, http://campus.felizmente.info

Page 34: Aprendizaje  resumen jc cabrera temas 1-9

32

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

TERMINOS CLAVE

Adaptación sensorial Reducción temporal en lasensibilidad de los órganos sensoriales provocadapor la estimulación repetida o excesiva.

Arco reflejo Estructura neural que consiste en unaneurona aferente (sensorial), una interneurona yuna neurona eferente (motora) y que permite queun estímulo pueda elicitar una respuesta refleja.

Conducta apetitiva Conducta que tiene lugar alprincipio de una secuencia natual de conducta yque sirve para poner al organismo en contactocon un estímulo desencadenante. (Véase tambiénmodo de búsqueda general y modo de búsquedafocalizada.)

Concucta consumatoria Conducta que lleva aconsumar o completar una secuencia natural deconducta. La respusta consumatorias son, por logeneral, patrones de acción modal específicos dela especie. (Véase también modo de manipulacióndel alimento.)

Deshabituación Recuperación de una respuestahabituada como resultado de la presentación deun estímulo externo e intenso.

Efecto de habituación Disminución progresiva en elvigor de la conducta elicitada que puede tenerlugar con la presentación repetida del estímuloelicitante.

Efecto de sensibilización Incremento en el vigor dela conducta elicitada que puede resultar de lapresentación repetida del estímulo elicitante ode la exposición a un estímulo externo intenso.

Estímulo desencadenante Lo mismo que estímuloseñal.

Estímulo señal Rasgo específico de un objeto oanimal que elicita una pauta de acción modal enotros organismos. También llamado estímulodesencadenante.

Estímulo supranormal Estímulo señal artificial-menteagrandado o exagerado que elicita una respuestainusualmente vigorosa.

Fatiga Disminución temporal de la conducta causadapor el uso repetido o excesivo de los músculosinvolucrados en la conducta.

Interneural Neurona de la médula espinal situadaentre la neurona aferente (sensorial) y laneurona eferente (motora) en el arco reflejo.

Modo de búsqueda focalizada Segundo componentede la secuencia de conducta de alimentación, trasla búsqueda general, en el que el organismo poneen marcha una conducta centada en lalocalización de un estímulo particular que indicala presencia de alimento. La búsqueda focalizadaes una forma de conducta apetitiva másdirectamente relacionada con el alimento que labusqueda general.

Modo de búsqueda general Primer compnente de lasecuencia de conducta de alimentación, en la queel organismo pone en marcaha una conductamotora sin dirección fija. La búsqueda general esuna forma de conducta apetitiva.

Modo de manipulación del alimento Últimocomponente de la secuencia de conducta dealimentación en el que el organismo manipula yconsume el alimento. Es similar a lo que losetólogos llaman conducta consumatoria.

Neurona aferente Neurona que transmite mensajesde los órganos de los sentidos al sistema nerviosocentral. También recibe el nombre de neuronasensorial.

Neurona eferente Neurona que transmite losimpulsos a los músculos. También llamadaneurona motora.

Neurona motora Lo mismo que neurona eferente.

Neurona sensorial Lo mismo que neurona aferente.

Descargado del campus, http://campus.felizmente.info

Page 35: Aprendizaje  resumen jc cabrera temas 1-9

33

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapitulo 2: Conducta elicitada, habituación y sensibilización

Juan Carlos Cabrera – 2009/2010

PAM Abreviatura de pauta de acción modal.

Pauta de acción modal Patrón de respuesta exhibidode forma similar por la mayoría de los miembrosde una misma especie. Las pautas de acción modalse utilizan como unidades básicas de conducta enlas investigaciones etológicas decomportamiento. Abreviatura PAM.

Proceso a Lo mismo que proceso primario en la teoríade proceso oponente de la motivación.

Proceso b Lo mismo que proceso oponente en lateoría de proceso oponente de la motivación.

Proceso de habituación Mecanismo neural activadopor la repetición de un estímulo que reduce lamagnitud de las respuestas elicitadas por eseestímulo.

Proceso de sensibilización Mecanismo neural queincrementa la magnitud de las respuestaselicitadas por un estímulo.

Proceso oponente Mecanismo compensatorio quetiene lugar en respuesta al proceso primarioelicitado por eventos biológicamentesignificativos. El proceso oponente provocacambios fisiológicos y conductuales opuestos alos que provova el proceso primario. Tambiénllamado proceso b.

Proceso primario Primer proceso elicitado por unevento biológicamente significativo. Tambiénllamado proceso a.

Recuperación espontánea Recuperación de unarespuesta habituada o de una respuestaexinguida tras un período de descanso.

Reforzador Estímulo cuya administracióninmediatamente posterior a una respuesaincrementa la probabilidad futura de dicharespuesta.

Sistema de estado Estructuras neurales quedeterminan el nivel general de responsividad otendencia a responder del organismo.

Sistema E-R Ruta neural más corta que conecta losórganos sensoriales estimulados por un estímuloelicitante con los músculos involucrados en laproducción de respuesta elicitada.

Tolerancia a las drogas Reducción en la efectividadde una droga como resultado del uso repetido dela droga.

Descargado del campus, http://campus.felizmente.info

Page 36: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 37: Aprendizaje  resumen jc cabrera temas 1-9

35

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera - 2009/2010

Los primeros años del acondicionamiento clásico- Los descubrimientos de Vul'fson y Snarskii- El paradigma de condicionamiento clásico

Situaciones experimentales- Condicionamiento del miedo.- Condicionamiento del parpadeo.- Seguimiento del signo.- Aprendizaje de aversión al sabor.

Procedimientos de condicionamiento pavloviano excitatorio- Procedimientos típicos de condicionamiento pavloviano.- Medida de las respuestas condicionadas.- Procedimientos de control en el condicionamiento clásico.- Eficacia de los procedimientos típicos de condicionamiento.

Condicionamiento pavloviano inhibitorio- Procedimientos de condicionamiento inhibitorio.- Mediación de la inhibición condicionada.

Predominio del condicionamiento clásico

Descargado del campus, http://campus.felizmente.info

Page 38: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 39: Aprendizaje  resumen jc cabrera temas 1-9

37

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

El condicionamiento clásico es el mecanismo más simple por el cual los organismos puedenaprender acerca de las relaciones entre estímulos y cambiar su conducta en conformidadcon la misma. Permite a los seres humanos y a los demás animales aprovecharse de lasecuencia ordenada de eventos de su ambiente y aprender qué estímulos tienden a ir conqué evento.

Los Primeros años del condicionamiento clásico (página 60 del libro)

Comenzaron con el trabajo del fisiólogo ruso Ivan P. Pavlov. Los descubrimientos de EdwinB. Twitmyer sobre el condicionamiento clásico, que realizó en su tesis doctoral, en el que noinvestigó sistemáticamente las implicaciones y sus hallazgos no despertaron gran atención.

Como una estensión más de los estudios que Pavlov realizó sobre la digestión, su equipoténico descubrió que los perro secretaban jugos gástricos en respuesta de la mera visión dela comida o la persona que normalmente se las suministraba. Sus técnicos del laboratorio lollamaban "secreciones psíqicas" .

Los descubrimientos de Vul'fson y Snarskii

Los primeros estudios sistemáticos sobre el condicionamiento clásico fueron realizados porS. G. Vul'fson y A. T. Snarskii en el laboratorio de Pavlov.

Vul'fson estudió la respuesta salival de los perros con productos naturales. Después de quelos perros hubieran experimentado la sensación provocada por estas sustancias en susbocas, la mera visión de la misma era suficiente para provocar salivación.

Snarskii extendió estas observaciones a sustancias artificiales.

El aprendizaje de objeto, requiere asociar diferentes características de un mismo objeto.

El paradigma de condicionamiento clásico

El procedimiento básico de Pavlov para el estudio de la salivación condicionada conlleva dosestímulos: un tono o luz que no provoca salivación al principio y un alimento o solución ácidasituada en la boca que provoca una fuerta salivación.

EC o Estímulo condicionado sería la luz.EI o Estímulo incondicionado sería el alimento.RC o Respuesta condicionada sería la respuesta provocada por la Luz.RI o Respuesta incondicionada sería la salivación provocada por el alimento.

Descargado del campus, http://campus.felizmente.info

Page 40: Aprendizaje  resumen jc cabrera temas 1-9

38

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Descargado del campus, http://campus.felizmente.info

Page 41: Aprendizaje  resumen jc cabrera temas 1-9

39

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Situaciones experimentales (página 63 del libro)

Condicionamiento del miedo.

Watson y Rayner (1920) condicionaron la respuesta de miedo en unniño de 9 meses, Albert, a la presentación inofensiva de una ratablanca de laboratorio. Albert se alarmaba cuando se hacía sonar unfuerte sonido, así que cada vez que le presentaba la rata segolpeaba una barra de acero. Después de cinco ensayos, Albertmostró una reacción de miedo intenso ante la rata. Este miedo segeneralizó rápidamente a otros objetos peludos.

Desde el estudio de Albert, los experimentos se realizan sobretodo con ratas de laboratorio. El EI aversivo (odioso odesagradable) utilizado en estos estudios es una breve descargaeléctrica administrada directamente en las patas del animal mediante un rejilla metálica,con una intensidad y duración que no provoque daño tisular (de los tejidos u organos). El ECpuede ser un tono o una luz.

La respuesta de miedo de las ratas es quedarse quietas, así se utiliza una técnica popular demedida indirecta del miedo condicionado como es el procedimiento de respuesta emocionalcondicionada o supresión condicionada (REC) diseñada por Estes y Skinner (1941). Consisteen primero enseñar al sujeto (rata) a presionar una barra varias veces para obteneralimento como recompensa de forma regular. Después comienza la segunda fase queconsiste en presentar un EC (un tono) durante 1 o 2 minutos e inmediatamente aplicarle unabreve exposición a la descarga. Espaciando los ensayos entre 15 o 20 minutos.

La supresión condicionada puede ser completa, de modo que las ratas no presionen enabsoluto la barra, en 3 o 5 ensayo de condicionamiento. Sin embargo, la supresión esespecífica de del EC y cuando desaparece, los animales vuelven rápidamente a su conductapara obtener comida.

Para medir cuantitativamente la supreción condicionada se calcula una razón de supresión.

ECpre el durante RespuestaEC el durante RespuestaEC durante Respuestasupresión deRazón

−+=

La razón de supresión adopta un valor 0 si la rata deja de presionar la palanca completamente durante el EC, ya que elnumerador de la fórmula es 0. En el otro extremo, si la rata no altera su ritmo de presiones en absoluto cuando se presenta elEC, la razón tiene un valor de 0,5.

John Broadus Watson(1878-1958)

Descargado del campus, http://campus.felizmente.info

Page 42: Aprendizaje  resumen jc cabrera temas 1-9

40

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Algunos investigadores prefieren el procedimiento de supresión condicionada del lameteoporque requiere menos entrenamiento para hacer que las ratas beban del tubo que para quepresionen una palanca y obtener comida. En el procedimiento de supresión del lameteo, seregistra el tiempo que el animal tarda en completar un total de 5 segundos de lameteo comomedida de la supresión de la respuesta.

Condicionamiento del parpadeo.

El reflejo palpebal es un reflejo discreto ( moderado, sin exceso, que no destaca ). Unsoplo suave en un ojo hace que se parpadee. Si el aire está precedido de un tono breve, esproblable que la persona aprenda a parpadear cuando aparece el tono, anticipando el soplode aire.

En un experimento se tomó dos grupos de niños de 5 meses de edad y se realizadon dosensayos . A uno de estos grupos se emparejó un tono (EC) que terminaba con un ligero soplode aire en el ojo. Al otro el tono y el soplo nunca ocurrian juntos. En el primer ensayo la tasade parpadeo no influyo en ninguno de los grupos, sin embargo, en el segundo ensayo, en elprimer grupo la tasa fue significativamente superior al segundo grupo, debido en parte a laasociación EC-EI que comenzaron a aprender en la primera sesión.

Este experimento demostro varios aspectos importantes del aprendizaje: Primero, elcondicionamiento clásico requiere del emparejamiento del EC y el EI. Segundo, elaprendizaje inicial puede no ser directamente observable.

El interes por el condicionamiento palpebral en humanos se debe al hecho de que se hanrealizado los progresos sutanciales en la compresión de los sustratos neurobiológicos deeste tipo de aprendizaje. Las investigaciones neurobiológicas sobre el condicionamientopalpebral se ha llevado a cabo principalmente con conejos dómesticos y fue desarrollado porGormezano.

Descargado del campus, http://campus.felizmente.info

Page 43: Aprendizaje  resumen jc cabrera temas 1-9

41

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

El condicionamiento palpebral y la búsquea del engrama.Cuando un organismo aprende algo, el resultado de esteaprendizaje debe almacenarse en el cerebro. De algún modo, lared de neuronas que constituyen el sistema nervioso central (SNC)es capaz de codificar la relación entre evento biológicamentesignificativos y de utilizar esta información para dirigir la conductaen curso. Esta memoria biológica se denomina engrama. Según elpunto de vista tradicional, el engrama de una respuestacondicionada concreta se almacena en regiones localizadas delcerebro.

Richard Thompson y sus colegas, después de casi cuatro décadasbuscando el engrama, reconoció que requeriría un sistemaconductual claramente definido en el que estuvieran precisamenteespecificados tanto las condiciones para el aprendizaje como elresultado motor. Estas consideraciones le llevaron a estudiar losmecanismos que subyacen al condicionamiento palpebral.

La búsqueda del engrama comenzó por el hipocampo. Personascon daños en esta región revelaron perdida de habilidad enrecordar conscientemente un evento reciente. Colocando unaserie de electrodos a animales en el hipocampo revelaron que lascélulas reflejaban el aprendizaje por una asociación EC-EI. La ablación del hipocampo, incluso la eliminación de todas lasestructuras cerebrales por encima del cerebro medio, no eliminaba la capacidad del animal para adquirir y retener una respuestacondicionada de parpadeo. Esto sugirie que el circuito esencial para el condicionamiento palpebral se sitúa en las estructurasinferiores del tronco del encéfalo y el cerebelo. Los experimentos posteriores mostraron claramente que la adquisción de una

respuesta condicionada del parpadeo bienajustada depende de un circuito neuronalsituado en el cerebelo.

La respuesta incondicionada elicitada por unsoplo de aire en el ojo está mediada porneuronas que se proyectan sobre una regióndel tronco del encéfalo conocida como núcleotrigeminal. Desde allí, las neuronas siguen dosrutas, una directa y otra a través de laformación reticular, hasta llegar al núcleocraneal motor, donde se organiza la salidaconductual. Para definir este recorrido, seutilizan tres técnicas básicas. La primeraconsistía en tomar registros electrofisiológicospara verificar que las neuronas de ese circuitointervienen el la resusta EI. La segundatécnica consistía en desactivar el circuitoneuronal, ya fuera permanentemente(eliminando las células) o temporalmente (pormedio de drogas o frio), para mostrar que elcircuito tiene un papel esencial en la respuestaincondincionada. Si el circuito es necesario, laalteración de sus funciones debería eliminar lasalida conductual. Finalmente, se estimuló elcircuito de forma artificial para mostrar que laactividad de dicho circuito era suficiente parproducir la salida conductual.

Las mismas técnicas (registro eléctrico,desactivación y estimulación) se utilizaron paradefinir el reorrido neuronal que media en laadquisición y ejecución de la respuestacondicionada.La entrada EC se trasmite hastauna región del tronco del encéfalo conocidacomo núcleo pontino. Desde allí, al cerebelopor medio de fibras musgosas. La señal del EIllega al cerebelo a través de fibras trepadoras.Estas dos señales se encuentran en el córtex

Descargado del campus, http://campus.felizmente.info

Page 44: Aprendizaje  resumen jc cabrera temas 1-9

42

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

cerebeloso donde la convergencia de actividades produce una modificación sináptica que altera la salida neuronal del cerebelo.Básicamente, las fibras ascendentes actuan como “maestras”, seleccionando un subconjunto de conexiones para sumodificación. Este cambio definelas propiedades del estímulo (las características del EC) que serán responsables de una salidamotora concreta. Esta salida está mediada por neuronas que se proyectan desde el núcleo interpositus al núcleo rojo, yfinalmente, al núcleo craneal motor.

A medida que se va adquiriendo la respuesta condicionada, la actividad condicionada se desarrolla en el núcleo interpositus. Lasneuronas de dicho núcleo se proyectan hacia atrás hasta el circuito del EI e inhiben la señal del mismo en la oliva inferior. Estoproporciona una retroalimentación negativa que reduce la efectividad del EI. Muchos investigadores creen que fenómeno comoel bloqueo o el ensombrecimiento tienen lugar porque un EI previsto es menos eficaz. En el paradigma del condicionamientopalpebral esto podría suceder debido a que la entrada del EI está inhibida en la oliva inferior. Esta idea se ve apoyada por unexperimento de Kim y colaboradores (1998), que mostró que la eliminación de esta fuente de inhibición eliminaba el efecto debloqueo.

Previamente hemos dicho que el hipocampo no es ncesario para el condicionamiento de demora simple. Sin embargo, síinterviene en formas más complejas de aprendizaje. Un ejemplo lo proporciona el condicionamiento de huella, en el que seinserta una demora temporal entre el final del EC y el principio de EI. Un animal normal puede adquirir fácilmente un parpadeocondicionado a un EC que termina 0,5 segundos antes del comienzo del EI. Sin embargo, no puede alvar este espacio si seretira el hipocampo. Se observa un patrón de resultados similar en los pacientes amnésicos que han sufrido daño en elhipocampo. Estos pacientes no pueden recordar concientemente la relación EC-EI. En ausncia de esta memoria esplícita, sonincapaces de aprender con un procedimiento de huella. El aprendizaje con un procedimento de demora no se ve alterado,incluso si los pacientes no pueden recordar conscientemente la relación EC-EI de una sesión a la siguiente. Curiosamente, laalteración de conciencia en un individuo normal debilita la apreciación de la relación EC-EI con un procedimiento de huella. Denuevo, los sujetos que no pueden dar información explícita sobre la relación, son incapaces de aprender.

-J.W.Grau

Seguimiento del signo.

Uno de los paradigmas experimentales que ha contribuido significativamente a la concepciónactual del condicionamiento pavloviano es el paradigma de seguimiento del signo oautomoldeamiento que consiste en el movimiento hacia un estímulo que señala ladisponibilidad de un reforzador, como comida, y posible contacto con el mismo.

Experimentos con palomas en un laboratorio mediante la presentación de un estimulo visualdiscreto y bien localizado (una tecla luminosa) justo antes de cada administraciónautomática de alimentos, las palomas en vez de utilizar el estímulo visual para predecircuando dirigirse al comedero, picoteaban la tecla aunque no era necesario para tener accesoa la comida. Demostrando que el seguimiento del signo es una herramienta útil para elestudio del aprendizaje asociativo.

El aprendizaje tiene lugar de forma rápida cuando EC se presenta justo antes del EI. Laspalomas no se aproximan a EC si el EC y el EI se presentan de forma aleatoria uno del otro.

El segimiento del signo sólo es posible en situaciones en las que el EC tiene una localizaciónprecisa y puede ser "seguido". Cuando el EC es un sonido no provoca la aproximación a lafuente y sí el acercamiento al comedero. El EC tiene que ser de una modalidad yconfiguración apropiada.

Descargado del campus, http://campus.felizmente.info

Page 45: Aprendizaje  resumen jc cabrera temas 1-9

43

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Otro factor importante es la relación entre la cantidad de tiempo que el sujeto pasa en elcontexto experimental y la duración de cada presentación del EC. Se obtienen mayoresniveles de seguimiento del signo con mayores exposiciones al contexto experimental enrelación a la duración EC.

Aprendizaje de aversión al sabor.

El simple acto de comer proporciona numerosas oportunidades de aprendizaje de laasociación. La experiencia de aprendizaje de aversión típica consiste en ingerir una comidacon un sabor muy distinto y posteriormente enfermar. Este emparejamiento, sabor-enfermedad, puede dar lugar a una aversión condicionada al alimento en un único ensayo, y elaprendizaje puede tener lugar incluso si la enfermedad se manifiesta con varias horas deretraso con respecto a la ingestión de la comida. Otro hallazgo interesante es que el 20%de las personas que enfermaron estaban seguras de que no lo provocó la comida. Lo queindica que el aprendizaje de aversión al sabor puede ser independiente de los procesos depensamiento racional y que puede ser contrario a las conclusiones de una persona sobre lacausa de su enfermedad.

Personas con malestar gástrico producidos por tratamientos médicos, como enquimioterapia del cáncer que suele producir náuseas, pueden adquieren aversiones a losalimentos ingeridos justo antes de las sesiones, contribuyendo a la falta de apetito, a lasupresión de la ingesta de alimento o anorexia.

El desarrollo de tumores, depresiones severas y la anorexia nerviosa, entre otras, puedencontribuir a incrementar la probabilidad de aprender aversión al sabor.

La aversión al sabor es el resultado del emparejamiento de un EC (un sabor) con un EI (malestar: una droga o exposición aradiación) similar a otros ejemplos de condicionamiento clásico, y sigue las mismas leyes de aprendizaje en muchos aspectos.También tiene caracteristicas especiales:

• Primero, puede aprenderse con un solo ensayo aversión al sabor por el emparejamiento del sabor y la enfermedad.

• Segundo, puede darse después de varias horas de la exposición al nuevo sabor. Probablemente sea un aprendizajedemorado de la aversión al sabor que ha evolucionado para permitir a os animales evitar alimentos venenosos conefecto retardado.

Descargado del campus, http://campus.felizmente.info

Page 46: Aprendizaje  resumen jc cabrera temas 1-9

44

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Procedimientos de Condicionamiento Pavloviano Excitatorio(página 74 del libro)

Procedimientos típicos de condicionamiento pavloviano.

Uno de los factores críticos que determinan el curso del condicionamiento clásico es laordenación temporal del EC y el EI. Pequeñas variaciones en la forma de emparejarlospueden tener importantes efectos en la intensidad de la RC.

A continuación se muestran cinco procedimientos comunes de condicionamiento clásico.

La distancia horizontal representa el paso del tiempo; el desplazamiento vertical el momento en ue cada estímulo aparece ydesaparece. Cada configuración EC y EI representa un único ensayo de condicionamiento.

TiempoInicio Final

ECCondicionamientode demora corta EI

ECCondicionamientode huella EI

ECCondicionamientode demora larga EI

ECCondicionamientosimultaneo EI

ECCondicionamientohacia atrás EI

Procedimiento de condicionamientoclásico en el que el estímulocondicionado aparece poco antesdel estímulo incondicionado encada ensayo de condicionamiento.

Procedimiento de condicionamientoclásico en el que el estímuloincondicionado se presenta pocodespués de que haya terminado elestímulo condicionado.

Similar al procedimiento decondicionamiento de demora corta,en que el EC comienza antes que elEI, sin embargo, EI se demora mástiempo (5-10 minutos).

Procedimiento de condicionamientoclásico en el que el estímulocondicionado y el incondicionadose presenta simultáneamente encada ensayo condicionado.

Procedimiento de condicionamientoclásico en el que el estímulocondicionado se presenta en todoslos ensayos después del estímuloincondicionado.

Descargado del campus, http://campus.felizmente.info

Page 47: Aprendizaje  resumen jc cabrera temas 1-9

45

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Un experimento típico de condicionamiento clásico, los episodios EC-EI se repiten variasveces a lo largo de la sesión de entrenamiento. El tiempo entre el final de un ensayo y elcomienzo del siguiente se llama intervalo entre ensayos. El tiempo entre el comienzo del ECy el comienzo del EI en un mismo ensayo se llama intervalo entre estímulos o intervaloEC-EI.

Medida de las respuestas condicionadas.

Para poder medir el condicionamiento, en cualquiera de los procedimientos anteriores, hayque realizar un ensayo de prueba, consistente en la presentación del EC aislado (sin el EI) yobservar la respuesta del EC sin la contaminación procedente de la respuesta provocada porel EI. Estos ensayos pueden introducirse periodicamente a lo largo del curso delentrenamiento para hacer un seguimiento del proceso de aprendizaje.

La conducta EC puede cuantificarse:• Por la magnitud de la respuesta condicionada (Pavlov midió en número de gotas de

saliva elicitada por un EC).• Por la probabilidad de la respuesta (en estudios de condicionamiento palpebral, el

porcentaje de ensayos en los que el EC provoca una respuesta condicionada).• Por latencia de la respuesta (es la cantidad de tiempo que pasa entre el principio del EC

y la aparición de la respuesta condicionada).

En procedimientos de demora y huella, el EC aparece de forma aislada al principio de cadaensayo, por lo que puede utilizarse como medida del aprendizaje al no estar contaminadapor el EI. Por el contrario, ensayos de condicionamiento simultáneo y hacia atrás larespuesta durante el EC puede reflejar presencia del EI o su presentación reciente. Portanto, los ensayos de prueba resultan cruciales para evaluar el aprendizaje en estas dos.

Procedimientos de control en el condicionamiento clásico.

Un ensayo de prueba válido no es suficiente para tener evidencias concluyentes decondicionamiento clásico. En los estudios de habituación y sensibilización tan sólo eran deinterés los efectos de exposición previa al un estímulo. El procedimiento de comparación ocontrol consistía en la ausencia de exposición al estímulo. Cuando el estudio es la forma enla que se asocian los EC y EI, los procedimientos de control son más complicados.

Una asociación EC-EI implica que dos eventos se han conectado de alguna forma. DespuésEC adquiere la capacidad de activar procesos relacionados con el EI. Requiere algo más queuna familiaridad. Para concluir que se ha establecido asociación, debemos asegurarnos de

Descargado del campus, http://campus.felizmente.info

Page 48: Aprendizaje  resumen jc cabrera temas 1-9

46

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

que el cambio conductual observado no podría haberse producido por la mera presentaciónde EC o del EI por separado.

El incremento en la respuesta podría resultar de la sensibilización y no por un procesoasociativo. La presentación de un estímulo activador, como la comida a un animalhambriento, puede incrementar la conducta provocada por un estímulo menos efectivo, talcomo un tono, sin que se haya establecido ninguna asociación entre los dos estímulos. Portanto, el incremento de la respueta que se observa con el emparejamiento repetido del EC yel EI podría ser, en realidad, el resultado de una mera exposición al EI. Los casos en los quela mera exposición al EI da lugar a respuestas similares a la respuesta condicionada recibenel nombre de pseudocondicionamiento. Para determinar si la respuesta que se dan ante elEC representa una asociación entre EC-EI, en lugar de sensibilización debido a la exposicióna los EC y EI, se requieren procedimientos de control.

Uno de los procedimientos discutidos por los investigadores es el de control aleatorio, en elque los estímulos condicionado e incondicionado se pesentan en momentos aleatorios unorespecto al otro. Desafortunadamente hay evidencias de que puede dar lugar a aprendizajeasociado.

Un procedimiento más útil es el denominado control desemparejado explícito, que consisteen la presentación de los estímulos condicionados e incondicionado en diferentes ensayos,pero con el suficiente espacio temporal para evitar que se asocien.

Eficacia de los procedimientos típicos de condicionamiento.

En general, se ha observado poco condicionamiento en los procedimientos decondicionamiento simultáneo, en los que el intervalo EC-EI es cero. Una ligera demora de lapresentación EI tras el EC a menudo facilitaba la Respuesta Condicionada. Sin embargo, siel intervalo se incrementaba más, la RC disminuía. Incluso en el procedimiento de aversión alsabor, donde el aprendizaje es posible con intervalos de 1 ó 2 horas, la RC disminuye amedida que se aumente el intervalo.

Se consolida la idea de que el condicionamiento es más efectivo cuando el EC es una buenaseñal de que EI aparecerá pronto. El valor de la señal es mejor en el procedimiento dedemora corta, en el que el EI tiene lugar poco después de la aparición del EC. El valor de laseñal EC disminuye a medida que se incrementa el intervalo EC-EI. También el EC es malpredictor del EI en los procedimientos simultáneo y de huella. El procedimiento simultáneose presenta el EC junto con EI y por tanto EC no señala la parición del EI. En el intervalo dehuella el EC va seguido por el intervalo de huella en lugar del EI.

Descargado del campus, http://campus.felizmente.info

Page 49: Aprendizaje  resumen jc cabrera temas 1-9

47

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

El condicionamiento hacia atrás produce resultadoa ambiguos. Algunos han observadocondicionamientos excitatorio y otros de tipo inhibitorio, mientras que otros encontraronexcitatorios e inhibitorio.

Nuevas tendencias emergentes sobre los procedimientos de demora, simultáneo, de huella yhacia atrás, conceptualizan que todos ellos producen un aprendizaje sólido y una respuestacondicionada vigorosa, pero lo que los sujetos aprenden es direrente en cada caso. En vezde aprender una mera asociación EC-EI, se asume que también se aprende cuándo apareceel EI en relación al EC, denominadose tal fenómeno hipótesis de la codificación temporal.La idea es que puede obtenerse diferentes tipos de RC dependiendo de la informacióntemporal acerca del EI que proporciona el EC.

Condicionamiento Pavloviano Inhibitorio (página 79 del libro)

La exposición a estímulos aversivos impredecibles es muy perturbador y produce úlceras deestómago y otros sintomas fisiológicos del estrés.

Otra fuente de estrés es el ataque depánico (sensación repentina de miedo oincomodidad, acompañada de síntomasfísicos -por ejemplo, taquicardia- y unasensación de desastre inminente).Cuando son frecuentes se dice que elindividuo sufre de un trastorno depánico y a veces estas personas puedenpredecirlos. En un estudio con estosindividuos se midieron la ansiedadgeneral de los sujetos antes y despuésde cada tipo de ataque (predecibles eimpredecibles). Antes de los ataques losniveles de ansiedad eran similares,después del ataque de pánico la ansiedadse incrementaba si este era imprevisto y disminuía tras un ataque previsto. Demostrandoque son preferibles los ataque cuando son predecibles.

Las señales que predicen la ausencia de un estímulo aversivo son estímulos condicionadosinhibitorios.

Niveles de ansiedad general de individuos con trastorno de pánicoantes y después de ataques de pánico previstos e imprevistos.

Descargado del campus, http://campus.felizmente.info

Page 50: Aprendizaje  resumen jc cabrera temas 1-9

48

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Procedimientos de condicionamiento inhibitorio

La inhibición condicionada tiene un requisito importante, y es que, para que la ausencia deEI sea significativa, este debe ocurrir periódicamente en la situación.

Procedimiento estandar deinhibición condicionada.

Se requiere dos estimuloscondicionados y dos tipos deensayo de condicionamiento, unopara el condicionamientoexcitatorio y otro para elcondicionamiento inhibitorio.

Ensayo Tipo A (condicionamiento exitatorio): Siempre que aparece el EI va anunciado por elestimulo condicionado EC+, conviertiendose así por asociación en una señal del EI y sirvepara proporcionar el contexto excitatorio necesario para el desarrollo de la inhibicióncondicionada.

Ensayo B (condicionamiento inhibitorio): El EC- se presenta en el contexto excitatorioproporcionado por el EC+, pero no se empareja con el EI. Esto convierte al EC- en uninhibidor condicionado.

A lo largo del tratamiento, los ensayos se alternan de forma aleatoria. A medida que elanimal recibe ensayos repetidos del EC+ seguido del EI y ensayos del EC+ y el EC- seguidosde la ausencia de EI, el EC- adquiere gradualmente propiedades inhibitorais.

Ejemplo: Un semáforo rojo en un cruce transitado es una señal (EC+) de un peligro potencial(EI). Sin embargo, si un agente de policía indica con su silbato (EC-) que debemos cruzar, apesar de la luz roja, es poco probable que tengamos un accidente y el peligro señalado por elsemáforo queda bloqueado o inhibido por silbato.

Contingencia o correlaciónnegativa entre el EC y el EI.

Otro procedimiento paraproducir inhibición condicio-nada que no requiere un estímulo excitatorio EC+ explícito; en lugar de eso, se utiliza unúnico EC- que está negativamente correlacionado con el EI. Una correlación o contingencianegativa indica que el EI es menos probable tras el EC que en otro momento.

Procedimiento estándar de inhibición condicionada. En algunos ensayos (Tipo A)el EC+ se empareja con el EI. En otros ensayos (tipo B) el EC+ se presentajunto con el EC- y se omite el EI. El procedimiento resulta efectivo paracondicionar propiedades inhibitorias al EC-.

Descargado del campus, http://campus.felizmente.info

Page 51: Aprendizaje  resumen jc cabrera temas 1-9

49

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

El EC señala una reducción en la probabilidad de que aparezca el EI. Como por ejemplo, Losniños que se meten con un compañero en clase y dejan de hacerlo en presencia del profesor.El profesor funciona como EC- que señala un período libre de acoso, o ausencia EI.

En el procedimiento de contigencia negativa EC-EI, el EI aversivo puede aparecer de vez encuando tras el EC, pero con una probabilidad pequeña. Es mucho más probable que el EIaversivo aparezca en ausencia del EC, dando lugar a una contingencia negativa entre el EC yel EI. Sin embargo, incluso en ausencia del EC, el momento exacto de presentación del EI nopuede predecirse. El EI tiene lugar de forma probabilística, a diferencia del procedimientoestándar, en el que el EI siempre aparece al final del EC+ y no aparece cuando se presentael EC- junto con el EC+. Así podemos predecir el momento preciso de la aparición del EI, ytambién permite predecir cuándo no va a aparecer, posibilitando la codificación temporal dela ausencia del EI.

Medición de la inhibición.

Los estímulos inhibitorios elicitan reacciones opuestas a los estímulos condicionadosexcitatorios. Si los estímulos condicionados excitatorios provocan salivación, los estímulosinhibitorios provocan la supresión de la salivación.

Sistema de respuesta bidireccionales. La identificación de tendencias de respuestaopuesta es sencilla en aquellos sistemas de respuesta que pueden variar en direccionesopuestas con respecto a una línea base de ejecución normal. Por ejemplo, una paloma puedeacercarse a una tecla luminosa asociada con la presentación subsiguiente de comida ocuando se utiliza un procedimiento inhibitorio, alejarse de la luz.

Una limitación es que este método funciona sólo con respuestas que pueden ir endirecciones opuestas. Otra es que esta técnica puede mostrar sólo el efecto neto de laexcitación y la inhibición. El sujeto se aproxima a EC si excitación es mayor a la inhibicióny se aleja en caso contrario. La paloma no puede acercarse y alejarse al mismo tiempo. Estoinvalida el procedimiento para los casos en que EC adquiere ambas propiedades (exitatoriase inhibitorias)

La prueba del estímulo compuesto o sumación. Cuando la conducta no es bidireccional elprocedimiento más aceptado por los investigadores para la medición de la inhibicióncondicionada es la prueba de sumación o del estímulo compuesto. La prueba requiereobservar los efectos de un EC inhibitorio en compuesto con un EC+ exitatorio.

Descargado del campus, http://campus.felizmente.info

Page 52: Aprendizaje  resumen jc cabrera temas 1-9

50

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Experimento de lameteo con ratas de laboratorio:

El procedimiento de prueba del estímulo compuesto para la inhibición condicionada sugiereque la presentación de un inhibidor condicionado o de una señal de seguridad puede reducirlos efectos estresantes de una experiencia aversiva.

La prueba de retraso en la adquisición. Si un estímulo inhibe de forma activa unarespuesta particular, entonces debería ser especialmente difícil de condicionar eseestímulo para que provoque la conducta.

Prueba del estímulo compuesto de la inhibición en un experimento de supresión del lameteo. Los estímulos A y B secondicionaron como estímulos excitatorios mediante la presentación de cada uno de ellos por separado junto con la descarga(A+ y B+). El estímulo X se condicionó como inhibidor presentándolo junto con el estímulo A sin la descarga (AX-). Elestímulo Y era un estímulo de control que no había intervenido en ningún condicionamiento excitatorio o inhibitorio. A era unaluz brillante. B, X e Y eran claves auditivas ( un clic, un ruido blanco y un zumbador, contrabalanceados). A y AX se pusieron aprueba con el contexto original de condicionamiento. B, BX y BY se pusieron a prueba en un contexto diferente. (Para detallesadicionales, vease Cole, Barnet y Miller, 1997, Experimento 1.

Descargado del campus, http://campus.felizmente.info

Page 53: Aprendizaje  resumen jc cabrera temas 1-9

51

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Retomando el experimento anterior, en una cámara experimental diferente a las utilizadasanteriormente para realizar el entrenamiento inhibitorio, Cole y sus colegas tomaron elestímulo X (que había sido condicionado como inhibidor) y el estímulo Y ( que no habíautilizado con anterioridad en el procedimiento de condicionamiento ) y realizadon unaprueba de retraso en la adquisición emparejando tres veces cada uno de estos estímulos conuna descarga. Tras los tres ensayos sometierón a prueba para ver cuál provocaba una mayorsupresión de la conducta de beber. El tiempo empleado en completar un total de 5 segundosde ingestión de agua fue mayor en presencia del estímulo de control Y que en presencia delestímulo X. El entrenamiento inhibitorio inicial de X retrasó la adquisición de propiedadesexcitatorias de miedo condicionado.

La inhibición condicionada puede ser difícil de distinguir de otros procesos conductuales. Lamejor estrategia es utilizar más de una prueba y asegurarse de que las diferentes pruebasseñalan la misma conclusión. La estrategia dual ( utilización tanto la prueba de estímulocompuesto como de la del retraso en la adquisición) ha gozado de popularidad desde que lopropuso Rescorla (1969).

PREDOMINIO DEL CONDICIONAMIENTO CLÁSICO (página 86 del libro)

El condicionamiento clásico se estudia normalmente en situaciones de laboratorio, aunquetambién ocurre en una gran variedad de situaciones fuera de este. Aparece con mayorprobabiliad cuando un evento predice a otro regularmente y con una demora corta entre elEC y el EI.

Un área de investigación particularmente interesante es cómo las personas llegan aconsiderar que un evento es la causa de otro, denominado juicios de causalidad humanos. Losestudios sobre causalidad se parecen a los estudios sobre condicionamiento pavloviano enque ambos conllevan experiencias repetidas con dos eventos y respuestas basadas en elgrado en que esos dos eventos están relacionados. Los mecanismos asociativos pavlovianosno se limitan a los perros de Pavlov, sino que pueden tener un importante papel en los juiciosde causalidad informales que realizamos en el curso de nuestra vida cotidiana.

El condicionamiento pavloviano puede dar lugar al condicionamiento de preferencias yaversiones alimenticias, adquisición de miedo (ansiedad, fobias y trastornos del pánico),tolerancia y adición a las drogas ...

El condicionamiento pavloviano también interviene en las respuestas de los niños y de lasmadres durante la lactancia. Para que el amamantamiento sea satisfactorio, la madre debemantener al bebé en una postura determinada, que proporcione estímulos táctiles especialestanto para la madre como para el niño. Los estímulos táctiles que percibe el niño puedencondicionarse y elicitar respuestas de orientación y succión. Los estímulos táctiles

Descargado del campus, http://campus.felizmente.info

Page 54: Aprendizaje  resumen jc cabrera temas 1-9

52

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

experimentados por la madre que amamanta a sus hijos suelen experimentar el reflejo desecreción de lecha cuando el niño llora o cuando llega lahora habitual de amamantamiento.Todos estos estímulos preceden de forma regular a la succión del bebé y por tanto puedencondicionarse a la estimulación propia de la succión y adquirir la capacidad de provocar lasecreción de lecha como respuesta condicionada. Las respuestas anticipatorias deorientación y succión y la respuesta anticipatoriade secreción de leche hace que la lactanciasea más satisfactoria tanto para la madre como para el niño.

El condicionamiento pavloviano también es importante en el aprendizaje acerca desituaciones sexuales. Estudios realizados con animales machos y como estímulo condicionadola visión de una hembra sexualmente receptiva o el acceso a una hembra, los sujetos acabanaproximandose a los estímulos que señalan la disponibilidad de un compañero sexual. Laexposición a un EC sexual realizan la respuesta copulatoria más rápidamente, compitenmejor con otros machos por el acceso a una hembra, muestran más conducta de cortejo,liberan una mayor cantidad de esperma y muestran un incremento en los niveles detestosterona y hormona luteinizante. Incluso incrementan el número de crías en algunasespecies de peces y codornices estudiadas.

COMENTARIOS FINALES

En este Capítulo se ha continuado el estudio sobre la conducta elicitada desplazando laatención de la habituación y la sensibilización al condicionamiento clásico, más complejo, yaque está mediada por mecanismos asociativos. El condicionamiento clásico es una de lasprincipales técnicas para investigar cómo se aprenden las asociaciones y pueden interveniren muchos aspectos importantes de la conducta. Dependiendo del procedimiento empleado,el aprendizaje puede tener lugar de manera rápida o lenta. Con algunos procedimientos, seaprenden tendencias de respuesta excitatorias y con otros, el organismo aprende a inhibiruna respuesta particular en presencia del estímulo condicionado. El condicionamientoexitatorio e inhibitorio tiene lugar en muchos aspectos de la experiencia cotidiana y sirvepara mejorar la efectifidad con la que nos enfrentamos a eventos biológicamentesignificativos.

Descargado del campus, http://campus.felizmente.info

Page 55: Aprendizaje  resumen jc cabrera temas 1-9

53

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

TÉRMINOS CLAVE

Aprendizaje de objeto Aprendizaje de asocia-ciones entre diferente elementos de un objeto.

Automoldeamiento Lo mismo que seguimiento delsigno.

Condicionamiento de demora corta Procedimientode condicionamiento clásico en el que el estímulocondicionado aparece poco antes del estímuloincondicionado en cada ensayo de condiciona-miento.

Condicionamiento de huella Procedimiento decondicionamiento clásico en el que el estímuloincondicionado se presenta poco después de quehaya terminado el estímulo condicionado.

Condicionamiento hacia atrás Procedimiento decondicionamiento clásico en el que el estímulocondicionado se presente en todos los ensayosdespués del estímulo incondicionado.

Condicionamiento simultáneo Procedimiento decondicionamiento clásico en elque el estímulocondicionado y el incondicionado se presentansimultáneamente en cada ensayo de condiciona-miento.

Control aleatorio Procedimiento en el que losestímulos condicionado e incondicionado serpresentan en momentos aleatorios uno con res-pecto a otro.

Control desemparejado explícito Procedimiento enel que se presentan tanto el estímulocondicionado como el incondicionado, pero con elsuficiente tiempo entre ellos como para que no seasocien el uno del otro.

EC Abreviatura de estímulo condicionado.

EI Abreviatura de estímulo incondicionado.

Ensayo de condicionamiento Episodio de entre-namiento compuesto por la presentación de unestímulo condicionado con ( o sin) un estímuloincondicionado.

Ensayo de prueba Ensayo en el que se presenta elestímulo condicionado sin el estímulo incondicio-nado. Esto permite medir la respuesta condiciona-da en ausencia de la respuesta incondicionada.

Estímulo condicional o condicionado Estímulo queinicialmente no provoca una respuesta particular,pero que adquiere la capacidad de hacerlo comoresultado del desarrollo de una asociación con unestímulo incondicionado. Abreviatura EC.

Estimulo incondicional o incondicionado Estímuloque elicita una respuesta particular sin necesidadde entrenamiento. Abreviatura EI.

Hipótesis de la codificación temporal Idea segúnla cual el condicionamiento pavloviano lleva, nosólo al aprendizaje de que el EI ocurre, sinotambién de cuándo ocurre en relación al EC. El ECrepresenta ( o codifica) la disposición temporaldel EI.

Intervalo de huella Intervalo entre el final delestímulo condicionado y el principio del estímuloincondicionado en los ensayos de condiciona-miento de huella.

Intervalo EC-EI Lo mismo que intervalo entreestímulos.

Intervalo entre ensayos Cantidad de tiempo quepasa entre dos ensayos consecutivos.

Intervalo entre estímulos Cantidad de tiempo quepasa entre el comienzo del estímulo condicionado(EC) y el comienzo del estímulo incondicionado(EI) durante un ensayo de condicionamientoclásico. También llamado intervalo EC-EI.

Latencia Tiempo transcurrido entreel comienzo deun estímulo (o el comienzo de un ensayo) y larespuesta que se da a ese etímulo.

Descargado del campus, http://campus.felizmente.info

Page 56: Aprendizaje  resumen jc cabrera temas 1-9

54

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 3: Condicionamiento clásico: fundamentos

Juan Carlos Cabrera

Magnitud de la respuesta Medida del tamaño,vigor o extensión de una respuesta.

Probabiliad de una respuesta Probabilidad de quese realice una respuesta, normalmente represen-tada en términos de porcentaje de ensayos en losque tiene lugar la respuesta.

Prueba de retraso en la adquisición Procedimien-to de prueba que identifica un inhibidor condicio-nado si ese estímulo tarda más tiempo en adquirirpropiedades exitatorias que un estímulo de compa-ración.

Prueba de sumación Lo mismo que prueba del estí-mulo compuesto.

Prueba del estímulo compuesto Procedimoento deprueba que sirve para identiricar un inhibidorcondiconado si dicho estímulo reduce a respuestaelicitada por un estímulo condicionado excitatorio.También llamado prueba de sumación.

Pseudocondicionamiento Incremento en la respues-ta que puede provocar un estímulo cuyaspresentaciones están entremezcladas con laspresentaciones del estímulo condicionado (EC) sinque se establezca una asociación entre el estímulo yel EI.

RC Abreviatura de respuesta condicionada.

REC Abreviatura de respuesta emocional condicio-nada.

Respuesta condicional o condicionada Respuestaque se realiza ante el estímulo condicionado comoresultado del condicionamiento clásico. AbreviaturaRC.

Respuesta emocional condicionada Supresión deuna conducta instrumental positivamente reforzada(por ejemplo, presión de una palanca para obteneralimento) provacada por la presentación de unestímulo que se ha asociado con un estímuloaversivo. Abreviatura REC. También llamadasupresión condicionada.

Respuesta incondicional o incondicionada Res-puesta que provoca un estímulo sin necesidad deentrenamiento previo.

RI Abreviatura de respuesta incondicionada.

Seguimiento del signo Movimiento hacia unestímulo que señala la disponibilidad de un reforza-dor positivo, como comida, y posible contacto con elmismo. Tambien llamada automoldeamiento.

Supresión condicionada del lameteo Similar a larespuesta emocional condicionada (REC) oprocedimiento de supresión condicionada. Sinembargo, en lugar de utilizar la presión de lapalanca para obtener la comida como conducta asuprimir por el miedo condicionado, la línea de basees el lameteo de un tubo con agua por parte deratas sedientas. La presentación de un ECcondicionado al miedo ralentiza la tasa de lameteo.

Supresión condicionada Lo mismo que respuestaemocional condicionada.

Descargado del campus, http://campus.felizmente.info

Page 57: Aprendizaje  resumen jc cabrera temas 1-9

55

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera – 2009/2010

¿A qué deben su eficacia los estímulos condicionados e incondicionados?- Respuestas iniciales a los estímulos.- La novedad de los estímulos condicionados e incondicionados.- Intensidad y saliencia del EC y del EI.- Relevancia o pertinencia EC-EI.- El conceto de fuerza biológica.

¿Qué determina la naturaleza de la respuesta condicionada?- El modelo de sustitución del estímulo.- Aprendizaje y homeostasis: Un caso especial de sustitución del estímulo.- El EC como determinante de la forma de la RC.- Conducta condicionada y sistemas de conducta.- Aprendizaje E-R frente a aprendizaje E-E.

¿Cómo se asocian los estímulos condicionado e incondicionado?- El efecto de bloqueo.- El modelo de Rescola y Wagner.- Otros modelos de condicionamiento clásicos.

Comentarios finales

Descargado del campus, http://campus.felizmente.info

Page 58: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 59: Aprendizaje  resumen jc cabrera temas 1-9

57

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

¿A qué deben su eficiacia los estímulos condicionados eincondicionados? (página 91 del libro)

Esta es quizá la pregunta más importante en relación al condicionamiento clásico. Planteadaoriginalmente por Pavlov y también en la actualidad está recabando cada vez más la atenciónde los investigadores.

Respuestas iniciales a los estímulos.

Según definió Pavlov los términos condicionado e incondicionado: un estímulo condicionado(EC) inicialmente no provoca la respuesta condicionada, pero adquiere la capacidad dehacerlo como resultado del desarrollo de una asociación con el estímulo incondicionado (EI).Por el contrario, el EI elicita eficazmente la respuesta en custión desde el principio, sinningún entrenamiento previo.

La comparación de los ECs y de los EIs son relativas, pues en un evento particular puedeservir de EC respecto a un estímulo y de EI respecto a otro. Una exposición salina en unexperimento de aversión al sabor actua como EC y la droga que produce el malestar comoEI; mientras que en un experimento de seguimiento del signo la exposición salina se podríaconsiderar como EI y la luz el EC. Por tanto, el que la sacarina se considere un EC o un EIdepende de su relación con otros estímulos de la situación.

La novedad de los estímulos condicionados e incondicionados.

Tanto si el estímulo condicionado como el incondicionado es familiar, el aprendizaje sedesarrolla con mayor lentitud que si el EC y el EI son novedosos.

Los estudios sobre el papel de la novedad de los estímulos en el condicionamiento clásicosuelen realizarse en dos fases. Primero se expone repetidamente y de forma aislada alsujeto al estímulo que posteriormente va a utilizarse como EC y después se empareja con unEI según el condicionamiento clásico. La familiarización que se produce por la exposiciónincial retrasa el condicionamiento posterior de dicho estímulo. Este fenómeno se denominaefecto de preexposición al EC o efecto de inhibición latente.

La habituación y efecto de preexposición al EC sirven para limitar la cantidad deprocesamiento y atención a los estímulos que se sabe carecen de consecuencias.

El mismo proceso realizado con EI han dado similares resultados. Los sujetos familiarizadoscon un EI antes de su emparejamiento con EC desarrollan la respuesta condicionada al EC

Descargado del campus, http://campus.felizmente.info

Page 60: Aprendizaje  resumen jc cabrera temas 1-9

58

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

más lentamente que los participantes para los cuales el EI es novedoso. Este resultado sedenomina efecto de preexposicion al EI.

Dos son las explicaciones por parte de los investigadores de los efectos de preexposicioónal EC y al EI. La interferencia asociativa como mecanismo que disminuye la capacidad de losestímulos para participar en nuevas asociaciones; y otra, la interferencia de memoria en laque los participantes recuerdan lo sucedido en fase de experimento alterando la respuestacondicionada. Los mecanismos que reduzcan el recuerdo de preexposición en el momento dela prueba fortalecen la respuesta condicionada.

Intensidad y saliencia del EC y del EI.

Otra variable importante para elcondicionamiento clásico es la intensidad delos estímulos condicionados e incondicionados.La respuesta es más fuerte cuanto másintenso sean estos.

Un estímulo puede adquirir saliencia osignificación aumentando su intensidad, lo quehace que despierte mayor atención. Porejemplo, una rata presta más atención a la salsi sufre un deficit nutricional de sal.

Estudios sobre condicionamiento sexual de la codorniz macho doméstica, muestran que seobserva una respuesta sexual condicionada más intensa utilizando un EC que incluya algunasde las características estimulares de la hembra de codoniz.

Relevancia o pertinencia EC-EI.

El aprendizaje depende de la relevancia o adecuación del EC con respecto al EI que seadministra. El sabor se asocia fácilmente al malestar y las claves audiovisuales se asocian aldolor periférico.

condicionamiento Gustativo + audiovisual Descarga Gustativo + audiovisual Malestar

El experimento se emparejaron un estimulo audiovisual y un estímulo gustativo, presentados simultaneamente, con una descargao con una sensación de malestar, dependiendo del grupo. Después los sujetos se pusieron a prueba con los estímulosgustativos y audiovisuales por separado.

Las ratas condicionadas con una sensación de malestar adquirieron una mayor aversión a las claves gustativas que lasaudiovisuales. Por el contrario, las ratas condicionadas con una descarga adquirieron una mayor aversión a las clavesaudiovisuales que a las gustativas.

Objeto utilizados como EC en los estudios sobrecondicionamiento sexual con codornices macho paraseñalar la oportunidad de copula. El objeto de la izda. es"arbitrario" está hecho de un material lanudo. El objetode la derecha inlcuye una cabeza y algunas plumas delcuello de un ejemplar de hembra disecado, de modo quecontenga alguna de las claves que proporciona la hembra.

Descargado del campus, http://campus.felizmente.info

Page 61: Aprendizaje  resumen jc cabrera temas 1-9

59

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

Se demostró con ratas recien nacidas que la experiencia con sabores o con la enfermedad(o con las claves audiovisuales y el daño periférico) no es necesaria para que se dé el efectode relevancia del estímulo. Más bien, el fenómeno parece reflejar una predisposicióngenética para la asociación selectiva de ciertas combinaciones de estímulos condicionados eincondicionados.

Se ha documentado otras situaciones del efecto de relevancia del estímulo de aversión alsabor en palomas que asocian la comida mejor con claves visuales que con auditivas y unadescarga más efectivas con las auditivas. En cuanto a efectos de relevancia del estímulo enla adquisición del miedo en monos, estos parecen que tienen una predisposición paraaprender a temer a las serpientes de juguete que si lo hacen a flores de plástico. Estaselectividad de estímulos en el aprendizaje de miedos también se muestran en las personas,cuando participantes en estudios, han asociado fotografías de serpientes y arañas con unadescarga con mayor facilidad que fotografías de flores y casas.

Aproximaciones conductuales al control deltabaquismo

Se han desarrollado diversos procedimientos decondiciona-miento aversivo para que las personas dejende fumar (Hall, Hall y Ginsberg, 1990). Los primerosintentos consistieron en una terapia aversiva en la que elacto de fumar se emparejaba con el dolor producido poruna descarga eléctrica. Técnicas más recientes se basanen los hallazgos que indican que el condicionamiento de laaversión es más efectivo si el estímulo aversivo es“relevante” en relación a la situación. En estosprocedimientos, suele utilizarse el propio acto de fumarcomo fuente de la estimulación aversiva. Un procedimientoutilizado frecuentemente es el de inhalación rápida(USDHHS, 1996), en el ue se pide al sujeto que inhaletabaco cada 6 segundos durante un periodo de tiempohasta que surja náuseas o mareos. Esta forma de fumar esaversiva y permite condicionar una aversión al tabaco.

Los procedimiento de condicionamiento aversivo resultan másefectivos a la hora de eliminar el tabaquismo si se combinancon otras técnicas de modificación conductual. La inhalaciónrápida, por ejemplo, puede combinarse con un entrenamientoen autoobservación o autoadministración.

Primero se pide al sujeto que mantenga un egistro preciso delnúmero de cigarrillos que fuma, así como del momento, lugary circunstancia en las que lo hace. Una vez conocidas lafrecuencia y las circunstancias en las que fuma, se proponendos objetivos con los que se pretende reducir gradualmente elconsumo de tabaco: reducir el número total de cigarrillosfumados al día y reducir el número de situaciones en las quese permite fumar. Esta combinación de objetivos permitarestringir la conducta de fumar. El cumplimiento puedealentarse utilizando un sistema de contratos. Por ejemplo, lapersona puede depositar una cantidad de dinero al comienzodel tratamiento y recuperar posiciones de este depósito cadavez que logre un objetivo.

El concepto de fuerza biológica

Pavlov sugirió que para que un estímulo se condicionara debía tener una fuerza biológicamenor que la del estímulo incondicionado con el que se emparejaba. El concepto de "menorfuerza biológica" se refería a que inicialmente el EC debía elicitar menos respuestas y másdébiles que el EI.

Descargado del campus, http://campus.felizmente.info

Page 62: Aprendizaje  resumen jc cabrera temas 1-9

60

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

Condicionamiento de orden superior. Un estímulo puede hacer de EI tras haber sidofuertemente condicionado. Un tono emparejado repetidamente con la comida, elicitará lasalivación, así como seguimiento del signo. El concepto de fuerza biológica dice que estetono debería ser efectivo para condicionar una luz.

El condicionamiento de segundo orden es similar al procedimiento estandar para la inhibicióncondicionada, sin embargo, parece ser el número de ensayos no EI es el factor crítico. Conpocos ensayos no reforzados tiene lugar condicionamiento excitatorio de segundo orden.Con un entrenamiento más extenso, se desarrolla inhibición condicionada.

Con el condicionamiento de orden superior, el condicionamiento clásico puede acontecer sinun EI primario. El único requisito es que estén disponibles estímulos previamentecondicionados.

El condicionamiento de segundo orden también resulta interesante como técnica paraconfirmar la aparición de condicionamiento de primer orden, que a veces no provocadirectamente una respuesta condicionada, pero que el EC de primer orden puede elicitar larespuesta condicionada si es sometido a un condicionamiento de segundo orden.

Condicionamiento de orden superior del miedo

Los miedos irracionales se desarrollan muchas veces pormedio del condicionamiento de oren superior. Por ejemplo,Woldpe (1990) describe el caso de una mujer queinicialmente tenía miedo a las multitudes. Aunque sedesconoce cómo se condicionó este miedo, las multitudeshabían adquirido la capacidad de elicitar miedo. Para evitarel surgimiento del miedo, la mujer iba al cine sólo en elmomento del día en el que había poca gente. En una detales visitas, el cine se llenó repentinamente de estudiantes.La mujer quedó muy afectada por esta experiencia y asociólos cines con las multitudes. Así pues, como consecuencia

del condicionamiento de orden superior, un estímulocondicionado al miedo (las multitudes) había condicionadoelmiedo a otros estímulos (cines) que previamenteresultaban inocuos. El aspecto destacable de estaexperiencia es que se adquirió aversión a los estímulos delcine sin que estas claves se hubieran emparejadodirectamente con un estímulo incondicionado aversivo.Después de esta terrible experiencia con el cine, la mujerevitaba ir al cine incluso cuando era poco probable que seencontrara con mucha gente. Además, el miedo a los cinesrecién adquirido se generalizó a otros lugares públicos, talescomo restaurantes, iglesias y edificios públicos, que tambiénevitaba incluso si estaban vacíos.

El término orden superior, puede considerarse el condicionamiento como si operase en diferentes niveles. El emparejamientodel tono con la comida se considera condicionamiento de primer orden; El emparejamiento de la luz con el tonopreviamente condicionado sería el condicionamiento de segundo orden; y si la luz se usara para condicionar otro estímulo,por ejemplo, un olor, se trataría de condicionamiento de tercer orden.

Descargado del campus, http://campus.felizmente.info

Page 63: Aprendizaje  resumen jc cabrera temas 1-9

61

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

Contracondicionamiento. Dos estímulos pueden quedar asociados aunque ambos eliciteninicialmente respuesta intensas. La respuesta que un animal da a un EC se invierte ocontrarresta emparejando ese estímulo con un EI que provoca una reacción opuesta. Porejemplo, un animal puede condicionarse para aproximarse a un estímulo que anteriormenteevitaba.

Precondicionamiento sensorial. También pueden aprenderse asociaciones entre dosestímulos que tan sólo elicitan una débil respuesta de orientación antes decondicionamiento. Por ejemplo, el emparejamiento del sabor de vainilla y canela quedanasociados el uno del otro en los pasteles. Una aversión a la canela por medio deenvenenamiento, nos llevará a rechazar también pasteles con sabor a vainilla.

¿Qué determina la naturaleza de la respuesta condicionada?(pág. 100 del libro)

El modelo de sustitución del estímulo

Según el modelo de sustitución del estímulo de Pavlov, el EC adquiere la capacidad defuncionar de forma similar a como el EI lo hacía previamente, asumiendo, que el EC activalos circuitos neuronales que previamente activaba sólo el EI y elicita respuetas similares aEI.

Pavlov sugirió que el condicionamiento da lugar al establecimiento de nuevos enlacesneuronales durante los emparejamientos reptidos de EC y EI, desarrollando una nuevaconexión entre los circuitos que previamente activaba el EC y los que previamente activabael EI. Establecida la conexión EC se convierte en un sustituto del EI

El EI como factor determinante de la RC. EC diferentes elicitan respuetan condicionadasdiferentes. La comida elicita salivación y aproximación; las descargas elicitan aversión yalejamiento. Si el condicionamiento convierte al EC en un sustituto del EI, entonces los Ecscondicionados con diferentes EIs deberían provocar diferentes tipos de RC.

El experimento con palomas de Jenkins y Moore (1973) compararon el condicionamientopavloviano utilizando como EI comida y agua . Para comer las palomas picotean rápido ybruco hacia el grano y abren el pico justo antes de tomar contacto con él. Para el beberintroducen el pico casi cerrado en el agua y bajo ella abren periodicamente para succionar.Las respuestas incondicionadas de comer y beber son diferentes.

Descargado del campus, http://campus.felizmente.info

Page 64: Aprendizaje  resumen jc cabrera temas 1-9

62

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

El EC fue la iluminación de una tecla durante 8 segundos y se emparejó tanto para lapresentación del grano de cereal como con la disposibilidad de agua. La forma de RC separecía a la forma de la respuesta incondicionada: El EC condicionado con la comidaprovocaba el picoteo relacionado con la comida y el EC condicionado con agua provocaba lospicoteos relacionados con la bebida.

Aprendizaje y homeostasis: Un caso especial de sustitución del estímulo.

Walter Cannon introdujo el concepto homeostasis para referirse a los mecanismosfisiológicos que mantienen los aspectos críticos del cuerpo dentro de los límites aceptables,Estos mecanismo funcionaban por procesos de retroalimentación negativa que servían paracontrarestar las alteraciones una vez que estas ya habían provocado una desviación de losniveles optimos. Esto puede resultar ineficiente, especialmente si el proceso decompensación o corrección tarda en activarse. Dworking (1993) señalo que las alteracionesen la homeosteasis pueden compensarse más activamente si pueden anticiparse. Elcondicionamiento pavloviano proporciona los medio necesarios para tal anticipación.

Las respuetas homeostáticas condicionadas se han examinado más extensamente enrelación a la forma en que los organismos respondem a la administración de drogaspsicoactivas. Suelen provocar alteraciones fisiológicas que afectan a la homeostasis queactivan reacciones compensatorias condicionadas. Las claves que se asocian con la alteraciónfisiológica inducida por la droga pueden llegar a elicitar estas reacciones compensatoriascomo respuestas condicionadas anticipatorias.

El modelo de condicionamiento de tolerancia a las drogas: Se considera que se hadesarrollado tolerancia a las drogas cuando las administraciones repetidas de las mismastiene un efecto cada vez menor. Tradicionalmente se ha considerado esta tolerancia comodebida a procesos farmacológicos. Shepard Siegel, en contraste ha propuesto un modelobasado en el condicionamiento clásico, utilizando el concepto de homeostasis aprendida.

El modelo de condicionamiento de la tolerancia a las drogas atribuye la tolerancia a lasrespuestas compensatorias condicionadas a los estímulos del entorno que se emparejan conla administración de la droga. Una importante predicción del modelo es que la tolerancia a ladroga se verá atenuada si los sujetos reciben la droga en condiciones novedosas o enausencia de las claves que normalmente predicen su consumo. También predice que variosfactores que atenúan el desarrollo de las respuestas condicionadas (como la preexposiciónal EC) también deberían atenuar el desarrollo de la tolerancia a la droga

Descargado del campus, http://campus.felizmente.info

Page 65: Aprendizaje  resumen jc cabrera temas 1-9

63

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

El EC como determinante de la forma de la RC

La forma de la RC también esta influenciada por la naturaleza del EC. Timberlake y Grant(1975) utilizaron comida como EI, el EC fue la presentación de otra rata justo antes de laadministración de comida, el EC no porvoco conductas de roer y morder, elicito respuestasde orientación, aproximación y olfateo, asi como contactos de tipo social.

Conducta condicionada y sistemas de conducta

Los diversos sistemas de conductas han evolucionado para permitir al animal llevar a cabotareas criticas, tales como obtener y comer el alimento, defender su territorio, evitar a losdepredadores, reproducirse y cuidad sus crías. Cada sistema consiste en una serie de modosde respuesta, cada uno de ellos con sus propios estimulos y respuestas relevantes,dispuestos con determinado orden espacial y secuencial.

La teoría de los sistemas de conducta asume que la presentación del EI en un porcedimientode condicionamiento pavloviano activa el sistema de conducta relevante para ese EI. Losestímulos condicionados con comida elictan componentes del sistema de alimentación y losestímulos condicionados sexuales elicitan componentes del sistema de conducta sexual.

Una predicción de la teoría de los sitemas de conducta es que la forma de la RC dependerádel intervalo EC-EI que se utilice. Este intervalo determina el lugar en que se incorporara elEC dentro de la secuencia de respuestas del sistema de conducta.

La teoría es claramente compatible con el hecho de que la forma de la RC está determinadapor: La naturaleza del (EI) estímulo incondicionado y la naturaleza del (EC) estímulocondicionado.

Aprendizaje E-R frente a aprendizaje E-E

Historicamente la conducta condicionada se veía como una conducta elicitada directamentepor el EC. De acuerdo con la teoría del aprendizaje E-R, establece una nueva conexiónestímulo-respueta entre el EC y la RC. La teoría del aprendizaje E-E los sujetos aprendenuna asociación estimulo-estimulo entre el EC y el EI. Los sujetos responden al EC, no porqueeste elicite directamente una RC, sino porque el EC activa una representación del EI. Lapresentación del EC hace que el sujeto piense en el EI y esta es la causa de la conductacondicionada.

Un método de investigación importante para decidir entre aprendizaje E-R y E-E es la de ladevaluación del EI.

Descargado del campus, http://campus.felizmente.info

Page 66: Aprendizaje  resumen jc cabrera temas 1-9

64

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

¿ Cómo se asocian los estímulos condicionados e incondicionados ?(pág. 109 del libro)

El efecto de bloqueo

Conlleva una secuencia de suscesossimilar. Primero se asocia EC (estímuloA) y el EI. Una vez que el ECA esta biencondicionado, se añade el segundoestímulo (estímulo B) al estímulo A y sepresentan los dos juntos en los ensayosde condicionamiento. El hallazgo básicoes que el condicionamiento previo de A,bloquea el desarrollo de la RC alestímulo B.

Este efecto se ha convertido en unfenómeno clave del condicionamientoclásico porque puso en duda elpresupuesto de que la contigüidadtemporal fuese suficiente para el aprendizaje.

Kamin, su descubridor, explico el efecto proponiendo que para que se produzca aprendizajede forma efectiva el EI debía ser inesperado o sorprendente.

El modelo de Rescorla y Wagner

Rescola Wagner asumieron que la sorpresividad, y por tanto le efectividad, de un EIdepende de lo diferente que el EI sea en comparación con lo que el sujeto espera. Asumenque la expectativa del EI está relacionada con las propiedades condicionadas o asociativasdel estímulo que precede al EI. Una RC intensa indica una fuerta expectativa de que el EIaprecerá (condicionamiento excitatorio o incremento de la fuerza asociativa); una RC débilindica una baja expectativa del EI (condicionamiento inhibitorio o disminución de la fuerzaasociativa).

EI. del y EC del saliencia la con arelacionad constante

estímulos los de asociativovalor

eaprendizaj de asítona

:básica Ecuación

:

:: λ

)(

kV

VkV −=Δ λ

Figura 4.13. Esquema del procedimiento de bloqueo.

En la fase 1, el estímulo A se condiciona con el EI para el grupoexperimental, mientras que el grupo de control recibepresentaciones desemparejadas de A y el EI.

En la fase 2, ambos grupos reciben ensayos de condicionamientoen los que el estímulo A se presenta a la vez que el estímulo B yse empareja con el EI.

Una prueba posterior con el estímulo B aislado muestra que elgrupo experimental produce una respuesta condicionada menorante el estímulo B que el grupo de control.

Descargado del campus, http://campus.felizmente.info

Page 67: Aprendizaje  resumen jc cabrera temas 1-9

65

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

Aplicación del efecto de bloqueo. El modelo de Rescorla y Wagner predicen claramente elefecto bloqueo. Como se muestra en la Figura 4.13, el grupo experimental de diseño debloqueo recibe primero un condicionamiento extenso del estímulo A, de forma que adquiereuna expectativa de que el EI ocurrirá siempre que se presente el estímulo A. Cuandofinaliza la fase 1, VA es igual a la asíntota de aprendizaje o )( λλ =AV . En la fase 2, elestímulo B se presenta junto con el estímulo A, y ambos van seguido del EI. De acuerdo conel modelo Rescorla-Wagner, no habrá condicinamiento del estímulo B en la Fase 2, ya que elEI es perfectamente predecible por la presencia del estímulo A: 0)( =− +BAVλ

El grupo de control recibe un tratamiento idéntico en la Fase 2, pero para ellos la presenciadel estímulo A no lleva a unaexpectativa del EI y por tanto es sorprendente para el grupode control y produce nuevo aprendizaje.

Perdida de valor asociativo a pesar de los emparejamientos con el EI. Gran parte de laimportancia del modelo se debe a sus inusuales predicciones. Una de tales predicciones esque, en ciertas circunstancias, las propiedades condicionadas de los estimulos se reducirana pesar de que siga habiendo emparejamientos con el EI.

el EI1

Inhibición condicionada. La aplicación del modelo de Rescorla y Wagner a esteprocedimiento requiere que se consideren separadamente los ensayos reforzados y los noreforzados. Para poder anticipar el EI en los ensayos reforzados, el EC+ debe adquirirpropiedades excitatorias. El condicionamiento excitatorio conlleva la adquisición de unavalor asociado positivo, y cesa una vez que el organismo predice el EI perfectamente encada ensayo.

En cada ensayo aparecen tanto el EC+ como el EC-. Una vez que el EC+ ha adquirido ciertogrado de excitación condicionada (debido a su presentación en los ensayos reforzados), elorganismo esperará que se presente el EI siempre que aparezca el EC+, incluyendo losensayos no reforzados. Sin embargo, el EI no ocurre en los ensayos no reforzados, por loque se trata de un caso de expectativa excesiva. Para predecir con exactitud la ausencia delEI en los ensayos reforzados, los valores asociativos del EC+ y del EC- tienen que sumar

Fase 1 Fase 2

A → EI [A + B] → EI

B → EI

Pérdida de valor asociativo a pesar de las presentación continuada del EI. Los estímulos A y B se condicionan separadamentehasta llegar a la asíntota en la Fase 1, de modo que cada EC sea capaz de predecir el EI perfectamente. En la Fase 2, losestímulos A y B se presentan simultáneamente y se emparejan con el mismo EI utilizando en la Fase 1. Esto produce unaexpectativa excesiva del EI. Dado que el EI es sorprendentemente pequeño al principio de la Fase 2, las propiedadescondicinadas de los estímulos A y B se reducen hasta que la presentación simultánea de los dos ECs deja de producir unexceso de expectativas.

Descargado del campus, http://campus.felizmente.info

Page 68: Aprendizaje  resumen jc cabrera temas 1-9

66

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

cero (valor que representa la ausencia de EI). Para lograrlo, como el EC+ tiene un valorasociativo positivo, la única forma es hacer que el valor asociativo del EC- sea negativo. Elmodelo Rescola-Wagner explica la inhibición condicionada asumiento que el EC- adquiere unvalor asociativo negativo.

Extinción de la excitación y de la inhibición. En un procedimiento de extinción, elestímulo condicionado se presenta repetidamente sin el EI. Si un EC ha adquiridopropiedades excitatorias (EC+) habrá un exceso de expectativa del EI la primera vez que elEC se presente sin el EI en la fase de extinción. Al continuar con los ensayos del EC solo, laexpectativa elicitada por el EC se va acercando a la línea que representa la ausencia del EIpor medio de una reducción gradual del valor asociativo del EC+ hasta llegar a cero.

El modelo de Rescola y Wagner prdice un situación similar para la extinción de la inhibicióncondicionada. Al principio de la extinción, el EC- tiene valor asociativo negativo, esto puedeconsiderarse una predicción excesivamente baja del EI; el organismo predice un EI con unvalor menor del valor cero con el que de hecho aparece le EI. Para ajustar las expectativasa la ausencia del EI, el valor asociativo negativo del Ec- se va perdiendo gradualmente y elEC- termina con una fuerza asociativa igual a cero.

Problemas del modelo Rescorla Wagner.

1º- Su análisis de la extinción de la inhibición es incorrecto. Algunos investigadoreshan encontrado que no reforzar un EC- de forma repetida puede potenciar sus propiedadesinhibitorias.

2º- El modelo considera la extinción como lo opuesto a la excitación, o a la vuelta a unvalor asociativo cero, pero la extinción no debería verse como una mera inversión de laadquisición. La extinción parece involucrar el aprendizaje de una nueva relación entre el ECy el EI.

3º- En ciertas condiciones el mismo EC puede tener tanto propiedades excitatoriascomo inhibitorias, en el modelo no pueden ser ambos.

4º- El modelo tiene dificultades para explicar hallazgos recientes obtenidos en losparadigmas de avesion al sabor y olor. En experimentos similares al de efecto de bloqueo,cabria esperar que la presencia del EC previamente condicionado interfiriera en elcondicionamiento del EC añadido en la fase 2. Se encontró el resultado opuesto: un efectode aumento o de contrabloqueo.

Descargado del campus, http://campus.felizmente.info

Page 69: Aprendizaje  resumen jc cabrera temas 1-9

67

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

Otro modelos de condicionamiento clásico

Modelos atencionales de condicionamiento. Las teorías atencionales difieren en sussupuestos sobre que es lo que determina la saliencia del EC en un ensayo. Pearce y Hall(1980) asumen que el grado de atención que un animal presta al EC en un ensayodeterminado depende del grado en el que el EI haya sido sorprendente en el ensayoanterior, y por tanto aún tiene mucho que aprender y prestarán más atención al EC en elsiguiente ensayo. Por el contario, si un EC iba seguido de un EI esperado en el ensayoanterior, el sujeto prestará menos atención a ese EC en el siguiente ensayo, asumiendo queun EI esperado reduce la saliencia o la atención dedicada al EC.

Una caracteristica importante de la teorías atencionales es que asumen que la sorpresividaddel EI en un ensao determinado altera el grado de atención dedicado al EC en los ensayossiguientes. Esta es una diferencia importante con Rescorla Wagner que asumen que lasorpresividad del EI en un ensayo determina lo que se aprende en ese ensayo.

El supuesto de que el EI presentado en un ensayo sólo afecta a lo que se aprende en elsiguiente ensayo ha permitido explicar ciertos hallazgos, pero también tienen dificultadescon otros, como los del experimento de bloqueo en el primer ensayo de la Fase 2 delexperimento de bloqueo.

Factores temporales y respuesta condicionada. Ni el modelo de Rescola y Wagner ni losmodelos modificación del EC fueron diseñados para explicar los efectos del tiempo sobre elcondicionamiento, pese a que el tiempo es un factor crítico. Una variable temporalimportante es el intervalo EC-EI. La respuesta condicionada es inversamente proporcional alintervalo EC-EI o duración del EC. Por encima de un punto óptimo los procedimientos conintervalos EC-EI más largos producen menos respuestas.

Otra variable temporal importante es el intervalo entre ensayos. En general en ensayos másseparados entre si, mayor respuesta condicionada. Mas interesante resulta que el intervaloentre ensayos y la duración del EC interactuan a la hora de determinar la respuesta.Numerosos ensayos han mostrado que el factor crítico es la duración relativa de estas dosvariables temporales, más que el valor absoluto de las mismas.

Se han ofrecido varias interpretaciones sobre por qué la respuesta condicionada esta tanfuertemente determinada por la razón IEE/DE (intervalo entre ensayos/duración delensayo). Una de las primeras explicaciones fue la hipótesis de espera relativo, que suponeque un EC proporciona información acerca de la aparición del EI sólo si el sujeto tiene quepasar menos tiempo esperando al EI que cuando esta simplemente expuesto al contextoexperimental.

Descargado del campus, http://campus.felizmente.info

Page 70: Aprendizaje  resumen jc cabrera temas 1-9

68

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

Cuando la Razón IEE/ED es baja, el tiempo de espera ante el EC es similar al tiempo deespera en el contexto. En este caso, el EC proporciona poca información adicional sobre elmomento de aparición del EI y no se desarrollara mucha respuesta condicionada. Por elcontrario, cuando la razón IEE/ED es alta, el tiempo de espera ante el EC es mucho menorque el tiempo de espera en el contexto. Esto hace que el EC aporte información sobre elmomento que aparece el EI, y la respuesta condicionada será mas fuerte.

La hipótesis del comparador. R.Miller. Se parece a la hipótesis del tiempo de esperarelativo, en que asume que la respuestas condicionadas depende no sólo de la asociaciónentre el EC y EI, sino también de todas las posibles asociaciones que puedan establecerseen claves contextuales y el EI. La fuerza asociativa de otras claves presentes durante elentrenamiento con el EC crítico es especialmente importante. Otra restricción del modelodel comparador es que sólo permite asociaciones excitatorias con el EI. El modelo asumeque el que la RC refleje excitación o inhibición está determinado por la fuerza relativa de laexcitación condicionada al EC en comparación con la excitación condicionada a las clavescontextuales presentes durante el entrenamiento del EC.

La hipótesis hace más hincapié en las asociaciones que en el tiempo. Asume que los sujetosaprenden tres asociaciones en el curso del condicionamiento:

1º Une el EC crítico con el EI.2º Une el EC crítico con las claves contextuales de comparación .3º Une los estímulos de comparación y el EI.

Cuando se presenta el EC este activa la representación del EI tanto directamente (asoc 1)como indirectamente (asoc 2 y3). La comparación de las activaciones directa y indirecta delEI determina el grado de respuesta excitatoria o inhibitoria que tendrá lugar.

Esta hipótesis no indica cómo se establecen las asociaciones, es una teoría de la ejecución.

Un importante corolario es que la comparación entre asociaciones EC-EI y el contexto-EI serealiza en el momento de la prueba. Predice que la extinción de la asociación contexto EIdespués del entrenamiento del EC potenciara la respuesta al EC crítico.

Principal contribución ha sido su énfasis en que las diferencias en la respuesta condicionadapueden reflejar diferencias en la ejecución más que en el aprendizaje, considera el efectobloqueo como un fallo en la ejecución, Predice que la extinción del estimulo bloqueadorelevara la RC al EC bloqueado

También se ha puesto a prueba en estudios sobre inhibición condicionada. El modelo leatribuye la inhibición condicionada a situaciones en las que se asocia el EC crítico con el EIes más débil que la asociación de las claves contextuales con el EI. En este caso, las claves

Descargado del campus, http://campus.felizmente.info

Page 71: Aprendizaje  resumen jc cabrera temas 1-9

69

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

contextuales son estímulos que proporcionan el contexto excitatorio necesario para elcondicionamiento inhibitorio. Curiosamente predice que la extinción de estos estímuloscondicionados excitatorios tras el condicionamiento inhibitorio reduciría la respuestainhibitoria. Por tanto, la hipotesis del comparador es la única que predice que la extinción dela inhibición condicionada se logra de forma óptima, no presentando el EC- aislado, sinoextinguiendo las claves que sirven de EC+ y que proporcionan el contexto excitatorio para elcondicionamiento inhibitorio del EC-.

El modelo predice también que incrementar el valor excitatorio de las claves contextualestras el tratamiento (Asoc. 3) reducirá la respuesta condicionada del EC crítico. No se haconseguido confirmar esta predicción.

Una de sus principales contribuciones ha sido su énfasis en que la diferencias en larespuesta condicionada puede reflejar diferencias en la ejecución más que en elaprendizaje. El bloqueo lo considera como un mero fallo en la ejecución más que en elaprendizaje. Predice que la extinción del estímulo bloqueador tras el entrenamiento elevarála respuesta condicionada al EC bloqueado.

Visión general de las alternativas teóricas. Cada uno de los modelos que se han descritohace hincapié en un aspecto diferente del condicionamiento clásico. La hipótesis del tiempode espera relativo se centre en un pequeño conjunto de fenómenos relacionados con ladistribución temporal de los estímulos condicionados e incondicionados, a pesar de que suantecesora (la teoría de la expectativa escalar) tiene un alcance mucho mayor.

La hipótesis del comparador también es ambiciosa, pero es una teoría de la ejecución másque del aprendizaje y, por toanto, no explica como se adquieren las asociaciones.

Los modelos atencionaes hacen referencia al mismo tipo de fenómeno que el modeloRescorla-Wagner, pero comparten algunas de sus limitaciones.

Todos estos modelos han sido importantes en tanto que han dirigido nuestra atención aaspectos previamente ignorados del condicionamiento clásico. Ninguno de ellos ha llegado adominar el estudio del condicionamiento clásico e la misma forma que el modelo Rescorla-Wagner lo hizo en los setenta.

Descargado del campus, http://campus.felizmente.info

Page 72: Aprendizaje  resumen jc cabrera temas 1-9

70

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

Comentarios finales (pág. 122 del libro)

Inicialmente, algunos psicólogos consideraron el condicionamiento clásico como un tipo deaprendizaje relativamente simple y primitivo que intervenía sólo en la regulación derespustas glandulares y vecerales como la salivación. Se asumía que el establecimiento delas asociaciones EC-EI tenía lugar automáticamente con los emparejamientos del EC y el EI.Debido a la naturaleza simple y automática del condicionamiento y a que se creía que estabalimitado a las respustas glandulares y vicerales, no se consideraba que fuera importante a lahora de explicar la complejidad y riqueza de la experiencia humana. Claramente, esta visióndel condicionamiento clásico resulta insotenible en la actualidad.

La investigación revisada de los Capítulos 3 y 4 muestra que el condicionamiento clásicoinvolucra numerosos procesos complejos y está implicado en el control de una gran variedadde respuestas, desde la conducta emocional hasta las respuestas de aproximación yevitación. Además, el aprendizaje no ocurre de forma automática por el meroemparejamiento de un EC con un EI. Depende de la experiencia previa del organismo concada uno de estos estímulos, de la presencia de otros estímuos durante los ensayos decondicionamiento y del grado con que el EC y el EI sean mutuamente relevantes. Además, losprocesos de condicionamiento clásico no se limitan a emparejamientos EC-EI. Tambiénpueden desarrollarse asociaciones entre dos eventos sin significación biológica(precondicionamiento ensorial), en ausencia de un estímulo incondicionado (condicionamientode orden superior) o en ausencia de un estímulo condicionado convencional(contracondiconamiento).

Debido a estas y otras complejidades de los procesos de condicionamiento clásico, es unerror ignorar el condiconamiento clásico al tratar de explicar formas complejas decomportamiento. La riqueza de los mecanismos del condicionamiento clásico los convierte enrelevantes en relaicón a la riqueza y complejidad de la experiencia humana.

Descargado del campus, http://campus.felizmente.info

Page 73: Aprendizaje  resumen jc cabrera temas 1-9

71

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

Términos clave

Aprendizaje E-E Aprendizaje de una asociaciónentre dos estímulos, con el resultado de que laexposición a uno de los estímulos adquiere lacapacidad de activar una representación o“imagen mental” del otro estímulo. Tambiénllamado aprendizaje estímulo-estímulo.

Aprendizaje E-R Aprendizaje de una asociaciónentre un estímulo y una respuesta, con elresultado de que el estímulo adquiere lacapacidad de provocar la respuesta. Lo mismoque aprendizaje estímulo-respuesta.

Aprendizaje estímulo-estímulo Lo mismo queaprendizaje E-E.

Aprendizaje estímulo-respuesta Lo mismo queaprendizaje E-R.

Condicionamiento de orden superior Procedimien-to en el que se utiliza un estímulo previamentecondicionado (EC1) para condicionar un nuevoestímulo (EC2)

Contracondicionamiento Procedimiento de condi-cionamiento que invierte la respuestacondicionada con anterioridad a un estímulo. Porejemplo, un animal puede condicionarse paraaproximarse aun estímulo que anteriormenteevitaba.

Devaluación del EI Reducción el atractivo de unes-tímulo incondicionado, normalmente obtenidamediante la aversión o la saciedad.

Efecto de aumento Facilitación en el condiciona-miento el un estímulo novedoso debido a sucondicionamiento junto a un estímulo previa-mente condicionado. También llamado efecto decontrabloqueo.

Efecto bloqueo Interferencia en elcondicionamien-to de un nuevo estímulo debida ala presencia de un estímulo previamentecondicionado.

Efecto de contrabloqueo Lo mismo queaumentación.

Efecto de inhibición latente Lo mismo que efectode preexposicioón al EC.

Efecto de preexposición al EC Interferencia conel proceso de condicionamiento producida por laexposición repetida al estímulo condicionadoantes de los ensayos de condicionamiento.También llamado efecto de inhibición latente.

Efecto de preexposición al EI Interferencia conel proceso de condicionamiento producida por laexposición repetida al estímulo incondicionadoantes de los ensayos de condicionamiento.

Hipótesis del comparador Idea según la cual larespuesta condicionada depende de unacomparación entre la fuerza asociativa delestímulo condicionado crítico (EC) y la fuerzaasociativa de otras claves presentes durante elcondicionamiento del EC crítico.

Hipotesis del tiempo de espera relativo Ideasegún la cual la respuesta condicionada dependede cuánto tiempo tenga que esperar elorganismo para el estímulo incondicionado (EI)en presencia del estímulo condicionado (EC), encomparación con el tiempo que tenga queesperar para el EI en la situación experimentalindependientemente del EC.

Homeostasis Concepto introducido por WalterCannon para referirse a los mecanismosfisiológicos que permiten mantener los aspectoscorporales críticos (tales como los niveles eazúcar en sangre o la temperatura) dentro deciertos límites. El nivel homeostático suelelograrse mediante la acción de mecanismos deretroalimentación negativa que permitencontrarrestar el efecto de los cambios en elnivel homeostático.

Precondicionamiento sensorial Procedimiento en elque un estímulo biológicamente débil (EC2) seempareja repetidamente con un estímulobiológicamente débil (EC1). Después, el EC1 secondiciona con un estímulo incondicionado. En unensayo de prueba posterior, el EC2 tambiénnunca se había emparejado directamente con elestímulo incondicionado.

Descargado del campus, http://campus.felizmente.info

Page 74: Aprendizaje  resumen jc cabrera temas 1-9

72

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 4: Condicionamiento clásico: mecanismos

Juan Carlos Cabrera

Respuesta homeostática condicionada Respuestacondicionada que se parece a las reaccioneshomeostáticas incondicionadas que elicita unestímulo incondicionado.

Saliencia del estímulo Significación o percep-tibilidad de un estímulo para el organismo. Engeneral, el aprendizaje avanza más rápido conestímulos condicionados e incondicionados mássalientes.

Sustitución del estímulo Idea teórica según lacual el resultado del condicionamiento clásico esque el organismo responde al estímulocondicionado de la misma manera que respondíapreviamente al estímulo incondicionado.

Tolerancia a las drogas Reducción en laefectividad de una droga como resultado delconsumo repetido de la misma.

Descargado del campus, http://campus.felizmente.info

Page 75: Aprendizaje  resumen jc cabrera temas 1-9

73

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera – 2009/2010

Primeras investigaciones sobre el condicionamiento instrumental

Aproximaciones modernas al estudio del condicionamiento instrumental- Procedimientos de ensayo discreto- Procedimientos de operante libre

Procediminetos de condicionamiento instrumental

Elementos fundamentales del condicionamiento instrumental- La respuesta instrumental- El reforzador instrumental- La relación respuesta-reforzador

Contigüidad y contingencia: Comentarios finales

Descargado del campus, http://campus.felizmente.info

Page 76: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 77: Aprendizaje  resumen jc cabrera temas 1-9

75

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

En este capítulo se vuelve la vista al análisis de las situaciones de aprendizaje en las cualeslos estímulos a los que un organismo se enfrenta son el resultado directo de su conducta,descrita como “dirigida a una meta”.

La conducta que sucede debido a que ha servido previamente como instrumento paraproducir ciertas consecuencias se denomina conducta instrumental.

Primeras investigaciones sobre el condicionamiento instrumental.(página 125 del libro)

Los análisis teóricos y de laboratorio del condicionamiento instrumental comenzaronformalmentecon el trabajo de thorndike. Su intención original era estudiar la inteligenciaanimal. Estudio la cuestión planteada por Darwin sobre que capacidades intelectualeshumanas estaban presentes en los animales mediante investigación empírica, para elloinvento una serie de cajas problema donde introducía un gato hambriento con algo decomida fuera de la vista del animal. Su tarea era aprender a salir de la caja y obtener lacomida.

La cuidadosa aproximación empirica de Thorndike fue un avance significativo en el estudiode la “inteligencia animal”. Otra contribución importante fue la estricta evitación deinterpretaciones antropomórficas de la conducta observada. En lugar de ello, interpreto losresultados de sus estudios como el reflejo del aprendizaje de una asociación E-R. A medidaque la asociación o conexión entre las claves de la caja y la respuesta con éxito se hacia masfuerte, el gato llegaba a realizar esta de forma más rápida. La consecuencia de la respuestaexitosa fortalecía la asociación entre los estimulos de la caja y esa respuesta.

Sobre la base de eta investigación, Thorndike formulo la ley del efecto: si una respuestaen presencia de un estimulo es seguida por un suceso satisfactorio, la asociación E-R sefortalece, si es seguida por un suceso molesto, se debilita. Esta ley implica un aprendizajeE-R.

Descargado del campus, http://campus.felizmente.info

Page 78: Aprendizaje  resumen jc cabrera temas 1-9

76

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

Aproximaciones modernas al estudio (página 125 del libro)

del condicionamiento instrumental.

Thorndike utilizó 15 cajas problemas diferentes en sus investigaciones que requeríandiferentes manipulaciones para que el gato saliese. Algunas llegaron a ser “estándar”.

Procedimientos de ensayo discreto

El método es similar al de Thorndike, en el que cada ensayo de entrenamiento acaba con laretirada del animal del aparato, y la respuesta instrumental se realiza sólo una vez durantecada ensayo.

Similares al método de Thorndike, W.S.Small (1899,1900), introdujo el laberinto en lasinvestigaciones sobre aprendizaje inspirado en las madrigueras bajo tierra.

Un laberinto muy utilizado es el de forma de T, diseñado para estudiar la conducta deelección. La conducta en el laberinto puede cuantificarse midiendo la velocidad decarrera, que normalmente aumenta con ensayos de entrenamiento repetidos. Otra medidacomún es la latencia, tiempo que tarda el animal en abandonar la caja salida y empezar adesplazarse por el pasadizo, las latencias se hacen mas cortas a medida que progresa elentrenamiento.

Procedimientos de operante libre

Ideado por B.F. Skinner, los procedimientos de operante libre permiten al animal que repitala respuesta instrumental una y otra vez sin restricciones.

Skiner estaba interesado en analizar en el laboratorio una forma de conducta que fueserepresentativa de toda la actividad en curso que ocurria de forma natural. La conducta nose divide como si fueran moléculas, por eso propuso el concepto de operante como la formade dividir la conducta en unidades medibles con significado.

La típica caja básica de Skinner que utilizada para estudiar la conducta opeante libre,consistia en una pequeña cámara que contiene una palanca y un mecanismo que proporcionaun reforzador.

Una respuesta operante, como presionar una palanca, se defina a partir del efecto queproduce en el ambiente. Las actividades que provocan el mismo efecto ambiental seconsideran ejemplos de la misma operante.

Descargado del campus, http://campus.felizmente.info

Page 79: Aprendizaje  resumen jc cabrera temas 1-9

77

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

Entrenamiento y moldeamiento al comedero. Hay algunos pasos preliminares paraestablecer la conducta de presión de la palanca. En primer lugar, los animales tienen queaprender cuándo esta disponible la comida en el comedero. Esto comprende uncondicionamiento clásico. Tras suficientes emparejamientos del sonido del dispensador conla entrega de comida, el sonido llega a elicitar una respuesta de seguimiento del signo: elanimal se dirige al comedero y recoge la bolita de comida. Esta fase preliminar se llamaentrenamiento al comedero.

Después, el organismo esta preparado para aprender la respuesta instrumental requerida.Si la respuesta no es algo que el animal ya realiza, nunca sucederá por si mima, para facilitarla adquisición de una nueva respueta operante, al principio, la comida se entrega si el animalhace cualquier cosa remotamente relacionada con la respuesta deseada. Una vez que larespuesta de alzamiento ha sido establecida la comida solo entrega si la rata realiza larespuesta de alzamiento sobre la palanca de respuesta. Una vez que el alzamiento sobre lapalanca ha sido establecido, la bolita de comida puede entregarse solo si realmente la ratapresiona la palanca. Esta secuencia de pasos se denomina moldeamiento. Este incluye dostácticas complementarias: reforzamiento de aproximaciones sucesivas a la respuestarequerida y no reforzamiento de las formas de respuesta más tempranas.

Moldeamiento y nueva conducta: El condicionamiento instrumental incluye a menudo laconstrucción o síntesis de una nueva unidad conductual a partir de componentes derespuesta preexistentes que ya se encuentran en el repertorio del sujeto. Elcondicionamiento instrumental puede también utilizarse para producir respuestas que no separecen en nada a lo que el individuo es probable que haga sin entrenamiento. Elmoldeamiento aprovecha la variabilidad inherente de la conducta. Sin esta variabilidad, losprocedimientos de moldeamiento no tendrían éxito. El moldeamiento puede producir nuevasformas de respuesta nunca antes realizadas por el organismo.

La tasa de respuesta como medida de la conducta operante. Los métodos de operantelibre permiten una observación continua durante largos periodos, proporcionan una ocasiónespecial para obsevar cambios en la probabilidad de la conducta a lo largo del tiempo.Las medidas de la latencia de la respuesta y de la velocidad que se emplea normalmente enprocedimientos de ensayo discreto no permiten que se repita la respuesta. Skinner propusoque la tasa de ocurrencia de una conducta operante (frecuencia por minuto, por ej.) seutilizase como medida de la probabilidad de respuesta.

Descargado del campus, http://campus.felizmente.info

Page 80: Aprendizaje  resumen jc cabrera temas 1-9

78

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

Procedimientos de condicionamiento instrumental (página 133 del libro)

Una consecuencia placentera se denomina técnicamente estimulo apetitivo. Unaconsecuencia molesta estimulo aversivo. La respuesta instrumental puede proporcionar elestimulo, en este caso se dice que surte efecto una contingencia positiva entre la respuestay su estimulo consecuente. De forma alternativa, la respuesta instrumental puede retirar oeliminar un estimulo, en este caso se dice que existe un efecto de contingencia negativoentre la respuesta y su consecuencia: Que el resultado de un procedimiento decondicionamiento sea un aumento o una disminución de la tasa de respuesta depende tantode la contingencia respuesta-consecuencia como de la naturaleza de la consecuencia.

Reforzamiento positivo: es un procedimiento en el que la respuesta instrumental produce unestimulo apetitivo. Si se da la respuesta el estimulo apetitivo se presenta, si no se da larespuesta el estimulo apetitivo no se presenta: existe una contingencia positiva entre laespuesta instrumental y el estimulo positivo. El reforzamiento positivo produce incrementoen la tasa de respuesta.

Castigo: En un procedimiento de castigo, la respuesta instrumental produce o aproxima unestimulo molesto o aversivo. Produce disminución en la respuesta instrumental.

Reforzamiento negativo: En una contingencia negativa, la respuesta retira o previene lapresentacion de un suceso ambiental. Un procedimiento en el que la respuesta instrumentalfinaliza o previene la entrega de un estimulo aversivo se denomina reforzamiento negativo.

Hay dos tipos, escape y evitación.:

En el escape, el estimulo aversivo se presenta pero puede ser eliminado por larespuesta instrumental.La presencia de un estimulo aversivo establece la ocasión para laocurrencia de la respuesta instrumental, entonces es reforzada por la terminación delestimulo aversivo.

La evitación implica la programación de un estimulo aversivo para ser presentado enalgún momento del futuro. En este caso la respuesta instrumental previene la entrega delestimulo aversivo.

Entrenamiento de omisión: Incluye una contingencia negativa entre la respuestainstrumental y un suceso ambiental. En este caso la respuesta instrumental previene lapresentación de un estimulo apetitivo o placentero. A menudo es el preferido para disuadirla conducta humana (niño a su habitación).

Descargado del campus, http://campus.felizmente.info

Page 81: Aprendizaje  resumen jc cabrera temas 1-9

79

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

Los procedimientos de entrenamiento de omisión se denominan en ocasiones reforzamientodiferencial de otras conductas o RDO. Este termino refleja el hecho de que el individuorecibe un estímulo apetitivo periódicamente a condición de que se dedique a realizar otraconducta diferente de la respuesta especificada por el procedimiento. Implica elreforzamiento de “otras” conductas.

La respuesta instrumental disminuye por el castigo y aumenta por el reforzamiento negativo

Elementos fundamentales del condicionamiento instrumental(página 137 del libro)

La esencia de la condcuta instrumental es que esta controlada por sus consecuencias. Elcondicionamiento instrumental consta de tres elementos claves; una respuesta, unaconsecuencia (el reforzador) y una relación o contingencia, entre la respuesta y laconsecuencia.

La respuesta instrumental

El resultado de los procedimientos del condicionamiento instrumental depende en parte dela naturaleza de la respuesta que se este condicionando.Algunas respuestas son masfácilmente condicionables que otras.

Variabilidad conductual versus estereotipia. Thorndike y Skinner enfatizaron que elreforzamiento incrementa la probabilidad de que la respuesta se repita en el futuro. Esteénfasis alentó la creencia de que los procedimientos de condicionamiento instrumentalproducían repeticiones de la misma respuesta - que producían uniformidad o estereotipia enla conducta - . Sin embargo, esto no significa que el condicionamiento instrumental no puedaverse también involucrado en la producción de respuestas creativas o variables. Losorganismos pueden aprender a obtener refuerzo en situaciones donde se requiera haceralgo nuevo. La variabiliad de la respuesta puede ser la base para el reforzamientoinstrumental. (ver ejemplo. Pag 137).

Relevancia o pertinencia en el condicionamiento instrumental: Thorndike propuso eltermino de pertinencia para explicar los fallos en el entrenamiento del rascado y delbostezo, ciertas respuestas se corresponden de forma natural con el reforzador debido a lahistoria evolutiva del animal. Los Breland denominaron deriva instintiva al desarrollo derespuestas como la de hozar en los cerdos y frotar monedas en los mapaches. Estasrespuestas naturales relacionadas con la comida eran aparentemente muy fuertes ycompetían con las respuestas que requería el investigador.

Descargado del campus, http://campus.felizmente.info

Page 82: Aprendizaje  resumen jc cabrera temas 1-9

80

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

Sistemas de conducta y limitaciones en el condicionamiento instrumental. De acuerdocon la teroría de los sistemas de conducta, cuando un animal está privado de comida y seencuentra en una situación donde podría encontrarla, su sistema de alimentación se activa, yse dedica al forrajeo y otras actividades relacionadas con la comida. Sobre este sistema deconducta se superpone un procedimiento de condicionamiento instrumental. La efectividaddel procedimiento para el incremento de una respuesta instrumental dependerá de lacompatibilidad de esa respuesta con la organización preexistente del sistema dealimentación.

Podemos predecir qué respuestas se incrementarán con un reforzamiento de comidamediante el estudio de lo que los animales hacen cuando su sistema de alimentación estáactivado en ausencia de condicionamiento instrumental.

Otra forma de diagnosticar si una respuesta es parte de un sistema de conducta es realizarun experimento de condicionamiento clásico. Un EC llega a elicitar componentes del sistemade conducta activado por el EI. Si la deriva instintiva refleja las respuestas del sistema deconducta, las respuestas análogas a la deriva instintiva deberías ser evidentes en unexperimento de condicionamiento clásico. Timberlake y colaboradores comprobaron estapredicción en ratas utilizando una modificación de los estudios de manipulacion de monedasllevados a cabo por los Brelands.

El reforzador instrumental

Cantidad y naturaleza del reforzador: En un estudio sistemático, Hutt(1954) intentoaislar los efectos de la cantidad y naturaleza del reforzador alimenticio líquido mediante lavariación sistematica de ambos rasgos. Los incrementos en el calidad y cantidad produjeronmayor tasa de respuesta.

Cambios en la naturaleza y la cantidad de reforzador: Se plantea la posibilidad de que laefectividad de un reforzador dependa no sólo de sus propiedades sino también de cómo esereforzador se compara con otros que el individuo haya experimentado. La efectividad de unEI en el condicionamiento clásica depende de cómo se compare el EI con las expectativasdel individuo basándose en la experiencia previa. Esta es la idea fundamental del modeloRescorla-Wagner, si el EI es mayor de lo esperado, producirá condicionamiento excitatorio,si el EI es menor producirá condicionamiento inhibitorio. Los efectos de una cantidad o tipode reforzador dependen de la cantidad y la naturaleza de los reforzadores que el individuoha experimentado previamente.

Mellgren (1972) Los resultados que obtuvo ilustran el fenómeno de contraste positivo: serefiere a una elevada respuesta por una recompensa favorable, resultado de unaexperiencia anterior con una consecuencia menos atractiva y contraste negativo: se refiere

Descargado del campus, http://campus.felizmente.info

Page 83: Aprendizaje  resumen jc cabrera temas 1-9

81

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

a una respuesta disminuida por una recompensa desfavorable debido a una experienciaanterior con una consecuencia mejor. Los efectos de contraste también se dan si lascondiciones de recompensa se modifican una y otra vez con una clave diferente sañalandocada condición de recompensa, estos efectos son ejemplo de contraste conductualsimultaneo.

Todos los efectos de contraste ilustran que la efectividad de un reforzador en unasituación esta determinada en parte por las experiencias del organismo con reforzadores enotras situaciones. Por razones que no están totalmente claras, el contraste negativo se haobtenido de forma más clara que el contraste positivo.

La relación respuesta-reforzador

Unas veces existe una fuerte relación entre la conducta y sus consecuencias (introducir unamoneda en una maquina y obtener un refresco), en otras no (llevar una camiseta roja alexamen y sacar buena nota) y también puede ser probabilistica (hacer llamadas de telefonoy encontrar a alguien que te ayude).

Existen dos tipos de relaciones entre una respuesta y un reforzador:1.- La relación temporal , que se refiere al tiempo que transcurre entre la respuesta

y el reforzador. Un tipo especial es la contigüidad temporal, la cual se refiere a la entregadel reforzador inmediatamente después de la respuesta.

2.- La relación causal o contingencia respuesta-reforzador, se refiere al hecho deque la respuesta instrumental es necesaria y suficiente para la ocurrencia del reforzador.Los factores temporales y causales son independientes unos de otros.

Ambas son independientes unos de otros .

Efectos de contigüidad temporal. El reforzamiento inmediato es preferible alreforzamiento demorado. Los psicólogos del aprendizaje han resaltado que elcondicionamiento instrumental requiere porporcionar el reforzador inmediatamentedespués de la ocurrencia de la respuesta instrumental. Grice informo que el aprendizajeinstrumental puede deteriorarse con demoras tan cortas como 0.5 seg.

Hay varios factores que pueden contribuir a este deterioro. Cuando el reforzamiento esdemorado tras la realización de una respuesta, R1, el organismo no deja de hacer cosas, R2R3 R4 etc. Si el reforzador se establece en R1 pero no se entrega hasta algún tiempo

Hay una relación causal fuerte entre presentar una solicitud de admisión y ser aceptado, pues si no lo solicitas es seguro queno será aceptado; sin embargo, la relación temporal entre solicitar y ser admitido es débil porque puede pasar semanas omeses sin conocer la respuesta a la solicitud despues de haberla presentado.

Descargado del campus, http://campus.felizmente.info

Page 84: Aprendizaje  resumen jc cabrera temas 1-9

82

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

después, el reforzador puede ocurrir después de alguna otra respuesta por ej. R5. Paraasociar R1 con el reforzador, el organiso tiene que poder distinguir R1 de otras respuestasque realiza durante el intervalo de demora.

Hay dos formas de resolver este problema.La primera técnica, es proporcionar un reforzador secundario o condicionado

inmediatamente después de la respuesta instrumental. Un reforzador condicionado osecundario es un estímulo condicionado que previamente ha sido asociado con el reforzador.

Otra técnica es marcar la respuesta instrumental criterio de alguna manera parahacerla distinguible de otras actividades del organismo.La efectividad del procedimiento demarcado se demostró por primera vez por Lieberman, Mcintosh y Thomas (1979)

La contingencia respuesta-reforzador. Los estudios de demora del reforzamientomuestran que no es suficiente una relación causal perfecta entre la respuesta y elreforzador para producir una respuesta instrumental vigorosa. Incluso con una relacióncausal perfecta, el condicionamiento no ocurre si el reforzamiento es demorado durantedemasiado tiempo. Se concluyó que la contigüidad respuesta-reforzador más que lacontingencia era el factor critico que producía el aprendizaje instrumental. No obstante,esta visión ha resultado injustificada por la investigación posterior. La contingenciarespuesta-reforzador es también importante.

El experimento de superstición Skinner. Fue un hito en el debate acerca del papel de lacontigüidad frente a la contingencia en el aprendizaje instrumental. Skinner situó palomasen cámaras experimentales independientes y montó el equipo para entregar una cantidad dede comida cada 15 segundos independientemente de lo que las palomas estuvieran haciendo.Las palomas parecían estar respondiendo como si la conducta controlara la entrega delreforzador. Skinner denominó a esto conducta supersticiosa.

La conducta supersticiosa descansa en la idea de reforzamiento accidental o adventicio.Se refiere al emparejamiento accidental de una respuesta con la entrega de un reforzador,un segundo emparejamiento accidental aumenta aún más la probabilidad de la respuesta, deesta forma cada emparejamientno ayuda a estampar una respuesta particular.

1º- Reinterpretación del experimento de superstición: la afirmacion de Skinner ha sidopuesta en duda por la evidencia empirica posterior. Stadon y Simmelhag (1971) realizaronobservaciones más extensas, definieron y midieron la ocurrencia de muchas respuestas,algunas respuesta ocurrían de modo predominante hacia el final del intervalo entrereforzadores, las llamaron respuestas terminales. Otras aumentaron tras la entrega delreforzador y disminuían a medida que se acercaba el tiempo de la siguiente comida;respuestas de interin.

Descargado del campus, http://campus.felizmente.info

Page 85: Aprendizaje  resumen jc cabrera temas 1-9

83

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

Las acciones que eran respuestas terminales y las que eran respuestas de interin novariaban mucho de una paloma a otra. No encontraron evidencia de reforzamientoaccidental. La investigacion posterior ha proporcionado mucha evidencia adicional de que laspresentaciones periodicas de un reforzador producen regularidades en la conducta.

2º-Explicación de la periodicidad de las respuestas de interin y terminales. Staddon ySimmelhag sugirieron que las respuestas terminales son respuestas típicas de la especie quereflejan la anticipación de la comida a medida que el tiempo se encuentra más cerca de lapróxima presentación de comida. En contraste, entendieron las respuestas de interin comouna manifestación de otras fuentes de motivación que eran mas importantes al comienzo delintervalo entre comidas, cuando la presentación de comida era improbable. Losinvestigadores posteriores, sin embargo han favorecido aproximaciones en las cuales lasrespuestas terminales y de interin se consideran diferentes manifestaciones del mismosistema motivacional.

La teoría de sistema de conducta, el sistema de alimentación está activado en animalesprivados de comida a los que se les proporciona periódicamente pequeñas cantidades decomida. Justo después de la entrega de comida se asume que el organismo realiza respuetasde búsqueda focalizada poscomida, que involucra actividades cercana a la comida. En mediodel intervalo entre entregas ocurren respuestas de búsqueda general, que aleja al suejto dela comida. En el momento de la próxima entrega de comida ocurre la respuesta de búsquedafocalizada.

Congruente con la teoría de los sistemas de conducta, la distribución de las actividades sedesarrollan con la entrega periodica de un reforzador depende de la naturaleza de esereforzador. Por ejemplo, se desarrollan diferentes patrones de conductas conpresentaciones de comida o agua, debido a que activan diferentes patrones de forrajeo.

Efectos de la controlabilidad de los reforzadores. Una contingencia fuerte entre unarespuesta instrumental y un reforzador esencialmente significa que la respuesta controla elreforzador, esto es, que el reforzador suceda depende de si ha ocurrido la respuestainstrumental. Los estudio acerca de los efectos de control sobre reforzadores hanproporcionado la evidencia mas amplia de la sensibilidad de la conducta a las contingenciasrespuesta-reforzador. La mayoría de la investigación se ha centrado en los efectos decontrol sobre la estimulación aversiva, esa se origino con los estudios pioneros de Seligman,Overmier y Maier, quienes investigaron los efectos de la exposición a una descargaincontrolable en el aprendizaje posterior de escape-evitación en perros. El hallazgo másimportante fue que la exposición a una descarga incontrolable dificultaba el aprendizajeposterior: Efecto de indefensión aprendida.

Descargado del campus, http://campus.felizmente.info

Page 86: Aprendizaje  resumen jc cabrera temas 1-9

84

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

1º - Diseño tríadico: los experimentos sobre indefensión aprendida se realizan normalmenteutilizando este diseño, incluye dos fases: exposición, un grupo de ratas (E escape) esexpuesto a descargas periodicas que puede fianlizar mediante la realización de un respuestade escape. Cada sujeto del segundo grupo (A, acoplado) es acoplado a un animal del grupo Ey recibe las mismas descargas, pero el grupo A no puede hacer nada por evitarlas. El tercergrupo (C confinado), no recibe descargas durante la fase de exposición pero esta confinadoen el aparato tanto tiempo como los otros grupos. Durante la fase de condicionamiento, lostres grupos reciben entrenamiento escape-evitacion. El hallazgo destacable es que losefectos de la estimulación aversiva durante la fase de exposición dependen de si ladescarga es o no es escapable. La exposición a una descarga incontrolable (grupo A) produceuna severa interrupción del aprendizaje posterior de escape-evitacion, esto indica que losanimales son sensibles a las diferencias procedimentales entre la descarga escapable y ladescarga inescapable. La principal diferencia procedimental entre los grupos E y A es lapresencia de una contingencia respuesta-reforzador para el grupo E pero no para el grupoA.

2º- La hipótesis de la indefensión aprendida: la primera explicación importante estababasada en la conclusión de que los animales pueden percibir la contingencia entre suconducta y la entrega de un reforzador. La hipótesis de la indefensión aprendida asumeque durante la exposición a descargas incontrolables, los animales aprenden que lasdescargas son independientes de su conducta. Es más, llegan a esperar que los reforzadorescontinuaran siendo independientes de su conducta . Esta expectativa de ausencia decontrol debilita su habilidad para aprender una nueva respuesta instrumental. Esto ocurrepor dos razones , primero, la expectativa de falta de control reduce la motivación de lossujetos para realizar una respuesta instrumental; segundo, incluso si realizan la respuesta yson reforzados en la fase de condicionamiento, la expectativa previamente aprendida defalta de control hace mas difícil para los sujetos aprender que su conducta es ahoraefectiva para producir reforzamiento.

Es importante distinguir la hipótesis de indefensión aprendida del efecto de indefensiónaprendida . El efecto de indefensión aprendida es el patrón de resultados obtenido con eldiseño tríadico, este ha sido reproducido en numerosos estudios y es un hallazgo bien

EL DISEÑO TRIÁDICO UTILIZADO EN LOS ESTUDIOS DEL EFECTO DE INDEFENSIÓN APRENDIDA

FASE DEGRUPO FASE DE EXPOSICIÓN CONDICIONAMIENTO PRUEBA .

Grupo E Descarga escapable Escape-evitación Aprendizaje rápido de evitación

Grupo A Descarga acoplada inescapable Escape-evitación Aprendizaje lento de evitación

Grupo C Confinado al aparato Escape-evitación Aprendizaje rápido de evitación

Descargado del campus, http://campus.felizmente.info

Page 87: Aprendizaje  resumen jc cabrera temas 1-9

85

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

establecido. En contraste, desde que se propuso, la hipótesis de indefensión aprendida hasido una explicación sugestiva y controvertida del efecto de indefensión aprendida.

3º- Déficit de actividad: El déficit de aprendizaje observado en el grupo A era resultado deque aprendían a ser inactivos durante la fase de exposición. Congruente con esta hipótesis,en algunas situaciones la descarga inescapable produce una disminución en el movimientomotor, y a esto se deberían los posteriores déficits de actuación. Hay también situacionesen las cuales los efectos del aprendizaje probablemente no son debidos a la supresión delmovimiento causada por la descarga inescapable. Por tanto, la hipótesis de la inactividadaprendida no puede explicar todos los ejemplos de efectos de indefensión aprendida.

4º- Déficit atencional: Que la descarga provoque que los animales presten menos atención asus acciones. Si un animal no presta atención a su conducta, tendrá dificultad para asociarsus acciones con los reforzadores en el escape.-evitacion o en otras formas decondicionamiento instrumental.

Maier, Jackson y Tomie (1987) probaron esta hipótesis de déficit atencional con ratas,razonaron que la atencion reducida a la conducta instrumental también podía ser aliviadamediante la introducción de una clave externa de retroalimentación de la respuesta oestímulo de marcado.

5º- Relaciones estimulares en el condicionamiento de escape: Resulta evidente que elcondicionamiento de escape resulta mas complejo de lo que se pensaba anteriormente. Elrasgo definitorio de la conducta de escape es que la respuesta instrumental tiene comoconsecuencia la terminación de un estimulo aversivo. Realizar la respuesta de escape tienecomo resultado claves internas de retroalimentación de la respuesta. Algunos de estosestimulos producidos por la respuesta son experimentados al comienzo de la respuesta deescape, justo antes de que la descarga se retire, y se denominan claves de retroalimen-tacion de la terminación de la descarga. Otros estimulos producidos por la respuesta sonexperimentados cuando el animal completa la respuesta, justo después de que la descargase haya retirado al comienzo del intervalo entre ensayos, estos se denominan claves deretroalimentación de la señal de seguridad. Estas son seguidas de forma fiable por elintervalo entre ensayos, y por tanto por la ausencia de descarga. En consecuencia, estasclaves contextuales pueden llegar a convertirse en inhibidores condicionados del miedo ylimitan o inhiben el miedo elicitado por las claves contextuales de la cámara experimental.Estas señales de seguridad no existen para los animales que están acoplados a la descargainescapable porque, para ellos, los periodos de descarga no descarga no son predecibles.

Centrarse en los factores estimulares del condicionamiento de escape en lugar de lascontingencias respuesta-reforzador no ha permitido todavía el desarrollo de una explicacióncomprensiva de todos los resultados con el diseño tríadico.

Descargado del campus, http://campus.felizmente.info

Page 88: Aprendizaje  resumen jc cabrera temas 1-9

86

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

Contiguidad y contingencia: comentarios finales (pagina 156 del libro)

Como se ha descrito, los organismos son sensibles a la contigüidad tanto como a lacontingencia entre una respuesta instrumental y un reforzador. Normalmente, estos dosaspectos de la relación entre la respuesta y el reforzador actúan en conjunto para producirel aprendizaje. Ambos factores sirven para entender los efectos del reforzamiento en larespuesta instrumental. La relación causal, o contingencia, asegura que el reforzador esentregado sólo tras la ocurrencia de la respuesta instrumental especificada. La relación decongigüidad asegura que otras actividades no se interpongan entre la respuestaespecificada y el reforzador para interferir en el condicionamiento de la respuesta crítica.

Términos clave (pagina 160 del libro)

Castigo Procedimiento de condicionamientoinstrumental en el cual hay una contingenciapositiva entre la respuesta instrumental y unestímulo aversivo. Si el sujeto realiza la respues-ta instrumental, recibe el estímulo aversivo; si elsujeto no realiza la respuesta instrumental, norecibe el estímulo aversivo.

Conducta instrumental Actividad que ocurre debidoa su efectividad para producir una consecuenciaparticular o reforzador.

Conducta supersticiosa Conducta que se incrementaen frecuencia debido a emparejamientos acciden-tales de la entrega de un reforzador con ocurre-ncia de la conducta.

Contigüidad Ocurrencia simultánea ( o casi simultá-nea) de dos eventos, como una respuesta y unreforzador. También denominada contigüidadtemporal.

Contigüidad temporal Lo mismo que contigüidad.

Contingencia respuesta-reforzador Relación causalentre una respuesta y un reforzador, medida entérminos de la probabilidad de ser reforzado porrealizar la respuesta en comparación con laprobabilidad de ser reforzado en ausencia de larespuesta.

Contraste conductual simultáneo Efectos decontraste conductual (contraste positivo ynegativo) que están producidos por frecuentescambios entre una condición de recompensafavorable y una desfavorable, con cada condiciónde recompensa asociada a su propio estímulodistintivo.

Contraste negativo Respuesta menor a unreforzador desfavorable tras una experienciaprevia con un reforzador más deseado que enausencia de esa experiencia previa.

Contraste negativo Respuesta mayor a un estímulofavorable tras una experiencia previa con unreforzador menos deseado que en ausencia de esaexperiencia previa.

Deriva instintiva Deriva gradual de la conductainstrumental que se aleja de las respuestasrequeridas para el reforzamiento haciarespuestas típicas de la especie o “instintivas”relacionadas con el reforzador y con otrosestímulos de la situación experimental.

Efecto de indefensión aprendida Interferencia enel aprendizaje de nuevas respuestas instrumen-tales como resultado de la exposición a estimula-ción aversiva inescapable e inevitable.

Descargado del campus, http://campus.felizmente.info

Page 89: Aprendizaje  resumen jc cabrera temas 1-9

87

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

Entrenamiento al comedero Estadio preliminar delcondicionamiento instrumental en el cual unestímulo es repetidamente emparejado con elreforzador a fin de capacitar al sujeto paraaprender a ir a recoger el reforzador cuando sepresenta. El sonido del mecanismo de la entregade comida, por ejemplo, puede ser repetidamenteemparejado con la comida, por lo que el animalaprenderá a ir al cuenco de comida cuando ésta seentregue.

Entrenamiento de omisión Procedimiento deconicionamiento instrumental en el cual larespuesta instrumental previene la presentaciónde un estímulo refonzante. ( Véase tambiénreforzamiento diferencial de otras conductas)

Escape Procedimiento de condicionamiento instru-mental en el cual la respuesta intrumental finalizaun estímulo aversivo ( Véase tambien reforza-miento negativo.)

Estímulo apetitivo Estímulo placentero osatisfactorio que puede utilizarse para reforzarpositivamente una respuesta instrumental.

Estímulo aversivo Estímulo displacentero o molestoque puede ser utilizado para castigar unarespuesta instrumental.

Evitación Procedimiento de condicionamiento instru-mental en el cual la respuesta instrumental pre-viene la administración de un estímulo aversivo.

Hipótesis de la indefensión aprendida Idea teóricaque asume que durante la exposición aestimulación aversiva inescapable e inevitable, lossujetos aprenden que su conducta no controla loseventos ambientales.

Latencia Tiempo entre el inicio de un ensayo (o elinicio de un estímulo) y la respuesta instrumental.

Ley del efecto Regla de la conducta instrumental,propueta por Thorndike, que establece que si unarespuesta en presencia de un estímulo es seguidapor un evento satisfactorio, la asociación entre elestímulo y la respuesta se fortalecerá; si larespuesta es seguida por un evento molesto, laasociación se debilitará.

Método de ensayo discreto Método decondicionamiento instrumental en el cual el sujetopuede realizar la respuesta instrumental sólodurante períodos específicos normalmentedeterminados bien por el emplazamiento delsujeto en una cámara experimental o porlapresentación de un estímulo.

Método de operante libre Método decondicionamiento instrumental que permite laejecución repetida de la respuesta instrumentalsin que el sujeto sea retirado de la cámaraexperimental. (Compárese con el método deensayo discreto).

Moldeamiento Reforzamiento de aproximacionessucesivas a la respuesta instrumental deseada.

Pertinencia La idea teórica, originalmente propuestapor Thorndike, de que la historia evolutiva de unorganismo hace que ciertas respuestas encajen ose correspondan con ciertos reforzadores. Lapertinencia facilita el aprendizaje.

Procedimiento de marcado Procedimiento en el cualla respuesta instrumental es inmediatamenteseguida por un evento distintivo (el sujeto esrecogido, o se presenta un destello de una luz)que hace que la respuesta instrumental sea másfácil de memorizar y ayuda a superar los efectosperjudiciales del reforzamiento demorado.

Reforzador condicionado Estímulo que se convierteen un reforzador efectivo debido a su asociacióncon un reforzador primario o incondicionado.También denominado reforzador secundario.

Reforzador secundario Lo mismo que reforzadorcondicionado.

Reforzamiento accidental Caso en cual la entregade un reforzador coincide con una respuestaparticular incluso si esta respuesta no esresponsable de la presentación del reforzador.También denominado reforzamiento adventicio.

Reforzamiento adventicio Lo mismo quereforzamiento accidental.

Descargado del campus, http://campus.felizmente.info

Page 90: Aprendizaje  resumen jc cabrera temas 1-9

88

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 5: Condicionamiento instrumental: Fundamentos

Juan Carlos Cabrera

Reforzamiento diferencial de otras conductasProcedimiento de condicionamiento instrumentalen el cual un reforzador positivo esperiódicamente entregado sólo si el sujeto norealiza una respuesta particular. Abreviado RDO.

RDO Abreviación de reforzamiento diferencial deotras conductas.

Reforzamiento negativo Procedimiento decondicionamiento instrumental en el cual hay unacontingencia negativa entre la respuestainstrumental y un estímulo aversivo. Si larespuesta intrumental es realizada, el estímuloaversivo finaliza o se previene; si la respuestainstrumental no se realiza, se presenta elestímulo aversivo.

Reforzamiento positivo Procedimiento decondicionamiento instrumental en el cual hay unacontingencia positiva entre la respuestaintrumental y un estímulo reforzante. Si el sujetorealiza la respuesta, recibe el estímuloreforzante; si el sujeto no realiza la respuesta, norecibe elestímulo reforzante.

Respuesta de ínterin Respuesta que aumenta enfrecuencia después de la entrega de unreforzador periódico y que disminuye a medidaque se aproxima el siguiente reforzador.

Respuesta operante Respuesta que se define por elefecto que produce en el ambiente. Los ejemplosincluyen presionar una palanca y abrir una puerta.Cualquier secuencia de movimientos que emuje lapalanca hasta abajo o abra la puerta constituye unejemplo de esa operante particular.

Respuesta terminal Respuesta que es más probableal final del intervalo entre sucesivosreforzadores que están presentes a intervalosfijos.

Velocidad de la carrera Rapidez (en metros porsegundo, por ejemplo) con que se mueve un animalpor un corredor.

Descargado del campus, http://campus.felizmente.info

Page 91: Aprendizaje  resumen jc cabrera temas 1-9

89

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera – 2009/2010

Programas simples de reforzamiento intermitente- Programa de razón- Programas de intervalo- Comparación de los programas de razón y de intervalo- Programas de reforzamiento de tasas de respuesta

Conducta de elección: programas concurrentes- Medidas de la conducta de elección- La ley de la igualación- Mecanismos de la ley de la igualación

Elección con compromiso- Programas concurrentes encadenados- Estudios de "autocontrol"

Comentarios finales

Descargado del campus, http://campus.felizmente.info

Page 92: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 93: Aprendizaje  resumen jc cabrera temas 1-9

91

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Un programa de reforzamiento es un programa, o regla, quedetermina cómo y cuándo la ocurrencia de una respuesta iraseguida de un reforzador. Este puede establecerse deinfinidad de formas. Los programas de reforzamiento queincluyen relaciones similares entre los estímulos, lasrespuestas y los reforzadores, normalmente producenpatrones de conducta similares. Los programas de reforzamiento influyen tanto en laforma de aprender una respuesta instrumental como en la forma en que se mantiene elreforzamiento.

Zeiler (1984) denominó a los programas de reforzamiento el gigante durmiente del análisisde la conducta.

PROGRAMAS SIMPLES DE REFORZAMIENTO INTERMITENTE(página 154 del libro)

Los programas que organizan y dirigen la ejecución instrumental se activan de diferentesformas por los distintos programas de reforzamiento. En los programas "simples", un sólofactor determina qué ocurrencia de la respuesta instrumental se refuerza.

Programas de razón

La característica definitoria de un programa de razón es que el reforzamiento dependesólo del número de respuestas que el organismo realiza. Un programa de razón sólo requierecontar el número de respuestas que ha ocurrido y entregar el reforzador cad vez que sealcance el número requerido. Si este número es uno, cada ocurrencia e la respuestainstrumental provacará la entrega de reforzador. Este tipo de programa se denominatécnicamente reforzamiento continuo (abreviado RFC).

Las situaciones en las que la respuesta se refuerza sólo alguna vez, reforzamiento parcial ointermitente.

Razón fija. Por ejemplo, la entrega de un reforzador después de cada décima respuesta depresión de palanca en un estudio con ratas de laboratorio. En un programa como éste, hayuna razón fija entre el número de respuestas que la rata realiza y el número dereforzadores que consigue. Esto convierte al procedimiento en un programa de razón fija.El procedimiento podría denominarse programa de reforzamiento de razón fija (RF 10).

En la vida real, no siempre quedamos una respuesta, aparecerá unreforzador.

El programa de reforzamientodetermina cuándo la ocurrenciade la respuesta va a ir seguidade un reforzador

Descargado del campus, http://campus.felizmente.info

Page 94: Aprendizaje  resumen jc cabrera temas 1-9

92

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Un programa de reforzamiento continuoconstituye también un programa de razón fija. Esuna razón fija de una respuesta por reforzador,en la que los organismos suelen responder con unatasa de respuesta constante pero moderada.

Se da un patrón de respuesta diferente cuando se trata de un programa de razónintermitente de razón fija.

El patrón típico de los programas de razón fija es que se da una tasa constante y alta unavez que la conducta se ha iniciado, pero se puede tardar un tiempo antes de comenzar elnúmero requerido de respuestas. Estas se muestran con claridad en un registro acumulativode la conducta.

Un registro acumulativo es una forma especial de representar la forma de repetirse unarespuesta a lo largo del tiempo. Muestra el número total (o acumulativo ) de respuestas quehan ocurrido hasta un momento determinado en el tiempo.

El registro acumulativo propor-ciona una representación visualcompleta de cuando y con quefrecuencia responde el sujetodurante la sesión.

La tasa cero de respuesta quese observa justo después delreforzamiento se llama pausaposreforzamiento. La tasa altay estable que completa cadarequerimiento de la razón sellama carrera de la razón.

Si el requerimiento de la razón se incrementa un poco ( de una RF 120 a un RF 150), la tasade respuesta puede permanecer igual durante la carrera de razón. Con mayoresrequerimientos de tasa, tienden a ocurrir pausas posreforzamiento más largas. Si elrequerimiento de la razón sufre un aumento súbito y significativo (de RF 120 a RF 500) esprobable que el animal realice una pausa periodica cada vez que complete la razón requerida,este efecto se llama tensión de la razón. En casos exremos, la tensión de la razón puedeser tan grande que el animal deje de responder. La longitud de la pausa posreforzamientoesta controlada por el requerimiento de la razón subsiguiente, por tanto podría recibir elnombre de pausa pre-razón.

Programa de reforzamiento continuo:Cada respuesta correcta es reforzada.

Programa de reforzamento parcial o intermitente:No todas las respuestas correctas son reforzadas ypueden ser de varios tipos.

Descargado del campus, http://campus.felizmente.info

Page 95: Aprendizaje  resumen jc cabrera temas 1-9

93

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Razón variable. Es un procedimiento en el que se necesita un número de respuestas distintopara la entrega de cada recompensa. El valor numérico del programa de razón variable (RV)indica el número medio de respuestas requerido para conseguir el reforzador.

Debido a que el número de respuestas necesario para conseguir el reforzamiento no espredecible, las pausas predecibles en la tasa de respuesta son menos probables con estosprogramas RV que con los programas de RF. Los organismos suelen responder con una tasaclaramente estable en los programa RV.

Aunque pueden darse pausas posreforzamiento en los programas de razón variable, estasson mas largas y prominentes en los programas de razón fija. La tasa global de respuesta enlos programas de RF y RV es similar siempre y cuando, como promedio, se requieran númerossimilares de respuestas. Sin embargo, la tasa global de respuesta tiende a distribuirse enun patrón de pausa-carrera con los programa de RF, mientras que se observa un patrón másestable con los de RV.

Programas de intervalo

Las respuestas son reforzadas sólo si ocurren cuando ha transcurrido una cierta cantidadde tiempo.

Intervalo fijo: el tiempo no varia de una ocasión a la siguiente. Se dan en situaciones dondese requiere una cantidad fija de tiempo para dispensar el reforzador. A medida que eltiempo para la disponibilidad del próximo reforzador se acerca, la tasa de respuestaaumenta, este aumento de la tasa de respuesta se manifiesta como una aceleración delregistro acumulativo al final del IF, este se denomina por consenso festón de intervalofijo. La pusa posreforzamiento y el aceleron posterior hacia el final del intervalo reflejanuna habilidad rudimentaria para contar el tiempo, En un estudio se uso como reloj un puntode luz que crecia a medida que el tiempo pasaba. L introducción de este estimulo relojincremento la pausa posreforzamiento y provoco que la respuesta se desplazase mas cercadel final del ciclo IF.

Programa de RAZÓN:El reforzador se otorga en función del número de respuestas.

• Razón Fija (RF): El número de respuestas necesarias para obtener un reforzador es siempre el mismo.Ejemplo: RF5 = Cada 5 respuestas, me dan un premio.El programa de RF1 es un programa de reforzamiento continuo.Produce pausas post-reforzamiento.

• Razón variable (RV): El número de respuestas necesarias para obtener un reforzador va variando.Ejemplo: RV5 = Cada 5 respuestas de media, me dan un premio.

Descargado del campus, http://campus.felizmente.info

Page 96: Aprendizaje  resumen jc cabrera temas 1-9

94

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Un programa IF no garantiza que el reforzador se proporcionara en algún momento a lolargo del intervalo, el intervalo sólo determina cuándo el reforzador esta disponible, nocuando se entrega.

Intervalo variable: (IV), las respuestas se refuerzan si se dan tras haber transcurrido unintervalo variable desde la administración del reforzador previo. Se hallan en situacionesdonde se requiere una cantidad de tiempo impredecible para preparar o dispensar elreforzador.El sujeto en los programas IV tiene que realizar la respuesta instrumental para obtener elreforzador., no se dan gratis, se dan solo si el organismo responde tras un intervalovariable. Los programa IV mantienen tasa de respuesta constantes y estables sin pausasregulares.

Programas de intervalo y esperalimitada: Con los programas fuera delaboratorio, es mas común que losreforzadores estén disponibles durantetiempo limitado. Este tipo derestricción en cuanto al tiempo quepermanece el reforzador disponible sellama espera limitada. Las restriccionesde la espera limitada pueden añadirsetanto a los programas de intervalo fijocomo a los de intervalo variable

Programa de INTERVALO:El reforzador se otorga en función del tiempo que ha transcurrido desde el último reforzador (Pero todavía hay queresponder al menos 1 vez para obtener el reforzador

• Intervalo Fijo (IF): El tiempo que pasa entre dos reforzamientos es siempre el mismo.Ejemplo: IF5 = Cada 5 segundos, el reforzador está disponible (cada cinco segundos, si respondo me dan un premio.Produce pausas post-reforzamiento y aceleración pre-reforzamiento (Patrón “festoneado”)

• Intervalo variable (IV): El tiempo que pasa entre dos reforzadores va variando.Ejemplo: IV5 = Cada 5 respuestas de media, el reforzador está disponible.

Descargado del campus, http://campus.felizmente.info

Page 97: Aprendizaje  resumen jc cabrera temas 1-9

95

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Comparacion de los programas de razón e intervalo

Hay similitudes entre los patrones de respuesta, tanto los programas RF como los IFproducen una pausa posreforzamiento después de la administración del reforzador.Producen altas tasas de respuestajusto antes de la administración delsiguiente reforzador. Por elcontrario, los programas de RV y deIV mantienen tasas estables derespuesta, sin pausas predecibles.Los programas de intervalo y derazón activan diferentes cambiosneuroquímicos en el cerebro.La conducta mantenida porprogramas de intervalo estamediada por el sentido temporal delorganismo, en los programas de razón no.La primera evidencia sobre las diferencias entre programas de intervalo y de razón fueproporcionada por un importante experimento de Reynolds (1975), ver pag 169-170 libro.

Reforzamiento diferencial del tiempo interres-puesta. ¿Por qué los programas de razón soncapaces de producir tasas más altas de respuestaque los programas de intervalo? El factor critico esel espaciamiento entre respuestas que se da justoantes del reforzamiento. El intervalo entre unarespuesta y la siguiente se denomina tiempointerrespuesta o TIR. Si se refuerzan TIRs cortos,será mas probable que el sujeto realice TIRscortos, si se refuerzan TIRs largos será masprobable que el sujeto realice TIRs largos. En unprograma de razón , no hay restricciones acerca decuando cuentan las respuestas para conseguir elreforzador, esto es no se espera mucho entre las

respuestas. Los programas de intervalo favorecen TIRs largos.

¿Cuál produce más respuesta?

Los programas que más respuestas producenson los de RAZÓN, porque en los de intervalo elreforzador se obtiene por esperar al momentoidóneo, no por dar un número determinado derespuestas.

¿Cuál produce más respuestas?

Los programas fijos producen menosrespuestas que los variables porque son máspredecibles. Además son más faciles de extinguir(tema 9).

De modo que el programa más efectivopara crear respuestas es el de razónvariable ( Ejemplo: máquina tragaperras, por esoson tan “adictivas” y peligrosas)

Descargado del campus, http://campus.felizmente.info

Page 98: Aprendizaje  resumen jc cabrera temas 1-9

96

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Programas de reforzamiento de tasas de respuesta.

Requieren específicamente que el organismoresponda a una tasa particular de respuesta. Elreforzamiento de una respuesta particular dependede cuan pronto ocurra tras la respuestaprecedente. Reforzamiento diferencial de tasaaltas (RDA): una respuesta se refuerza sólo siocurren antes de que haya transcurrido ciertacantidad de tiempo tras la respuesta precedente.Reforzamiento diferencial de tasas bajas (RDB):una respuesta se refuerza sólo si ocurre despuésde que haya transcurrido cierta cantidad de tiempodesde la respuesta previa.

CONDUCTA DE ELECCIÓN: PROGRAMAS RECURRENTES(página 154 del libro)

Históricamente se estudio con laberintos enforma de T. Las aproximaciones recientes alestudio de la conducta de elección utilizancajas de Skinner equipadas con dosmanipulandos (dos botones). En elexperimento típico, responder en cada teclaes reforzado según algún programa dereforzamiento. Los dos programas funcionanal mismo tiempo (o concurrentemente) y elsujeto es libre de cambiar de una tecla a otra, este tipo de procedimiento se llamaprograma concurrente, permite una medicion continua de la elección porque el organismo eslibre para cambiar de una tecla a otra en cualquier momento.

Además de las respuestas independientes,también podemos reforzar la tasa de respuesta (lavelocidad a la que se dan las respuestas).

Ejemplo: quiero que un animal dé cómo mínimo12 respuestas por minuto. Entonces le doy elreforzador sólo si produce una respuesta en los 5segundos siguientes a la anterior respuesta. Siresponde cada 5 segundos o menos, tiene unatasa de 12 respuestas por minuto, lo que yoquería. Si tarda más de 5 segundos en responder,no es reforzado aunque responda. Eso hará quese vuelva más rápido en el futuro.

Si te dejan elegir, ¿qué prefieres hacer?

En los programas concurrentes se deja elegir al animalentre dos programas de reforzamiento

Descargado del campus, http://campus.felizmente.info

Page 99: Aprendizaje  resumen jc cabrera temas 1-9

97

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Medidas de la conducta de elecciónLa conducta de elección de un organismo en unprograma concurrente se refleja en ladistribución de su conducta entre dosrespuestas alternativas. Una técnica común demedición es calcular la tasa relativa derespuestas de cada alternativa.

RA / (RA+RB)

La forma en que un individuo distribuye suconducta entre dos alternativas esta muyinfluida por el programa de reforzamiento quefunciona para cada respuesta. La tasa relativade reforzamiento para cada alternativa derespuesta puede calcularse de una manerasemejante a la tasa relativa de respuesta.

rA/(rA+rB)

La ley de la igualación

Herrnstein (1961) estudio la distribución delas respuestas en varios programasconcurrentes IV-IV en los cuales la tasa totalmáxima de reforzamiento que las palomaspodían obtener estaba fijada en 40 por hora.Dependiendo del valor exacto de cadaprograma de IV, se podían obtener diferentesproporciones de los 40 reforzadores y nohabía restricciones acerca de cual teclapodían picotear. Los sujetos distribuyeron susrespuestas de una manera altamentepredecible, la tasa relativa de respuesta enuna alternativa dada, estaba siempre muy cercana a igualar la tasa relativa dereforzamiento en esa alternativa, por tanto la tasa de respuesta en una alternativa seiguala con la tasa relativa de reforzamiento en esa alternativa: ley de la igualación.RA/(RA+RB)=rA/(rA+rB) o RA/RB=rA/rB; las tasas relativas de respuesta se igualan con lastasas relativas de reforzamiento.

RA/RB= rA/rB

Para saber qué programa prefiere seguir la paloma,recurriremos a la tasa relativa de respuestas.

BA

A

RRR+

= Atecla de respuestas de relativa Tasa

Si la paloma no tiene ninguna preferencia en especial, latasa relativa se queda en 0,5.

Para saber que programa administra más reforzadores a lapaloma, recurriremos a la tasa relativa de reforzamiento.

BA

A

rrr+

= Atecla de ntoreforzamie de relativa Tasa

Si la paloma recibe reforzadores con la misma frecuncia encada lado, la tasa relativa se queda en 0,5.

Ley de la igualación (Herrnstein)

La tasa de respuesta = tasa de reforzamiento

BA

A

BA

A

rrr

RRR

+=

+

O sea, que la paloma responde más en el programaque más reforzadores le proporciona.

Si te dejan escoger entre pasar una tarde en el cine opaseando con un amigo, escogerás probablemente laactividad más reforzante.

Descargado del campus, http://campus.felizmente.info

Page 100: Aprendizaje  resumen jc cabrera temas 1-9

98

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Infraigualacion, supraigualacion y sesgo de respuesta.

La tasa relativas de respuestano siempre se igualan con lastasas relativas de reforza-miento. Para acomodarlo añadie-ron dos parametros, b y s a laecuación: RA/RB=b(rA/rB)S ,donde s representa la sensibili-dad de la conducta de elección alas tasas relativas de reforza-miento para las alternativas derespuesta. Cuando ocurre unaigualacion perfecta s=1.0.

Un tipo de desviación de laiguala-ción perfecta incluye unasensi-bilidad reducida de laconducta de elección a las tasas relativas de reforzamiento: infraigualación y puedenacomodarse mediante la ecuación de arriba dotando al exponente s de un valor menor que1.0, indicando la sensibilidad reducida a la tasa relativa de reforzamiento.

En otros ejemplos, la tasa relativa de respuesta es mas sensible a la tasa relativa dereforzamiento de lo que se predice para una igualación perfecta: supraigualación, dotandoal exponente s un valor mayor que uno, indicando el aumento de la sensibilidad de estefactor.

Es más probable que las elecciones muestren sensibilidad reducida a las tasas relativas dereforzamiento que sensibilidad reducida a las mismas. El parámetro de sensibilidad puedeestar influido por númerosas variables, le especie, esfuerzo dificultad, etc.

El parámetro b de la ecuación representa el sesgo de respuesta, estos influyen en laelección cuando las alternativas de respuesta son diferentes, también es importante cuandoel reforzador proporcionado para las dos respuestas es diferente. En ausencia de sesgosb=1.0.

Infraigualación, supraigualación y sesgo de respuesta

A veces la ley de igualación no se cumple, y en esos casos se cumple estanorma:

s

rrb

RR

B

A

B

A⎟⎟⎠

⎞⎜⎜⎝

⎛=

EL parámetro s es la sensibilidad de laconducta de eleción a las tasas dereforzamiento (“Cuáto me afecta la tasade reforzamiento de este programa”).

Una buena comida es reforzante, perosi no me gusta el pescado a lo mejor noeligiría ese menú (sensibilidad).

El parámetro b es el sesgo (bias) de respuesta. Es una preferenciapor uno de los dos programas en particular, incluso aunqueproporcione la misma tasa de reforzamiento que el otro (por ejemplo,la respuesta en sí puede ser más cómoda).

Ir al ginmasio podría ser más reforzante que ver la televisión, porqueproduce un bneficio a largo plazo, pero como la respuesta es costosa,puede que prefiramos quedarnos en casa (sesgo de respuesta)

Infraigualación: El animal tiene una tasa de respuesta menor que la tasa de reforzamiento (recibe muchos reforzadores,pero no responde mucho), es como si los reforzadores obtenidos no produjeran mucha efecto en su elección.El parámetro sensibilidad (s) es <1.

Supraigualación: El animal responde más de lo que le correspondería en función de su tasa de reforzamiento.El parámetro sensibilidad (s) es >1.

En realizad, en estas relaciones influyen tanto la cantidad como la calidad del reforzador: si es un reforzador valioso, unospoquitos bastaran para que el animal prefiera ese programa a otro.

Descargado del campus, http://campus.felizmente.info

Page 101: Aprendizaje  resumen jc cabrera temas 1-9

99

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

La ley de la igualación y el valor del reforzador: Se ha encontrado que la tasa relativa derespuesta es una función de la cantidad relativa de reforzador, asi como de la demorarelativa del reforzamiento. También están determinadas por la palatabilidad de losreforzadores.

La ley de la igualación y los programas simples de reforzamientoHerrnstein (1970) apuntó que incluso lassituaciones de respuesta única puedeninvolucrar elección, entre realizar la respuestaespecificada (presión de palanca) y ocuparse enotras posibles actividades (acicalarse). En unprograma simple, el sujeto recibe no sóloreforzamiento explícito por realizar una

respuesta operante específica, sino también recompenss intrínsecas de las otrasactividades que puede realizar. Por tanto, el reforzamiento total incluye las recompensasextrínsecas programadas tanto como las fuentes del reforzamiento no programadas. Estetipo de análisis permite la aplicacion de la ley de la igualación.

Si sustituimos los valores de la ecuación de la ley de igualación, podemos adaptarla assituaciones de respuesta única:

• RA representa la tasa de respuesta operante especificada por el programa.• RO representa la tasa de otras actividades del animal.• rA es la tasa de reforzamiento explicito programado.• rO es la tasa de reforzamiento intrínseco por las otras actividades.• k es una constante que el investigador utiliza cuando presupone que (RA+RO) es una

constante que no guarda relación con el reforzador utilizado.

OA

AA rr

krR

+=

Esta ecuación predice que la tasa de respuesta (RA) estará directamente relacionada con latasas de reforzamiento para esa respuesta de una forma negativamente acelerada. Otraimplicación, de particular interés clínico, es que la tasa de respuesta disminuirá a medidaque aumente la tasa de las otras fuentes de reforzamiento (rO). Por tanto, esta ecuaciónproporcionara dos maneras de modificar la tasa de una respuesta, mediante el cambio de sutasa de reforzamiento o mediante el cambio en la tasa de las otras fuentes dereforzamiento.

La presuposición de que (RA+RO) es constante para unas situación instrumental esta puestoen cuestión con estudios recientes que varian el reforzador pero no la respuestainstrumental.

La ley de la igualación también puede aplicarse aprogramas sencillos de reforzamiento (no a la elecciónen programas concurrentes)

Realizar cualquier conducta supone una elección(elegimos realizar esa conducta en vez de hacercualquier otra cosa). Si una conducta no me “refuerza”más que cualquier otra alternativa, si no es atractiva, espoco probable que la realice.

Descargado del campus, http://campus.felizmente.info

Page 102: Aprendizaje  resumen jc cabrera temas 1-9

100

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Mecanismos de la ley de la igualación

La ley de la igualación describe como los organismos distribuyen sus respuestas en unasituacion de elección pero no explica que mecanismos son responsables de esta distribuciónde respuestas. Está establecida en funcion de las tasas de respuestas y de reforzamientopromediada sobre la duración total de las sesiones experimentales. Ignora cuando serealizan las respuestas individuales. Igualmente las teorías molares de la igualación ignoranque podría ocurrir al nivel de las respuestas individuales. Las terorías molares explicanagregados de respuestas y se relacionan con la distribución total de respuestas yreforzadores en las situaciones de elección. Las teorías moleculares se centran en lo queocurre al nivel de las respuestas individuales y consideran la relación de igualación como elresultado neto de estas elecciones individuales. Otras teorías proporcionan.caracterizaciones de la conducta que no son ni molares ni moleculares, sino algo intermedioentre ellas ; el mejoramiento.

Igualación y maximización de las tasas de reforzamiento: las explicaciones másinvestigadas de la conducta de eleccion están basadas en la idea de que los organismosdistribuyen sus acciones entre las alternativas de respuesta para recibir la mayor cantidadposible de reforzamiento.

1º Maximizacion molecular: los organismos siempre eligen cualquier alternativa de respuestacon mejores probabilidades de que sea reforzada en ese momento. Shimp (1966.1969)propuso una primera versión de la ley de igualación molecular. Cuando dos programas A y B,funcionando simultáneamente, el sujeto cambia del programa A al B a medida que laprobabilidad de reforzamiento aumenta para el programa B. Supuso que la relación deigualación es un subproducto de una alternancia prudente cuando la probabilidad dereforzamiento en la tecla de respuesta alternativa es mayor que la probabilidad dereforzamiento en la tecla de respuesta actual.

Estudios detallados de las pautas de alternancia entre respuestas no siempre apoyaron lateoría de maximización molecular propuesta por Shimp. Algunos estudios han mostrado quela igualación es posible en ausencia de una maximización momentánea. Sin embargo,aproximaciones más recientes a los análisis moleculares de la conducta de elección hantenido mas éxito.

2º maximización molar: presuponen que el organismo distribuye sus respuestas entre lasvarias alternativas a fin de maximizar la cantidad de reforzamiento que consiguen a lalarga. Se centran en agregados de conducta sobre algún período más que en las respuestasde elección individual.

Descargado del campus, http://campus.felizmente.info

Page 103: Aprendizaje  resumen jc cabrera temas 1-9

101

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Fue originalmente formulada para explicar la eleccion en programas concurrentesconstruidos con programas de razón, en estos programas, los animales raramente cambiande una alternativa a otra, en su lugar, responden exclusivamente en el componente de razónque requiere el menor número de respuestas, de esta forma maximiza su tasa dereforzamiento con el mínimo esfuerzo.

La maximización molar predice de forma precisa los resultados de los procedimientos deelección, pero ciertos hallazgos presentan dificultades; como en los resultados de losprogramas concurrentes de reforzamiento IV-IV, en los cuales los organismos puedenconseguir casi todas las recompensas disponibles en ambos programas, siempre y cuadnoprueben de forma ocasional cada alternativa. La teoría no puede explicar por qué laconducta de elección se distribuye de forma tan cercana a la relación de igualación.

Otro desafio son los programas de IV-RV, dadas las diferencias entre estos dos programas,para el máximo beneficio en un programa concurrente RV-IV, los sujetos deberíanconcentrara sus respuestas en la alternativa de razón variable y responder soloocasionalmente en el componente de intervalo variable, esto no sucede, los animalesfavorecen el componente RV pero no de forma tan fuerte como predice la teoría

3ª Mejoramiento: Los mecanismos de mejoramiento operan en una escala temporal que estaentre la escala temporal de las teorías molar y molecular.

El termino mejoramiento se refiere a hacer algo mejor. No se refiere a elegir la mejoralternativa en ese momento (maximización molecular), o hacer que a largo plazo algo sea tanbueno como pueda (maximización molar), sino a hacer que la situacion sea mejor a cómo esasituación ha sido en el pasado reciente. Los beneficios están circunscritos a una situaciónlimitada - no en su totalidad o a largo plazo.

La teoría asume que los organismos cambian de una alternativa a otra para mejorar la tasalocal de reforzamiento. Puede demostrarse matemáticamente que cuando los sujetosdistribuyen sus respuestas para obtener la misma tasa local de reforzamiento en cadaalternativa, se están comportando de acuerdo con la ley de igualación. Por tanto, elmecanismo de mejoramiento da como resultado la igualación. De acuerdo con esta teoría, lapaloma cambiara su preferencia a favor de la alternativa de respuesta que arroje la tasalocal más alta. Estos cambios de un lado a otro continuaran hasta que sea igual la tasa localde reforzamiento conseguida en las dos alternativas.

¿Qué determina los cambios de un programa a otro?

• Teorías de la maximización molecular: El animal hace un cambio de programa para obtener un reforzador determinado.• Teoría de la maximización molar: El animal hace los cambios precisos para obtener el máximo de reforzadores a la larga.• Teoría del mejoramiento: El animal cambia para obtener una tasa local de reforzamiento mejor que la actual. La tasa

local de reforzamiento en el programa A: Número de reforzadores obtenidos durante el tiempo que se ha dedicado alprograma A.La alternancia de programas continúa hasta que las tasas locales se igualan.

Descargado del campus, http://campus.felizmente.info

Page 104: Aprendizaje  resumen jc cabrera temas 1-9

102

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

ELECCION CON COMPROMISO(página 182 del libro)

Una vez que se tome una decisión, no se puede cambiar.

Programas concurrentes encadenados

La técnica básica en este area deinvestigación es el programa concurrenteencadenado de reforzamiento, este constade dos fases; eslabón de elección; sepermite al participante elegir entre dosprogramas alternativos de respuesta. Laoportunidad para el reforzamiento sucedesólo después de que la elección inicial hayasido realizada y la paloma se encuentra enel eslabón terminal; otra característicaimportante de este programa es que unavez que el participante ha realizado laelección, esta comprometido con esta hasta el final del programa. Por tanto los programasconcurrentes encadenados implican elección con compromiso.

Los estudios de este tipo han demostrado que los sujetos prefieren la alternativa de RV,esta está guiada por el hecho de que ocasionalmente un programa de RV proporcionareforzamiento por un número relativamente pequeño de respuestas.

La consecuencia de responder duranteel eslabon inicial de un programaconcurrente no es el reforzadorprimario (comido), es pasar a uno de loseslabones terminales, la consecuenciainmediata de una respuesta en uneslabon inicial es un estímulo que estaasociado con el eslabón terminalelegido. Como este estimulo estapresente cuando se proporciona elreforzador primario, el estimulo deleslabón terminal se convierte enreforzador condicionado . Por tanto, se puede caracterizar un programa concurrente comoaquel en que las respuestas al eslabón inicial se refuerzan por la presentación de unreforzador condicionado. Las diferencias en el valor de reforzador condicionadodeterminaran entonces la tasa relativa de cada respuesta de elección en el eslabon inicial.

Descargado del campus, http://campus.felizmente.info

Page 105: Aprendizaje  resumen jc cabrera temas 1-9

103

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Estudios de “autocontrol”El autocontrol es a menudo cuestión de elegir una recompensagrande demorada sobre una recompensa pequeña inmediata.

Explicaciones del autocontrol: El valor de un reforzador se reduce en función de cuantotiempo se tiene que esperar para obtenerlo, funcion descontadora de valor. El consensoactual es que el valor (V) de un reforzador esta directamente relacionado con la magnitudde la recompensa (M) e inversamente relacionado con la demora de la recompensa (D), deacuerdo con la formula: V=M/(1+KD) donde K es el parámetro de la tasa descontadora, estaecuación se llama función del decaimiento hiperbólico, de acuerdo con esta ecuación, si elreforzadro es entregado sin demora (D=0), el valor del reforzador está directamenterelacionado con su magnitud. Cuanto más se demora el reforzador, menor es su valor.

Las funciones descontadoras y los problemas de autocontrol en la adicción a lasdrogas. Madden, Petry, Badger y bickel (1997) advirtieron que el abuso de sustanciasfrecuentemente revela una serie de elecciones impulsivas. Los adictos elegirán larecompensa relativamente pequeña y rápida de la intoxicación de la droga a riesgo deconsecuencias negativas más demoradas de problemas interpersonales. Este tipo deelecciones sugieren que se descuenta el valor (o amenaza) de las consecuencias a largoplazo. Si esto es cierto, entonces los adictos deberían mostrar funciones de descuento dela recompensa mas acusadas que otros individuos. Madden y colaboradores (1997)comprobaron esta predicción con un grupo de pacientes dependientes de la heroínaapuntados aun programa de desintoxicacion y otro grupo de no dependientes igualados enedad, genero, educación y CI. Ver ej libro pag 187. Un hallazgo significativo fue que lafunciones descontadoras de la recompensa eran mucho más acusadas para los adictos a laheroína. Esto indica una falta de control.

Descargado del campus, http://campus.felizmente.info

Page 106: Aprendizaje  resumen jc cabrera temas 1-9

104

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

¿Puede entrenarse el autocontrol? Una persona que no puede tolerar esperar el tiemponecesario para obtener recompensas grandes tiene que olvidarse de obtener esosreforzadores. El autocontrol, o la preferencia pr una recompensa grande demorada frente auna recompensa pequeña inmediata, es a menudo una estrategia sensible. De hecho, algunoshan sugerido que el autocontrol es un componente crítico de la socialización y del ajusteemocional.

Entrenar a las personas con recompensas demoradas parace tener efectos generalizados enincrementar su tolerancia a la recompensa demorada. En un estudio de elección, realizadoscon niños de una escuela elemental, a los que se les preguntó si querían conseguir 2 céntimosinmediatamente o 3 al final del día, se les realizadon tres sesiones de entrenamiento conuna recompensa imediata o demorada.

Durante cada sesión de entrenamiento, se presentaron varios roblemas: uno incluía contarobjetos en una carta, otro era una rarea pictórica, y el tercero era una tarea deemparejamiento de formas. Para la mitad de los estudiantes, la respuesta correcta erareforzada inmediatamente con 2 centimos. Para el resto, las respuestas correctas teniancomo resultado 3 céntimos que se situaban en un cuanco y serían entregados al final de día.Se midió la preferencia por la recompensa pequeña inmediata frente a la más grandedemorada. Siempre y cuando las tareas de entrenamiento implicasen bajo esfuerzo, elentrenamiento con la recompensa demorada incrementó la preferencia por la recompensamás grande demorada durante el postest. Por tanto, el entrenamiento con reforzamientodemorado producía autocontrol generalizado.

Comentarios finales(página 189 del libro)

El principio básico del condicionamiento instrumental es muy simplie: el reforzamientoaumenta (y el castigo disminuye) la probabilidad futura de una respuesta instrumental. Sinembargo, como se ha descrito, el análisis experimental de la conducta instrumental puedeser bastante intrincado. Muchos aspectos importantes de la conducta instrumental estádeterminados por el programa de reforzamiento. Hay numerosos programas por los cualeslas respuestas pueden ser reforzadas. El reforzamiento puede depender de cuántasrespuestas han ocurrido, el paso del tiempo, o la tasa de respuesta. Es más, puede estardisponible más de un programa de reforzamiento al mismo tiempo. El patrón de conductainstrumental, así como las elecciones entre varias alternativas de respuestas, estánfuertemente determinados por el programa de reforzamiento en curso. Estos hallazgos hanpermitido conocer bastante sobre cómo el reforzamiento controla la conducta en diversascircunstancias y han alentado muchas aplicaciones importantes de los principios delreforzamiento a la conducta humana.

Descargado del campus, http://campus.felizmente.info

Page 107: Aprendizaje  resumen jc cabrera temas 1-9

105

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

TÉRMINOS CLAVE

Carrera de razón Tasa de respuesta alta y estableque se observa tras la pausa posreforzamiento enlos programas de reforzamiento de razón fija. Lacarrera de la razón finaliza cuando se ha llevado acabo el número necesario de respuestas y el sujetoes reforzado.

Espera limitada Restricción en cuánto tiempopermanece disponible el reforzamiento. Para queuna respuesta sea reforzada, debe ocurrir duranteel periodo de espera limitada.

Festón del intervalo fijo Incremento gradual de latasa de respuesta que ocurre entrereforzamientos sucesivos en un programa deintervalo fijo.

Función descontadora del valor Función matemáticaque describe cómo disminuye el valor delreforzador en función del tiempo que el sujetotiene que esperar para la administración delreforzador.

Infraigualación Sensibilidad menor de la predichapor una igualación perfecta a la tasa relativa dereforzamiento.

Ley de la igualación Regla de la conductainstrumental, propuesta por R.J.Herrnstein, queestablece que la tasa relativa de respuesta en unaalternativa de respuesta particular es igual a latasa relativa de reforzamiento para esa alternativade respuesta.

Mejoramiento Mecanismo para alcanzar laigualación respondiendo para mejorar las tasaslocales de reforzamiento en las alternativas derespuesta.

Pausa posreforzamiento Pausa en el responder quesucede normalmente tras la administración delreforzador en los programas de reforzamiento derazón fija e intervalo fijo.

Programa concurrente Procedimiento dereforzamiento complejo en el cual el participantepuede elegir cualquiera de dos o más programas dereforzamiento simples que están disponiblessimultáneamente. Los programas concurrentespermiten la medida de la elección entrealternativas de programas simples.

Programa concurrente encadenado Procedimientode reforzamiento complejo en el que se permite alparticipante elegir cuál de varios programassimples de reforzamiento funcionará. Una vezrealizada la elección, las alternativas rechazadasno están disponibles durante algún tiempo.

Programa de intervalo Programa de reforzamientopor el que una respuesta es reforzada sólo siocurre después de una cantidad de tiempoestablecida desde el último reforzamiento.

Programa de intervalo fijo Programa dereforzamiento en el cual el reforzador se entregapor la primera respuesta que ocurre después deuna cantidad fija de tiempo desde el últimoreforzador. Abreviado IF.

Programa de intervalo variable Programa dereforzamiento en el que el reforzamiento seproporciona por la primera respuesta que ocurretras una cantidad de tiempo variable desde elúltimo reforzador. Abreviado IV.

Programa de razón Programa de reforzamiento enel que el reforzamiento depende sólo del númerode respuestas que realiza el sujeto,independientemente de cuándo sucedan.

Programa de razón fija Programa de reforzamientoen el cual debe ocurrir un número fijo derespuestas para que la próxima respuesta seareforzada. Abreviado RF.

Descargado del campus, http://campus.felizmente.info

Page 108: Aprendizaje  resumen jc cabrera temas 1-9

106

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 6: Programas de Reforzamiento y Conducta de Elección

Juan Carlos Cabrera

Programa de razón variable Programa dereforzamiento en el que el número de respuestasnecesarias para producir reforzamiento varía deensayo a ensayo. El valor del programa se refiere alnúmero medio de respuestas necesarias para elreforzamiento. Abreviado RV.

Programa de reforzamiento Programa, o regla, quedetermina cómo y cuándo la ocurrencia de unarespuesta irá seguida por la adaministración de unreforzador.

Programa de tasa de respuesta Programa dereforzamiento en el que la respuesta se refuerzdependiendo de lo pronto que ésta se realiza tras laocurrencia previa de la conducta.Reforzamiento continuo Programa de reforzamientoen el cual cada ocurrencia de la respuestainstrumental produce el reforzador. Abreviado RFC.

Reforzamiento diferencial de tasas altas Programade reforzamiento en el cual una respuesta esreforzada sólo si ocurre antes de que hayatranscurrido una cantidad especifica de tiempodespués de la respuesta precedente. Abreviado RDA.

Reforzamiento diferencial de tasas bajasPrograma de reforzamiento en el cual una respuestaes reforzada sólo si ocurre despues de que hayatranscurrido una cantidad especificada de tiempodespues de la respuesta precedente. Abreviado RDB.

Reforzamiento intermitente Programa dereforzamiento por el que sólo algunas de lasocurrencias de la respuesta instrumental sonreforzadas. La respuesta instrumental es reforzadaocasionalmente, o de forma intermitente. Tambiéndenominado reforzamiento parcial.

Reforzamiento parcial Lo mismo que reforzamientointermitente.

Registro acumulativo Una representación gráfica decómo se repite una respuesta a lo largo del tiempo,con el paso del tiempo representado por la distanciahorizontal (o eje x) y el total o número acumulativode respuestas que ha ocurrido hasta un momentodeterminado representado por la distancia vertical (oeje y).

Supraigualación Sensibilidad mayor de la predichapor una igualación perfecta a la tasa relativa dereforzamiento.

Tensión de la razón Deterioro en la respuesta quesucede cuando el requerimiento de respuesta de unarazón fija se incrementa demasiado rápido.

Tiempo interrespuesta o TIR Intervalo entre unarespuesta y la siguiente. Los TIRs pueden serdiferencialmente reforzados de la misma manera queotros aspectos de la conducta, como la fuerza delarespuesta o la variabilidad.

Descargado del campus, http://campus.felizmente.info

Page 109: Aprendizaje  resumen jc cabrera temas 1-9

107

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera – 2009/2010

La estructura asociativa del condicionamiento instrumental- La asociación E-R y la ley del efecto.- Expectativa de recompensa y la asociación E-C- Relaciones R-C y E(R-C) en el condicionamiento instrumental

Regulación conductual- Antecedentes de la regulación conductual- Regulación conductual y el punto de deleite conductual- Conceptos económicos y distribución de respuesta- Problemas con las aproximaciones de regulación conductual- Contribuciones de la regulación conductual

Comentarios finales

Descargado del campus, http://campus.felizmente.info

Page 110: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 111: Aprendizaje  resumen jc cabrera temas 1-9

109

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

Se han propuesto dos aproximaciones muy diferentes a intentar explicar por que ocurre larespuesta instrumental. Una de estas se inicio con el trabajo de Pavlov y se centra enexplicar la estructura asociativa del condicionamiento instrumental. La otra se origino conel trabajo de Skinner y se centra en como la conducta esta regulada en vista de laslimitaciones o restricciones creadas por los procedimientos de condicionamientoinstrumental. Las teorías de la regulación conductual describen los efectos delreforzamiento dentro del amplio contexto del repertorio conductual de un organismoutilizando conceptos de varias áreas de investigación, incluyendo la economía conductual yla ecología conductual. La aproximación asociacionista se centra en los mecanismosmoleculares y no se preocupa de la meta a largo plazo o la función de la conductainstrumental. Por el contrario, la aproximación de la regulación conductual se centra n losaspectos molares de la conducta y considera los efectos del condicionamiento instrumentalcomo manifestaciones de procesos de maximización u optimización.

La motivación de la respuesta instrumental ha sido considerada desde dos perspectivasradicalmente distintas. La primera se origino con Thorndike e incluye el análisis de laestructura asociativa del condicionamiento instrumental , radica en el concepto deasociaciones y es compatible con la tradición teórica del condicionamiento pavloviano. Tomauna perspectiva molecular: se centra en las respuestas individuales y sus antecedentesestimulares y consecuencia especificas. Para alcanzar este nivel de detalles, laaproximación asociativa examina el aprendizaje instrumental en preparaciones conductualesaisladas. Debido a que las asociaciones pueden encontrar sustento en el sistema nerviosos,la aproximación asociativa proporciona un marco conveniente para estudiar los mecanismosneurales del condicionamiento instrumental.

La aproximación alternativa a los procesos motivacionales en el aprendizaje instrumental esla regulación conductual. Se desarrolla dentro de la tradición skinneriana e incluye laconsideración del condicionamiento instrumental en el contexto más amplio de las múltiplescosas que el organismo esta haciendo. Esta interesada en como un procedimiento decondicionamiento instrumental establece los limites al flujo de actividades de un organismoy las consecuencias conductuales de estas restricciones: considera la motivación de laconducta instrumental desde un punto de vista más molar, las metas y como los organismossacan provecho de la complejidad de su ambiente y de sus múltiples opciones conductualespara alcanzar sus metas.

Dos perspectivas de motivación de la respuesta instrumental:

• Estructura asociativa del condicionamiento instrumentalConcepto de asociación pavloviano → (perspectiva molecular→respuestas especificas)

• Regulación conductual: influencia Skinneriana. Contexto más amplio que la conducta aislada. Se centra en cómo unprocedimiento instrumental establece límites a las actividades naturales de un organismo y las consecuencias dedichas restricciones (perspectiva molar)

Descargado del campus, http://campus.felizmente.info

Page 112: Aprendizaje  resumen jc cabrera temas 1-9

110

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

La estructura asociativa del condicionamiento instrumental(página 192 del libro)

Eduard Thorndike fue el primer en reconocer que el condicionamiento instrumental incluyealgo más que una respuesta y un reforzador. La respuesta instrumental ocurre en presenciade estímulos particulares. Deben considerarse tres sucesos en el análisis delcondicionamiento instrumental: el contexto estimular (E), la respuesta instrumental (R) y laconsecuencia de la respuesta instrumental o reforzador (C). Skinner también suscribió lanoción de tres sucesos y describió el condicionamiento instrumental en términos de unacontingencia de tres términos que incluía E R y C .

La asociación E-R ya la Ley del efecto

La asociación E-R fue postulada por Thorndikecomo la clave del aprendizaje instrumental ensu ley del efecto; el papel del reforzador o dela consecuencia de la respuesta es establecer o"estampar" una asociación entre las claves contextuales E y la respuesta instrumental.Pensó que una vez establecida esta asociación E-R sería, de forma única, responsable de laocurrencia de la respuesta instrumental. Por tanto, el ímpetu básico o motivación para larespuesta instrumental era la activación de la asociación E-R mediante la exposición delsujeto a los estímulos en presencia de los cuales la respuesta instrumental fue previamentereforzada.

La ley del efecto asume que el único papel del reforzador es crear una asociación E-R, queel reforzador en si mismo no es una parte o no participa en esta asociación. Esta presunciónes bastante contraintuitiva.

Expectativa de recompensa y la asociación E-C

Cualesquiera que sean los estímulos, el reforzamiento de larespuesta instrumental produciría inevitablemente unemparejamiento entre E y el reforzador o consecuencia de larespuesta (C). Estos emparejamientos proporcionan elpotencial para el condicionamiento clásico y elestablecimiento de una asociación entre E y C.

Una de las explicaciones más tempranas e influyentes del papel del condicionamiento clásicoen la conducta instrumental fue propuesta por Clark Hull (1930,1931) y más tardeelaborada por Kenneth Spence (1956) , durante el curso del condicionamiento instrumental.La respuesta instrumental llega a ser instigada o motivada por dos factores. En primerlugar, la presencia de E llega a evoca la respuesta instrumental directamente por asociacióncon E-R. En segundo lugar, la actividad instrumental también llega a realizarse en respuesta

Thorndike → La respuesta ocurre en presencia deciertos estímulos particulares.

Recordemos la ley del efecto: La presencia de señales oestímulos que señalan acontecimientos significativos(por ejemplo, la disponibilidad de recompensa sillevamos a cabo una respuesta determinada) controlanuestra expectativa de recompensa.

Clark Hull

Dos tipos distintos de aprendizaje:1. Aprendizaje pavloviano E-C

(expectativa de recompensa)Activa un estado emocional

2. Aprendizaje instrumental E-R.

Descargado del campus, http://campus.felizmente.info

Page 113: Aprendizaje  resumen jc cabrera temas 1-9

111

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

a la expectativa de recompensa debido al establecimiento de una asociación R-C: la formaconcreta en que la asociación R-C llega a motivar la conducta instrumental ha sido tema deconsiderable debate e investigación experimental. Una formulación especialmenteinfluyente fue la teoría moderna de los dos procesos /Rescorla y Salomon,1967)

La teoría moderna de los dos procesos. Asume que hay dos tipos distintos deaprendizaje, el condicionamiento pavloviano y el instrumental, además, estos dos procesosestán relacionados de una forma especial. Durante el curso de un condicionamientoinstrumental, los estímulos (E) -en presencia de los cuales de refuerza la respuestainstrumental- se presume que llegan a asociarse con la consecuencia de la respuesta (C) através de condicionamiento pavloviano para establecer una asociación E-C. A través de laasociación E-C, el estímulo E llega a motivar la conducta instrumental mediante laactivación de un estado emocional central. La naturaleza de ese estado emocional omotivación dependerá de la naturaleza del reforzador. Por ejemplo, en un procedimiento decondicionamiento instrumental en el que la respuesta sea reforzada por la presentación decomida ( u otro reforzadores apetitivos), la asociación E-C activa la expectativa de comida(Mowrer la llamo "esperanza").

Recorla y Salomon (1967) apuntaron que si la expectativa pavloviana motiva la conductainstrumental, entonces la presentación de un estímulo condicionado pavloviano deberíaalterar el curso de la respuesta instrumentalmente reforzada. La implicación básica de lateoría moderna de los dos procesos es que la tasa de una respuesta instrumental serámodificada por la presentación de un estímulo clásicamente condicionado. la presentaciónde un EC+ clásicamente condicionado con comida durante la ejecución de una respuestareforzada con comida debería aumentar la esperanza que fue creada por la contingenciainstrumental e incrementar la respuesta.

Resultados consecuentes con la teoría moderna de los dos procesos. Utilizanormalmente un diseño experimental llamado experimento de transferencia de control,consta de tres fases:

Fase 1: Condicionamiento instrumental de una respuesta operante utilizando algúnprograma de reforzamiento positivo o negativo.

Fase 2: Condicionamiento clásico, en el cual se asocia un EC explícito con la presencia oausencia de un EI. Es necesario durante esta fase no esté presente el condicionamientoinstrumental.

Fase 3: Fase de transferencia crítica. Los participantes pueden realizar la respuestainstrumental y se presenta periodicamente el EC de la fase 2 para observar su efectoen la tasa de conducta instrumental.

Descargado del campus, http://campus.felizmente.info

Page 114: Aprendizaje  resumen jc cabrera temas 1-9

112

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

Interacciones de respuesta en los experimentos de transferencia de control. Losestímulos condicionados clásicamente elicitan no sólo estados emocionales, sino tambiénrespuestas concretas que puede influir sobre la conducta que habíamos condicionado. Porejemplo, si el estímulo condicionado provoca una conducta de quedarse quieto y la conductainstrumental que se ha aprendido y reforzado es dar saltos, la presencia del EC disminuirá,interferirá. Esto hace ver que no es sólo el estado emocional lo que influye en la conductareforzada.

¿Estados emocionales centrales condicionados o expectativas especificas derecompensa? La teoría moderna de los dos procesos asume que el condicionamiento clásicomedia la conducta instrumental a través del condicionamiento de estados emocionalescentrales como la esperanza (en el caso de reforzamiento positivo) o el miedo (en el casodel reforzamiento negativo). En ciertas circunstancias los animales adquieren expectativasespecificas del reforzador en lugar de un estado emocional más general de esperanzadurante el condicionamiento instrumental y clásico. El aprendizaje de expectativaespecifica de recompensa es una alternativa importante a la teoría de los dos procesospara explicar ciertos tipos de resultados. Esta basada en la asunción de que elcondicionamiento instrumental incluye aprendizaje de una asociación E-C.

Las asociaciones E-C parecen ser fundamentales para la motivación de la conductainstrumental, Berridge (2001) apunto que la asociación E-C, E llega a ser un estímulo deincentivo; E en si mismo llega a ser atractivo. Esta motivación adquirida de incentivocontribuye significativamente a la motivación de la respuesta instrumental.

Relaciones R-C y E(R-C) en el condicionamiento instrumental

La intuición sugiere que la conducta instrumental involucra asociaciones R-C, estas noexisten en el modelo de los dos procesos.

Otra peculiaridad de la estructura asociativa del condicionamiento instrumental asumidapor las teorías de los dos procesos es que E supone que llega a estar asociado directamentecon C en la idea de que el emparejamiento de E con C es suficiente para la ocurrencia decondicionamiento clásico. Los emparejamientos EC-EI no son suficientes para el desarrollode asociaciones pavlovianas. El EC debe también proporcionar información acerca del EI, oestar de alguna manera relacionado con el EI. Esta condicionalidad en la relación de E con Ces desestimada en la teoría de los dos procesos.

Como resumen: la teoría de los dos procesos asume que el condicionamiento clásico media de conducta instrumental através del condicionamiento de estados emocionales centrales como la esperanza o el miedo.

Parece difícil creer que toda la motivación depende de las asociaciones E-C y E-R teniendo en cuenta que ninguna de ellasestablece una relación directa entre la respuesta y el reforzador. En la vida diaria hacemos las cosas porque conllevanuna consecuencia determinada, cosa que no refleja la teoría de los dos procesos.

Descargado del campus, http://campus.felizmente.info

Page 115: Aprendizaje  resumen jc cabrera temas 1-9

113

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

Evidencia de asociaciones R-C; Algunas investigaciones han sugerido que elcondicionamiento instrumental lleva el aprendizaje de asociaciones respuesta-consecuencia.

La devaluación del reforzadorha sido utilizada paradeterminar si la repuestainstrumental esta mediadapor una asociación entre larespuesta y la consecuenciareforzante. La supresión

selectiva de respuesta que se obtuvo es difícil de explicar a partir de las asociaciones E-Co E-R que se supone que son aprendidas de acuerdo con la teoría de los dos procesos, ladevaluación de un reforzador debilita selectivamente la respuesta particular que ha sidoentrenada con ese reforzador. Este hallazgo indica que cada respuesta estaba asociadaseparadamente con su propio reforzador.

Evidencia del aprendizaje de una relación jerárquica E-(R-C); los organismos aprendena asociar la respuesta instrumental con su consecuencia. Sin embargo, las asociaciones R-Cno pueden actuar aisladamente para producir la repuesta instrumental. E no activa Rdirectamente , sino que activa la asociación R-C. El sujeto llega a pensar en la asociación R-C cuando se encuentra con E, y eso motiva que realice la respuesta instrumental.

Skinner (1938) sugirió que E, R y C en el condicionamiento instrumental están conectados através de una relación condicional E-(R-C).

Regulación Conductual (página 199 del libro)

La regulación conductual se centran en cómo las contingencias instrumentales ponenlimitaciones a las actividades de un organismo.

Antecedentes de la regulación conductualLos teóricos están de acuerdo en que los reforzadores son un tipo especial de estímulos.

La teoría de la respuesta consumatoriaEl primer reto a esta idea vino de Fred Sheffieldque formularon la teoría de respuestaconsumatoria, esta atribuye el reforzamiento aestas conductas típicas de la especie. Se estableceque las respuestas consumatorias típicas de laespecie son en si mismas el rasgo critico de losreforzadores. Fue una innovación radical debido aque traslado la investigación de los reforzadoresdesde tipos especiales de estímulos a tipos especiales de respuestas. Se considero que lasrespuestas reforzadoras eran especiales porque involucraban la consumación o el

La importancia de la asociación R-C se ve con la devaluación del reforzador.

DEVALUACIÓN DEL REFORZADOR• Fase 1: Entrenamiento de dos conductas con IV1 con reforzadores distintos.• Fase 2: Devaluación del reforzador: Reforzador + LiC1 (condicionamiento de

aversión)• Fase 3: Posibilidad de realizar las dos conductas aprendidas → La conducta

cuyo reforzador ha sido condicionado aversivamente disminuye.

Las respuestas consumatorias típicas de laespecia (comer, beber...) son en sí mismas elrasgo crítico de los reforzadores.

Esta teoría considera que las respuestasreforzadoras son especiales porque involucran laconsumación o el completamiento de unasecuencia instintiva de conducta. La teoríaasume que las respuestas consumatorias(masticar y tragar, por ejemplo) sonfundamentalmente diferentes de variasrespuestas instrumentales potenciales (correr,saltar...)

Descargado del campus, http://campus.felizmente.info

Page 116: Aprendizaje  resumen jc cabrera temas 1-9

114

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

completamiento de una secuencia instintiva de conducta. David Premack retomo el tema consu teoría y sugirió que las respuestas reforzadoras son especiales sólo debido a que es másprobable que ocurran que las respuestas instrumentales a las que siguen.

El principio de Premack: Apuntó quelas respuestas incluidas en losreforzadores comúnmente utilizadoseran actividades que es altamenteprobable que realicen los animales. Lasrespuestas instrumentales son activi-dades que normalmente ocurren a unabaja probabilidad. Propuso que estadiferencia en las probabilidades derespuesta es critica para el reforza-miento.Se centra en la diferencia de la probabilidad de las respuestas instrumental y reforzadora.En consecuencia también es denominado el principio de la probabilidad diferencial.

El principio de Premack significó un avance importante en el pensamiento científico sobre elreforzamiento. Estimuló la consideración de los reforzadores como respuestas más quecomo estímulos, y amplió mucho el rango de cosas que los investigadores empezaron autilizar como reforzadores. Cualquier actividad podía servir como reforzador siempre ycuando fuera más probable que la respuesta instrumental.

Principio de Premack

Las respuestas incluidas en los reforzadores comúnmenteutilizados son actividades que es altamente probable querealicen los animales.

Principio de Premack o "Principio de la probabilidad diferencial"

"Dadas dos respuestas de diferente probabilidad, A y B, laoportunidad para realizar la respuesta de alta probabilidad Adespués de la respuesta de baja probabilidad B tendrá comoresultado el reforzamiento de la respuesta B. (B→A refuerza B). Laoportunidad para realizar la respuesta B de baja probabilidaddespués de la respuesta A de alta probabilidad no dará comoresultado el reforzamiento de la respuesta (A→ no refuerza A)"

Principio de Premack

Una conducta muy probable es una conducta muy preferida. Las conductas probables (preferidas) sirven para reforzar las

menos probables y hacer que se repitan más en el futuro. Respuesta reforzadora: La que se usa para reforzar otra. Respuesta instrumental: La que es reforzada con otra.

Principio de PremackTambién sirve para el castigo...

Las conductas poco probables (no preferidas)sirven para castigar la más probables y hacer queno se repitan tanto en el futuro.

La conducta instrumental es la castigada.

Descargado del campus, http://campus.felizmente.info

Page 117: Aprendizaje  resumen jc cabrera temas 1-9

115

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

La hipótesis de la privación de respuesta: En la mayoría de los procedimientos decondicionamiento instrumental, la probabilidad momentanea de una respuesta reforzada semantiene a un nivel alto mediante la restricción al acceso a la respuesta reforzante.

Premack (1965) reconoció la importancia de restringir el acceso a respuesta reforzadorapara el condicionamiento instrumental. Caracterizo la privación de respuesta no sólo comouna condición necesaria para el reforzamiento sino como algo adjunto al principio deprobabilidad diferencial. La respuesta reforzadora todavía tiene que ser una conducta másprobable que la respuesta instrumental. Por el contrario, Timberlake y Allison (1974)abandonaron totalmente el principio de probabilidad diferencial y argumentaron que larestricción de la respuesta reforzadora era el factor critico para el reforzamientoinstrumental, esta propuesta es denominada Hipótesis de privación de respuesta, haceexplícita la idea radicalmente diferente de que un reforzador es producido por lacontingencia instrumental en si misma. Posteriores desarrollos de las teorías de regulaciónconductual han establecido como las contingencias instrumentales crean los reforzadores ylos efectos del reforzamiento.

Regulación conductual y el punto de deleite conductual

Las teorías de la regulación conductual asumen que existen mecanismos homeostáticosanálogos respecto a la conducta. Se propone que los organismos tienen una distribución deactividades preferida u optima que luchan por mantener frente a los cambios ointerrupciones. Se centran en el grado en que la contingencia instrumental respuesta-reforzador rompe la estabilidad conductual y empuja al individuo fuera de su distribuciónde actividades preferida u optima.

El punto de deleite conductual. La teoríade la regulación conductual asume que si losorganismos son libres para distribuir susrespuestas entre las alternativasdisponibles, lo harán de la forma en quesea más cómodo o en algún sentido optimopara ellos. Esta distribución de respuestasdefine el punto de deleite conductual.

El punto de deleite conductual puedeidentificarse mediante la frecuenciarelativa de ocurrencia de todas lasrespuestas de un organismo en una situación sin restricciones.

Hipótesis de la privación de la respuesta: Lo importante no es la probabilidad diferencial de las conductas (cuálesse repitan más y cuáles menos), sino el estado de privación de una determinada conducta. Puede que en el estadonatural correr sea una conducta de baja probabilidad, pero si yo privo el acceso a esta conducta, entonces la puedo usarcomo respuesta reforzadora.

Descargado del campus, http://campus.felizmente.info

Page 118: Aprendizaje  resumen jc cabrera temas 1-9

116

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

Imposición de una contingencia instrumental. La teoría de regulación conductual estableceque los organismos defenderán el punto de deleite conductual contra los cambios. Lointeresante es que la línea de base libre delpunto de deleite conductual no siempre puedeser restablecida después de que se hayaintroducido una contingencia instrumental. Estees a menudo el dilema que impone unacontingencia instrumental. No permite volver alpunto de deleite.

El punto de deleite proporciona lamotivación para la conductainstrumental. La teoría deregulación conductual asume quepara volver al punto conductualestablecido continua siendo unameta en la distribución derespuestas. Cuando este meta nopuede alcanzarse, la redistribuciónde las respuestas entre lasconductas instrumental ycontingente llega a ser una cuestiónde ajuste. La tasa de una respuestase mantiene lo mas cerca posible

del nivel preferido sin cambiar la otra respuesta demasiado de su nivel preferido.

Staddon propuso un modelo de desviación mínima de regulación conductual para resolverel dilema de las restricciones del programa, la introducción de una contingencia respuesta-reforzador provoca que los organismos redistribuyan sus conductas entre las respuestasinstrumentales y contingentes de manera que se minimice la desviación total de las dosrespuestas con respecto al punto optimo o de deleite.

Explicación los efectos de reforzamiento. La regulación conductual incluye la defensa deun punto de deleite conductual frente a restricciones de respuesta impuestas por unacontingencia respuesta-reforzador. Esta defensa puede requerir establecerse en algúnpunto cercano peno no exactamente en el punto de deleite de la línea base. El aumento en larespuesta instrumental (un efecto de reforzamiento ) es el resultado de mecanismosreguladores de la conducta que funcionan para minimizar las desviaciones del punto dedeleite conductual.

Una visión sobre las contingencias de reforzamiento en un contexto conductual masamplio: Las contingencias instrumentales no suceden en un vacío conductual ocurren en elcontexto de una variedad de respuestas y reforzadores que puede obtener el sujeto.

Imposición de una contingencia instrumental:Si dejamos al sujeto a su aire, se quedará en elpunto de deleite. Eso puede ser malo ( ejemplo:estudiar poco, fumar mucho...)El terapeuta quiere modificar esa distribución deconductas haciendo que se apartasen del punto dedeleite. ¿Cómo? Mediante reforzamientos y castigos.

Descargado del campus, http://campus.felizmente.info

Page 119: Aprendizaje  resumen jc cabrera temas 1-9

117

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

Centrarse solo en la respuesta instrumental y sus estímulos antecedentes y consecuentes(esto es, la estructura asociativa de la conducta instrumental) desatiende el contextoconductual mas amplio ya que puede influir de forma significativa en el resultado de losprocedimientos particulares de condicionamiento instrumental.

Conceptos económicos y distribución de respuesta

En las situaciones de condicionamiento instrumental, las restricciones están proporcionadaspor el número de respuestas que un organismo es capaz de realizar y el número derespuestas requerido para obtener cada reforzador.

Demanda del consumidor. La relación entre el precio de una comodidad y cuanto se obtienese denomina curva de la demanda.

El grado en el cual el precio influye en elconsumo se denomina elasticidad de lademanda.

El concepto de demanda del consumidorpuede utilizarse para analizar el refor-zamiento instrumental considerando elnumero de respuestas realizadas comoanálogo al dinero. EL precio de unreforzador es el tiempo o numero derespuestas requeridas para obtener unreforzador. Por tanto, el precio delreforzador esta determinado por elprograma de reforzamiento.

Determinantes en la elasticidad de la demanda.Los conceptos económicos han ayudado a identificar tres factores principales que influyenen como las restricciones de un programa moldean la redistribución de la conducta.

1º Disponibilidad de sustitutos: Es el factor que mas influye en la elasticidad de lademanda. La disponibilidad de sustitutosaumenta la sensibilidad del articulo a los preciosaltos.

Una fuente de reforzadores sustituible es la disponibilidad de un reforzador fuera de lasesión experimental. La parte de comida que no comen durante la sesión experimental seles da luego en la jaula hogar, esta situación se denomina una economía abierta, Esto secontrapone con una economía cerrada, en la cual los sujetos no reciben alimentación

Descargado del campus, http://campus.felizmente.info

Page 120: Aprendizaje  resumen jc cabrera temas 1-9

118

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

suplementaria. En general la elasticidad de la demanda es mayor en situaciones de economíaabierta que en economías cerradas.

2º Rango de precios: Un aumento en elprecio tiene menos efecto en preciosbajos que en precios altos.

3º Nivel de ingresos: En estudios decondicionamiento instrumental, elnúmero de respuestas o la cantidad detiempo disponible para respondercorresponde a los ingresos. Cuantas másrespuestas o tiempo tengan disponibleslos animales, menos estará su conductainfluida por los aumentos en el coste delreforzador.

Problemas con las aproximaciones de regulación conductual

El punto de deleite es una característicamolar de la conducta. Se basa en una medidade cada respuesta acumulada a lo largo delbloque temporal amplio. Un punto de deleitemolar dado puede alcanzarse de variasformas, de acuerdo con esta aproximación ,las diferencias en las pautas de respuesta nodeberían tener importancia. Pero la evidenciaexperimental indica que es importante comose alcanza el punto de deleite molar. Enconsecuencia una adecuada caracterización del deleite conductual requiere informaciónsobre las pautas de elección moleculares.

Otra dificultad, tal vez más seria es que las respuestas durante un periodo de línea baselibre no siempre tiene el mismo valor como respuestas que ocurren como parte de unacontingencia instrumental impuesta, Hacer algo cuando no hay requerimientos impuestosexternamente (correr por placer ) parece ser diferente a hacer lo mismo cuando serequiere por una contingencia instrumental impuesta.

Finalmente, debido a que las aproximaciones no comprenden procesos conductualesmoleculares, no dicen nada de cómo los organismos defienden una combinación favorita debienes o actividades.

1. El punto de deleite se formula desde un punto de vistamolar (como un conjunto, y a lo largo de un periodoamplio). Sin embargo, está demostrado que esimportante cómo se alcanza ese punto de deleite(pausas de elección en los cambios de conducta aotra) desde un punto de vista más molecular.

2. El "valor reforzante· de una conducta puede cambiarsegún si es obligada o no. Por ejemplo, al principiouna conducta A puede ser agradable, pero cuando lautilizo para reforzar otra conducta B, estoyimponiendo la conducta A. ¿Cómo sé si sigue siendotan agradable como al principio?

Descargado del campus, http://campus.felizmente.info

Page 121: Aprendizaje  resumen jc cabrera temas 1-9

119

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

Contribuciones de la regulación conductual

1º Nos alejó de la consideración de losreforzadores como tipos especiales derespuestas. Los efectos del reforzamiento seven como producidos por las restricciones delprograma en el devenir de las actividades deun organismo.

2º Los procedimientos de condicionamientoinstrumental ya no se considera que estampano fortalecen la conducta instrumental: en sulugar el condicionamiento instrumental esvisto como la creación de una nuevadistribución o asignación de respuestas, lareasignación de la conducta incluye unaumento en la respuesta instrumental y unadisminución de la respuesta reforzadora.

3º No existe una distinción fundamental entrelas respuestas instrumentales y lasreforzadoras, se distinguen solo por lospapeles asignados a ellas mediante unprocedimiento de condicionamiento instrumental.

4º Aceptan la idea de que los organismos responden para maximizar sus beneficios.

5º Han proporcionado caminos nuevos y precisos para describir las restricciones queimponen varios procedimientos de condicionamiento instrumental en el repertorio deconducta de un organismo. Mas importante, han enfatizado que la conducta instrumental nopuede ser estudiada en un vacío o en un tubo de ensayo conductual. Todas las opciones derespuesta del organismo que se dan en un momento dado deben ser consideradas como unsistema.

Comentarios finales

Los procesos motivacionales en la conducta instrumental se ha enfocado desde dosperspectivas radicalmente diferentes y dos tradicionales intelectuales: la perspectivaasociacionista tiene sus raices en la ley del efecto de Thorndike y el condicionamientopavloviano, y la perspectiva de la regulación conductual tiene su origen en el análisisconductual skinneriano. Estas dos aproximaciones difieren más que se asemejan, haciendodifícil imaginar cómo podrían integrarse. Por ejemplo, el concepto fundamental en la

1. Antes se pensaba en los reforzadores como tiposespeciales de estímulos. Desde la aproximación de laregulación conductual, la causa del reforzamiento estáen la forma en que el flujo libre, natural, de la conductase ve alterado por las contingencias instrumentales. Unaconducta puede ser reforzante.

2. Ahora, el entrenamiento instrumental ya no sirve sólopara "fijar" o "eliminar" una conducta, sino que crea unanueva distribución de conductas en general.

3. Una respuesta reforzadora no tiene nada inherentedistinto de una respuesta instrumental: no proporcionaningún beneficio especial, por ejemplo fisiológico (hacerejercicio vs. Comer caramelos). Simplemente, el que unaconducta sea reforzadora o instrumental va a dependerde los papeles que les asigne el terapeuta oexperimentador.

4. Ha contribuido a ver el condicionamiento instrumentalcomo un sistema, en vez de cómo elementos aislados.Al cambiar un solo elemento, el sistema entero se veafectado.

Descargado del campus, http://campus.felizmente.info

Page 122: Aprendizaje  resumen jc cabrera temas 1-9

120

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

aproximación asociacionista (el concepto de una asociación) es enteramente soslayado porla regulación conductual. Igualmente, los conceptos críticos de la regulaciónconductual(puntos de deleite y restricciones del programa) no tienen correspondencia en laaproximación asociacionista. La aproximación asociacionista por sí misma lleva un inmediatoa la exploración de los circuitos neurales de condicionamiento instrumental. Por otra parte,es difícil ver cómo la aproximación de la regulación conductual podría utilizarse para guiarla investigación neurofisiológica.

Las dos aproximaciones parecen centrarse en asuntos completamente distintos, pero ambashan contribuido de forma significativa a la compresión de la motivación de la conductainstrumental. Es evidente que una aproximación no puede ignorarse a favor de la otra, pero¿cómo contribuye cada una a la compresión completa de la motivación instrumental?.

Una forma de pensar sobre las dos aproximaciones es que incluyen diferentes niveles deanálisis. La asociacionista involucra un nivel molecular donde el objetivo son los estímulosespecíficos, las respuestas, y sus conexiones. En contraste, como se ha descrito, laregulación conductual opera a un nivel molar de agregados de conducta y de contextosconductuales más amplio en el que operan las contingencias instrumentales. Por tanto, laaproximación de la regulación conductual contacta mejor con las complejidades de laecología de un organismo.

Otra forma de pensar en la relación entre las dos aproximaciones es que una se relacionacon procesos y la otra está más relacionada con funciones o metas a largo plazo. Laaproximación asociacionista describe procesos específicos [asociaciones E-R, E-C, R-C y E-(R-C)] que sirven para generar y dirigir la conducta instrumental, pero no tienen en cuentael “propósito” o función a largo plazo del aprendizaje instrumental. Éste es el punto de vistade la regulación conductual y la economía conductual, que asumen que los organismostrabajan para defender una distribución óptima de actividades. La defensa del punto dedeleite conductual se alcanza mediante los procesos moleculares de las asociaciones.

Los desarrollos conceptuales en el estudio de la motivación de la conducta instrumentalproporcionan un ejemplo representativo del curso de la investigación científica. Ésta se hadesarrollado desde formulaciones simples estímulo-respuesta hasta consideraciones máscomprensivas de la forma en que el repertorio del organismo se restringe mediante lascontingencias instrumentales y cómo los organismos resuelven problemas ecológicoscomplejos. En ese aspecto del estudio del condicionamiento y el aprendizaje, tal vez másque en ningún otro, los investigadores se han movido con atrevimiento para explorar nuevasconcepciones cuando las viejas ideas no afrontaban con éxito los desafíos propuestos porlos hallazgos empíricos.

Descargado del campus, http://campus.felizmente.info

Page 123: Aprendizaje  resumen jc cabrera temas 1-9

121

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 7: Condicionamiento instrumental: Mecanismos Motivacionales

Juan Carlos Cabrera

TERMINOS CLAVE (página 216 del libro)

Curva de la demanda Relación entre la cantidadque se obtiene de una comodidad y su precio.

Elasticidad de la demanda Grado en el que el precioinfluye sobre el consumo u obtención de unacomodidad. Si el precio tiene un efectoimportante en el consumo, la elasticidad de lademanda es alta. Si el precio tiene poco efectosobre el consumo, la elasticidad de la demanda esbaja.

Experimento de transferencia de controlExperimento que evalúa los efectos de unestímulo condicionado clásicamente (EC) en laejecución de la conducta instrumental. El EC y larespuesta instrumental se condicionan en primerlugar en fases independientes del experimento.Los efectos del EC sobre la respuestainstrumental se determinan entonces en la fasede transferencia.

Hipótesis de la privación de respuesta Explicacióndel reforzamiento que defiende que la restricciónel acceso a una respuesta por debajo de su tasade línea base de ocurrencia (privación derespuesta) es suficiente para hacer que laoportunidad de ejecutar esa respuesta actúecomo un reforzador positivo efectivo.

Modelo de desviación mínima Modelo de conductainstrumental, según el cual los participantesresponden a la contingencia respuesta-reforzador de manera que los acerque lo máximoposible a su punto de deleite conductual.

Punto de deleite conductual Distribución preferidade las actividades de un organismo antes de quese introduzca un procedimiento decondicionamiento instrumental que dispongalimitaciones en la distribución de respuesta.

Principio de Premack Lo mismo que principio deprobabilidad diferencial.

Principio de probabilidad diferencial Principio queasume que el reforzamiento depende laprobabilidad relativa del organismo de ejecutar larespuesta reforzadora frente a la respuestainstrumental antes de que se introduzca elprocedimiento de condicionamiento instrumental.Cuanta más diferencia exista entre laprobabilidad de la respuesta reforzadora y lainstrumental durante las condiciones de línea debase, mayor será el efecto reforzante deproporcionar la oportunidad de ejecutar larespuesta reforzadora tras realizar lainstrumental. También conocido como principio dePremack.

Teoría de la respuesta consumatoria Teoría queasume que las respuestas consumatorias típicasde la especia (comer, beber y cosas así) son lascaracterísticas fundamentales de losreforzadores.

Descargado del campus, http://campus.felizmente.info

Page 124: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 125: Aprendizaje  resumen jc cabrera temas 1-9

123

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera – 2009/2010

Identificación y medida del control por el estímulo- Respuesta diferencial y discriminación de estímulos- Generalización de estímulos- Los gradientes de generalización del estímulo como medida de control por el estímulo.

Factores del estímulo y la respuesta en el control por el estímulo- Capacidad sensorial y orientación.- Facilidad relativa del condicionamiento de varios estímulos.- Tipo de reforzamiento.- Tipo de respuesta instrumental.- Elementos del estímulo frente a claves configuracionales en los estímulos compuestos.

Factores de aprendizaje en el control por el estímulo- Entrenamiento en discriminación de estímulos.- Efectos del entrenamiento en discriminación sobre el control por el estímulo.- Rango de posibles estímulos discriminativos.- ¿Qué se aprende en el entrenamiento de discriminación?- Interacciones entre el E+ y el E-: desplazamiento del máximo- Entrenamiento de equivalencia de estímulos

Claves contextuales y relaciones condicionales- Control por claves contextuales.- Control por las relaciones condicionales.

Comentarios finales

Descargado del campus, http://campus.felizmente.info

Page 126: Aprendizaje  resumen jc cabrera temas 1-9

Es tan importante la adecuación de una respuesta instrumental al contexto estimular en elque se realiza, que la falta de un apropiado control por el estímulo se considera a menudoanormal, desvestirse en privado es aceptable en publico motivo de arresto.

El control de la conducta por el estímulo es un aspecto importante de la forma en que losorganismos se adaptan al ambiente. Para acomodarse de forma efectiva y evitar el peligrolos animales tienen que comportarse de forma congruente con las circunstanciascambiantes.

Identificación y medida del control por el estímulo(página 218 del libro)

¿Cómo se puede afirmar que una respuesta instrumental esta bajo el control de ciertosestímulos?.

Respuesta diferencial y discriminación de estímulos

El control por el estímulo de la conductainstrumental se demuestra mediante variacionesen la respuesta (respuesta diferencial) rela-cionadas con las variaciones en los estímulos. Siun organismo responde de una manera enpresencia de un estímulo, y de forma diferenteen presencia de otro, se puede decir que suconducta esta bajo el control de esos estímulos.Estas respuestas diferenciales resultan eviden-tes en el comportamiento de las dos palomas delexperimento de Reynolds.

La respuesta diferencial a dos estímulos tambiénindica que las palomas estaban tratando cadaestímulo de forma diferente. Esto se denominadiscriminación de estímulos. Se dice que unorganismo muestra discriminación de estímulos siresponde de forma diferente a dos o másestímulos. La discriminación de estímulos y elcontrol por el estímulo constituyen dos manerasde considerar el mismo fenómeno: una no existesin la otra. Si un organismo no discrimina entre dos estímulos, su conducta no esta bajo elcontrol de esas claves.

Reynolds (1961)

Entrenamiento:

Prueba:

Resultados: una paloma picoteaba más el circulorojo y para la otra fue el triángulo blanco.

Conclusiones:

Si un cambio en el estímulo conlleva un cambioen la conducta, es que ese estímulo controlaen cierta medida esa conducta.

Para que un estímulo controle una conducta, elorganismo tiene que poder distinguir ese estí-mulo de otros (diferenciar al estímulo com-puesto del círculo por un lado y del triángulopor el otro).

En esta situación es difícil predecir qué compo-nente del estímulo original va a tener el con-trol. Unas palomas responden más al círculo,otras al triángulo.

Descargado del campus, http://campus.felizmente.info

Page 127: Aprendizaje  resumen jc cabrera temas 1-9

125

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

Otro aspecto interesante del experimento de Reynolds es que la conducta de cada pájaroestaba controlada por un estímulo diferente. En ausencia de procedimientos especiales, losinvestigadores no siempre pueden predecir cual de varios estímulos de aquellos que unorganismo experimenta adquirirá control sobre su conducta instrumentalGeneralización de estímulos

Identificar y diferenciar varios estímulos no es algo tan simple. Los estímulos puedendefinirse de formas muy diversas. En ocasiones, objetos o eventos muy diferentes seconsideran ejemplos del mismo estímulo debido a que comparten la misma función. En otroscasos, los estímulos se identifican y distinguen partiendo de rasgos físicos precisos, comola longitud de onda.

Los análisis experimentales del problema han dependido en su mayoría del fenómeno de lageneralización de estímulos, que es lo opuesto a la respuesta diferencial, o discriminaciónde estímulos. Se dice que un organismo muestra generalización de estímulos si respondemanera similar a dos o mas estímulos. Este fenómeno fue observado en primer lugar porPavlov.

En un experimento clásico Guttman y Kalish palomas programa IV picotear con luzamarillenta con longitud de onda 580 anómetros, después se observa que palomas tambiénresponde a 570 y590. Estos resultados mostraron un gradiente de respuesta en función dela semejanza entre cada estímulo de prueba y el estímulo original de entrenamiento. Esteresultado es un ejemplo de lo que se denomina gradiente de generalización de estímulo.

Los gradientes de generalización del estímulo como medidas del control por elestímulo

Se utilizan a menudo para medir el control por el estímulo porque facilitan informaciónacerca del grado de sensibilidad de la conducta de un organismo ante la variación de unaspecto particular del ambiente.

Guttman y Kalish (1956) y el experimento hipotético con las palomas ciegas a los coloresindica que lo acusado del gradiente de generalización de un estímulo proporciona unamedida precisa del grado de control del estímulo. Se obtiene un gradiente degeneralización plano si el organismo responde de forma similar a todos los estímulos de laprueba. Esta falta de respuesta diferencial demuestra que el rasgo del estímulo que sevaria en la prueba de generalización no controla la conducta instrumental. Por el contrario,se obtiene un gradiente de generalización acusado si el organismo responde en mayormedida a algunos de los estímulos de prueba que a otros. Esta respuesta diferencial

Descargado del campus, http://campus.felizmente.info

Page 128: Aprendizaje  resumen jc cabrera temas 1-9

126

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

evidencia el hecho de que la conducta instrumental esta bajo el control del rasgo delestímulo que varia entre los estímulos de prueba.

Si se da una gran cantidad de generalización, se dará poca respuesta diferencial. Si larespuesta es altamente diferencial ante los estímulos, se obtendrá una mínimageneralización.

Factores del estímulo y la respuesta en el control por el estímulo.(página 222 del libro)

La cuestión principal es la siguiente ¿Qué es lo que determina que una de las muchascaracterísticas de una situación estimular adquiera control sobre la conductainstrumental?.

Capacidad sensorial y orientación

El factor que determina de forma mas evidente si una característica particular delestímulo llega a controlar la respuesta es la capacidad sensorial y de orientación delindividuo. La presentación de estímulos con ciertas características de interés para unorganismo no garantiza que otro organismo responderá a las mismas características.

Los sucesos fuera del rango de lo que un organismo puede detectar con sus órganossensoriales simplemente no existen para ese organismo a menos que se amplifiquen o seantraducidos a algo que el organismo pueda detectar. Las limitaciones en los estímulos quepueden llegar a controlar la conducta dependen también de si el individuo llega a tomarcontacto con el estímulo.

Descargado del campus, http://campus.felizmente.info

Page 129: Aprendizaje  resumen jc cabrera temas 1-9

127

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

Facilidad relativa del condicionamiento de varios estímulos

La intensidad con que los organismos aprendensobre un estímulo depende de la facilidad relativade condicionamiento de otras claves presentes en lasituación. Este fenómeno se llamaensombrecimiento. Pavlov fue el primero enobservar que si dos estímulos se presentan al mismotiempo, la presencia del estímulo que se puedeentrenar mas fácilmente puede ocultar elaprendizaje del otro. En general cuanto más intensosea el estímulo , más rápido se condicionara yensombrecerá el aprendizaje del estímulo masdébil. Pavlov encontró que el estímulo débil podíallegar a condicionarse (algo más lentamente ) si sepresentaba solo.

Tipo de reforzamiento

Es más probable que ciertos tipos deestímulos adquieran control sobre laconducta instrumental con reforzamientopositivo que con reforzamiento negativo.

Ciertos hallazgos indican que el control porel estímulo de la conducta instrumentalesta determinado en parte por el tipo dereforzamiento utilizado. Es más probableque los estímulos visuales adquieran controlsobre la conducta en situaciones apetitivasque las claves auditivas, mientras que esmas probable que estas adquieran controlen situaciones aversivas.

Esto está probablemente relacionado conlos sistemas de conducta que se activan enlos dos casos, la activación del sistema de alimentación puede involucrar una sensibilidadincrementada a los estímulos visuales. En contraste los procedimientos de evitación de ladescarga activan el sistema de conducta defensiva. Responder a claves auditivas puede serparticularmente adaptativo para evitar el peligro.

Efectos del tipo de reforzamiento en el control por el estímulo. Sereforzó una respuesta de presión de un pedal en palomas enpresencia de un estímulo compuesto consistente en un tono yuna luz. Con un reforzamiento con comida, la luz obtuvo muchomás control sobre la conducta que el tono. Con unreforzamiento de evitación de una descarga, el tono adquiriómucho más control sobre la conducta que la luz (Adaptado deForee y Lolordo, 1973.)

Factores del estímulo y la respuesta.

1. Capacidad sensorial del individuo.

2. Facilidad de condicionamiento del estimulo.

Unos estímulos secondicionan mejor queotros, por suintensidad,naturaleza...

Descargado del campus, http://campus.felizmente.info

Page 130: Aprendizaje  resumen jc cabrera temas 1-9

128

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

Tipo de respuesta instrumental

Otro factor que puede determinar que rasgos de un estímulo compuesto obtendrán controlsobre la conducta es la naturaleza de la respuesta requerida por el reforzamiento.

Las respuestas que se diferencian por la localización es mas probable que lleguen a estarbajo el control de la característica espacial de las claves auditivas. Por el contrario lasrespuestas que se diferencian por la naturaleza (hacer/no hacer) es mas probable quelleguen a estar bajo el control de la naturaleza de las claves auditivas. Este fenómeno sedenomina efecto de la naturaleza-localizacion. Este efecto es una forma de asociaciónselectiva.

El efecto de naturaleza-localización no significa que los sujetos no puedan nunca aprendersobre la naturaleza de los sonidos cuando están involucradas respuestas que se diferenciasespacialmente o que nunca puedan aprender acerca de la localización de los sonidos en unatarea de hacer/no hacer. Con un emplazamiento oportuno de las fuentes de sonido (unomucho más cerca de la respuesta que el otro), los sujetos pueden llegar a responder a lascaracterísticas de localización de sonidos en una tarea de hacer/no hacer.

Elementos del estímulo frente a claves configuracionales en los estímuloscompuestos.

En el análisis anterior sobre el control de la conducta por varios elementos del estímulo, seasumió que los organismos tratan a estos elementos del estímulo como rasgos distintivos yseparados del ambiente. Esto se denomina aproximación elemental del estímulo. Por tanto,en el efecto de naturaleza-localización, la naturaleza y la localización de un estímuloauditivo se consideran características separables de las claves auditivas. Se suponía queuna característica particular del estímulo (la naturaleza del sonido) se percibía de la mismamanera independientemente del estatus de la otra característica (la localización delsonido). Una alternativa teórica importante presuma que los organismos tratan losestímulos complejos como un todo integral que no se divide en partes o elementos. Esto sedenomina aproximación de la clave configuracional.

De acuerdo con la aproximación de la clave configuracional, los individuos responden a unestímulo compuesto en función de la configuración única de sus elementos. Se asume que loselementos no se tratan como entidades separadas. Pueden incluso no ser identificablescuando se presenta el estímulo compuesto, los elementos del estímulo son importantes noen cuanto a su individualidad sino en función de cómo contribuyen a la configuración totalde la estimulación proporcionada por el compuesto.

El ensombrecimiento , según esta teoría, refleja diferentes grados de decremento de lageneralización desde la fase de entrenamiento a la de prueba para los grupos deensombrecimiento y de control, (John Pearce, 1987): No hay decremento de lageneralización para el grupo de control cuando se prueba el estímulo débil a porque es elmismo estímulo que recibió durante el condicionamiento. Por el contrario, se da unDescargado del campus, http://campus.felizmente.info

Page 131: Aprendizaje  resumen jc cabrera temas 1-9

129

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

considerable decremento de la generalización cuando se prueba el estímulo a en el grupo deensombrecimiento tras el condicionamiento con el compuesto aB. Para el grupo deensombrecimiento, la respuesta se condiciona al compuesto aB, que es muy diferente depresentar sólo a durante la generalización, este mayor decremento de la generalización esla causa del efecto de ensombrecimiento.

En ciertas condiciones, los organismos claramente responden a los estímulos compuestosprincipalmente en términos de la configuración de los elementos que forman el compuesto.Esta teoría es incompatible con varios ejemplos de asociaciones selectivas que se handescrito con anterioridad, no explica por que el control por el, estímulo esta en función deltipo de reforzamiento utilizado o del tipo de respuesta requerida. La conclusión masprudente es que los organismos responden a los compuestos estimulares tanto a partir delos elementos del estímulo que forman el compuesto como en función de configuracionesestimulares únicas creadas por los elementos del estímulo. En ciertas circunstanciaspredomina el control elemental, mientras que en otras condiciones predomina el control delas características configuracionales de los compuestos estimulares.

La estructura de una teoría unificada de este tipo ha sido descrita recientemente porWagner y Brandon (2001), estímulos como el sonido de un tono contienen rasgos distintivos(tono, intensidad, localización ). Cuando un estímulo se combina con otro se crean nuevoselementos estimulares configuracionales que son únicos para este nueva combinaciónestimular. Además, algunos de los rasgos individuales de los estímulos originales se pierdenen la combinación. Esto sesga el control por el estímulo a favor de los elementosconfiguracionales y produce resultados congruentes con la aproximación de la claveconfiguracional.

FACTORES DE APRENDIZAJE EN EL CONTROL POR ELESTÍMULO (página 230 del libro)

Los factores del estímulo y la respuesta son los puntos de arranque del control por elestímulo. El que ciertos estímulos lleguen a controlar la conducta a menudo depende de loque el organismo ha aprendido acerca de esos estímulos.

La sugerencia de que la experiencia con los estímulos puede determinar hasta que puntoestos llegan a controlar la conducta tuvo su origen en los esfuerzos por explicar elfenómeno de la generalización de estímulos. Pavlov sugirió que la generalización del estímulose da porque el aprendizaje sobre el EC llega a transferirse a otros estímulos en función dela semejanza física de esos estímulos de prueba con el EC original.

Lashley y Wade (1946) adoptaron una postura contraria a la de Pavlov. Rechazaron la ideade que la generalización del estímulo reflejase la transferencia del aprendizaje yargumentaron que reflejaba la ausencia de aprendizaje. En particular propusieron que lageneralización del estímulo ocurre si los organismos no han aprendido a distinguir lasdiferencias entre los estímulos. Defendían que los animales tenían que aprender a tratarlos estímulos como diferentes uno de otro. Consideraban la forma del gradiente deDescargado del campus, http://campus.felizmente.info

Page 132: Aprendizaje  resumen jc cabrera temas 1-9

130

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

generalización del estímulo como determinada principalmente por las experiencias previasde aprendizaje del organismo mas que por las propiedades físicas de los estímulos.

Entrenamiento en discriminación de estímulos.

Numerosos estudios han demostrado que el control por el estímulo puede alterarse deforma notable por las experiencias de aprendizaje. El procedimiento más poderoso parasituar la conducta bajo el control de un estímulo es el entrenamiento en discriminación deestímulos. En un procedimiento de discriminación de estímulos los participantes seexponen al menos a dos estímulos diferentes, pero el reforzamiento por realizar larespuesta instrumental esta disponible solo en presencia de uno de los colores. El estímuloque señala la disponibilidad de reforzamiento se denomina E+ o ED (pronunciado “e de”). Encontraste, el estímulo que señala la falta de reforzamiento se denomina E- o EΔ

(pronunciado “e delta”). Losprocedimientos de discriminación deestímulos establecen un control porlos estímulos que señalan cuandoesta o no disponible elreforzamiento. Cuando E+ y E- hanadquirido control sobre la conductadel organismo, se denominanestímulos discriminativos . El E+ esun estímulo discriminativo para larealización de la respuestainstrumental, y el E- es un estímulodiscriminativo para la supresión dela respuesta.

Los procedimientos instrumentales de discriminación de estímulos se diferencian de losprocedimientos de condicionamiento clásico sólo en que el reforzador se presenta de formacontingente a la respuesta durante el E+. No es necesario responder para que se den losemparejamientos del EC+ con el EI en el condicionamiento clásico. A diferencia de un EC+,un E+ no señala de que el reforzador ocurrirá inevitablemente. Más bien, el E+ indica que larespuesta instrumental será reforzada.

En un programa múltiple de reforzamiento funcionan diferentes programas dereforzamiento en presencia de diferentes estímulo.

Efectos del entrenamiento en discriminación sobre el control por el estímulo

El entrenamiento en discriminación sitúa la conducta instrumental bajo el control del E+ yel E-. Los investigadores deben también determinar lo acusado del gradiente degeneralización cuando los participantes responden en presencia de estímulos que varíansistemáticamente a partir del E+: Es mas debe determinarse que aspecto del procedimiento

Descargado del campus, http://campus.felizmente.info

Page 133: Aprendizaje  resumen jc cabrera temas 1-9

131

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

del entrenamiento en discriminación es responsable del tipo de gradiente de generalizacióndel estímulo que se obtiene.

Jenkins y Harrison (1960,1962) examinaron como los estímulos auditivos que diferían en eltono llegaban a controlar la conducta de picoteo de las palomas reforzada con comida. Ungrupo de pájaros fue reforzado por picotear en presencia de un tono de 1000 hertzios y norecibía reforzamiento cuando el tono no se presentaba. El tono de 1000 hz servía como E+y la ausencia de tono como E-.

Para el segundo grupo, el tono de 1000 hz sirvió de nuevo como E+ , pero el E- fue un tonode 950 hz. El tercer grupo de palomas sirvió como grupo de control y no recibióentrenamiento, el tono de 1000 hz sonaba constantemente y siempre podían recibirreforzamiento por picotear cuando estaban en la cámara experimental.

Después de acabar el entrenamiento, en cada grupo se puso a prueba la conducta de picoteoen presencia de tonos de varia frecuencias para ver con que precisión controlaba el tonodicha conducta. El grupo control respondió de forma casi idéntica en presencia de todos losestímulos de prueba; el tono de los sonidos no controlaba su conducta: Cada uno de losotros procedimientos de entrenamiento produjo un mayor nivel de control estimular por eltono. El gradiente de generalización mas acusado y por tanto el control por el estímulo masfuerte se observo en los pájaros que habían sido entrenados con el tono de 1000 hz comoE+ y el tono de 950 como E-. Las otras (1000 hz y ausencia de tono ) mostraron un gradointermedio de control.

Este experimento aporto dos conclusiones importantes (1) el entrenamiento endiscriminación aumenta el control por el estímulo de la conducta instrumental, y (2) unadimensión particular del estímulo (como la frecuencia tonal ) es mas probable que adquieracontrol sobre la respuesta si el E+ y el E- difieren a lo largo de la dimensión del estímulo.

Rango de posibles estímulos discriminativos

Los procedimientos de entrenamiento en discriminación se emplean a menudo para evaluarla capacidad sensorial de los animales. Schsterman y colaboradores lo han utilizado paradeterminar los umbrales visuales y auditivos .Los investigadores también se han interesadopor el estudio de si los animales son capaces de detectar las sensaciones internas creadaspor una droga. Esta investigación ha mostrado que los mecanismos de control por elestímulo con drogas son asombrosamente parecidos a los mecanismos identificados porJenkins y Harrison para el control del picoteo de una tecla por claves visuales en laspalomas. El gradiente de generalización fue mucho mas acusado, lo que indica un control porlas drogas mucho mas fuerte.

Descargado del campus, http://campus.felizmente.info

Page 134: Aprendizaje  resumen jc cabrera temas 1-9

132

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

¿Qué se aprende en el entrenamiento de discriminación?

Se aprende a responder al E+ como a suprimir la respuesta ante el E-.

Teoría de Spence del aprendizaje de discriminación: Esta basada en la idea de que lo quese aprende tanto el significado del E+ como del E-, o sea aprender tanto a responder al E+como a suprimir la respuesta ante el E-. El reforzamiento de una respuesta en presencia delE+ condiciona tendencias excitatorias de respuesta al E+. Por el contrario, el noreforzamiento de la respuesta durante el E- condiciona propiedades inhibitorias al E-, loque sirve para suprimir la conducta instrumental. Se asume que la respuesta diferencial alE+ y al E- refleja tanto la excitación por responder ante el E+ como la inhibición porresponder ante el E-.

Comprobar esto requiere pruebas sofisticadas. Una posibilidad es utilizar los gradientes degeneralización del estímulo.

Si se ha condicionado una tendencia exitatoria al E+, entonces los estímulos que difieran deforma progresiva del E+ deberían ser cada vez menos efectivos en evocar la respuestainstrumental. En otras palabras, debe observarse un gradiente de generalización acusado,con la mayor cantidad de respuesta ante el E+. Un resultado como este se llama gradientede generalización del estímulo excitatorio. Por el contrario, si se ha condicionado unatendencia inhibitoria al E-, entonces los estímulos que difieran progresivamente del E-deberían ser cada vez menos efectivos en inhibir la respuesta instrumental, este resultadose llama gradiente de generalización del estímulo inhibitorio.

Las pruebas conductuales llevadas acabo décadas después omprobaronque las ideas de Spence eransustancialmente correctas. En unexperimento clásico Honig, Boneau,Burstein y Pennypacker, 1963. Ungrupo de palomas es reforzadocuando la tecla estaba iluminada conluz blanca y una línea vertical negra(E+) sin la línea vertical no refuerzo(E-). 2º Grupo el E+ y E-intercambiados, después de que losdos grupos aprenden a responder alE+, se llevaron a cabo las pruebas degeneralización del estímulo paraaveriguar el grado de control de labarra vertical negra sobre laconducta; en el grupo 1, mayor tasade respuesta ante la raya vertical yprogresivamente descendiendo, esto

Gradientes de generalización del estímulo para estímulosconsistentes en la inclinación de una línea en dos grupos de palomastras un entrenamiento en discriminación. Para el Grupo 1, sirvió comoE+ una barra vertical negra sobre un fondo blanco, y la luz blanca sinbarra sirvió como E-. Para el Grupo 2, las funciones de los estímulosse invirtieron.

Descargado del campus, http://campus.felizmente.info

Page 135: Aprendizaje  resumen jc cabrera temas 1-9

133

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

ilustra un gradiente de generalización del estímulo excitatorio. En el grupo 2los estímulosque eran cada vez mas diferentes del original E- producían progesivamente menos inhibiciónen la conducta, ilustrando un gradiente de generalización del estímulo inhibitorio.

Este experimento muestra que el entrenamiento en discriminación puede producir tantocondicionamiento excitatorio al E+ como condicionamiento inhibitorio al E-. El hecho de quelos gradientes de excitación e inhibición puedan ocurrir alrededor del E+ y del E-proporcionan un fuerte apoyo a la teoría de Spence del aprendizaje de discriminación.

Se obtienen diferentes resultados si los estímulos E+ y E- difieren cuantitativamente enuna caraterística en lugar de cualitativamente ( incluyendo muchas características.)

Interacciones entre el E+ y el E-: desplazamiento del máximo

Lo que los sujetos aprenden sobre el E+ es independiente de lo que aprenden sobre el E-.Esta suposición es demasiado simplista. Lo que se aprende sobre el E+ puede influir en larespuesta al E- y viceversa. Estas interacciones son particularmente probables si el E+ y elE- se relacionan de alguna manera.

Una de las maneras en que el E+ y el E- puede estar relacionados es siendo semejantesexcepto por un rasgo o atributo. Un procedimiento de entrenamiento en que sólo difierenpor el valor de una característica del estímulo se llama discriminación intradimensional.

Las discriminaciones intradimensionales son de particular interés debido a que estánrelacionadas con el problema de la ejecución experta, esta implica normalmente realizardistinciones sutiles. Distinguir los estímulos que difieren en un única característica es masdifícil que distinguir entre estímulos que difieren en muchos aspectos. La discriminaciónintradimensional requiere la detección de un único rasgo diferenciador entre el E+ y el E-y, en consecuencia, es una forma de ejecución experta.

Una característica importante de la discriminación intradimensional es que a veces dancomo resultado una interesante interacción entre las respuestas al E+ y al E-, en unexperimento clásico Hanson (1959) examinaba el grado en que varios colores controlaban laconducta de picoteo en paloma. Todos los sujetos fueron reforzados con un luz de 550nn, elE+ era el mismo para todos los grupos, diferían en lo similar que era el E- al E+. un gruporecibió un E- de 590nn , para otro grupo el E- era de 555nm, y u n grupo de control que norecibió entrenamiento en discriminación pero que también fue reforzado por picotear enpresencia del estímulo de 550 nm. El grupo de control mostró un gradiente degeneralización del estímulo excitatorio normal centrado alrededor del E+, el grupo en que elE- fue de 590nm mostró un desplazamiento del máximo del gradiente de generalizacióndesde el E+ llamativo porque la respuesta nunca se reforzó en 540 o 530 donde seobtuvieron las tasas mas altas de respuesta, estos estímulos nunca habían sido presentadosdurante el entrenamiento original.

El desplazamiento del máximo del gradiente de generalización alejado del E+ original seDescargado del campus, http://campus.felizmente.info

Page 136: Aprendizaje  resumen jc cabrera temas 1-9

134

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

denomina efecto del desplazamiento del máximo, este puede ocurrir en cualquierdiscriminación intradimensional.

Explicación de Spence del desplazamiento del máximo. El efecto de desplazamiento demáximo es importante porque muestra que el único estímulo en cuya presencia se refuerzala respuesta (E+) no es necesariamente es estímulo que evoca la tasa de respuesta más alta.Spence sugirió que los gradientesexcitatorio e inhibitorio pueden producir elfenómeno de desplazamiento del máximo,asumió que el entrenamiento endiscriminación intradimensional producegradientes de generalización excitatorios einhibitorios centrados en el E+ y el E-, sinembargo, debido a que el E+ y el E- sonsemejantes en las tareas de discriminaciónintradimensional, los gradientes de generalización de la inhibición y excitación sesuperpondrán. Es mas, el grado de superposición dependerá del grado de semejanza entreel E+ y el E-. La inhibición generalizada del E- suprimirá la respuesta al E+, dando comoresultado un efecto de desplazamiento del máximo.

Explicaciones alternativas del desplazamiento del máximo: Una cuestión importante es sivemos los estímulos en función de sus propiedades individuales y absolutas, o en función desu relación con otros estímulos que experimentamos, existe evidencia consistente con cadauna de estas aproximaciones, que sugiere que ambos tipos de mecanismos están implicadosen la forma de responder de los organismos.

El modelo de Spence es un modelo de aprendizaje absoluto del estímulo. Predice laconducta basada en las propiedades excitatorias netas de los estímulos individuales. Unaaproximación alternativa asume que los organismos aprenden a responder a un estímulobasándose en la relación de ese estímulo con otras claves de la situación. Una prediccióninteresante de esta aproximación es que la forma de un gradientes de generalizacióncambiara en función del rango de los estímulos de prueba que se presenten durante lasesión de generalización. Estas y oras predicciones de la teoría relacional han sidoconfirmadas.

Entrenamiento de equivalencia de estímulos

De la misma forma que el entrenamiento en discriminación potencia la respuestadiferencial, el entrenamiento en equivalencia potencia la respuesta generalizada oequivalencia de estímulos.

Se dispone de varias aproximaciones para promover la generalización en lugar de ladiscriminación, 1º (Herrnstein, Loveland y Cable 1976, la estrategia básica deentrenamiento es reforzar la misma respuesta en presencia de varias imágenes que

Descargado del campus, http://campus.felizmente.info

Page 137: Aprendizaje  resumen jc cabrera temas 1-9

135

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

contiene agua, una vez que aprenden la discriminación agua/no agua, su conducta segeneralizo a nuevas fotografía.

Los investigadores también han explorado la posibilidad de que la equivalencia funcionalentre dos estímulos diferentes podría establecerse enlazando cada una de las distintasclaves con un tercer estímulo común Ej. Honey y Hall (1989) un grupo ruido y click concomida, grupo control ruido y click, solo el click con comida después ambos recibe ruido condescarga-miedo al ruido. Los investigadores estaban interesados en saber si este miedocondicionado se generalizaría al clik, se dio significativamente mas generalización en losanimales entrenados en equivalencia que en el grupo de control.El emparejamiento de estímulos diferentes con la misma consecuencia crea equivalenciafuncional entre esos estímulos, con la consecuencia de que una respuesta condicionada a unode ellos se generalizara a los oros. Una definición mas formal de clase de equivalencia hasido propuesta por Siedman y colaboradores. Se dice que existe una clase equivalencia sisus miembros poseen propiedades matemáticas 1 reflexividad o igualdad, 2 simetría y 3transitividad. La reflexividad o igualdad se refiere a la relación A=A: la simetría existe siuna relación es bidireccional, la transitividad se refiere a la integración de dos relacionesen una tercera.

CLAVES CONTEXTUALES Y RELACIONES CONDICIONALES(página 242 del libro)

Un estímulo se dice que es discreto si se presenta durante un breve periodo y tiene uncomienzo y un final claros. Las claves contextuales pueden ser visuales, auditivas o clavesolfatoria de la habitación o lugar donde se presentan los estímulos discriminativosdiscretos. La investigación reciente indica que las claves contextuales pueden proporcionaruna importante fuente adicional de control de la conducta aprendida.

Control por claves contextualesLas claves contextuales pueden llegar a controlar la conducta instrumental. Es más fácilconcentrarse en una biblioteca del colegio que en casa durante las vacaciones, debido alcontrol contextual de la conducta de estudio por los estímulos experimentados en labiblioteca. Charlar en un partido de fútbol, pero no durante misa es otro ejemplo del poderde las claves contextuales.

El control contextual por el estímulo puede ocurrir sin que un contexto esté másfuertemente asociado con el reforzamiento que otro. Dado que un contexto no es mejorseñal par el reforzamiento que otro, las asociaciones involucran un tipo diferente demecanismos. Una posibilidad es que cada contexto activa una memoria diferente. Que leContexto 1 active la memoria de reforzamiento con 90º y la de ausencia de reforzamientocon 0º. Por el contrario, el Contexto 2 active la memoria de reforzamiento con 0º y la deausencia de reforzamiento con 90º. En lugar de estar asociado con un estímulo particular,cada contexto podría estar asociado con una contingencia diferente E+/E-. Estasasociaciones se denominan relaciones condicionales.

Descargado del campus, http://campus.felizmente.info

Page 138: Aprendizaje  resumen jc cabrera temas 1-9

136

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

Control por las relaciones condicionales

En capítulos anteriores se han destacado las relaciones que involucran sólo dos eventos, unEC y un EI, o una respuesta y un reforzador. Las relaciones entre dos eventos se llamanrelaciones binarias. En ciertas circunstancias, la naturaleza de un relación binaria estadeterminada por un tercer suceso, llamado modulador. La relación de un modulador con larelación binaria que señala se denomina una relación condicional.

Numerosos experimentos hanindicado que los animales puedenaprender a utilizar moduladores paradecir cuando esta en funcionamientouna relación binaria particular.

Un procedimiento en el que unorganismo es reforzado porresponder en presencia del E+ perono es reforzado en presencia del E-,los estímulos discriminativos E+ y E-son moduladores que señalan la relación entre la respuesta y el reforzador. Existe unarelación respuesta-reforzador durante el E+ y una relación diferente durante el E-, portanto los procedimientos de discriminación instrumental incluyen el control condicional dela relación entre la respuesta y el reforzador.

Control condicional en el condicionamiento pavloviano. El concepto fundamental delcontrol condicional es que un evento señala la relación entre otros dos eventos.

Un modulador es un tercer elemento que indica cuándo la presentación del EC o elreforzador aparecerá.

En los procedimientos de discriminación instrumental, los moduladores (E+ y E-) sedenominan "estímulos discriminativos". En el condicionamiento pavloviano han denominado alcontrol condicional de la respuesta facilitación debido a que el modulador facilita larespuesta del EC. Mas común, el control condicional en el condicionamiento clásico se llamaestablecimiento de la ocasión porque el modulador establece la ocasión para losemparejamientos del EC con el EI. En esta terminología, el modulador se llama establecedorde la ocasión.

Distinción entre la excitación y la modulación. El establecimiento de la ocasión es unaspecto importante del condicionamiento clásico porque parece involucrar mecanismos deaprendizaje diferentes . Los emparejamientos de un EC con un EI dan como resultado unaasociación entre los dos sucesos tal que la presentación del EC llega a activar unarepresentación del EI. Este tipo de aprendizaje se ha considerado que refleja elcondicionamiento de la excitación al EC. Las propiedades modulatorias de los estímulos sondiferentes de la excitación condicionada.Descargado del campus, http://campus.felizmente.info

Page 139: Aprendizaje  resumen jc cabrera temas 1-9

137

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

En varios estudios, los intentos de obtener evidencia de las propiedades excitatoriascondicionadas de los moduladores han fracasado, estos experimentos indican que unestímulo puede establecer la ocasión para la respuesta condicionada elicitada por otra clavesin elicitar por si mismo una respuesta condicionada visible. Otros estudios han mostradoque condicionar las propiedades excitatorias simples a un estímulo no hace que estefuncione como un modulador.

La evidencia adicional para mantener la distinción entre modulación y excitacióncondicionada se basa en los efectos de los procedimientos de extinción. La extinción es unprocedimiento en el cual un estímulo previamente condicionado se presenta repetidamentepero se omite el EI.

Un estímulo condicionado excitatorio señala la próxima presentación del EI. La ausenciadel EI después de la presentación del EC durante la extinción es una violación de esaexpectativa. Por tanto, el valor como señal del EC tiene que reajustarse en la extinción paraestar en consonancia con la nueva realidad. Un reajuste como este no se requiere en unprocedimiento de extinción de un establecedor de la ocasión

Un establecedor de la ocasión señala una relación entre un EC y un EI. La ausencia del EIcuando se presenta el establecedor de la ocasión por si solo durante la extinción nosignifica que la relación entre el EC y el EI haya cambiado. La información señalada por unestablecedor de la ocasión no se prueba que sea incorrecta mediante la presentación delmodulador por si mismo durante la extinción. En consecuencia, la habilidad del moduladorpara promover la respuesta elicitada se reduce si se altera la relación EC-EI señalada porel modulador.

Otra evidencia que apoya la conclusión de que el establecedor de la ocasión es distinto de laexcitación convencional se ha obtenido en las pruebas de transferencia, estas fueronllevadas a cabo para determinar si un estímulo que había sido condicionado para establecerla ocasión de responder a un EC critico particular también incrementaría la respuesta aorto EC. Se ha obtenido evidencia de transferencia positiva de los efectos de unmodulador a un nuevo EC critico, los efectos de transferencia son mas probables si losnuevos estímulos críticos han servido previamente como estímulos críticos de otrosestímulos moduladores. Las limitaciones en la transferencia proporcionan evidenciaadicional de que los moduladores tienen sus efectos mediante algún mecanismo distinto dela excitación convencional.Modulación frente a condicionamiento configuracional: Los efectos modulatoriosrequieren la respuesta al compuesto estimular como constituido por elementosindependientes estimulares, Los investigadores han presentado los elementos uno tras otromas que simultáneamente, en lo que se llama compuesto serial. En los ensayos reforzados,el establecedor de la ocasión es presentado normalmente primero, seguido por el EC críticoy el reforzamiento. Holland y colaboradores han encontrado que los organismos respondena las discriminaciones condicionales que incluyen compuestos seriales en términos de

Descargado del campus, http://campus.felizmente.info

Page 140: Aprendizaje  resumen jc cabrera temas 1-9

138

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

relaciones condicionales. En contraste, la utilización de compuestos simultáneos en ladiscriminación condicional a menudo no produce efectos modulatorios.

COMENTARIOS FINALES(página 249 del libro)

El control por el estímulo se refiere al grado de precisión del ajuste de la conducta de unorganismo a las características específicas del ambiente. Por tanto, los temas relacionadoscon el control de la conducta por el estímulo son importantes para entender cómo unorganismo interactúan con su ambiente. El control por el estímulo se mide en términos deapuntamiento de los gradientes de generalización. Un gradiente de generalización acusadoindica que pequeñas variaciones en un estímulo producen grandes diferencias en larespuesta. Un control por el estímulo más débil se manifiesta en gradientes degeneralización más planos.

El grado de control por el estímulo está determinado por numerosos factores, incluyendo lacapacidad y orientación sensorial del organismo, la prominencia relativa de otras claves enlas situaciones, el tipo de reforzamiento utilizado, y el tipo de respuesta requerida para elreforzamiento. El control por el estímulo está también en función del aprendizaje. Elentrenamiento en discriminación aumenta el control de la conducta por el estímulo tanto siincluye estímulos que difieren en varios aspectos como en uno solo. El entrenamiento endiscriminación con estímulos que difieren sólo en una dimensión produce un control por elestímulo más preciso y puede llevar al resultado contraintuitivo de que el nivel máximo derespuesta se desplace del estímulo reforzado. Lo opuesto del entrenamiento endiscriminación es el entrenamiento en equivalencia, el cual aumenta la generalización de laconducta.

No sólo los estímulos discretos sino también las claves contextuales de fondo pueden llegara controlar la conducta. El control del estímulo por claves contextuales puedendesarrollarse aun cuando no se requiera atención a las claves contextuales para optimizarel reforzamiento. Las claves contextuales pueden llegar a asociarse directamente con el EIo servir para modular la relación entre un EC discreto y un EI.

Descargado del campus, http://campus.felizmente.info

Page 141: Aprendizaje  resumen jc cabrera temas 1-9

139

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

TÉRMINOS CLAVE

Aproximación de la clave configuracional Aproxi-mación al análisis del control por estímuloscompuestos que asume que los organismosresponden a un estímulo compuesto como un todointegral más que a una colección de elementosestimulares separados e independiente. (Compa-rése con la aproximación elemental del estímulo)

Aproximación elemental del estímulo Aproximaciónal análisis del control por los estímuloscompuestos que asume que los participantesresponden a un estímulo compuesto en términosde los elementos del estímulo que forman elcompuesto. (Compárese con aproximación de laclave configuracional.)

Desplazamiento del máximo Desplazamiento de latasa más alta de respuesta en un gradiente degeneralización del estímulo desde el E+ endirección opuesta al E- después del entrenamien-to en discriminación intradimensional.

Discriminación del estímulo Respuesta diferencialen presencia de dos o más estímulos.

Discriminación intradimensional Discriminaciónentre estímulos que difieren sólo en cuanto alvalor de una característica del estímulo, como elcolor, el brillo o el tono.

Equivalencia de estímulos Responder a estímulosfísicamente distintos como si fuesen igualesdebido a experiencias comunes previas con losestímulos.

Ensombrecimiento Interferencia en elcondicionamiento de un estímulo debido a lapresencia simultánea de otro estímulo que es másfácil de condicionar.

Establecimiento de la ocasión Lo mismo quefacilitación.

Estímulo discriminativo Estímulo que controla laejecución de la conducta instrumental porqueseñala la disponibilidad (o no disponibilidad) dereforzamiento.

Facilitación Procedimiento en el que una clavedesigna cuándo otra clave será reforzada.También llamado establecimiento de la ocasión.

Generalización del estímulo Ocurrencia de unaconducta aprendida a través de habituación ocondicionamiento en presencia de estímulos queson diferentes de los estímulos utilizadosdurante el entrenamiento.

Gradiente de generalización del estímuloGradiente de respuesta que se observa si losparticipantes se prueban con estímulos quedifieren cada vez más del estímulo que estabapresente durante el entrenamiento. (Véasetambién gradiente de generalización del estímuloexcitatorio y gradiente de generalización delestímulo inhibitorio.)

Gradiente de generalización del estímuloexcitatorio Gradiente de respuesta que seobserva cuando se prueba a los organismos con elE+ de un procedimiento de discriminación y conestímulos que difieren cada vez más del E+. Elnivel más alto de respuesta sucede con losestímulos similares al E+; se da progresivamentemenos respuestas a los estímulos que difierencada vez más del E+. Por tanto, el gradiente tieneforma de U invertida.

Gradiente de generalización del estímuloinhibitorio Gradiente de respuesta que seobserva cuando se prueba a loa organismos con elE- de un procedimiento de discriminación y conestímulos que difieren cada vez más del E-. Elnivel más bajo de respuesta sucede con losestímulos similares al E-; se da progresivamentemás respuestas a los estímulos que difieren cadavez más del E-. Por tanto, el gradiente tieneforma de U.

Modulador Estimulo que señala la relación entreotros dos sucesos. La naturaleza de una relaciónbinaria está determinada por el modulador.

Descargado del campus, http://campus.felizmente.info

Page 142: Aprendizaje  resumen jc cabrera temas 1-9

140

PRINCIPIOS DE APRENDIZAJE Y CONDUCTACapítulo 8:El control de la conducta por el estímulo

Juan Carlos Cabrera

Procedimiento de discriminación del estímulo (encondicionamiento clásico) Procedimiento decondicionamiento clásico en el cual un estímulo (elEC+) es emparejado con el estímulo incondi-cionado en algunos ensayos y otros estímulos (elEC-) se presenta sin el estímulo incondicionado enotros ensayos. Como resultado de este procedi-miento, el EC+ llega a elicitar una respuestacondicionada, y el EC- llega a inhibir esta res-puestas. (También denominado inhibición diferen-cial.)

Procedimiento de discriminación del estímulo (encondicionamiento instrumental) Procedimiento enel cual el reforzamiento por responder estádisponible siempre y cuando se presente unestímulo (el E+, o ED) y no está disponible siemprey cuando se presente otro estímulo (el E- o E∆).

Programa múltiple de reforzamiento Procedimientoen el cual funcionan diferentes programas dereforzamiento en presencia de diferentesestímulos presentados en sucesión. General-mente, cada estímulo llega a evocar un patrón derespuesta que se corresponde con el programade reforzamiento.

Relación condicional Relación en la que lasignificación de un estímulo o suceso depende delestatus del otro estímulo.

Descargado del campus, http://campus.felizmente.info

Page 143: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 144: Aprendizaje  resumen jc cabrera temas 1-9

143

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

Efectos de los procedimientos de extinción

Extinción y aprendizaje originales- Recuperación espontánea- Renovación del condicionaiento excitatorio original- Restauración de la ejecución de la extinción.- Restablecimiento de la excitación condicionada.- Sensibilidad a a devaluación del reforzador.

¿Qué se pretende en la extinción?- Asociación E-R inhibitorias- Efectos “paradójicos”- Mecanismos del reforzamiento parcial de la extinción

Resistencia a la extinción y momento conductual

Comentarios finales

Descargado del campus, http://campus.felizmente.info

Page 145: Aprendizaje  resumen jc cabrera temas 1-9

Descargado del campus, http://campus.felizmente.info

Page 146: Aprendizaje  resumen jc cabrera temas 1-9

145

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

La extinción puede llevarse a cabo sólo después de que haya sido establecida unarespuesta o una asociación utilizando condicionamiento pavloviano o instrumental. Elobjetivo es revertir los efectos de la adquisición, pero raramente se alcanza y en la mayoríaresultan imposible. Fenómenos como la recuperación espontánea, la renovación y elrestablecimiento muestran que la extinción no elimina lo que se aprendió de forma original.

Los estudios sobre devaluación del reforzador sugieren que la extinción no tienevirtualmente ningún impacto sobre las asociaciones E-C o R-C. Parece implicar el nuevoaprendizaje de una asociación E-R inhibitoria que se superpone a lo que se aprendió conanterioridad.

La inhibición surge de los efectos de la frustación y esta falta inesperada derecompensa es responsable de una serie de efectos “paradójicos” de la recompensa,incluyendo el efecto del reforzamiento parcial en la extinción.

El reforzamiento parcial o intermitente permite a los organismos aprender sobre lafalta de recompensa de manera que les sirva para inmunizarse frente a los efectos de laextinción, como demuestra los estudios acerca del momento conductual.

La extinción implica la omisión del EI o reforzador. Por tanto, la extinción en elcondicionamiento clásico incluye presentaciones repetidas del estimulo condicionado por sísolo; la extinción en el condicionamiento instrumental implica no volver a presentar elreforzador como una consecuencia de la respuesta instrumental. El resultado es que larespuesta condicionada disminuye. La extinción no es lo contrario de la adquisición.

La extinción se produce por la omisión del EI que sigue a las presentaciones del EC ola omisión del reforzador que sigue a la respuesta instrumental. El olvido, por el contrario,es una disminución de la respuesta condicionada que se da por la ausencia prolongada deexperiencia con el estimulo condicionado o con la respuesta instrumental.

La extinción no siempre funciona en la terapia de conducta, los avances sugieren quelos fallos en la extinción reflejan las limitaciones normales de la misma. La extinción norevierte los efectos de la adquisición, en lugar de ello, implica el aprendizaje de algo nuevoque se superpone sobre lo que se aprendió antes (sin la perdida de lo que se aprendióanteriormente).

Descargado del campus, http://campus.felizmente.info

Page 147: Aprendizaje  resumen jc cabrera temas 1-9

146

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

EFECTOS DE LOS PROCEDIMIENTOS DE EXTINCION.(página 253 del libro)

La extinción disminuye la tasa de respuesta e incrementa la variabilidad de respuesta, perono altera de otro modo la estructura de la conducta.

Si un organismo está acostumbrado a recibir reforzamiento por una respuesta particular,puede trastornarse cuando no vuelve a entregar los reforzadores. Las reacción emocionalinducida por la falta de un reforzador esperado se denomina frustación. La ausenciafrustrante de recompensa proporciona energía a la conducta que en ocasiones puede ser losuficietemente severa como para implicar reacciones agresivas.

EXTINCION Y APRENDIZAJE ORIGINAL (página 255 del libro)

Aunque la extinción produce importantes efectos conductuales y emocionales, no reviertelos efectos de la adquisición. La evidencia de que la extinción no elimina lo que se aprendióoriginalmente se ha obtenido a través de estudios sobre la renovación espontanea, larenovación, el restablecimiento y los efectos de la devaluación del reforzador.

Recuperación espontanea

La recuperación espontanea tras el condicionamiento pavloviano: La extinción se disipacon el tiempo, y como consecuencia, la respuesta condicionada original vuelve a presentarsesi el sujeto se pone a prueba tras una demora que siga al procedimiento de extinción.

Recuperación espontanea tras el condicionamiento instrumental: La recuperaciónespontánea es un fenómeno notable en la extinción tras el condicionamiento instrumental. Laintroducción de un periodo de descanso tras la extinción produce una recuperaciónsustancial en la respuesta.

Renovación del condicionamiento excitatorio original

La renovación se refiere a la recuperación de la ejecución propia de la adquisición que se dacuando se cambian las claves contextuales que estaban presentes durante la extinción. Elcambio puede consistir en una vuelta al contexto de la adquisición original o a un cambio a uncontexto “neutral”.

El efecto de la renovación no sólo se ha observaldo en el condicionamiento pavloviano delmiedo, sino también en el condicionamiento apetitivo del miedo, la inhibición condicionada y

Descargado del campus, http://campus.felizmente.info

Page 148: Aprendizaje  resumen jc cabrera temas 1-9

147

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

en varias situaciones de condicionamiento instrumental. El fenómeno se evidencia no sólocon claves externas contextuales sino con claves contextuales creadas por estadosprovocados por drogas. También puede darse si el sujeto se retira del contexto deadquisición a uno alternativo que no es el de la adquisición original. Este tipo de renovaciónno es tan sólido como cuando se reinstaura en el contexto original de adquisición.

La mayor parte de la evidencia indica que el efecto de renovación se produce porque lamemoria de la extinción es específica de las claves que estaban presentes durante la fasede extinción. En consecuencia, un cambio en el contexto de la extinción dificulta larecuperación de la memoria de extinción, con el resultado de que se pierde la ejecuciónpropia de la extinción.

Bouton (1993,1994) ha sugerido que las claves contextuales sirven para eliminar laambigüedad del significado de un estimulo condicionado. Un EC que adquierecondicionamiento excitatorio y luego se extingue también tiene un significado ambiguo, en elsentido de que podría indicar la cercanía del EI (adquisición) o su ausencia (extinción). Estaambigüedad permite al EC ponerse bajo el control contextual de manera más fácil. Tras elentrenamiento de adquisición por sí solo, el EC no es ambiguo porque solo significa una cosa(la proximidad de la entrega del EI). En consecuencia, este EC no es susceptible de controlcontextual.

Los investigadores han explorado la forma de reducir el efecto de renovación. Unprocedimiento que se muestra prometedor es llevar a cabo la extinción en distintoscontextos. Otras técnicas para reducir el efecto de renovación implican entrenamiento eninhibición condicionada, condicionamiento diferencial, y la presentación del ECexplícitamente emparejado con el EI.

Restauración de la ejecución propia de la extinción

El efecto de renovación representa reactivar una conducta aprendida previamente medianteel cambio del contexto a condiciones más aproximadas a las presentes cuando la conductase adquirió con anterioridad. Esta estrategia puede aplicarse a la extinción, es decir, laejecución propia de la extinción puede restaurarse introduciendo claves contextuales quereactiven la memoria de extinción.

La recuperación espontanea implica la recuperación de la conducta condicionadaoriginalmente que sigue a la extinción si transcurre un periodo suficiente de tiempo tras lafase de extinción. La conducta propia de la extinción puede restaurarse (contrarrestando larecuperación espontaneas) presentando las claves que estaban presentes durante la fase de

Descargado del campus, http://campus.felizmente.info

Page 149: Aprendizaje  resumen jc cabrera temas 1-9

148

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

extinción. La recuperación expontánea se debe a un eterioro de las claves contextuales dela extinción que se da con el paso del tiempo.

Restablecimiento de la excitación condicionada

El restablecimiento se refiere a la recuperación de la respuesta excitatoria a un estimuloextinguido, producida por exposiciones al estimulo incondicionado. Las respuestas que seextinguen con éxito, pueden recuperarse si el individuo se enfrenta de nuevo con el estímuloincondicionado.

Investigaciones durante los últimos 20 años sobre el efecto del restablecimiento, hanindicado que el condicionamiento contextual es importante, pero no porque permita la sumade la extinción sino por suprimir la ambigüedad del significado de un estimulo que tiene unahistoria mezclada de condicionamiento y extinción. El contexto tiene poco efecto en losestímuos con una historia sólo de condicionamiento.

Bouton considera el restablecimiento como una forma de renovación. Las clavescontextuales condicionadas proporcionan algunas de las claves contextuales para larespuesta excitatoria en circunstancias normales. Estas se extinguen cuando se presenta elEC por si solo durante la extinción.

Sensibilidad a la devaluación del reforzador

La persistencia del aprendizaje original a pesar de la extinción puede también investigarseanalizando los efectos de la devaluación del reforzador. Rescorla ha utilizado la técnica dedevaluación del EI para determinar si la asociación EC-EI establecida a través decondicionamiento pavloviano persiste a lo largo de la extinción.

Los hallazgos han fortalecido la conclusión de que la extinción no elimina las asociaciones -R-C y E-C que se aprende durante el condicionamiento instrumental.

Descargado del campus, http://campus.felizmente.info

Page 150: Aprendizaje  resumen jc cabrera temas 1-9

149

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

¿QUE SE APRENDE EN LA EXTINCIÓN? (página 266 del libro)

Si como hemos visto la extinción no implica “desaprendizaje” y deja intacta las asociacionesR-C y E-C, ¿por qué disminuye las respuestas en los procedimientos de extinción?

Asociaciones ER inhibitorias

Los investigadores han vuelto a considerar la relevancia de las asociaciones E-R. En lugar decentrarse en las asociaciones excitatorias E-R, como hizo originalmente Thorndike, hanllegado a la conclusión de que la falta de reforzamiento produce una asociación E-Rinhibitoria: La falta de reforzamiento de una respuesta en presencia de un estímuloespecífico, produce una asociación E-R inhibitoria que sirve para suprimir esa respuestasiempre y cuando el E esté presente. Esta hipótesis, predice que los efectos de la extinciónserán altamente específicos del contexto en el que la respuesta fue extinguida.

La omisión de una recompensa esperada genera desilusión o frustración. Estos efectosemocionales se presume que desempeñan un papel crítico en la disminución conductual que seda en la extinción. La ausencia de recompensa esperada desencadena una reacción frustanteaversiva incondicionada que sirve para que se deje de responder durante el curso de laextinción mediante el establecimiento de una asociación inhibitoria.

La afirmación de que la extinción implica el aprendizaje de una asociación inhibitoria resultacontrovertida frente a las teorías convencionales que consideraban la inhibicióncondicionada y la extinción como fenómenos diferentes.

Efectos paradójicos de la recompensa

Efecto de sobreentrenamiento en la extinción. Cuanto más entrenamiento conreforzamiento se proporciona más fuerte es la expectativa de recompensa, y más fuerte lafrustración cuando se introduce la extinción. La disminución en la respuesta se debe a losefectos frustrantes de la ausencia de recompensa, el entrenamiento de reforzamiento másextenso produce una extinción más rápida. Especialmente evidente cuando el entrenamientoincluye reforzamiento continuo.

Ejemplo: Podriamos pensar que un entrenamiento más extenso crearía una respuesta “más fuerte”,que sería más resistente a la extinción, pero sucede lo contrario.

Descargado del campus, http://campus.felizmente.info

Page 151: Aprendizaje  resumen jc cabrera temas 1-9

150

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

Efecto de magnitud del reforzamiento en la extinción: se refiere al hecho de que larespuesta disminuye más rápido durante la extinción que sigue a un reforzamiento con unreforzador mayor. Es más evidente cuando el entrenamiento incluye reforzamientocontinuo.

Ejemplo: Si consideramos dos posibiliades: en una, que se recibe 100€ al mes; en la otra, 20€ al mes.Si se deja de percibir la cantidad, es más aversiva si nos hemos acostumbramos a 100 que a 20.

Efecto del reforzamiento parcial en la extinción: Es el efecto paradójico más estudiado.Un factor crítico que determina la magnitud de los efectos tanto conductuales comoemocionales de un procedimiento de extinción es el programa de reforzamiento que operaantes de que se introduzca el procedimiento de extinción. Pero la característica dominantedel programa que determina los efectos de la extinción es si la respuesta instrumental sereforzó cada vez que ocurría (reforzamiento continuo) o sólo algunas veces (reforzamientointermitente o parcial). La extinción es mucho más lenta y produce menos reacciones defrustración si estaba en activo un programa de reforzamiento parcial antes de laintroducción del procedimiento de extinción. Este fenómeno se denomina el efecto dereforzamiento parcial en la extinción o ERPE,

Mecanismos del efecto del reforzamiento parcial en la extinción

La explicación más evidente del ERPE es que la introducción de la extinción es más fácil dedetectar tras el reforzamiento continuo que tras el reforzamiento parcial. La ausencia dereforzamiento es presumiblemente mucho más fácil de detectar tras el reforzamientocontinuo. Esta explicación del efecto del reforzamiento parcial en la extinción se llamahipótesis de la discriminación.

El reforzamiento parcial parece enseñar a los sujetos a no rendirse ante la ausencia dereforzador. El reforzamiento parcial favorece la persistencia de dos formas diferentes.Una explicación seria la teoría de la frustración, basada en que los sujetos aprenden sobrelos efectos emocionales de la ausencia de recompensa durante el entrenamiento enreforzamiento parcial. La otra explicación, la teoría secuencial, está basada en lo que lossujetos aprenden sobre la memoria de la ausencia de recompensa.

Teoría de la frustración: Desarrollada por Abram Amsel, la persistencia en la extinción esresultado del aprendizaje de algo paradójico, es decir, continuar respondiendo cuando seespera no ser reforzado o ser frustrado. Asume que el reforzamiento intermitente da comoresultado aprender a responder a pesar de esperar la ausencia de reforzamiento. Sinembargo, este aprendizaje requiere considerable experiencia con reforzamientointermitente.

Descargado del campus, http://campus.felizmente.info

Page 152: Aprendizaje  resumen jc cabrera temas 1-9

151

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

El reforzamiento intermitente incluye ensayos reforzados y no reforzados. Lorecompensados animan a los sujetos a esperar reforzamiento y los no recompensados lesllevan a espera la ausencia de recompensa. Por tanto el reforzamiento intermitente produceel aprendizaje de expectativas tanto de recompensa como de no recompensa. Laexpectativa de recompensa alienta a los sujetos a responder, y la anticipación de la ausenciade reforzamiento desalienta la respuesta, al principio del entrenamiento los sujetos entranen conflicto con lo que se ha de hacer. Sus expectativas motivan tendencias de respuestaopuestas. Sin embargo a medida que el entrenamiento continua, el conflicto se resuelva afavor de responder.

La resolución del conflicto ocurre debido a que el reforzamiento no es predecible en eltípico programa de reforzamiento parcial. Debido a estas experiencias, la respuestainstrumental se condiciona a la expectativa de la ausencia de recompensa. De acuerdo con lateoría de la frustración, esta es la clave de la persistencia en responder durante laextinción. Con suficiente entrenamiento, el reforzamiento intermitente da como resultadoel aprendizaje de realizar la respuesta instrumental como reacción a la expectativa deausencia de recompensa. Por el contrario no existe nada en la experiencia del reforzamientocontinuo que motive a los sujetos a responder cuando esperan ausencia de recompensa. Elreforzamiento continuo no produce persistencia en la extinción.

Teoría secuencial; Capaldi, está formulada en términos de memoria. Asume que los sujetospueden recordar si fueron reforzados por realizar la respuesta instrumental en el pasadoreciente. Recuerdan los ensayos recientes tanto recompensados como no recompensados.Se asume además que durante el entrenamiento en reforzamiento intermitente, la memoriade la ausencia de recompensa llega a ser una clave para la realización de la respuestainstrumental, esto produce persistencia en le extinción.

Considerese un ensayo: RNNRRNR. El sujeto es recompensado en el primer ensayo, norecompensado en los dos siguientes, recompensado dos veces, luego no reforzado yfinalmente recompensado de nuevo. Con suficientes experiencias de este tipo, el sujetoaprende a responder siempre y cuando recuerde no haber sido reforzado en los ensayoprecedentes. Este aprendizaje provoca la persistencia de la respuesta instrumental en laextinción.

Desde que la dos teorías fueron propuestas se ha obtenido gran evidencia en apoyo de cadateoría. Ambas representan dos formas diferentes en las que el reforzamiento parcial puedeinfluir sobre la respuesta durante la extinción. Los mecanismos de memoria puedencontribuir en mayor medida cuando los ensayos de entrenamiento no estén separados porlargos intervalos entre ensayos. El aprendizaje emocional descrito por la teoría de lafrustración es menos sensible a los intervalos entre ensayos y, por tanto, proporciona unamejor explicación del ERPE cuando se utilizan ensayos ampliamente espaciados.

Descargado del campus, http://campus.felizmente.info

Page 153: Aprendizaje  resumen jc cabrera temas 1-9

152

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

RESISTENCIA AL CAMBIO Y MOMENTO CONDUCTUAL(página 273 del libro)

Otra forma de considerar la persistencia de la respuesta en la extinción es que representala resistencia al cambio en las contingencias de reforzamiento que sucede cuando seintroduce la extinción. Nevin y colaboradores han estudiado la resistencia al cambio deforma más general y han propuesto el concepto de momentos conductual para caracterizarla susceptibilidad de la conducta a las interrupciones. Está basada en el concepto demomento de la física newtoniana. Predice que la conducta que posee un momento elevadotambién será difícil de “parar” o interrumpir por las manipulaciones. Ver ej. Pag 274 libro.

Un experimento en el que participó HCB, una chica de 17 años y una edad mental de 3. Losresultados obtenidos con HCB ilustran dos conclusiones normales de los estudios demomento conductual. La primera es que el momento conductual está directamenterelacionado con la tasa de reforzamiento. Una tasa más alta de reforzamiento produce unaconducta que tiene un mayor momento y que es menos susceptible a la interrupción; otrohallazgo es que el momento conductual no está relacionado con la tasa de respuesta. Dosconductas que se dan a tasas semejantes no es preciso que tengan grados similares demomento conductual. Nevin ha destacado la tasa de reforzamiento en lugar de la tasa derespuesta como el determinante fundamental del momento conductual. Esta conclusión estáconfirmada por otros estudios que demuestran que los programas que proporcionan tasassimilares de reforzamiento pero tasa diferentes de respuesta tienen similares momentos oresistencias al cambio.

La primacía de la tasa de reforzamiento sobre la tasa de respuesta como determinante delmomento conductual ha llevado a Nevin y Grace (2000) a atribuir el momento conductualprincipalmente al condicionamiento pavloviano o de asociaciones E-C, aunque la forma exactaen que estas asociaciones promueven el momento conductual no se han averiguado todavía.

El reto principal a la proposición básica de que el momento conductual está directamenterelacionado con la tasa de reforzamiento es el efecto ERPE, este es un caso en que laresistencia a la extinción es mayor después de una baja tasa o probabilidad dereforzamiento. Nevin y Grace han sugerido que el ERPE puede explicarse asumiendo que laextinción es menos discriminable tras el reforzamiento intermitente que tras el continuo

Descargado del campus, http://campus.felizmente.info

Page 154: Aprendizaje  resumen jc cabrera temas 1-9

153

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

Comentarios finales (página 276 del libro)

Los estudios sobre extinción ilustran la naturaleza duradera de ciertos temas en la teoríade la conducta. Los primeros estudios sobre la extinción se centraron en los efectos delreforzamiento parcial enla extinción y otros efectos “paradójicos” de la recompensa, y sellevaron a cabo dentro de la tradición hulliana que daba preeminencia al aprendizaje E-R.Los mecanismos E-R cayeron en desuso con la creciente evidencia de que elcondicionamiento pavloviano y el intrumental involucraban asociaciones E-C y R-C, queestaban controladas o moduladas por claves contextuales. Estas evidencias fueron parte dela “revolución cognitiva” que se introdujo en la psicología en el último cuarto de siglo XX.Ésta proporcionó una mejor compresión de la recuperación espontánea y llevó aldescubrimiento de nuevos fenómenos como la renovación y el restablecimiento. Sinembargo, estos fenómenos representas los fallos de la extinción más que la exticnión en símisma. Como se ha descrito, la compresión de la extinción en sí misma ha requerido lavuelta a los conceptos E-R, esta vez en forma de asociaciones E-R inhibitorias. Losinvestigadores sigun interesados en qué es lo que hace que conducta sea resistente alcambio. Esta resistencia o momento conductual plantea especiales desafíos para la terapiade conducta.

Descargado del campus, http://campus.felizmente.info

Page 155: Aprendizaje  resumen jc cabrera temas 1-9

154

PRINCIPIOS DE APRENDIZAJE Y CONDUCTA

Capítulo 9: Extinción de la conducta condicionadaJuan Carlos Cabrera 2009-2010

Terminos Clave (página 277 del libro)

Efecto de la magnitud del reforzamiento en laextinción Persistencia menor de la conductainstrumental en la extinción que sigue alentrenamiento con un reforzador de granmagnitud que en la que sigue al entrenamiento conun reforzador pequeño o moderado.

Efecto de reforzamiento parcial en la extinciónTérmino utilizado para describir una persistenciamayor de la respuesta instrumental en laextinción posterior a un entrenamiento dereforzamiento parcial (intermitente) que en laextinción posterior a un entrenamiento dereforzamiento continuo. Abreviado ERPE.

Efecto de sobreentrenamieno en la exticiónPersistencia menor de la conducta instrumentalen la que la extinción que sigue a unentrenamiento extenso con reforzamiento(sobrentrenamiento) que en la que sigue a unentrenamiento con niveles de reforzamientomoderados.

Extinción (en el condicionamiento clásico) Reducciónde la respuesta aprendida que ocurre debido aque el estímulo condicionado no se vulve aemparejar con el estímulo condicionado. También,el procedimiento de presentar repetidamente unestímulo condicionado sin el estímulo incondi-cionado.

Extinción (en el condicionamiento intrumental)Reducción de la respuesta instrumental queocurre porque la respuesta no vuelve a ir seguidade un reforzador. También, el procedimiento deno volver a reforzar la respuesta instrumental.

Frustración Respuesta emocional aversiva que esresultado de la ausencia inesperada de reforza-miento.

Hipótesis de la discriminación Explicación delefecto de reforzamiento parcial en la extinción,de acuerdo con la que la extinción es más lentatras el reforzamiento parcial que tras el reforza-miento continuo, porque el principio de la extin-ción es más difícil de detectar cuando sigue elreforzamiento parcial.

Momento conductual Susceptibilidad de la respues-ta a la interrupción mediante manipulaciones comola alimentación presión, la disponibilidad libre decomida, o el cambio en el programa dereforzamiento.

Olvido Reducción de la respuesta aprendida queocurre por el paso del tiempo, no debido aexperiencias particulares.

Reforzamiento continuo Programa de reforzamientoen el que cada ocurrencia de la respuesta intru-mental produce el reforzador. Abreviado RFC.

Reforzamiento intermitenta Un programa dereforzamiento en el que sólo algunas de lasocurrencias de la respuesta instrumental serefuerzan. La respuesta intrumental se refuerzaocasionalmente, o intermitentemente. Tambiéndenominado reforzamiento parcial.

Restablecimiento Recuperación de la respuestaexcitatoria a un estímulo extinguido producidapor la exposiciones al estímulo incondicionado.

Renovación Recuperación de la respuestaexcitatoria a un estímulo extinguido producidapor la retirada de las claves contextuales queestaban presentes durante la extinción.

Teoría de la frustración Teoría del efecto delreforzamiento parcial en la extinción, de acuerdocon la cual la extinción se retarda tras lereforzamiento parcial porque la resuesta instru-mental se condiciona a la anticipación de la ausen-cia frustante de recompensa.

Teoría secuencial Teoría del efecto de reforza-miento parcial en la extinción, de acuerdo con laque la extinción se retarda tras el reforzamientoparcial porque la respuesta intrumental se condi-ciona a la memoria de ausencia de rescompensa.

Descargado del campus, http://campus.felizmente.info