20
CONDUCTA DE ELECCIÓN BAJO UN PROGRAMA DE REFORZAMEINTO DIFERENCIAL Exiga, M.; Flores, P.; Guzmán, R. y Santibáñez, A. Facultad de Estudios Superiores Iztacala El objetivo del estudio fue analizar si la conducta de elección de una rata macho Long-Evans era debida al valor de los componentes del programa concurrente o si se debía a las cualidades del reforzador. Cada componente estuvo asociado a un reforzador distinto; para el operando derecho (OD) leche condensada diluida en agua y para el operando izquierdo (OI) agua; los parámetros variaron a lo largo de tres fases; Fase experimental (RF1-RF1), Fase de prueba A (OD: RV3-OI: RF2) y Fase de prueba B (OD: RF2-OI: RV3). Los resultados muestran que la preferencia del sujeto experimental se debió al tipo de reforzador dado y no a los valores de los componentes, como lo sostienen Tanno, Silberberg y Sakagami (2010), entre otros. Palabras clave: conducta de elección, programas concurrentes, reforzamiento diferencial. Aunque los sujetos experimentales estén expuestos a un solo programa de reforzamiento, realizan diversas actividades y continuamente eligen entre alternativas posibles; una rata puede palanquear en la única tecla de respuestas de la cámara experimental, acicalarse, o moverse alrededor de la cámara (Domjan, 2010). A través de los programas concurrentes es posible estudiar la conducta de elección como índice de las preferencias al ligar estas conductas con parámetros específicos del reforzador y del programa (Sandoval y cols. 1994). La situación de elección más sencilla es una que contiene dos alternativas de respuesta, cada una de las cuales produce un tipo diferente de reforzador de acuerdo con un tipo de reforzamiento

PrácticaFinal

Embed Size (px)

DESCRIPTION

Reporte de una prática con un un programa de reforzamiento concurrente

Citation preview

Page 1: PrácticaFinal

CONDUCTA DE ELECCIÓN BAJO UN PROGRAMA DE REFORZAMEINTO DIFERENCIAL

Exiga, M.; Flores, P.; Guzmán, R. y Santibáñez, A.

Facultad de Estudios Superiores Iztacala

El objetivo del estudio fue analizar si la conducta de elección de una rata macho Long-Evans era debida al valor de los componentes del programa concurrente o si se debía a las cualidades del reforzador. Cada componente estuvo asociado a un reforzador distinto; para el operando derecho (OD) leche condensada diluida en agua y para el operando izquierdo (OI) agua; los parámetros variaron a lo largo de tres fases; Fase experimental (RF1-RF1), Fase de prueba A (OD: RV3-OI: RF2) y Fase de prueba B (OD: RF2-OI: RV3). Los resultados muestran que la preferencia del sujeto experimental se debió al tipo de reforzador dado y no a los valores de los componentes, como lo sostienen Tanno, Silberberg y Sakagami (2010), entre otros.

Palabras clave: conducta de elección, programas concurrentes, reforzamiento diferencial.

Aunque los sujetos experimentales estén expuestos a un solo programa de reforzamiento, realizan diversas actividades y continuamente eligen entre alternativas posibles; una rata puede palanquear en la única tecla de respuestas de la cámara experimental, acicalarse, o moverse alrededor de la cámara (Domjan, 2010). A través de los programas concurrentes es posible estudiar la conducta de elección como índice de las preferencias al ligar estas conductas con parámetros específicos del reforzador y del programa (Sandoval y cols. 1994). La situación de elección más sencilla es una que contiene dos alternativas de respuesta, cada una de las cuales produce un tipo diferente de reforzador de acuerdo con un tipo de reforzamiento distinto; por lo tanto, el sujeto tiene la libertad para cambiar de un componente a otro.

La elección de un sujeto en un programa concurrente se refleja en la distribución de su conducta entre las dos alternativas de respuesta, lo cual puede medirse de varias maneras. Una técnica común es calcular la “tasa relativa de respuestas en cada alternativa”, que se ve fuertemente influenciada por el tipo de componente; si los parámetros son iguales, se podría esperar que la tasa de respuestas para ambos operandos sea la misma. De igual manera, si se trata de componentes iguales, se esperaría que la “tasa relativa de reforzamiento” en ambos operandos sea la misma (Domjan, 2010).

Herrnstein estudió la distribución de respuestas en varios programas concurrentes IV-IV en que la tasa máxima total de reforzamiento que podían obtener las palomas se fijó en 40 por

Page 2: PrácticaFinal

hora; concluyendo que la tasa relativa de respuestas en una alternativa igualaba la tasa relativa de reforzamiento obtenida en esa alternativa; a lo que llamó la “Ley de igualación”. La idea más importante surgida de la Ley de igualación es que la tasa de una respuesta particular no depende únicamente de la tasa de reforzamiento de una respuesta. El hecho de que una conducta ocurra con mucha o poca frecuencia no sólo depende de su propio programa de reforzamiento, sino también de las tasas de reforzamiento de otras actividades que el sujeto puede realizar (Domjan, 2010).

Sin embargo, las tasas relativas de respuesta no siempre igualan con exactitud las tasas relativas de reforzamiento. La mayor parte de los casos en los que la conducta de elección no se ajusta perfectamente a la relación de igualación pueden adecuarse mediante la adición de dos parámetros: la “sensibilidad” de la conducta de elección a las tasas relativas de reforzamiento para las alternativas de respuesta, en donde una menor sensibilidad es conocida como “subigualación”. Ésta puede reducirse si hay menos reforzamiento por cambiar de una alternativa a otra y si los sujetos tienen más experiencia con el procedimiento de elección. El segundo parámetro representa el “sesgo” o preferencia de respuesta, la cual influye en la elección cuando las alternativas de respuesta requieren diferentes cantidades de esfuerzo (requisito de respuesta) o si el reforzador que se proporciona a una respuesta es mucho más deseable (dependiente de la cantidad o cualidades del reforzador) que el que se ofrece a la otra respuesta. La preferencia (o sesgo) por una respuesta o un reforzador sobre los otros da por resultado que se responda más en el lado preferido y es representada por un valor más alto de dicho parámetro. (Domjan, 2010).

Aparicio y Jiménez (2007) comprobaron que la sensibilidad al reforzamiento aumenta con los incrementos en el requisito de respuesta de cambio. Su estudio fue llevado a cabo con ratas, utilizando comida como reforzador. El Experimento 1 (elección forzada) arregló reforzadores dependientes en dos programas de intervalo aleatorio y el Experimento 2 (elección libre) los arregló independientemente. Los autores concluyeron que en el Experimento 1 la sensibilidad al reforzamiento aumentó con los incrementos en el requisito de respuesta de cambio, pero en el Experimento 2 ésta disminuyó.Dado que el arreglo de los programas concurrentes independientes no obligó la alternancia de palancas, las ratas desarrollaron una preferencia exclusiva por la palanca de menor requisito de cambio, a pesar de estar asociada a la menor probabilidad de reforzamiento. Por tanto, el Experimento 2 apoya la idea de que las visitas prolongadas en la alternativa de menor probabilidad de reforzamiento conducen a la subigualación.

Por otro lado,Olton y cols. (1977), utilizando los principios generales de discriminación, analizaron la conducta de elección en un contexto más natural, después de que los sujetos (ratas) encontraran o no encontraran comida.Los resultados indicaron que la estrategia de búsqueda de la rata fue influenciada por la disponibilidad y distribución de alimentos, de manera que la conducta de elección estaba orientada hacia el lugar donde era más probable

Page 3: PrácticaFinal

que encontrara alimento, bastando un solo ensayo de “no encontrar” alimento en un lugar, para que la ocurrencia de buscar nuevamente ahí tendiera a cero.

Green y Estle (2003) realizaron un estudio donde a los sujetos (ratas) se les dio a elegir entre un reforzador pequeño recibido de inmediato o un reforzador grande recibido después de una demora (que iba aumentando de 0 a 25seg). En una primera fase se utilizó como reforzador agua y posteriormente se utilizó comida. Todos los sujetos (excepto una en la fase de agua) invierten su preferencia de la alternativa más pequeña recibida inmediatamente, a la más grande, después de una demora. Estos hallazgos extienden la generalidad del modelo animal “preferencia - reversión a reforzadores cualitativamente diferentes”. Además, demuestran que el autocontrol puede ser entendido como comportamiento de elección.

Calvert, Green y Myerson (2010), bajo la hipótesis de que en ratas el descuento es sensible a las diferencias en la calidad del reforzador retrasado a pesar de que no es sensible a la cantidad; realizaron un primer experimento donde la calidad de los reforzadores en un programa de reforzamiento concurrente se diferenciaba de comida “altamente preferida” de la “no preferida”, y un segundo experimento donde los reforzadores se diferenciaban de líquidos “altamente preferidos” y “no preferidos”. En ambos experimentos, la cantidad del reforzador fue juzgada de igual valor para el que fuera recibido inmediatamente, como el que fue recibido retardadamente. Los autores concluyeron que no hubo diferencias sistemáticas en el descuento entre alimentos y líquidos “altamente preferidos” o “no preferidos” con entrega retardada; ni hubo diferencias sistemáticas entre el descuento de cantidades más pequeñas y más grandes de los alimentos y líquidos. Dichos resultados concuerdan con estudios anteriores hechos con palomas (Green et. al, 2004) y monos (Freeman et. al, 2009) donde tampoco encontraron diferencias en el descuento sobre cantidades de reforzadores.

Leigh, Lee y Mohammed (2015) expusieron a un grupo de ratas ante dos tipos de reforzadores; por un lado, se suministraba nicotina vía intravenosa, y por el otro, se entregaban bolitas de sacarosa. Los sujetos se dividieron en dos grupos, cada uno fue entrenado previamente al programa concurrente con el mismo tipo de reforzador (ya sea nicotina o sacarosa) en ambos operandos. Durante la exposición a ambos tipos de reforzadores, se concluye que el grupo que fue entrenado únicamente con la sacarosa, prefirió la sacarosa; mientras que el grupo que fue entrenado únicamente con nicotina, prefirió la misma en la fase experimental.

Sin embargo, en el estudio realizado por Mangabeira, García-Mijares y Silva (2015), los sujetos experimentales (ratas) fueron expuestos a una línea base, con sólo un tipo de reforzador: agua, bajo parámetros iguales que consistían en IV´s que iban aumentando de 5seg hasta 20seg; posteriormente se cambiaron los reforzadores en el grupo experimental, estando disponibles agua y una solución azucarada; y finalmente, se volvió a la línea base. Se concluye que la ingesta de sacarosa en los animales que tenían que elegir entre agua y una solución de sacarosa indicó una clara preferencia por el azúcar.

Page 4: PrácticaFinal

Por otro lado, Paronis (2013) realizó un estudio para evaluar la fuerza de refuerzo relativa de etanol en ratas cuando un reforzador apetitivo similar estaba concurrentemente disponible, concluyendo que la tasa de respuesta disminuyó monotónicamente con la concentración de etanol.

Rachlin, Kagel, Green y Batallio (1976, citado en Sandoval et. al, 1994) evaluaron la conducta de elección con reforzadores diferentes: Tomcollins y cerveza. En un principio, los parámetros de los componentes fueron RF1 para ambos reforzadores; dado que los animales prefirieron la cerveza, en una segunda fase se incrementó el requisito (precio) para la misma, lo que ocasionó un incremento en la compra de Tomcollins, doblando el consumo de alcohol presentado en la fase anterior. Al regresar a las condiciones de la línea base, las ratas prefirieron otra vez la cerveza. Finalmente, en la última fase, se incrementó el requisito para obtener Tomcollins y se observa que los sujetos aumentan diez veces el consumo de cerveza. Los autores concluyen que debido a que ninguno de los dos reforzadores son esenciales, se puede sustituir uno por el otro dependiendo del requisito de respuesta.

Tanno, Silberberg y Sakagami (2010) evaluaron si la conducta de elección es determinada por los valores del programa de reforzamiento. Para ello, expusieron a un grupo de ratas a tres condiciones; la primera consistía en un programa de reforzamiento concurrente RV-IV, la segunda en un programa de reforzamiento concurrente IV-IV y finalmente un programa tándem IV-IV con el mismo reforzador en todas las condiciones. Los resultados arrojados indican que la preferencia del sujeto por algún componente, estuvo determinada por los parámetros del mismo.

La finalidad del presente estudio fue evaluar la conducta de elección en un programa concurrente simple con componentes asociados a un reforzamiento diferencial, con el objetivo de analizar si la preferencia hacia un componente es debida al valor del parámetro o al tipo de reforzador.

MÉTODO

Sujeto

Una rata macho de la cepa Long Evans, con nueve meses de edad, con un peso promedio de 580 gramos y mide aproximadamente 25 centímetros de largo; su pelaje es de color blanco con una mancha negra en la parte superior de su cuerpo. El sujeto es experimentalmente ingenuoen condicionamiento operante y estará en condición de privación de agua, se mantendrá en un 80% de su peso y tendrá libre acceso al alimento.

Page 5: PrácticaFinal

Aparatos y materiales.

Se ocupara una cámara experimental de condicionamiento operante para sujetos experimentales roedores. Dicha cámara cuenta con una luz ambiental, dos palancas en la parte frontal en forma horizontal y un dispensador de agua en el centro de la misma.Se hará uso de una malla metálica para cubrir la cámara, debido a que se introducirán dos bebederos (uno por cada tipo de reforzador) en la parte superior.

Para la recolección de los datos, se utilizarán formatos de registro de ocurrencia continua.

Procedimiento

El experimento se llevó a cabo en el salón de laboratorio 613 de la Facultad de Estudios Superiores Iztacala, ubicado en el primer piso del Edificio A6; donde se contaba con muros que separaban las cámaras experimentales contiguas. Además, el salón contaba con sistema de iluminación (que se mantuvodesactivado durante todo el estudio).

El estudio tendrá un diseño ABC, N = 1, donde el sujeto estará expuesto a un programa de privación temporal de agua (23hrs de privación, con media hora de acceso al agua) teniendo libre acceso al alimento.

Las fases del estudio fueron las siguientes:

Fase de entrenamiento; con el objetivo de que el sujeto aprenda a responder en los dos operandos adecuadamente, el sujeto fue sometido a un programa de reforzamiento continuo RF1, donde obtuvo como reforzador (para ambos operandos) una gota de agua; durante siete sesiones de 30min cada una.

Fase experimental; cuyo objetivo fue evaluar la conducta de elección entre ambos tipos de reforzadores ante componentesiguales, el sujeto fue expuesto a un programa de reforzamiento concurrente conformado por dos componentes de RF1.Esta fase tuvo una duración de seis sesiones de 30min cada una.

Fase de prueba, cuyo objetivo fue comparar la conducta de elección del sujeto entre la Fase anterior y la variablidad de los componentes en dos subetapas: A) el componente del OD (reforzador = leche condensada) constó de un RV3, cuyos valores fueron 2, 3 y 4; mientras que el componente correspondiente al OI (reforzador = agua) fue de RF2; B) los valores de los intervalos fueron intercalados; haciendo que el componente del OD (reforzador = leche condensada) se conformara por RF2 y el OI (reforzador = agua) de RV3. Esta fase tuvo una duración de seis sesiones de 30min cada una.

El reforzamiento diferencial tanto para la Fase experimental como de prueba, se llevó a cabo de manera continua; la luz ambiental se encontraba encendida mientras ambos componentes

Page 6: PrácticaFinal

dieron inicio al mismo tiempo, cuando el sujeto respondió ante uno de los operandos, la luz se apagó, y tuvo acceso al reforzador durante 2seg; al expirar este tiempo, la luz se volvió a encender y comenzó un nuevo ensayo. Cada reforzador fue otorgado por medio de un bebedero, que fue introducido en la parte superior de la cámara experimental, atravesando una rejilla de metal.

Lo anterior queda explícito en la Tabla 1.

Fase de entrenamiento. Fase experimental. Fase de prueba.

Programa de reforzamiento continuo RF1.

OD = RF1

OI = RF1

A

OD = RV3 (valores 2, 3 y 4)

OI = RF2

B

OD = RF2

OI = RV3 (valores 2, 3 y 4)

7 sesiones, 30min cada una.

6 sesiones, 30min cada una.

3 sesiones, 30min cada una.

3 sesiones, 30min cada una.

Tabla 1. Procedimiento del experimento.

En todas las Fases del estudio, dos de los experimentadores utilizaron un registro de ocurrencia continua para obtener la confiablidad de los datos de cada sesión; mientras que el resto de los experimentadores (2) controlaron manualmente la suministración de los reforzadores, cada uno en su respectivo operando.

RESULTADOS

A continuación, se muestran dos gráficas por cada Fase del estudio, una por cada componente. A su vez, en cada gráfica, se pueden observar dos líneas; una correspondiente a la tasa de respuestas y otra a la tasa de reforzamiento.

En la Gráfica 2 se puede ver que los palanqueos en el OI comienzan con un poco más del doble de palanqueos dados en el OD y al segundo día la frecuencia de respuestas casi es la misma por la diferencia mínima de 3 palanqueos. Sin embargo, a partir de la tercera sesión, el número de palanqueos dados en el OD se va incrementando y predomina esta tendencia en los siguientes cuatro días de la fase experimental; al cuarto día aumenta con 15 respuestas más que en la sesión anterior, al quinto aumenta 22 respecto al cuarto día, y al sexto suman 38 palanqueos más, finalizando con un total de 150 respuestas reforzadas (véase Gráfica 1).

Page 7: PrácticaFinal

Mientras que la tasa de respuestas se fue haciendo cada vez más alta en el OD, en el OI ésta tendió a disminuir hasta contar 24 palanqueos para el término de la fase, casi una sexta parte del total del otro operando.

En resumen, se puede visualizar en la Gráfica 3, que el total de respuestas dadas en el OD superó el total de respuestas dadas en el OI por 223 palanqueos en la Fase experimental. Por lo que la tasa relativa de respuestas en el OD fue de 0.6 (al igual que la tasa relativa de reforzamiento) y la tasa relativa de respuestas del OI fue de 0.3 (mismo valor que la tasa relativa de reforzamiento); en ambos operandos la Ley de Igualación se cumplió, pues la tasa relativa de respuestas igualó la tasa relativa de reforzamiento en ambos operandos, y hubo una preferencia por el OD (leche condensada como reforzador) puesto que superó el valor de estándar de referencia (0.5) que indica, precisamente, el componente elegido con mayor frecuencia (Domjan, 2010).

Gráfica 1. Tasa de respuestas y de reforzamiento para el OD en la Fase experimental

Gráfica 1. Tasa de respuestas y de reforzamiento para el OI en la Fase Experimental

Sesión 1

Sesión 2

Sesión 3

Sesión 4

Sesión 5

Sesión 6

020406080

100120140160

25

50

7590

112

150

24

48

7390

109

147

PalanqueosReforzadores

OD= Leche (RF1) condensada

Sesión 1

Sesión 2

Sesión 3

Sesión 4

Sesión 5

Sesión 6

010203040506070 60

47

65

51

3224

57

45

62

48

3223 Palanqueos

Reforzadores

OI= Agua (RF1)

Page 8: PrácticaFinal

Gráfica 3. Tasa de respuestas y de reforzamiento total en la Fase Experimental

En las Gráficas 4 y 5 se aprecia que en la primera sesión de la Fase de Prueba A, la diferencia de palanqueos dados entre los componentes es drástica, pues se reforzó 45 veces con leche condensada y 1 sola vez con agua. Para el siguiente día, mientras que se reforzó 48 veces en el OD, sólo hubo 12 reforzamientos en el OI, pero en este caso aumentó considerablemente respecto al día anterior. En el último día la tasa de respuestas en el OI vuelve a decrementar tan sólo 10 respuestas; en tanto que en el OD se suman 10 palanqueos más que la sesión anterior, entregando el reforzador 5 veces más.

Por lo tanto, se puede concluir que en el OD (RV3) la tasa de respuestas se mantiene con valores casi iguales a tasa de respuestas obtenida durante las últimas tres sesiones de la Fase anterior; y que a pesar de que en la primera sesión de la Fase de prueba A, la cantidad de palanqueos ejercidos en el OI (RF2) disminuyó drásticamente, posteriormente incrementó hasta alcanzar valores similares a los obtenidos en las últimas tres sesiones de la Fase experimental.

Nuevamente, el total de respuestas ejercidas en el OD superó el total de respuestas ejercidas en el OI, esta vez por 230 palanqueos, teniendo una tasa relativa de respuestas igual a 0.8; y obteniendo 125 reforzadores más que en el otro operando, con una tasa relativa de reforzamiento igual a 0.8 (Gráfica 6). Lo que indica que también en la Fase de prueba B, hubo una preferencia por el OD (leche condensada) a pesar del aumento en el requisito de respuesta.

Gráfica 4. Tasa de respuestas y de reforzamiento para el OD en la Fase de prueba A.

OD OI0

100

200

300

400

500

600502

279

491

267 PalanqueosReforzadores

Sesión 1 Sesión 2 Sesión 30

20

40

60

80

100

120

90 96106

45 48 53 PanqueosReforzador

OD= Leche condensada (RV3)

Page 9: PrácticaFinal

Gráfica 5. Tasa de respuestas y de reforzamiento para el OI en la Fase de prueba A.

Gráfica 6. Tasa de respuestas y de reforzamiento total en la Fase de prueba A.

En las Gráficas 7 y 8, correspondientes a la Fase de prueba B, se observa que hubo un aumento drástico de palanqueos desde el último día de la sesión de la Fase de Prueba A en el OI, siendo 4 veces mayor y entregándose el reforzador 45 veces, tan sólo dos menos que en el OD. En la sesión siguiente disminuyó la tasa de reforzamiento quedando en 45 reforzadores obtenidos, y el número de palanqueos decrementó a 134 de los 150 del día anterior. Pero en el componente del agua la rata palanqueó 15 veces más que la sesión anterior, entregándosele 12 veces más el reforzador con un total de 115 respuestas dadas; aunque esta disminuyó al día siguiente un poco más de la mitad, estableciéndose el número de reforzamientos por debajo de los que hubo en el primer día. En el OD se sumaron 18 palanqueos más que la sesión anterior y se le reforzó 49 veces, no difiriendo mucho de los 45 reforzadores obtenidos durante la sesión pasada.

Se puede concluir que aunque la tasa de respuestas en el OI en la Fase de prueba B aumentó considerablemente con respecto a la tasa de respuestas de la Fase anterior (dando un total de 208 palanqueos más); la tasa de respuestas del OD la superó por 166 palanqueos, obteniendo una tasa relativa de respuestas igual a 0.6 .Mientras que la tasa de reforzamiento

Sesión 1 Sesión 2 Sesión 305

10152025303540

2

35

25

1

128

PalanqueosReforzador

OI= Agua (RF2)

OD OI0

50

100

150

200

250

300

350292

62

146

21

PalanqueosReforzadores

Page 10: PrácticaFinal

entre ambos operandos fue de 0.6 para el OD y de 0.3 para el OI (véase Gráfica 9). Por lo tanto, nuevamente hubo una preferencia del sujeto por el OD.

Gráfica 7. Tasa de respuestas y de reforzamiento para el OD en la Fase de prueba B.

Gráfica 8. Tasa de respuestas y de reforzamiento para el OI en la Fase de

prueba B.

Gráfica 9. Tasa de respuestas y de reforzamiento total en la Fase de prueba B.

Fase 1 Fase 2 Fase 30

20406080

100120140160 150

134152

7050

62 PalanqueosReforzador

OD= Leche condensada (RF2)

Fase 1 Fase 2 Fase 30

20

40

60

80

100

120

140

100115

5545

57

19

PalanqueosReforzador

OI= Agua (RV3)

OD OI0

50100150200250300350400450500

436

270

182121

PalanqueosReforzadores

Page 11: PrácticaFinal

DISCUSIÓN

El objetivo del presente estudio fue evaluar la conducta de elección de un sujeto experimental no humano roedor (rata) en un programa concurrente simple con un reforzamiento diferencial.

Leigh, Lee y Mohammed (2015), sostienen que la conducta de elección está fuertemente influenciada por el entrenamiento previo a la exposición del programa concurrente; donde, si se expuso a los sujetos a sólo un tipo de reforzador; durante la fase experimental, al estar expuesto ante éste y otro más, habrá una tendencia por responder en el operando asociado con el reforzador utilizado en el entrenamiento. Los hallazgos de este estudio son discordantes con esta premisa; ya que, a pesar de que en el entrenamiento el sujeto estuvo expuesto sólo a un tipo de reforzador (agua), hubo una marcada preferencia por la leche condensada.

En la Fase experimental se evaluó la conducta de elección entre ambos tipos de reforzadores ante parámetros iguales (RF1-RF1). Según Domjan (2010), ante valores iguales en los componentes de un programa de reforzamiento concurrente, se esperaría que tanto la tasa de respuestas como la tasa de reforzamiento en ambos operandos, sea la misma. Sin embargo, se puede observar en las Gráficas 1 y 2, que estos no fueron los resultados de esta fase; ya que a partir de la segunda sesión, la tasa de respuestas y por ende, de reforzamiento, tendió a incrementarse en el operando derecho (Leche condensada), mientras que la tasa de respuestas y de reforzamiento del operando izquierdo (Agua) se fue a pique. Estos resultados demuestran que la conducta de elección es fuertemente afectada por el “sesgo” (uno de los parámetros que intervienen en la Ley de igualación) debido a las cualidades del reforzador; ya que, a pesar de que el requisito de respuesta en ambos operandos fue el mismo, fue evidente la preferencia del sujeto por el componente cuyo reforzador asociado fue la leche condensada.

La hallazgos de la Fase de prueba demostraron que no hubo una sustitución del reforzador “preferido” por el “no preferido” al incrementar el requisito de respuesta del primero; pues, contrario a lo sucedido en el estudio de Rachlin, et. al 1976 (citado en Sandoval et. al, 1994), al incrementar el requisito de respuesta del OD en la subetapa A de RF1 en la Fase experimental a RV3 (cuyos valores fueron 2, 3 y 4), el sujeto mantuvo la tasa de respuestas y de reforzamiento con valores casi igual de altos que los obtenidos durante las últimas tres sesiones de la Fase experimental (véase Gráfica 4). Dichos autores sostienen que la sustitución de los reforzadores se da al tratar con dos reforzadores que no son “esenciales”, y que por tanto, resulta predecible la tendencia del sujeto por elegir el operando que requiera menos esfuerzo por obtener el reforzador; sin embargo, las cualidades de los reforzadores del presente estudio; uno esencial (Agua) y el otro no esencial (Leche condensada) sugieren que la conducta de elección no está determinada por la indispensabilidad del reforzador, sino más

Page 12: PrácticaFinal

bien por las cualidades de este, las cuales, al resultarle más placenteras, determinan su preferencia.

Estos argumentos se complementan con los hallazgos del estudio realizado por Mangabeira, García-Mijares y Silva (2015), donde el grupo experimental, que fue expuesto a un programa concurrente con un reforzador “esencial” (agua) y otro “no esencial” (solución azucarada), tendió a elegir este último a pesar de que el parámetro asociado con dicho reforzador fue incrementándose.

Incluso si se trata de reforzadores “no esenciales” similares, como los utilizados en el estudio de Paronis (2013), se observa que no hubo una sustitución de reforzadores dependiente del requisito de respuesta en cada componente.

Asimismo, los datos arrojados por el estudio de Green y Estle (2003) confirman lo expuesto anteriormente, pues a pesar de haber empleado el mismo reforzador “esencial” en cada componente (agua o comida según cada sub etapa del experimento), la elección de los sujetos estuvo determinada por el operando asociado a una mayor cantidad de reforzador recibida por éste, más no por los parámetros de los componentes.

En la sub etapa B, al intercambiar los valores de los componentes de tal manera que el requisito de respuesta fuera mayor para recibir agua, a pesar de que la tasa de respuestas siguió siendo mayor en el OD; la tasa de respuesta del OI, de haberse mantenido con valores similares tanto en la Fase experimental como en la subetapa A, en esta ocasión, la tasa de respuestas se incrementó. Esto pudo haberse debido a que “la tasa total de respuestas puede ser similar en los programas de razón fija y de razón variable, siempre y cuando se requieran, en promedio, números similares de respuestas” (Domjan, 2010, pp.215).

Finalmente, es importante destacar que a pesar de que en promedio, el requisito de respuesta RV3 no difería mucho del componente con requisito RF2, hubo preferencia por uno de los componentes, dependiendo del tipo de reforzador asociado con él, lo que fortalece la hipótesis de investigación; pues la conducta de elección del sujeto estuvo determinada por el tipo de reforzador, más no por los valores de los componentes. Estos argumentos, a su vez, contradicen lo sostenido por Tanno, Silberberg y Sakagami (2010), pues si la conducta de elección del sujeto hubiera dependido de los parámetros de los componentes, se hubieran obtenido tasas de respuesta y de reforzamiento muy similares para ambos operandos en todo el experimento.

CONCLUSIÓN

Page 13: PrácticaFinal

Uno de los parámetros que se considera al estudiar la conducta de elección es el “sesgo” o preferencia de respuesta, el cual influye en la elección cuando las alternativas de respuesta requieren diferentes cantidades de esfuerzo (requisito de respuesta) o si el reforzador que se proporciona a una respuesta es mucho más deseable (dependiente de la cantidad o cualidades del reforzador) que el que se ofrece a la otra respuesta.

El interés de la presente investigación fue evaluar la conducta de elección en un programa concurrente simple con componentes asociados a un reforzamiento diferencial, con el objetivo de analizar si la preferencia hacia un componente es debida al valor del parámetro o al tipo de reforzador. Para ello, se sometió a un sujeto experimental no humano (rata) a tres fases; durante la Fase experimental los componentes del programa tuvieron el mismo valor (RF1-RF1); durante la Fase de prueba A se incrementó el requisito de respuesta en el operando derecho (OD) asociado a leche condensada diluida en agua como reforzador a RV3 (cuyos valores fueron 2, 3 y 4) mientras que el operando izquierdo (OI) asociado a agua como reforzador tuvo un valor RF2; finalmente, durante la Fase de prueba B se intercalaron los parámetros, haciendo que el OD tuviera el requisito de respuesta menor (RF2) y el OI el mayor (RV3).

En todas las Fases del experimento, los resultados arrojados demuestran que hubo una preferencia por el OD, lo que indica que la conducta de elección del sujeto estuvo determinada por las cualidades del reforzador y no por el requisito de respuesta. Estos hallazgos concuerdan con los de Mangabeira, García-Mijares y Silva (2015), Paronis (2013) y Green y Estle (2003). Al mismo tiempo que discrepan de los argumentos de Leigh, Lee y Mohammed (2015), quienes sostienen que la conducta de elección está fuertemente influenciada por el entrenamiento previo a la exposición del programa concurrente; de Rachlin, Kagel, Green y Batallio (1976, citado en Sandoval et. al, 1994), quienes concluyen que aunque se trate de reforzadores diferentes, si éstos no son esenciales, el sujeto tenderá a sustituir uno por el otro dependiendo del requisito de respuesta y finalmente, de Tanno, Silberberg y Sakagami (2010), quienes, al tratar sólo con un tipo de reforzador, argumentan que la conducta de elección está determinada por los parámetros de los componentes.

Cabe señalar, como limitaciones del presente estudio, el hecho de que no se hayan otorgado los reforzadores de manera común en la cámara experimental, debido a que la misma no contaba con dos dispensadores; lo cual pudo haber afectado en el aprendizaje y en la tasa de respuestas de las primeras sesiones de la Fase experimental, debido a la novedad que representó para el organismo los mecanismos empleados previos a la utilización de los bebederos convencionales. Por otro lado, se tenían contempladas seis sesiones tanto para la Fase de prueba A como para la Fase de prueba B; sin embargo, las de esta última Fase no fueron completadas; y por tanto, se decidió exponer sólo las últimas tres sesiones de la Fase de prueba A y las tres realizadas de la Fase de prueba B.

Page 14: PrácticaFinal

Se sugiere, para futuros estudios, utilizar el mismo mecanismo para otorgar el reforzamiento tanto en el entrenamiento como en fases posteriores e incrementar la cantidad de sesiones.

REFERENCIAS

Aparicio, C. F., Jiménez, A. (2007). Elección en transición y requisitos de respuesta de cambio en programas concurrentes independientes y dependientes. Universitas Psychologica, 6(3), 649-677. Disponible en: http://www.redalyc.org/pdf/647/64760316.pdf

Calvert, A. L., Green, L., Myerson, J. (2010). Delay Discounting of qualitatively different reinforcers in rats. Journal of the Experimental Analysis of Behavior, 93(2), 1-15. Disponible en: http://psych.wustl.edu/lengreen/publications.html

Domjan, M. (2010). Principios de aprendizaje y conducta.Conducta de elección: programas concurrentes (pp.198-216). Recuperado de: http://es.slideshare.net/profelugo/principios-de-aprendizaje-y-conducta-domjan-9thfl

Green, L., Estle, S. J. (2003). Preference reversals with food and water reinforcers in rats. Journal of the Experimental Analysis of Behavior, 79(2), 233-242. Disponible en: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1284932/

Leigh, V. P., Lee, H., M., Shoaib (2015).Concurrent access to nicotine and sucrose in rats. Psychopharmacology, 232(8), 145-160. Disponible en: http://www.ncbi.nlm.nih.gov/pubmed/25366874

Mangabeira, V., García-Mijares, m., Silva, M.T. (2015). Sugar withdrawal and differential reinforcement of low rate (DRL). Physiology & Behavior, 139, 468-473. Disponible en: http://www.ncbi.nlm.nih.gov/pubmed/25484352

Olton, D. S., Walker, J. A., Gage, F. H., Johnson, C. T. (1977). Choice behavior of rats searching for food. Learning and Motivation, 8(3), 315-331. Disponible en: http://www.sciencedirect.com/science/article/pii/0023969077900558

Paronis (2013).Ethanol self-administration in rats responding under concurrent schedules for milk or ethanol plus milk. Behav Pharmacol., 24(5), 48-60. Disponible en: http://www.ncbi.nlm.nih.gov/pubmed/23903243

Sandoval, M., Caycedo, C., Gutiérrez, C., Pereira, C. (1994). La economía conductual como una nueva teoría de refuerzo. Suma psicológica, 1(1), 65-75. Disponible en: http://publicaciones.konradlorenz.edu.co/index.php/sumapsi/article/view/297

Page 15: PrácticaFinal

Tanno, T., Silberberg, A., Sakagami, T. (2010). Concurrent VR VI schedules: Primacy of molar control of preference and molecular control of response rates. Learn Behav., 38(4), 382-393. Disponible en: http://www.ncbi.nlm.nih.gov/pubmed/21048229