28
RESUMEN Este trabajo presenta una aplicación de un modelo de red neuronal artificial para explicar la elección entre alternativas en el contexto de una categoría de compra frecuente y de alta penetra- ción en los hogares (el café molido) analizando los datos del punto de venta disponibles para el total de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección no son homogéneos por alternativas y, además, se constatan efectos acumulativos en las promociones simultaneas. El modelo planteado proporciona, por tanto, infor- mación que puede complementar el análisis de otros modelos clásicos como el modelo logit mul- tinomial cuando este se enfrenta a problemas en sus supuestos de partida. Palabras clave: Modelos de elección, datos de escáner, logit multinomial, redes neuronales artifi- ciales. ABSTRACT In this paper we use an Artificial Neural Net- work Model for the analysis of the brand choice problem in a high-penetration high-purchase fre- quency product category (ground coffee). Between other results, we find different impacts of the mar- keting instruments between alternatives and accu- mulative effects of simultaneous promotions in dif- ferent alternatives. Therefore the information pro- vided by this model is useful in helping the analyst complementing other classical models like the multinomial logit when these face problems in their initial assuptions. Keywords: Choice models, scanner data, artifi- cial neural networks, multinomial logit. 111 REVISTA ESPAÑOLA DE INVESTIGACION DE MARKETING ESIC EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA COMPLEJA. APLICACIÓN DE UNA RED NEURONAL ARTIFICAL Mónica Cortiñas Ugalde 1 , Margarita Elorz Domezain y José Miguel Múgica Grijalba UNIVERSIDAD PÚBLICA DE NAVARRA 1 Departamento de Gestión de Empresas. Universidad Pública de Navarra. Campus de Arrosadía 31006, Pamplona. Tfno. 948169895, Email: mcor tinas@una v ar ra.es

EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

  • Upload
    others

  • View
    2

  • Download
    0

Embed Size (px)

Citation preview

Page 1: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

RESUMEN

Este trabajo presenta una aplicación de unmodelo de red neuronal artificial para explicar laelección entre alternativas en el contexto de unacategoría de compra frecuente y de alta penetra-ción en los hogares (el café molido) analizando losdatos del punto de venta disponibles para el totalde compras en un establecimiento. Se compruebacomo los efectos de los instrumentos de marketingen la probabilidad de elección no son homogéneospor alternativas y, además, se constatan efectosacumulativos en las promociones simultaneas. Elmodelo planteado proporciona, por tanto, infor-mación que puede complementar el análisis deotros modelos clásicos como el modelo logit mul-tinomial cuando este se enfrenta a problemas ensus supuestos de partida.

Palabras clave: Modelos de elección, datos deescáner, logit multinomial, redes neuronales artifi-ciales.

ABSTRACT

In this paper we use an Artificial Neural Net-work Model for the analysis of the brand choiceproblem in a high-penetration high-purchase fre-quency product category (ground coffee). Betweenother results, we find different impacts of the mar-keting instruments between alternatives and accu-mulative effects of simultaneous promotions in dif-ferent alternatives. Therefore the information pro-vided by this model is useful in helping the analystcomplementing other classical models like themultinomial logit when these face problems intheir initial assuptions.

Keywords: Choice models, scanner data, artifi-cial neural networks, multinomial logit.

111

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

EL PROBLEMA DE ELECCIÓN DE MARCAEN UNA CATEGORÍA COMPLEJA.

APLICACIÓN DE UNA RED NEURONAL ARTIFICAL

Mónica Cortiñas Ugalde1, Margarita Elorz Domezain y José Miguel Múgica GrijalbaUNIVERSIDAD PÚBLICA DE NAVARRA

1 Departamento de Gestión de Empresas. Universidad Pública de Navarra. Campus de Arrosadía 31006, Pamplona. Tfno. 948169895,Email: [email protected]

Page 2: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

1. INTRODUCCIÓN

Desde el punto de vista del detallista, el conoci-miento del proceso por el cual los consumidoresseleccionan una alternativa entre las que permane-cen expuestas en el lineal del establecimiento tie-ne gran relevancia práctica. Las empresas de dis-tribución en España actúan en un entorno cada vezmás competitivo; mientras que en los años 90 loshipermercados vivieron su década dorada, a partirde finales de los 90, la competencia entre los dis-tintos formatos se incrementa con las grandescadenas de distribución tomando posiciones entodos los formatos y con un descenso de la cuotade mercado de hipermercados frente a supermer-cados (Distribución y actualidad, 2003). En estecontexto competitivo, la preocupación de los deta-llistas por la reducción de costes y el manteni-miento de la cuota de mercado es máxima, por loque surgen nuevas tendencias de gestión, como lastécnicas de Respuesta Eficiente al Consumidor(ECR) que implican, entre otros aspectos, tantogenerar una política de inventarios eficiente, queayude a la reducción de costes, como seleccionaruna política de precios y promociones adecuada.Para esto se precisan buenas previsiones de lademanda y valoraciones del impacto de cada unode los instrumentos del marketing en esta deman-da, tanto para cada referencia como al nivel decategoría. Las nuevas tecnologías de la informa-ción, como los lectores de códigos de barra insta-lados en los puntos de venta y la creación de basesde datos de clientes, han facilitado enormementela recogida de datos actualizados para dar respues-ta a estas cuestiones. Ante la ingente cantidad dedatos generados por estos sistemas, se hace nece-sario disponer de modelos adecuados para que elminorista pueda convertirlos en información útil ypueda incorporar esa información a la gestión desu oferta.

En aras a proporcionar un instrumento adecua-do para la toma de decisiones en este contexto degestión detallista, en este trabajo se analiza el pro-blema de elección de marca, utilizando para ellouna red neuronal artificial (en adelante RNA) y

centrándonos en dos aspectos: (1) capacidad de lasRNA para estimar las cuotas de mercado para unacategoría de producto dada y (2) información queeste modelo proporciona acerca del impacto de losinstrumentos de marketing en estas cuotas de mer-cado. Como base para la evaluación de los resulta-dos se toma un modelo clásico en el tratamientodel problema de elección, como es el modelo logitmultinomial. El modelo logit multinomial es unmodelo ampliamente contrastado en el contextode problemas de elección, por lo que los resulta-dos que proporciona en cuanto a capacidad deajuste a los datos pueden contemplarse comorequerimientos mínimos para los modelos alterna-tivos.

Respecto a la información que proporciona elmodelo RNA acerca del efecto de los instrumen-tos de marketing en las cuotas de mercado, si exis-ten efectos como interacciones entre distintos pre-cios (BUCKLIN y GUPTA, 1999), efectos umbral, oasimetrías en las respuestas de las distintas alter-nativas a cada uno de los instrumentos, los supues-tos de muchos de los modelos clásicos se incum-plen. Por ejemplo, una promoción en precios pue-de no ser efectiva hasta que no se supera un deter-minado umbral de valor como un 15% tambiénpuede tener un efecto máximo en el 20% a partirdel cual el efecto en cuota de mercado disminuye.También es posible que para una referencia dada,el efecto de una promoción sea superior cuandosimultáneamente se realiza una promoción de otraalternativa. En el caso de las RNA, no se realizanhipótesis a priori sobre la relación entre los instru-mentos de marketing y la respuesta de mercado,sino que estas relaciones se derivan de un conjun-to de datos dado definiendo la estructura que pro-porciona un mejor ajuste de este conjunto dedatos. Por tanto, un modelo RNA puede ser un ins-trumento útil para investigar la posible existenciade estos efectos y mostrarse más efectivo en elestudio de un problema de elección.

Este trabajo se estructura en seis partes. En elpunto dos se introduce el problema de elección demarca y su análisis mediante el modelos RNA. Elpunto tres realiza la revisión de las aplicaciones

112

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 3: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

RNA en el área de marketing y especialmente enel análisis de la respuesta de mercado. Estas apli-caciones, centradas principalmente en el análisisde la capacidad predictiva de estos modelos,sugieren que las RNA pueden proporcionar unajuste mayor que otros modelos tradicionalescomo modelos de regresión lineal para ventas,análisis discriminante y el modelo logit multino-mial. Sin embargo, en la mayoría de los casos, nose analiza el efecto de las variables independien-tes, por lo que las fuentes de mejora en la estima-ción no quedan claras. En el punto cuatro se des-criben los objetivos e hipótesis de la investigación,la base de datos y los modelos empíricos utiliza-dos en su aplicación al problema de elección demarca. A continuación, en el punto cinco, se des-cribe el proceso de estimación de los cuatro mode-los empíricos y los resultados obtenidos en la apli-cación de estos modelos. Estos resultados mues-tran una buena capacidad de ajuste de los dosmodelos empíricos de RNA y la existencia deefectos tanto lineales como no lineales para laspromociones de precios, además de efectos deinteracción entre descuentos. Por último, en elpunto seis, se señalan las principales conclusionesdel trabajo, sus implicaciones para la gestión y lasposibles futuras extensiones al mismo.

2. EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA COMPLEJA

La respuesta de mercado esperada para unasdeterminadas actividades de marketing se forma porla agregación de las respuestas de los individuos quecomponen un determinado mercado ante estas acti-vidades. Por tanto, la modelización de respuestas demercado está íntimamente relacionada con la teoríasubyacente sobre comportamiento de estos indivi-duos. Las ventas totales dentro de una determinadacategoría y las cuotas de mercado para distintasalternativas de una categoría son, en este sentido, elresultado del proceso de decisión de compra de losindividuos que componen el mercado.

Siguiendo a ROBERTS Y LILIEN (1993), la mode-lización del proceso de decisión de compra seencuadra dentro de un conjunto de modelos decomportamiento del consumidor para cada una delas distintas etapas del proceso básico de comprade los consumidores, desde el nacimiento de lanecesidad hasta el comportamiento post-compra.Por tanto, la modelización de la decisión de com-pra implica una teoría subyacente sobre el com-portamiento del consumidor durante la etapa deelección entre alternativas y las anteriores. Paraestablecer esta teoría es necesario definir cuatroelementos: el individuo que toma la decisión, lasalternativas disponibles, los atributos que caracte-rizan a las alternativas y una regla de decisión(BEN-AKIVA Y LERMAN, 1985). En general, se con-sidera que las alternativas en el conjunto de elec-ción pueden caracterizarse completamentemediante el conjunto de atributos. La decisión decompra será por tanto más compleja cuanto mayorsea el número de atributos que diferencian a lasalternativas, cuanto mayor sea el número de alter-nativas disponibles, cuanto mayor sea la compleji-dad de la regla de elección utilizada y dependien-do de las características del individuo decisor.

Uno de los modelos más utilizados en este con-texto es el modelo logit multinomial. En este mode-lo, se caracteriza la utilidad atribuida por el indivi-duo a una alternativa i en el conjunto de elección Cpor la expresión (BEN-AKIVA y LERMAN, 1985):

Ui = Vi+εi [2.1]

Donde: Vi es el componente sistemático de lafunción y εi es el componente aleatorio que reco-ge los factores no observados.

La probabilidad de elección de esta alternativaes la probabilidad de que su utilidad sea mayor oigual que la utilidad del resto de las alternativas enel conjunto de elección. Bajo ciertos supuestos,esta probabilidad toma la forma:

PC(i) = eVi/∑j∈CeVj [2.2]

Donde: c es el conjunto de elección.

113

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 4: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

Normalmente, se asume que la función V paraun individuo tiene una forma aditiva y linealmen-te separable (MCFADDEN, 1986) de la forma:

Vi = β1Xi1+β2Xi2+β3Xi3+ +βkXik [2.3]Donde: Vi es la utilidad sistemática de la alterna-

tiva iXik= es el vector de k atributos de la alternativa i para el individuo nβ=[β1,β2,…, βK] es el vector de paráme-tros a estimar

Este modelo se estima por el procedimiento demáxima verosimilitud. Una de las propiedades deeste modelo, es la que se deriva del supuesto deerrores independientemente distribuidos. Estapropiedad, denominada propiedad de independen-cia de las alternativas irrelevantes, establece que,para un individuo, la relación entre las probabili-dades de elección de dos alternativas es constantee independiente de las probabilidades de eleccióndel resto de las alternativas en el conjunto de elec-ción. Como resultado de esta propiedad, variacio-nes en el conjunto de elección no provocan varia-ciones en las probabilidades de elección relativasentre alternativas. Además, una variación en losvalores de los atributos de una alternativa tiene losmismos efectos en las probabilidades de eleccióndel resto de las alternativas.

Los supuestos del modelo logit multinomialpueden en muchos casos no ser realistas. Por ejem-plo, en el caso de la categoría del café molido, tene-mos dos atributos principales, la marca y el tipo decafé, que puede ser natural, mezcla o algunas varie-dades especiales, además del precio del producto ylas actividades promocionales. Los cambios en elprecio de uno de los productos pueden afectar enmayor medida a las compras en otro de su mismavariedad que al resto de productos. Además, losproductos de una misma marca pueden seguir unamisma estrategia de precios y promociones quehagan que sea difícil distinguir los efectos de cadauno de ellos. En el cuadro 1 se muestra un ejemplopara las compras de café molido en un hipermerca-do durante un año. Existen 14 alternativas disponi-

bles y se muestran las cuotas semanales de cadauna de ellas comparando las que se obtienen cuan-do la alternativa con mayor cuota (la variedad mez-cla de Bonka) está en promoción o no. Se observacomo el efecto de la promoción de la alternativalíder afecta en mayor medida a algunas alternativascomo las alternativas de Marcilla y Saimaza mien-tras que otras alternativas como 154, Brasilia oSoley resultan menos afectadas. Las marcas nacio-nales que compiten más directamente sufren losmayores efectos de las promociones. Por otro lado,la política de promociones simultaneas de las dis-tintas variedades de las mismas marcas hace quelos efectos de los descuentos en las alternativas dela misma marca (Bonka natural, alternativa 4) seantambién positivos.

En este trabajo, se propone para el análisis deeste problema un modelo flexible que permitaincluir este tipo de efectos sin predeterminarlos deantemano. Las RNA son una familia de modelosque surgen inicialmente en campos de investiga-ción relacionados con la forma de funcionamientodel cerebro humano. Sin embargo, la línea deinvestigación predominante en estos modelos estárelacionada con sus buenas capacidades pararepresentar distintos patrones de datos teniendocomo objetivo no tanto desarrollar modelos plau-sibles desde un punto de vista biológico, como elque estos modelos sirvan para aproximar distintosfenómenos que van desde el reconocimiento decaracteres escritos a mano al diagnóstico de cier-tas enfermedades a partir de sus síntomas (RUMEL-HART Y MCCLELLAND, 1986). Estos modelos hantenido una amplia aplicación dentro de distintasáreas de gestión, principalmente en el área definanzas (una revisión de estas aplicaciones seencuentra en KRYCHA Y WAGNER, 1999) y en elanálisis de problemas de marketing (HILERA yMARTÍNEZ, 1995; DAVIES, GOODE, MAZANEC yMOUTINHO, 1999). Entre sus principales ventajasestán su aprendizaje adaptativo mediante la utili-zación de parte de los datos como entrenamiento,su tolerancia a fallos (por ejemplo datos extremoso errores en los datos), la capacidad para operar entiempo real en el caso de utilizar el hardware apro-

114

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 5: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

piado y su capacidad para trabajar con gran canti-dad de datos (LUQUE, 2003). Las RNA recogenmuy distintos tipos de modelos pero una de lasclasificaciones más usuales distingue entre las lla-madas de aprendizaje supervisado, en las que

existe un resultado deseado que es el que se inten-ta modelizar, y las de aprendizaje no supervisado,en las que se trata de extraer patrones presentes enlos datos sin necesidad de asociarlos a un resulta-do concreto.

Dentro del primer grupo, las redes de aprendiza-je supervisado, uno de los modelos más habitualeses la red multicapa alimentada hacia delante. Estasredes (también llamadas Multilayer FeedforwardArtificial Neural Nets, en adelante MFANN) sonbásicamente un mecanismo para modelizar las rela-ciones entre unas variables de entrada (las denomi-nadas variables independientes) y unas variables desalida (las denominadas variables dependientes)determinadas. En este tipo de red, las unidades en laprimera capa (la capa de entrada) captan los valoresde las variables explicativas en el sistema y envíanese valor xi a la capa oculta intermedia. Las unida-des en la capa oculta ponderan esos valores inicia-les recibidos mediante unos pesos determinados ycalculan un nuevo valor basado en la transforma-ción del valor inicial mediante una función de trans-formación. A continuación envían ese valor a la

capa de salida. Por último, las unidades de salidacalculan el resultado final, de la misma forma quelas unidades ocultas. El resultado final de la red sepuede expresar como una función de los valores ini-ciales y los vectores de pesos:

Ok= F1(ΣJw2kjHj)=F1(ΣJw

2kj F2(ΣIw

1jixi)) [2.4]

Donde: Ok: Valor de la variable dependiente kw2

kj: Peso de conexión de la unidad ocul-ta j a la unidad de salida kHj: Valor de la unidad oculta hw1

ji: Pesos de conexión de la unidad de entrada i a la unidad oculta jXi: valor de la unidad de entrada iF1, F2: funciones de conexión

El procedimiento de estimación en unaMFANN consiste en la selección de los pesos de

115

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

CUADRO 1Cuotas de mercado durante un año cuando existe o no promoción de la alternativa Bonka mezcla

Alternativa Cuota media Cuota no prom. Cuota prom. % variación

1 Bonka mezcla 18,3% 10,3% 25,0% 143,7%2 Marcilla mezcla 15,0% 19,1% 11,6% -39,4%3 Marcilla natural 10,4% 13,2% 8,1% -38,3%4 Bonka natural 11,6% 6,7% 15,7% 136,2%5 Brasilia mezcla 9,1% 9,0% 9,1% 1,1%6 Saimaza mezcla 6,1% 8,3% 4,3% -48,4%7 154 mezcla 6,7% 6,6% 6,9% 5,3%8 Soley mezcla 5,1% 5,5% 4,9% -11,3%9 Marcilla especial 3,6% 5,2% 2,2% -57,1%10 Saimaza natural 3,3% 4,5% 2,4% -47,8%11 Bonka especial 4,5% 4,4% 4,7% 7,0%12 Bahía mezcla 2,4% 3,2% 1,7% -48,6%13 154 natural 2,2% 2,0% 2,3% 14,0%14 Bahía natural 1,6% 2,1% 1,2% -43,1%

Media 7,1% 7,1% 7,1% -1,9%

Page 6: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

conexión entre las capas, de forma que el errorcometido en las unidades de salida sea el mínimo.Este proceso de selección de los pesos se denomi-na aprendizaje y es un proceso iterativo en el quecada uno se modifica en función de la compara-ción entre el resultado obtenido para unos pesosdados y el resultado deseado. El procedimiento deaprendizaje en esta red puede considerarse, portanto, similar al de estimación de los parámetrosen un modelo econométrico. Existen diversosmecanismos para realizar este aprendizaje, siendoel más conocido en método de retropropagaciónde errores que después se ha modificado en diver-sos algoritmos para hacerlo más eficiente2.

En el caso de aplicar este tipo de red al proble-ma de elección de marca, las unidades de entradaen la red son los distintos atributos de las alterna-tivas disponibles, mientras que las unidades desalida de la red son las probabilidades de elecciónde cada una de las alternativas.

3. LAS REDES NEURONALES Y LA PREVISIÓN DE VENTAS Y CUOTAS DE MERCADO

Las aplicaciones de las RNA al análisis de pro-blemas de marketing siguen una tendencia cre-ciente. Como ejemplos, podemos citar los trabajosde WRAY et al (1994) y BEJOU et al (1996), que uti-lizan una RNA para analizar las relaciones com-prador-vendedor en un contexto de empresa-a-empresa, KUMAR et al (1995) y OLMEDA (1996),que analizan la decisión de aceptar o no un nuevoproducto por distribuidores, CURRY y MOUTINHO

(1993), comparando las RNA con los modelos deecuaciones estructurales, REINEKE FLIN et al(1995) que comparan las RNA y la regresión a lahora de predecir el comportamiento de comprabasándose en datos de encuesta o DAVIES, GOODE,MOUTINHO Y OGBONNA (2001) analizando la for-mación de la satisfacción del cliente con el super-

mercado minorista. Sin embargo, las aplicacionesde RNA más numerosas aparecen en el campo desegmentación de mercados. Por ejemplo, ZAHAVI yLEVIN (1997a) y (1997b) analizan la aplicabilidadde las redes neuronales para la planificación demailings en campañas de marketing directo,MAZANEC (1992) compara las RNA con el análisisdiscriminante para segmentar el mercado de turis-tas y BOONE y ROEHM (2002) comparan una RNAcon los modelos de mixturas en la segmentaciónde una base de datos de clientes de un detallista.

Centrándonos en los trabajos que pretendenestimar la respuesta de mercado a los instrumen-tos de marketing mediante distintos tipos de RNA,podemos dividirlos en dos grupos, los que inten-tan explicar los resultados para una única alterna-tiva dada realizando comparaciones con técnicasde regresión y los que intentan modelizar eleccio-nes teniendo en cuenta al mismo tiempo diferentesalternativas, más próximos a este trabajo. Lamayor parte de los trabajos de estos dos gruposcomparan los modelos únicamente en cuanto a sucapacidad de ajuste a los datos, ya sean ventas ocuotas de mercado, y no en cuanto a las relacionesentre acciones de marketing y resultados.

En el primer grupo de trabajos, que explican losresultados para una referencia, podemos clasificarlos trabajos de HRUSCHKA (1993), WIERENGA yKLUYTMANS (1994 y 1996), GRUCA et al (1995) yAINSCOUGH y ARONSON (1999). Los resultados deeste primer grupo de trabajos indican que las RNApueden obtener mejores resultados que modelosde regresión con las mismas variables en la pre-dicción de ventas y cuotas de mercado de un pro-ducto de consumo. Las razones de esta mejora enla estimación se atribuyen a la flexibilidad de losmodelos RNA frente a los modelos de regresiónsobre todo en cuanto a su capacidad para modeli-zar relaciones no lineales y su mayor tolerancia ala presencia de multicolinealidad en los datoscomo muestran los estudios de simulación. Sinembargo, ninguno de estos trabajos analiza empí-

116

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

2 En el Anexo se detallan los aspectos relativos a la implementación de este modelo en el presente trabajo.

Page 7: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

ricamente las relaciones entre las variables inde-pendientes y las dependientes ni se comprueba laposible existencia de estos efectos no lineales.Además, en estos trabajos se toma una perspectivade fabricante interesado en los resultados de unaúnica referencia de forma aislada en lugar de losresultados para una categoría de producto, por loque no se consideran efectos cruzados entre alter-nativas.

El segundo grupo de trabajos analiza el proble-ma de elección entre distintas alternativas tenidasen cuenta simultáneamente mediante RNA. Eneste grupo de trabajos, más próximos al presenteproblema, se incluyen los trabajos de DASGUPTA etal (1994), WEST et al (1997), DE CARVALHO et al(1998), WARTENBERG y DECKER (1996), AGRAWAL

y SCHORLING (1996), y BENTZ y MERUNKA (2000).Los tres primeros trabajos analizan el problema deelección entre únicamente dos alternativas mien-tras que en los otros tres, las alternativas conside-radas son más de dos. Los dos últimos trabajos sonlos más relevantes en este caso, ya que realizancomparaciones empíricas entre el modelo logitmultinomial y RNA. Este segundo grupo de traba-jos presentan resultados positivos en cuanto acapacidad de ajuste de las RNA frente a los mode-los logit binomial y multinomial, aunque no entodos los casos. Además, en cuanto a los efectosde las variables independientes, algunos de estostrabajos analizan los posibles efectos no lineales(WEST et al, 1997 y BENTZ y MERUNKA, 2000)para distintos tipos de variables con metodologíasalternativas. En ambos casos se confirma la exis-tencia de estos efectos. WARTENBERG y DECKER

(1996) también analizan la naturaleza de la com-petencia entre alternativas encontrando asimetríasque no pueden detectarse con el modelo alternati-vo presentado. Sin embargo, este grupo de traba-jos presenta algunas lagunas. Aunque los resulta-dos de ajuste frente al modelo logit multinomialson superiores para la red neuronal, no se haninvestigado completamente las fuentes de estamejora en ajuste. BENTZ y MERUNKA (2000) anali-zan únicamente una de las posibles fuentes de estamejoría, los efectos no lineales, a través de un

modelo restringido para permitir la existencia deeste tipo de efectos. En el presente trabajo, sinembargo, se presenta un modelo más amplio, en elque no se realizan supuestos iniciales sobre laestructura del proceso de elección.

4. OBJETIVOS, HIPÓTESIS Y MODELOS EMPÍRICOS

4.1. Objetivos e hipótesis

Como se ha puesto de manifiesto en la revisiónanterior de la literatura, las RNA han obtenidoresultados superiores al modelo de contraste en lamayoría de los casos, aunque en ocasiones estosresultados no son concluyentes. Los resultados delos estudios de simulación muestran que las RNApueden ser útiles en la estimación de cuotas demercado proporcionando un ajuste superior a losmodelos de contraste cuando los supuestos de losmodelos lineales de regresión y los modelos logitque se utilizan como comparación no se cumplen,es decir, la forma funcional subyacente es no line-al, existen problemas de multicolinealidad, y, en elcaso de los modelos logit, se incumple la propie-dad de independencia de las alternativas irrelevan-tes. En categorías de producto en las que el núme-ro de alternativas disponibles para el consumidores elevado, el proceso de elección es más comple-jo. En este contexto, es más probable que la redneuronal artificial supere el modelo logit multino-mial en la estimación de las cuotas de mercado(AGRAWAL y SCHORLING, 1996). El primer objetivode este trabajo es la evaluación de la capacidad deun modelo RNA para la estimación de las cuotasde mercado en una categoría de producto de com-pra compleja.

Respecto a la información que proporciona elmodelo sobre el efecto de las variables indepen-dientes en las dependientes, en el caso del mode-lo logit multinomial se obtiene un conjunto deparámetros para los que, si se cumplen lossupuestos de partida, es posible calcular valoresde significatividad que permiten el contraste de

117

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 8: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

hipótesis. En el caso de la RNA, el número deparámetros estimados, (los pesos de la red), esmuy superior al del modelo logit multinomial. Porejemplo, una RNA con 14 variables independien-tes, 14 dependientes y 5 unidades ocultas tiene untotal de 159 parámetros. Se han desarrollado esta-dísticos de contraste para estos pesos de este tipode red mediante distribuciones asintóticas (e.g.KUNG y WHITE, 1992) pero la interpretación deestos parámetros para una variable dada resultamuy complicada debido a este alto número deparámetros. Para simplificar la interpretación delos resultados del modelo, en lugar de analizardirectamente los pesos calculados, se van a calcu-lar las derivadas de los resultados de la red conrespecto a cada una de las variables independien-tes (WEST, BROCKET Y GOLDEN, 1997). Este pro-cedimiento permite el análisis de los efectos decada una de estas variables de forma separada yproporciona una visión descriptiva de los princi-pales efectos presentes en los datos. Por ejemplo,VAN HEERDE et al (2001) analizan la naturaleza dela curva que relaciona los descuentos en precioscon las ventas mediante una regresión no paramé-trica. Sus resultados muestran que, en el caso delas promociones en precios de tres categorías deproductos de consumo, la respuesta en ventas pre-senta tanto efectos de tipo umbral y niveles desaturación como efectos de interacción entre losdescuentos de distintas alternativas. El segundoobjetivo de este trabajo será la comprobación dela posible existencia de efectos no lineales, efec-tos umbral e interacciones (p.e.: mayor influenciade algunas alternativas en otras o efectos mayoresde las promociones cuando se producen simultá-neamente promociones en dos alternativas) entrelos distintos instrumentos de marketing a través

del análisis de las derivadas parciales de los resul-tados en el modelo RNA.

4.2. Modelos empíricos y base de datos

La aplicación empírica de la RNA y el modeloalternativo (el logit multinomial) se va a realizar enla categoría de producto del café molido. En estetrabajo únicamente se van a tener en cuenta, comodeterminantes para la elección, las característicasde las alternativas de la categoría y no característi-cas de los clientes que realizan la compra, aunqueel comportamiento de elección de estos clientespueda presentar diferencias según estas característi-cas (BERNÉ, CORTIÑAS, ELORZ y MÚGICA, 2004)3.Como características de estas alternativas, la basede datos recogida en los sistemas de escáner delpunto de venta incluye únicamente informaciónacerca del precio unitario de cada producto, la mar-ca y el tipo de producto. La información sobrepublicidad o colocación de productos puede estardisponible mediante un proceso de recogida dedatos manual, factible para pequeños periodos detiempo pero altamente costoso para el análisis devarias categorías de productos o durante largosperiodos de tiempo por lo que utilizaremos única-mente la información disponible directamente paralos detallistas, a través del escáner del estableci-miento. El precio unitario recogido en cada transac-ción, se descompone en dos variables, que van a uti-lizarse en modelos alternativos: precio regular ydescuento (GUPTA, 1988). De la consideración delprecio unitario como variable única o como dosvariables diferenciadas (precio regular y descuento)tanto en un modelo logit multinomial o en unaMFANN surgen 4 modelos empíricos a estimar:

118

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

3 Los datos disponibles para la gestión detallista únicamente presentan información acerca de las características de los individuos en el casode los individuos que disponen de una tarjeta del establecimiento y, en estos casos, únicamente para las compras que han realizado con esta tar-jeta. El enfoque detallista de este trabajo hace que nos centremos únicamente en las características disponibles para todas las elecciones.

Page 9: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

La especificación de los modelos logit multino-miales con estas variables será:

Modelo MNLogit(a): P(i)=exp(αi+β1PRi+β2Dtoi)/Σ1

Kexp(αk+β1PRk+β2Dtok) [4.1]Donde: P(i): Probabilidad de elección de la alter-

nativa i [0-1]PRi, PRk: Precio regular de la alternativa i, kDtoi, Dtok: Porcentaje de descuento en precio de la alternativa i, kK: número de alternativas en el conjunto de elecciónαi, β1, β2: Parámetros a estimar

Modelo MNLogit(b): P(i)=exp(αi+β1PUi)/Σ1Kexp

(αk+β1PUk) [4.2]Donde: P(i): Probabilidad de elección de la alter-

nativa i [0-1]PUi, PUk: Precio unitario de la alternati-va i, kK: número de alternativas en el conjunto de elecciónαi, β1: Parámetros a estimar

La MFANN utilizada en este caso utiliza dostipos de funciones de transferencia: la función enla primera capa es de tipo logístico y en la segun-da capa de tipo lineal. En el Anexo de este trabajose detallan las decisiones tomadas en la definicióndel modelo RNA. La especificación resultante delos dos modelos de redes neuronales es:

Modelo RNA(a): Cuota(k)= ΣJw2

kj(1/1+exp (-ΣIw

1jiXi)) [4.3]

X = [PR1, PR2, PRi……PRK; Dto1, Dto2, Dtoi……., DtoK] [4.4]Donde: Cuota(k): Cuota diaria de la alternativa k

Número de unidades ocultasw2

kj w1ji: peso de la unidad j en la unidad

k, peso de la unidad i en la unidad jXi: valor de la unidad de entrada i, com-ponente i del vector de variables XPRi: Precio regular de la alternativa iDtoi: Porcentaje de descuento en precio de la alternativa iK: número de alternativas en el conjunto de elección

Modelo RNA(b): Cuotai= ΣJw2

kj(1/1+exp(-ΣIw

1jiXi)) [4.5]

X = [PU1, PU2, PUi……PUK] [4.6]Donde: PUk: Precio unitario de la alternativa k

El resto de variables son las mismas que en el caso anterior

Para comparar los modelos logit multinomial ylas redes neuronales se utilizan las estimacionesde ambas modelizaciones. Sin embargo, en elmodelo logit multinomial la variable estimada esla probabilidad de elección para cada una de lasalternativas, mientras que en la red neuronal arti-ficial se estiman directamente las cuotas semana-les resultantes para las alternativas. COOPER yNAKANISHI (1988) muestran la relación existenteentre la cuota de mercado de una marca y su pro-babilidad de elección. Esta relación depende delnúmero de unidades compradas por elección, de laprobabilidad media del mercado y de la probabili-dad de elección individual. La mayor o menor

119

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

CUADRO 2Modelos empíricos y variables utilizadas

Modelo Nombre Variables incluidas en el modelo

Precio regular Porcentaje Descuento Precio Unitario1 MNLogit(a) X X2 MNLogit(b) X3 RNA(a) X X4 RNA(b) X

Page 10: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

relación entre la cuota de las distintas marcas y lasprobabilidades de elección a nivel agregadodependerá del grado de homogeneidad y correla-ción que exista entre las probabilidades de elec-ción y el volumen de compra de los consumidoresque adquieren sus productos en el mercado. Eneste caso, al no disponer de datos sobre la fre-cuencia de compra ni sobre las probabilidades deelección individuales para las compras totales, lasprobabilidades de elección se equiparan a la cuotaestimada para cada una de las alternativas.

La base de datos de trabajo comprende todaslas compras de la categoría de café molido reali-zadas en un hipermercado de la zona este espa-ñola durante 1999. Este hipermercado pertenecea una cadena de establecimientos regional, situa-da entre las 20 mayores españolas por volumende facturación y entre las 25 primeras por núme-ro de empleados. La selección de un único esta-blecimiento como base de trabajo permite, en pri-mer lugar, homogeneizar en mayor medida elconjunto de elección presente durante el periodoya que, aunque las grandes marcas nacionalespueden ofertarse durante un largo periodo detiempo, la selección de marcas regionales y loca-les presentes en el establecimiento puede ser másvariable por lo que el conjunto de elección puedepresentar grandes variaciones en periodos detiempo largo. En segundo lugar, tomando unaperspectiva de gestión, algunos autores planteanla necesidad de establecer estrategias de precios anivel de establecimiento, en lugar de a nivel decadena, debido a las diferencias en las sensibili-dades al precio que se pueden encontrar en losestablecimientos de una misma cadena en distin-tas zonas (MONTGOMERY, 1997, HOCH et al 1995entre otros).

La base de datos contiene inicialmente 28.842observaciones. De estas observaciones iniciales,se eliminan aquellas alternativas que están presen-tes menos de tres semanas del total en el año en elestablecimiento y aquellas que representan menos

de un 1% de las compras totales de lo que resultan25.565 observaciones de compra para 14 alterna-tivas de producto. Las 14 alternativas se presentanen el mismo formato (250 gr.) de modo que el pre-cio unitario que se toma por alternativa correspon-de al precio del paquete y el precio regular se cal-cula por inspección visual de los datos teniendo encuenta las disminuciones del precio unitario quese mantienen por periodos breves de tiempo (unao dos semanas) a partir de las cuales el precio uni-tario vuelve a los valores anteriores. El porcentajede descuento se calcula a partir de este precioregular. En la figura 1 se muestra un ejemplo deconstrucción de los precios regulares para la alter-nativa 1.

Las alternativas corresponden, por una parte, a3 variedades de café distintas (café mezcla, natu-ral y especial) y, distinguiendo por marcas, a 7marcas (4 marcas nacionales, Bonka, Marcilla,Saimaza y Brasilia y otras marcas locales, Café154, Bahía y Soley). Las dos marcas nacionalescon mayor cuota ofrecen las tres variedades con-templadas mientras que el resto de las marcas pre-sentan una o dos variedades. La variedad de cafécon mayor cuota en el establecimiento es la varie-dad mezcla, seguida del café natural. En el cuadro3 se muestran algunos descriptivos para las 14alternativas.

La alternativa de mayor precio medio es la quecorresponde a la variedad especial de Bonka.Podemos observar como los precios para las varie-dades natural y mezcla de una misma marca pre-sentan unos valores medios muy similares y comolas marcas nacionales presentan precios mediosmayores que el resto de las marcas en el conjuntode elección. El descuento medio se sitúa en el 10%del precio regular pero se presentan bastantes dife-rencias entre alternativas. Dos de ellas no se pro-mocionan durante el periodo (Brasilia y Soleymezcla). Además, las alternativas de una mismamarca tiende a promocionarse simultáneamente ycon un porcentaje de descuento similar.

120

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 11: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

121

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

FIGURA 1Precios regulares y descuentos para la alternativa Bonka mezcla

CUADRO 3Descriptivos

Alternativa Precio Unit Precio Reg Descuento Cuota

1 Bonka mezcla 206 216 7,6% 18,31%2 Marcilla mezcla 217 225 9,7% 14,97%3 Marcilla natural 217 225 9,7% 10,41%4 Bonka natural 207 217 7,0% 11,61%5 Brasilia mezcla 209 209 – 9,06%6 Saimaza mezcla 226 233 12,8% 6,12%7 154 mezcla 199 225 11,7% 6,74%8 Soley mezcla 205 206 – 5,13%9 Marcilla especial 215 222 8,7% 3,58%10 Saimaza natural 225 233 13,4% 3,34%11 Bonka especial 270 271 4,4% 4,52%12 Bahía mezcla 189 191 15,2% 2,39%13 154 natural 184 186 9,4% 2,18%14 Bahía natural 188 191 15,9% 1,62%

Media 211 218 10,5% 7,14%

Page 12: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

5. PROCESO DE ESTIMACIÓN Y SELECCIÓN DE MODELOS Y RESULTADOS

5.1. Proceso de estimación y selección de modelos

Para la estimación de los 4 modelos empíricosplanteados, las observaciones para cada compra seagregan al nivel de semana debido a la poca varia-bilidad de los precios y los descuentos diarios,obteniendo 53 observaciones de compras semana-les para cada una de las 14 alternativas, que inclu-yen la información de los precios unitarios, pre-cios regulares y descuentos.

Los dos modelos logit multinomial se estimanpor el procedimiento de máxima verosimilitud.Una vez estimados los modelos, comparamos labondad del ajuste correspondiente a cada uno deellos, utilizando el método de comparación SBIC(Criterio de Información Bayesiana de Schwarz).Al igual que en el caso del criterio AIC (criterio de

Información de Akaike), el SBIC selecciona elmodelo que considera que combina un valor altodel logaritmo de la función de verosimilitud conun número pequeño de parámetros estimados4. Elmodelo seleccionado en este trabajo, según estaconclusión, es el que presenta un menor valor parael estadístico SBIC. La definición para este crite-rio es5:

SBIC = -2[LL(B) - (K/2) Ln(T)] [4.7]Donde: LL(B): logaritmo de la función de vero-

similitud de los parámetros estimadosK: número de parámetros a estimar T: número de observaciones, total de uni-dades compradas (T=27.969)

Según este criterio, que presenta una conclusiónsimilar al criterio AIC, el mejor modelo en el casodel logit multinomial es el modelo MNL(a), en elque se incluyen efectos separados para el precioregular y el porcentaje de descuento en precio(Cuadro 4).

122

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

CUADRO 4Modelos MNL(a) y MNL(b). Ajuste

Modelo Variables LL(B) T K AIC SBIC

MNL(a) R.P. P.D. -62.561 27.969 15 125.152 125.275MNL(b) U.P. -62.963 27.969 14 125.954 126.069

Para la estimación de los modelos de redes neu-ronales, en primer lugar se realiza una selecciónde la función de salida en la capa final y del méto-do de entrenamiento. Una vez seleccionada la fun-ción de salida lineal y el método de entrenamien-to de Levenberg-Marquardt se selecciona el núme-ro de unidades de la capa oculta para ambos

modelos mediante un proceso iterativo. Se partede la estructura más sencilla, con una sólo unaunidad oculta y progresivamente se añade comple-jidad hasta detenerse en la estructura con un valormedio menor para el error cuadrático en la esti-mación. Cada uno de los modelos se estima 10rondas de forma que se obtienen valores para el

4 Los dos criterios (AIC y SBIC) tienen en común que consideran mejor modelo aquel que combina un valor alto de la función de verosi-militud con un número pequeño de parámetros. ALLENBY (1989) demuestra que, para muestras mayores de 8 observaciones el criterio SBIC esmás adecuado que el AIC, aunque ambos criterios se muestran en los resultados.

5 La formulación utilizada en este trabajo para el SBIC es la de KAMAKURA et al, 1996. Puesto que las definiciones alternativas son cre-cientes o decrecientes respecto a las originales y dado que estas se utilizan para seleccionar modelos alternativos, la definición concreta no alte-ra los resultados de la selección. La formulación del criterio AIC utilizada es la propuesta por KUMAR y SASHI (1989): AIC=-2[LL(B)-k] don-de LL(B): logaritmo de la función de verosimilitud de los parámetros estimados y K: número de parámetros a estimar.

Page 13: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

promedio y la desviación típica de este error tantoen el conjunto de datos total como en el de entre-namiento y validación. En ambos casos, el núme-ro de unidades seleccionado es 5. También seobserva como el error para el modelo (a) se sitúaen todos los casos por debajo del error en el mode-lo (b). En el Anexo se dan más detalles sobre esteproceso de estimación

Una vez definida la estructura, en el cuadro 4 secompara el ajuste de ambos modelos. El criterio

de selección de modelos utilizado en este caso esel promedio del error cuadrático medio6 ya queesta es la función objetivo a minimizar utilizadadurante la estimación.

PECM=Σ1NΣ1

T(yt-ot)2/T [4.8]

Donde: N: Número de rondas de estimaciónT: Número de observacionesyt: Valor estimado para la observación tot: Valor observado para la observación t

123

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

6 En este caso no se utiliza el criterio SBIC ya que, como señalan Qui y Zhang (2001), la penalización del número de parámetros que llevaasociado este criterio en el área de redes neuronales artificiales conlleva la selección del modelo más simple en todos los casos.

CUADRO 5Modelos RNA(a) y RNA(b). Ajuste

RNA(a) RNA(b)Número de unidades desde 1 hasta 20

Media 0,0011 0,0033Desviación típica 0,0003 0,0017Z Wilcoxon -3,8242Sig 0,0001

Estructura: 5 unidades

PECM 0,0008 0,0009Desviación típica 0,0001 0,0002Valor -1,6827Sig 0,0009

La utilización del precio regular y el descuento(26 variables) en el precio en lugar del precio uni-tario (14 variables) aumenta el número de paráme-tros a estimar para la estructura con 5 unidadesocultas desde 159 hasta 229 parámetros. Tanto eltest de Wilcoxon para muestras relacionadas a lolargo de todas las estimaciones como el test paralas estimaciones con 5 unidades ocultas muestrancomo el modelo (a) es superior al (b). Por tanto, enambos casos, el modelo elegido es aquel que utili-

za la información sobre el precio regular y el por-centaje de descuento en precios.

5.2. Resultados

El cuadro 5 muestra, como primera aproxima-ción al ajuste de los modelos, las correlaciones delas estimaciones de los cuatro modelos con las cuo-tas de mercado semanales de todas las alternativas.

Page 14: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

124

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

CUADRO 6Correlaciones de Pearson. Cuotas de Mercado y Estimaciones

Cuota RNA(a) RNA (b) MNLogit(a) MNLogit(b)

Cuota 1RNA(a) 0,945*** 1RNA(b) 0,909*** 0,923*** 1Logit(a) 0,913*** 0,930*** 0,909*** 1Logit(b) 0,901*** 0,916*** 0,899*** 0,983*** 1

Todas las correlaciones son significativas al1%. En la primera columna se encuentran lascorrelaciones de los cuatro modelos con la cuotade mercado. El modelo con mayor correlación esla estimación mediante red neuronal que incluyelos precios regulares y descuentos de cada alter-nativa, seguido del modelo logit con las mismasvariables, es decir, los dos modelos selecciona-dos. El modelo de red con precios unitarios pre-senta una correlación mayor con las cuotas que elmodelo logit con esta variable. Por tanto, en pri-

mer lugar, el modelo de red (a) parece realizarestimaciones aceptables para las cuotas de mer-cado.

El segundo objetivo del trabajo está relacionadacon el tipo de efectos de los instrumentos de mar-keting (precio regular y descuento) en las cuotasde mercado y los efectos cruzados entre alternati-vas. El cuadro 7 muestra los parámetros estimadosen el modelo logit multinomial elegido tomandocomo base la alternativa que tiene la menor cuotade mercado (Bahía natural).

CUADRO 7Parámetros estimados

Alternativa Coeficiente Valor t

1 Bonka mezcla 2,710 48,7212 Marcilla mezcla 2,804 47,2233 Marcilla natural 2,428 40,3404 Bonka natural 2,246 39,4715 Brasilia mezcla 2,388 43,2396 Saimaza mezcla 1,934 29,0347 154 mezcla 1,070 17,3938 Soley mezcla 1,689 29,3029 Marcilla especial 1,370 21,27810 Saimaza natural 1,298 18,43111 Bonka especial 3,038 32,95912 Bahía mezcla 0,420 6,75113 154 natural 0,299 4,692Precio Regular -0,022 -24,863Descuento 10,795 96,042

Page 15: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

De acuerdo con la especificación del modelo,se calcula un único coeficiente para todas lasalternativas, para el precio regular y el porcentajede descuento. Todos los coeficientes estimadosson significativos al 1% y tienen el signo espera-do. Los valores constantes para la utilidad de cadaalternativa (estimaciones de αi) pueden interpre-tarse como valores de preferencia para cada alter-nativa. La alternativa con mayor valor (3,038) es lavariedad especial de Bonka. Los valores para elresto de las constantes tienen una ordenación demayor a menor similar a las de las cuotas de mer-cado. Para comprobar si se mantiene o no la pro-piedad de independencia de las alternativas irrele-vantes, el modelo logit se vuelve a estimar consólo una parte de las alternativas, las resultantes deeliminar las variedades especiales y las marcasque sólo presentan una variedad (8 alternativas).Los parámetros del nuevo modelo se comparancon el anterior mediante el test de HAUSMAN Y

MCFADDEN (1984) que rechaza la hipótesis nulade independencia de las alternativas irrelevantes7.

En el caso del modelo RNA(a), los efectos delas variables independientes se evalúan medianteel cálculo de derivadas de las 14 variables depen-dientes con respecto a las independientes (verAnexo para las expresiones de las derivadas) ade-más de los valores constantes para cada una deestas variables. En el cuadro 8, se muestran estosvalores constantes, además del efecto del precioregular y descuento de cada alternativa en la cuo-ta estimada para esa alternativa evaluado en losvalores medios de estas variables. Los valores delas constantes, en este caso, no son comparables alos obtenidos en el modelo logit multinomial.Mientras que los parámetros estimados en el casode logit muestran el efecto constante de cada alter-nativa en la función de utilidad de los individuos,los parámetros para la red son efectos constantesdirectamente sobre las cuotas de mercado.

125

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

7 El resultado del test en este caso es 168,79 que sigue una distribución chi-cuadrado con 6 grados de libertad (la diferencia entre 14 y 8alternativas) por lo que se rechaza la hipótesis nula de independencia de alternativas irrelevantes al 1%.

CUADRO 8RNA(a). Constantes y efectos propios medios

Alternativa Constante Propio PR (efecto medio) Propio dto (efecto medio)

1 Bonka mezcla 0,314 -0,008 0,0262 Marcilla mezcla 0,400 -0,000 0,9203 Marcilla natural 0,347 -0,001 0,7474 Bonka natural 0,203 -0,001 0,9235 Brasilia mezcla -0,023 -0,009 –*6 Saimaza mezcla -0,299 0,052 0,4617 154 mezcla 0,384 -0,029 0,1938 Soley mezcla -0,340 0,007 –*9 Marcilla especial 0,083 -0,001 0,15510 Saimaza natural -0,121 -0,025 0,37811 Bonka especial 0,058 -0,001 0,57312 Bahía mezcla -0,111 -0,003 0,02113 154 natural 0,153 -0,002 0,23214 Bahía natural -0,048 -0,001 0,004

* Las alternativas 5 y 8 no se promocionan durante el periodo.

Page 16: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

Las marcas Bonka y Marcilla muestran losmayores valores para estas constantes con valorespositivos, al igual que la marca154 (una marcalocal). En estos casos, las cuotas que obtienen lasalternativas son superiores a las que se esperaríanpor los efectos de los precios regulares y descuen-tos en cada momento. En el caso de las alternati-vas con constantes negativas, la cuota efectivaestimada es menor a la explicada mediante losefectos de los precios regulares y porcentajes dedescuentos.

El resto de los parámetros presentados en elcuadro 8 corresponden a los efectos medios deprecios y descuentos de una alternativa en la cuo-ta estimada para esa alternativa. Cada valor indicala modificación esperada en la cuota de la alterna-tiva para una modificación en uno de los instru-mentos de marketing partiendo del valor medio(se ha tomado la mediana). En el caso de los pre-cios regulares, todos los parámetros estimados,salvo dos casos, presentan el signo esperado.Estos dos casos con signos inesperados se corres-ponden con la variedad mezcla de las marcas Sai-maza y Soley (alternativas 6 y 8). Una posibleexplicación para este fenómeno es la alta correla-ción de estos dos precios regulares con el precioregular de la alternativa 10, Saimaza natural(0,899 y 0,999 respectivamente); cuando el preciode la alternativa 10 aumenta, las cuotas de merca-do de las alternativas 6 y 8 aumentan al mismotiempo que sus precios. Como se esperaba, elefecto de aumentos en los precios regulares en lacuota de mercado es menor en el caso de Bonka yMarcilla salvo en el caso de la alternativa 1 que sesitúa en valores intermedios. Por tanto, puededecirse que las marcas nacionales se enfrentan auna menor sensibilidad a los precios que el restode las marcas.

Los efectos del porcentaje de descuento en pre-cios, muestran el signo positivo esperado. El por-centaje de descuento tiene el mayor efecto en elcaso de las variedades mezcla y natural de Marci-lla y las variedades mezcla y especial de Bonka.Por tanto, en el caso de estas marcas nacionales,las variaciones de los precios regulares tienenpoca repercusión sobre las cuotas de mercadomientras que las promociones en precios tienenfuertes efectos. Sin embargo, las promociones enprecios tienen muy poco efecto en el caso deBahía para las variedades mezcla y natural y parael café especial de Marcilla. En el caso de estaalternativa (alternativa 9), el efecto del precioregular también es muy bajo, por lo que el efectode la constante en esta alternativa es muy alto.Esta alternativa es un café especial para filtros loque podría hacer que una relativa situación demonopolio para un nicho de consumidores. Lasdos variedades de Bahía no experimentan prácti-camente variaciones en cuota ante promociones deprecios.

El siguiente paso es detallar los resultados dela red neuronal con respecto al porcentaje de des-cuento en precios. Desde el punto de vista deta-llista, la toma de decisiones sobre promocionesen precios resulta un instrumento más rápido ysencillo de utilizar que las modificaciones en elprecio regular. La estructura de red analizadapermite detallar los efectos de estos instrumentostanto para distintos puntos de valor (distintosefectos dependiendo del nivel de partida) comoanalizar los efectos cruzados entre distintas alter-nativas.

En el cuadro 9 y las figuras 2(a) y 2(b) se mues-tran las derivadas de las cuotas de cada alternativacon respecto a su propio porcentaje de descuentomedio evaluadas en distintos puntos.

126

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 17: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

La observación de ambas figuras da una prime-ra idea de que el tipo de respuesta ante descuentosde precios es diferente entre marcas. En algunoscasos, parece que el efecto del descuento puedeser de tipo lineal, como en el caso de las alternati-vas 9, 11, que son las dos variedades especiales delas Bonka y Saimaza o las alternativas Saimaza y154 mezcla. En otros casos, el efecto de las pro-mociones de precios en las cuotas es demasiadobajo como para extraer conclusiones, como en elcaso de las alternativas Bahía mezcla y natural.Sin embargo, para otras alternativas, el efecto delas promociones en precios desagregado por nive-les presenta una forma claramente no lineal. Engeneral, los gráficos presentan dos tipos de efec-tos. En el caso de las alternativas Bonka mezcla y154 natural, el valor mayor para la derivada delprecio se encuentra en el nivel de “no descuento”y disminuye a partir de este nivel. En estos casos,

la ganancia de la cuota de mercado parece conse-guirse por el hecho de realizar la promoción y elefecto marginal del volumen de descuento es cadavez menor. Sin embargo, los efectos marginalesdel descuento para las alternativas Marcilla mez-cla y natural y Bonka natural siguen una tendenciadiferente. En estos tres casos, el efecto de unaumento del descuento desde el nivel 0 es bastan-te bajo y este efecto aumenta progresivamentehasta llegar al máximo para descuentos entre el 10y el 15%. A partir de este punto, el efecto margi-nal del descuento disminuye bruscamente en elcaso de las alternativas 2 y 3, y más moderada-mente en el caso de la alternativa 4. Para estasalternativas, parece existir un nivel de descuentoóptimo para el que el efecto marginal es máximoy a partir del cual se produce un efecto saturación.Por tanto, el efecto de las promociones en preciosno es homogéneo entre alternativas.

127

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

CUADRO 9RNA(a). Porcentaje Descuento Propio

Alternativa 0% 0-5% 5-10% 10-15% 15-20% >20%

1 Bonka mezcla 0,543 0,541 0,026 0,209 0,007 –2 Marcilla mezcla 0,381 0,698 0,920 0,925 0,127 0,1383 Marcilla natural 0,186 0,624 0,747 0,962 0,034 0,0654 Bonka natural 0,294 0,373 0,923 0,946 0,821 –6 Saimaza mezcla 0,351 0,457 0,394 0,461 0,473 0,2047 154 mezcla – – 0,200 0,193 0,056 0,0509 Marcilla especial 0,029 0,058 0,155 0,162 – –10 Saimaza natural 0,182 – 0,199 0,378 0,370 0,17011 Bonka especial 0,548 0,573 0,515 – – –12 Bahía mezcla -0,019 – – 0,021 -0,001 –13 154 natural 0,368 0,179 0,232 0,131 – –14 Bahía natural 0,022 – – – – 0,004

Page 18: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

128

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

FIGURA 2(a)RNA(a): Efectos porcentaje de descuento, alternativas 1 a 7

Page 19: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

129

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

FIGURA 2(b)RNA(a): Efectos porcentaje de descuento, alternativas 8 a 14

Page 20: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

Por último, se presentan algunos resultadosreferidos a los efectos cruzados y de interacciónentre marcas. Como se señalaba al describir labase de datos, en este caso, en general, las promo-ciones se establecen para las marcas y no para las

alternativas. En el cuadro 10 se presentan, losefectos cruzados de los descuentos agregados paralas marcas, sobre las cuotas de las alternativas 1 y2 (las alternativas con mayor cuota)8.

En ambos casos, el efecto de descuentos en lapropia marca es claramente positivo. Sin embargo,los descuentos en el resto de las marcas no afectanpor igual a ambas marcas. Mientras que en el casode la alternativa 1 (Bonka) los descuentos de Mar-cilla y Saimaza tienen efectos similares, la cuotade la alternativa 2 (Marcilla) se ve mucho másafectada por descuentos en la marca Bonka que enla marca Saimaza. La marca 5 (Bahía) afecta deforma positiva a la cuota de la alternativa 2 debi-do a que, para las 18 semanas en que esta alterna-tiva está en promoción, la correlación entre ambosdescuentos es muy alta (0,974). Sin embargo, esta

marca tiene un efecto bajo en la cuota de la alter-nativa 1. Los descuentos en la marca 154 afectanen menor medida a la cuota de las dos alternativasaunque el efecto es superior para la alternativaMarcilla.

Para terminar, se analizan los efectos de inte-racción para las dos alternativas con mayor cuota(Bonka y Marcilla mezcla). En este caso, se com-prueba el efecto de un descuento en precio en lapropia alternativa dependiendo de que la otra sepromocione o no simultáneamente. En la figura 3se muestran para las alternativas 1 y 2, los efectosde interacción en promociones en la marca.

130

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

8 En este caso, no se han calculado los efectos en cada punto, que pueden o no ser lineales, para facilitar el análisis y se presentan única-mente los resultados que corresponden al punto medio de descuento, por lo que estos resultados serían comparables a los que aparecen en latabla 8.

CUADRO 10RNA(a). Efectos agregados por marcas. Alternativas 1 y 2

Descuento (suma) Cuota Alt. 1 (Bonka mezcla) Cuota Alt.2 (Marcilla mezcla)

Bonka 1,3617 -0,6879Marcilla -0,6414 1,7174Saimaza -0,7616 -0,2306Bahía -0,2988 0,1351154 -0,0072 -0,046

Page 21: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

En el caso de la alternativa 1 (Bonka mezcla), elanálisis inicial mostraba cómo el mayor efectomarginal se producía por el hecho de introducir lapromoción y cómo el incremento del descuentoafectaba en menor medida a la cuota de mercado.Al introducir el efecto del descuento en la alterna-tiva 2 (Marcilla Mezcla), estas conclusiones semodifican. Cuando las alternativas 1 y 2 se pro-mocionan simultáneamente, el efecto inicial de lapromoción sigue siendo similar, pero el efecto enla cuota aumenta al incrementar el valor del des-cuento. En el caso de la alternativa 2, el efecto enla cuota de mercado al introducir una promociónen precios, aunque el porcentaje de descuento seamuy bajo, se incrementa considerablemente cuan-do la alternativa 1 está siendo promocionadasimultáneamente. Sin embargo, a partir de estosbajos niveles, las ganancias en cuota al incremen-tar el volumen de descuentos son similares inde-pendientemente de que ambas alternativas se pro-mocionen al mismo tiempo.

6. CONCLUSIONES

La primera conclusión que se puede extraer deeste trabajo se refiere a la información que pro-porciona el precio de un producto al explicar lacapacidad de elección. En el caso de los cuatro

modelos empíricos planteados en este trabajo, losresultados son mejores cuando se divide el precioen dos componentes: el precio regular y el por-centaje de descuento sobre este precio que cuandoúnicamente se proporciona información sobre elprecio unitario. Parece existir un efecto promociónque es capaz de explicar más que la simple com-paración de los precios a pagar por el compradorindependientemente del modelo utilizado parareflejar esta relación. Los consumidores habitua-les en el establecimiento pueden tener un sistemade precios de referencia que puedan compararfácilmente los precios actuales con este precioreferencial para valorar el porcentaje de descuentoefectivo.

En segundo lugar, el modelo MFANN presentaunos resultados de ajuste adecuados para modeli-zar las cuotas de mercado semanales en un esta-blecimiento en una categoría de producto comple-ja, los resultados son superiores a los del modelologit multinomial, modelo ampliamente contrasta-do en este contexto. Por tanto, este tipo de RNAresulta útil en el contexto de elección dentro deuna categoría de producto aunque sería necesarioobtener una mayor cantidad de datos y evaluar lacapacidad predictiva del modelo para obtener con-clusiones definitivas sobre este aspecto.

La superioridad del ajuste de las redes neurona-les frente a técnicas estadísticas clásicas es un

131

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

FIGURA 3Interacciones de descuentos. Alternativas 1 (Bonka mezcla) y 2 (Marcilla mezcla)

Page 22: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

resultado encontrado con frecuencia en la literatu-ra. Estas técnicas permiten la estimación de fun-ciones altamente no flexibles por lo que, enmuchas ocasiones, superan las estimaciones demodelos más restringidos. Sin embargo, el altonúmero de parámetros estimado en estos modeloshace que en ocasiones hayan sido contempladoscomo “cajas negras” adecuados en problemas depredicción pero de utilidad reducida en la explica-ción de respuestas de mercado. Aunque la defini-ción de la forma funcional estimada por el mode-lo es compleja, es posible estimar los efectos enlos resultados de cada una de las variables expli-cativas y este análisis puede indicar las causas dela superioridad en la estimación. En este trabajo seha utilizado este enfoque para, mediante la evalua-ción de derivadas de los resultados en la red, obte-ner una visión más detallada de las relacionesentre variables dependientes e independientes.

En primer lugar, se analizan las relaciones entrelos instrumentos de promoción utilizados en cadaalternativa y sus cuotas semanales. Se compruebacomo los efectos no son homogéneos por alterna-tivas. Aunque no disponemos de intervalos deconfianza para las derivadas por niveles, el análi-sis gráfico muestra para las alternativas conmayores cuotas dos tipos de efectos. En primerlugar, de modo similar a los resultados de VAN

HEERDE et al (2001), en algunas alternativas pare-ce existir un nivel umbral alrededor del 5% a par-tir del cual el efecto marginal del descuentoaumenta, y un nivel alrededor del 15% en el queeste efecto marginal se hace máximo. En estoscasos, es necesario realizar un nivel mínimo depromoción en descuento para que la promociónsea efectiva. En otras ocasiones, de forma similara los resultados de AGRAWAL y SCHORLING (1996),el efecto marginal máximo en la cuota se producepara los niveles de descuento más bajos, a partirde los cuales el efecto disminuye. En estos casos,parece existir un efecto promoción de preciosfrente a ausencia de promoción, por el que loscompradores reaccionan a la existencia o no deuna promoción, independientemente del nivel dedescuento de la misma.

Las implicaciones de estos resultados para lapolítica de promociones son claras: el porcentajede descuento aplicado para cada alternativa debetener en cuenta estos factores. Para aquellas alter-nativas en las que el efecto marginal del descuen-to aumenta con el porcentaje de descuento la fija-ción de un descuento mayor tiene un efecto supe-rior que en aquellos casos en los que el efecto dela promoción es de tipo umbral, en los que por elhecho de introducir la promoción se consiguen losmayores efectos.

En segundo lugar, se analizan tanto los efectoscruzados entre las distintas alternativas como losefectos de interacción entre instrumentos. Respec-to a los efectos cruzados entre alternativas, lasimultaneidad entre promociones de distintasvariedades para una misma marca, limita este aná-lisis a efectos entre marcas. Los efectos en el pun-to medio indican que, como cabe esperar, para elcaso de las dos alternativas presentadas, las pro-mociones de la propia marca afectan positivamen-te a su cuota mientras que el resto lo hace de for-ma negativa. Sin embargo, aunque las dos alterna-tivas correspondan a la variedad mezcla de lasmarcas Bonka y Marcilla, los efectos del resto delas marcas no se reparten de forma similar. Lacuota de una la alternativa mezcla de Bonka se veafectada de forma más homogénea por los des-cuentos en el resto de las marcas, mientras que enel caso de la segunda (variedad mezcla de Marci-lla), la marca Bonka tiene la mayor influencia ensu cuota de mercado. En el primer caso, la alter-nativa tiene un mayor número de competidoresdirectos, mientras que en el segundo, la alternati-va tiene una directa competidora y se ve menosafectada por el resto de los descuentos. Esto pue-de indicar que los compradores de estas dos mar-cas las contemplan de forma diferente. Mientrasque, en un caso, los compradores habituales pue-den ser más sensibles al precio y estar dispuestosa cambiar de marca cuando se realiza una promo-ción de otra alternativa, en el otro, los comprado-res habituales pueden percibir una única alternati-va como posible sustituto y reaccionar únicamen-te ante las promociones de esta alternativa.

132

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 23: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

Además, se analizan los efectos de interacciónentre los instrumentos promocionales de las alter-nativas Bonka y Marcilla mezcla. La relación entreel descuento y cuota de mercado para estas alter-nativas se ve modificada en función de que, simul-táneamente, se realice o no una promoción de suprincipal competidora. Para la primera alternativa,si la segunda no realiza una promoción, el mayorefecto marginal en la cuota se produce al realizarun pequeño descuento, pero si la segunda alterna-tiva se promociona al mismo tiempo, el efectomarginal aumenta al aumentar el volumen de des-cuento. En el caso de la segunda alternativa, si laprimera alternativa no se promociona, el efecto deintroducir un pequeño porcentaje de descuento esbajo y se consigue un alto rendimiento marginal enla cuota para niveles de descuento superiores al10%. Sin embargo, cuando la primera alternativase encuentra en promoción, el efecto marginal enla cuota de introducir un porcentaje bajo de des-cuento aumenta. Según estos resultados, la políticade promociones óptima para ambas alternativastiene que tener en cuenta las promociones en laotra y, además, esta influencia no es simétrica entrealternativas. Por tanto, la política de promocionesno puede establecerse de forma independiente paracada alternativa, la competencia entre marcas no essimétrica entre alternativas y la existencia de pro-mociones en otras alternativas pueden afectar alnivel de estos efectos umbral.

La principal limitación del trabajo se relacionacon la ausencia de criterios para valorar la signifi-catividad de los efectos individuales de las varia-bles. Como líneas futuras de investigación y parasuperar estas limitaciones, se plantea la posibili-dad de combinar esta técnica con otras técnicasparamétricas introduciendo alguno de los efectosaquí analizados en un modelo paramétrico a con-trastar o evaluar la posibilidad de desarrollar inter-valos de confianza empíricos a través de técnicascomo el bootstrapping. La segunda limitación serelaciona con el número total de datos, sería dese-able disponer de una mayor cantidad de observa-ciones semanales que permita valorar también lacapacidad predictiva del modelo.

7. REFERENCIAS

AGRAWAL D. y SCHORLING, C. (1996), “MarketShare Forecasting: An Empirical Comparison ofArtificial Neural Netwroks and MultinomialLogit Model”, Journal of Retailing, Vol. 72(4),pp. 383-407.

AINSCOUGH T.L. y ARONSON, J.E. (1999), “AnEmpirical Investigation and Comparison of NeuralNetworks and Regression for Scanner Data Analy-sis”, Journal of Retailing and Consumer Services,Vol. 6(4), pp. 205-217.

ALLENBY, G.M. (1989), “A Unified Approachto Identifying, Estimating and Testing DemandStructures with Aggregate Scanner Data”, Marke-ting Science, Vol. 8(3), pp. 265-280.

BEJOU, D., B. WRAY, B. y INGRAM, T.N. (1996),“Determinants of Relationship Quality: An Artifi-cial Neural Network Analysis”, Journal of Busi-ness Research, Vol. 36(2), pp. 137-143.

BEN-AKIVA, M. y LERMAN, S.R. (1985), Discre-te choice analysis: theory and application to tra-vel demand. MIT Press.

BENTZ, Y. y MERUNKA, D. (2000), “Neural Net-works and the Multinomial Logit for Brand Choi-ce Modelling: A Hybrid Approach”, Journal ofForecasting, Vol. 19, pp. 177-200.

BERNÉ, C, CORTIÑAS, M., ELORZ, M y MÚGICA,J.M. (2004), “The Use of a Retail Store Databasefor Brand Choice Análisis”, The InternacionalReview of Retail, Distribution and ConsumerResearch, Vol. 14(1), pp. 19-29.

BOONE, D.S. y ROEHM, M (2002), “Retail Seg-mentation using Artificial Neural Networks”,International Journal of Research un Marketing,Vol. 19(3), pp. 287-301.

BUCKLIN, R.E. y GUPTA, S. (1999), “Commer-cial Use of UPC Scanner Data: Industry and Aca-demic Perspectives”, Marketing Science, Vol.18(3), pp. 247-273.

COOPER, L.G. y NAKANISHI, M. (1988), Market-Share Analysis. Evaluating Competitive Marke-ting Effectiveness, Kluwer Academic Publishers.

CURRY, B. y MOUTINHO, L. (1993), “NeuralNetworks in Marketing: Modelling Consumer

133

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 24: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

Response to Advertising Stimuli”, EuropeanJournal of Marketing, Vol. 27(7), pp. 5-26.

DASGUPTA, C.G., DISPENSA, G.S. y GHOSE, S.(1994), “Comparing The Predictive Performanceof a Neural Network Model with Some TraditionalMarket Response Models”, International Journalof Forecasting, Vol. 10, pp. 235-344.

DAVIES, F., M. GOODE, J. MAZANEC Y MOUTIN-HO L. (1999), “LISREL and Neural NetworkModelling: Two Comparison Studies”, Journal ofRetailing and Consumer Services, Vol. 6, pp.249-261.

DAVIES, F.M., M. GOODE, L. MOUTINHO Y

OGBONNA. E. (2001), “Critical factors in Consu-mer Supermarket Behavior: A Neural NetworkApproach”, Journal of Consumer Behavior, Vol.1(1), pp. 35-49.

DE CARVALHO, M.C.M., DOUGHERTY, M.S.,FOWKES, A.S. y WARDMAN, M.R. (1998), “Fore-casting Travel Demand: A Comparison of Logitand Artificial Neural Networks Methods”, Jour-nal of the Operational Research Society, Vol. 49,pp. 717-722.

DISTRIBUCIÓN ACTUALIDAD. (2003), “Hipermer-cados en España”, Distribución Actualidad, Vol.319, Octubre.

GRUCA, T.S., KLEMZ, B.R. y PETERSEN, E.A.F.(1995), “Inside the Black Box: Neural NetworkModeling of Aggregate Market Response”, Wor-king Paper, Abril, University of Iowa.

GUPTA, S. (1988), “Impact of Sales Promotionson When, What and How Much to Buy”, Journalof Marketing Research, Vol. 25, pp. 342-355.

HAUSMAN, J. y MCFADDEN, D. (1984), “Specifi-cation Tests for the Multinomial Logit Model”,Econometrica, Vol. 52, pp.1219-1240.

HEERDE, H.J. VAN, LEEFLANG, P.S. y WITTINK,D.R. (2001), “Semiparametric Analysis of theDeal Effect Curve”, Journal of Marketing Rese-arch, Vol. 38(2), pp. 197-216.

HILERA, J.R. y MARTÍNEZ, V.J. (1995), RedesNeuronales Artificiales, Fundamentos, Modelos yAplicaciones, Ed. Ra-Ma, Madrid.

HOCH, S.J., KIM, B., MONTGOMERY, A.L. y ROS-SI, P.E. (1995), “Determinants of Store-Level Pri-

ce Elasticity”, Journal of Marketing Research,Vol. 32, pp. 17-29.

HORNICK K., M. STINCHCOMBE Y WHITE, H.(1989), “Multilayer Feedforward Networks AreUniversal Approximators”, Neural Networks, Vol.2, pp. 359-366.

HRUSCHKA, H. (1993), “Determining MarketResponse Functions by Neural Network Mode-ling: A Comparison to Econometric Techniques”,European Journal of Operational Research, Vol.66, pp. 27-35.

HU, M.H., SHANKER, M Y HUNG., M.S (1999),“Estimation of Posterior Probabilities Of Consu-mer Choices With Neural Networks Classifiers”,International Journal Of Research In Marketing,Vol. 16, pp. 307-317.

ILASHEM, S. (1992), “Sensitivity Analysis forFeedforward Artificial Neural Networks with Dif-ferentiable Activation Functions” en Proceedingsof the International Joint Conference on NeuralNetworks, Baltimore, IEEE, New Jersey, vol I,419-424.

KAMAKURA, W.A., KIM, B.D. y LEE, J. (1996),“Modelling Preference and Structural Heteroge-neity in Consumer Choice”, Marketing Science,Vol. 10(2), pp. 172-183.

KRYCHA, K.A. y WAGNER, U. (1999), “Applica-tions of Artificial Neural Networks in Manage-ment Science: A Survey”, Journal of Retailingand Consumer Services, Vol. 6, pp. 185-203.

KUMAR, A., RAO, R. y SONI, H. (1995), “AnEmpirical Comparison of Neural Network andLogistic Regression Models”, Marketing Letters,Vol. 6(4), pp. 251-263.

KUMAR, A. y SASHI, C.M. (1989), “Confirma-tory Analysis of Aggregate Hierarchical Structu-res: Inferences from Brand Switching Beha-vior”, Journal of Marketing Research, Vol 26,pp. 444-453.

KUNG, C.M. y WHITE, H. (1992), “ArtificialNeural Networks: An Econometric Perspective”,Econometric Reviews, Vol. 13(1), pp. 1-91.

LUQUE MARTÍNEZ, T. (2003), Nuevas Herra-mientas de Investigación de Mercados, Ed. CivitasEdiciones, Madrid.

134

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 25: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

MCFADDEN, D. (1986), “The Choice TheoryApproach to Market Research”, Marketing Scien-ce, Vol. 5(4), pp. 275-297.

MAZANEC, J. (1992), “Classifying Tourists intoMarketing Segments: A Neural Network Appro-ach”, Journal of Travel and Tourism Management,Vol. 1, pp. 39-59.

MONTGOMERY, A.L. (1987), “Creating Micro-Marketing Pricing Strategies Using SupermarketScanner Data”, Marketing Science, Vol. 16(4), pp.315-317.

OLMEDA, I. (1996), “Modelos Discriminantespara la Decisión de Introducción de Nuevos Pro-ductos por Distribuidores”, Actas VII Encuentrode Profesores de Marketing, Zaragoza.

QI, M. y ZHANG, G.P. (2001), “An Investigationof Model Selection Criteria for Neural NetworkTime Series Forecasting”, European Journal ofOperational Research, Vol. 132, pp. 666-680.

REINECKE FLIN, L., EASTMAN, J.K. y NEWELL S.J.(1995) “An Exploratory Study of the Application ofNeural Networks to Marketing: Predicting RockMusic Shopping Behaviour”, Journal of MarketingTheory and Practice, Vol. 3(2), pp. 75-85.

ROBERTS, J.H. y LILIEN, G.L. (1993), “Explana-tory and Predictive Models of Consumer Beha-viour”, en Marketing, ed. J. Eliashberg y G.L.Lilien, North-Holland. Amsterdam.

RUMMELHART, DAVID E., JAMES L. MCCLE-LLAND & THE PDP GROUP. (1986), Parallel Distri-buted Processing: Explorations In The Micros-

tructure Of Cognition, Ed. The Mit Press, Cam-bridge.

WARTENBERG, F. y DECKER, R. (1996), “Analy-sis Of Sales Data, A Neural Net Approach”, EnFrom Data To Knowledge, Gaul, W. y D. PfeiferEds., Springer, Berlin

WEST, P.M., BROCKET, P.L. y GOLDEN, L.L.(1997), “A Comparative Analysis of Neural Net-works and Statistical Methods for Predicting Con-sumer Choice”, Marketing Science, Vol. 16(4), pp.370-391.

WIERENGA, B. y KLUYTMANS, J. (1994), “NeuralNets versus Marketing Models in Time SeriesAnalysis: A Simulation Study” en Proceedings ofthe 23th Annual Conference of the European Mar-keting Academy (EMAC 94), Maastricht.

WIERENGA, B. y KLUYTMANS, J. (1996), “Pre-diction with Neural Nets in Marketing Time SeriesData”, Working Paper, Management Report Series,nº 258, Erasmus University of Rotterdam.

WRAY, B., PALMER, A. y BEJOU, D.(1994),“Using Neural Network Analysis to Eva-luate Buyer-Seller Relationship”, European Jour-nal of Marketing, Vol. 28(10), pp. 32-48.

ZAHAVI, J. y LEVIN, N. (1997a), “Applying Neu-ral Computing to Target Marketing”, Journal ofDirect Marketing, Vol. 11(1), pp. 5-22.

ZAHAVI, J. y LEVIN, N. (1997b), “Issues andProblems in Applying Neural Computing to Tar-get Marketing”, Journal of Direct Marketing, Vol.11(4), pp. 63-75.

135

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

Page 26: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

Para la aplicación empírica de este trabajo seseleccionó en primer lugar el tipo de RNA a utili-zar. Las redes MFANN fueron las seleccionadaspor ser las más utilizadas en la literatura para eltratamiento de este tipo de problemas. Para ajustaresta red, se necesita tomar diversas decisionesrelativas a su implementación. En primer lugar, esnecesario seleccionar un método de entrenamien-to. El algoritmo clásico es el denominado métodode retropropagación de errores pero este métodopuede ser bastante lento. Dos de los métodos deestimación alternativos son el algoritmo de Leven-berg-Marquardt y el algoritmo de gradiente conju-gado de escala. En segundo lugar, existen diversasalternativas para las funciones de transferencia enlas capas ocultas y de salida (HILERA y MARTÍNEZ,1995). En este caso, para la función de la capa desalida se plantearon 2 alternativas: la funciónlogística o lineal. La función lineal presenta laventaja de aproximar la estructura de la red a la dellogit multinomial haciendo más comparables losmodelos y la ventaja adicional de simplificar elcálculo de derivadas para interpretar los resultadosde la red pero puede afectar a la calidad de las esti-maciones. Por último, es necesario seleccionar elnúmero de capas ocultas y el número de unidadesen cada capa que tendrá cada una de las redes. Elnúmero de unidades en una capa oculta es el quepermite asegurar las propiedades de aproximaciónde la MLANN para el caso de funciones continuas

(HORNICK, STINCHCOMBE y WHITE, 1989), perocuanto mayor sea este número mayor será elnúmero de parámetros a estimar. En el caso de queexistan discontinuidades en la función que rela-ciona las entradas con las salidas puede ser nece-sario introducir capas ocultas adicionales pero eneste caso no se ha considerado esta posibilidadpara facilitar el cálculo de derivadas y la interpre-tación de los resultados.

Para seleccionar estos aspectos, se realiza unproceso experimental, partiendo de una red inicialcon la estructura más sencilla y se estiman sucesi-vamente redes más complejas combinando unnúmero de unidades ocultas creciente, los dosmétodos de entrenamiento alternativos y las dosalternativas de función de salida (WEST, BROCKET,y GOLDEN, 1997). El aprendizaje de las redes sedetiene por el método de validación cruzada. Paracada combinación de método de entrenamiento,función de salida y número de unidades se estiman10 redes neuronales en las que se para las que secalcula el error cuadrático medio y su desviacióntípica. El paquete informático utilizado para lasestimaciones es el módulo de RNA de Matlab. Lasestimaciones de cada combinación “método deentrenamiento-función de salida-número de uni-dades” se comparan en cuanto a este error cuadrá-tico medio y se utiliza la estructura que genera unerror menor. El cuadro 11 resume las decisionesde formulación.

136

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

ANEXO. IMPLEMENTACIÓN DE LA RED MULTICAPA ALIMENTADA HACIA DELANTE

Page 27: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

Por último, una vez estimada la red y en lo quese refiere a la interpretación de los resultados,algunos autores han utilizado medidas de resúme-nes de pesos como el máximo efecto de los pesospara cada variable (KUMAR et al, 1995) o la pre-dicción media para cada combinación de variablesindependientes (HU et al, 1999). Sin embargo, otraalternativa a estos métodos es valorar el efecto delas variables independientes en la variable depen-diente, mediante la evaluación de las derivadas delresultado de la red con respecto a cada una deestas variables independientes (ILASHEM, 1992,WEST BROCKET, y GOLDEN, 1997, WARTENBERG yDECKER, 1996). La valoración de estas derivadasen los distintos niveles de las variables indepen-dientes permite, por un lado, valorar la importan-cia general de cada una de las variables en losresultados obtenidos y, por otro lado, analizar los

efectos no lineales que se presentan en el modelo,a través de la comparación de las derivadas en losdistintos niveles.

En el caso de una MFANN con una únicacapa oculta y con funciones de activación logís-tica y lineal, el proceso para el cálculo de lasderivadas es el que se describe a continuación.Para cada unidad de salida K, tomando el vectorde resultados Ok para cada uno de los patronesde entrada en el caso, calculamos la sensibilidadpara cada variable xi como la derivada parcialcon respecto a xi. Para calcular esta derivadaparcial aplicamos la regla de la cadena de formaque:

∂Ok/∂xi=Σj∂Ok/∂Hj ∂Hj/∂xi [A.1]

Dado: Ok= f 2(w(2)kH) [A.2]

137

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C

CUADRO 11Decisiones de formulación

Estructura

Tipo Multicapa Alimentada Hacia DelanteModelo (a) Modelo (b)

Número de capas 3 3Unidades en cada capa

Capa de entrada 14 precios regulares y 12 descuentos 14 preciosCapa oculta 5 5Capa de salida 14 cuotas 14 cuotas

FuncionesFunción capa oculta Logística LogísticaFunción salida Lineal Lineal

Entrenamiento

Algoritmo aprendizaje Levenberg-MarquardtParámetros

Valor µ inicial 0.001 0.001Incremento µ 10 10Disminución µ 0.1 0.1

Función de ajuste Error Cuadrático Medio Error Cuadrático Medio

Validación cruzadaConjunto de entrenamiento 70% del conjunto de datosConjunto de validación 30% del conjunto de datos

Page 28: EL PROBLEMA DE ELECCIÓN DE MARCA EN UNA CATEGORÍA … · de compras en un establecimiento. Se comprueba como los efectos de los instrumentos de marketing en la probabilidad de elección

donde w(2) es la matriz de pesos w(2)jk para j= 0,..J

(número de unidades de salida y 0 igual a cons-tante o peso del sesgo), H es el vector de activa-ciones de la capa oculta y f (2) la función de acti-vación en la capa de salida

Hj= f 1(x’w(1).j) [A.3]

donde x es el vector de variables independientes,w(1)

.j es el vector de pesos que une la capa deentrada con la unidad oculta j incluido el peso dela unidad de sesgo y f (1) es la función de activa-ción en la capa oculta

Según estas expresiones, la derivada parcial delresultado del modelo con respecto a una de lasvariables independientes sería:

∂Ok/∂xi=Σjw(1)

jiw(2)

jk f (1)’(x’w(1).j) f (2)’(w(2)H)

[A.4]

En el caso de que la capa de salida tenga unafunción de activación de tipo lineal y la función de

activación en la capa oculta sea de tipo logístico,distinguimos entre f (1)=1/(1+exp(-z)) yf (2)(w(2)H)=w(2)H y la expresión para la sensibili-dad se transforma en:

∂O/∂xi=Σjw(1)

jiw(2)

j¶(x’w(1).j)(1-f (x’w(1)

.j)) [A.5]

A partir de esta expresión general y una vezfinalizado el entrenamiento, la sensibilidad mediadel resultado para un input determinado se calcu-la para el caso en el que las variables dependientesson categorías como:

Sik=1/N(k)Σ1N(K)∂Ok/∂xi [A.6]

donde Sik es la sensibilidad del input i en la cate-goría k y N(k) es el número de vectores con elvalor k para la variable i. En el caso de que lasvariables sean de tipo continuo podemos agrupar-las por intervalos y realizar el mismo cálculo.

138

R E V I S T A E S P A Ñ O L A D E I N V E S T I G A C I O N D E M A R K E T I N G E S I C