67
Autor: Prof. Rubén J. Rodríguez Estadística II Licenciatura en Sociología, UCES 1 INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA y ANÁLISIS CHAID UNIVERSIDAD DE CIENCIAS EMPRESARIALES Y SOCIALES Facultad de Psicología y Ciencias Sociales Estadística II Prof. Rubén José Rodríguez r6

INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

  • Upload
    others

  • View
    0

  • Download
    0

Embed Size (px)

Citation preview

Page 1: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

1

INTRODUCCIÓN A LASEGMENTACIÓN JERÁRQUICA

yANÁLISIS CHAID

UNIVERSIDAD DE CIENCIAS EMPRESARIALES Y SOCIALES

Facultad de Psicología y Ciencias Sociales

Estadística IIProf. Rubén José Rodríguez

r6

Page 2: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Diapositiva 1

r6 Actualizado al 12-06-04ruben, 12/06/2004

Page 3: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

2

1ª Parte: SEGMENTACIÓN JERÁRQUICA/No JERÁRQUICA p. 3

2ª Parte: ANSWERTREE 2.0 p. 29

Índice

Page 4: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

3

TIPOS DESEGMENTACIÓN:

JERÁRQUICAY No JERÁRQUICA

1ª Parte

Page 5: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

4

SEGMENTACIÓNConcepto

Segmentar es definir segmentos, dada unapoblación de elementos se trata de identificarsubconjunto homogéneos respecto de determinadascaracterísticas y heterogéneos entre sí.

Existen dos acepciones de segmentación: comoestrategia de marketing, y como técnicaestadística.

Según Phillip Kotler existen 4 variables desegmentación en marketing: geográficas,demográficas, psicográficas y comportamentales.

Page 6: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

5

TIPOS DE SEGMENTACIÓN EN MARKETING (1)

• SEGMENTACION GEOGRAFICA.• Identificación, calificación y selección de áreas geográficas

de interés, con potencial para realizar transaccionescomerciales.

• SEGMENTACION DEMOGRAFICA.• Cuantificación poblacional de un mercado, en grupos más o

menos homogeneos, diferenciados por variablesdemográficas que les crean un vínculo común.

• SEGMENTACION PSICOGRAFICA.• Agrupación poblacional de un mercado, de acuerdo a ciertas

características humanas, expresadas en términos devariables psicosociales: actitudes, valores, motivaciones,opiniones, creencias o comportamientos sobre situacionesespecíficas.

Page 7: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

6

TIPOS DE SEGMENTACIÓN EN MARKETING (2)

• POR PRODUCTO.• Grupos de individuos afínes por las características

percibidas de un producto en particular.• POR MERCADO

• Real: Mis clientes actuales • Potencial: Los que están con la Competencia.• Latente: No utilizan ninguna institución.

• POR NIVEL SOCIOECONÓMICO/CLASE SOCIAL• Alto, Medio-Superior , Medio-Medio,Medio Inferior, Popular,

Marginal • (INSE-Índice de Nivel Socio-Económico: AB-C1-C2-C3-DE)

Page 8: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

7

MÉTODOS ESTADISTICOS DE SEGMENTACIÓN

Los Métodos de segmentación se clasifican en Métodosdescriptivos y predictivos Los Métodos descriptivos o de Interdependenciaincluyen: Variables socio-demográficas, y Variablescomportamentales, los procedimientos son: Cluster Analysis(Análisis de Conglomerados), y Análisis Factorial (AF). Los Métodos predictivos, o de dependencia incluyen lossiguientes algoritmos estadísticos: AID (Automatic InteractiveDetector de J. A. Sonquist y N.A. Morgan, 1964), CHAID (ChiSquare Automatic Interaction Detector, de Kass, 1980 yMagidson 1992), CART (Clasification and Regression Trees,de Breiman, Friedman, Olshen y Stone, l984), y QUEST(Quick, Unbiased, Efficient, Statistical Tree, de Loh y Shih,1997)

Page 9: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

8

MÉTODOS AGLOMERATIVOS

Los Métodos de segmentación se clasifican en MétodosAglomerativos y Divisivos Los Métodos Aglomerativos, o Composicionalesagrupan, clasifican, conglomeran o agrupan (‘clusterizan’)casos o variables, en función del parecido o similaridad.Parten de los casos individuales y a partir de una medida dedistancia respecto de un centro de gravedad determinan lainclusión en un grupo (‘cluster’), hasta llegar a formacion detodos los conglomerados homogeneos. SPSS dispone de dosmétodos de Análisis de Conglomerados (Cluster Analysis):Análisis de Conglomerados Jerárquicos y Análisis deConglomerados de k Medias. [Guía de SPSS 10.0 para análisis dedatos, Capítulos 23 y 22]

Page 10: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

9

MÉTODOS DIVISIVOSLos Métodos Divisivos, Disociativos oDescomposicionales parten de la muestra global como unsolo grupo y lo van dividiendo en subgrupos hasta llegar a laformación de sub-grupos o conglomerados homogéneos conun número relativamente reducida de sujetos.

Las técnicas divisivas son especialmente adecuadas parael análisis de variables categóricas.Uno de los métodos divisivos más difundidos es el CHAID (Chi Squared Automatic Interaction Detector) (disponible como un procedimiento autónomo del Módulo Base, y comercializado por SPSS Inc con la marca ANSWERTREE) ) (*)(*) A partir de la versión 13.0 de SPSS (2004) se incluye el algoritmo Árboles de Clasificación: Analizar > Clasificación > Árbol. Ver diapositiva 31

Page 11: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

10

MÉTODOS DIVISIVOS

Fuente: http://www.estadistico.com/arts.html?20010709+22#start Diapo 22/46

Page 12: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

11

TÉCNICAS ESTADÍSTICAS DE SEGMENTACIÓN PREDITIVA (a)

Es un conjunto de algoritmos que clasifican a lapoblación en segmentos a través de variablespredictoras o explicativas (VI’s), que mejor expliquenla variabilidad de la variable criterio o variableexplicada (VD).

Técnicamente los algoritmos buscan identificar quepredictor proporciona la mayor reducción de la sumade los cuadrados (SCTotal ) residuales de la variabledependiente. O sea, la que maximiza la varianza entregrupos (SCEntre) y minimiza la varianza intragrupos(SCIntra) con respecto a la variable a explicar ovariable criterio.

Page 13: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

12

TÉCNICAS ESTADÍSTICAS DE SEGMENTACIÓN PREDITIVA (b)

Los subconjuntos obtenidos son particionesde la población total en términos dedicotomías o tricotomías de las variablespredictoras más significativas.

Los algoritmos son iterativos generando en eldiagrama arborescente (Dendograma)divisiones sucesivas hasta un nodo con unnivel de no significatividad o con un tamañomínimo del grupo.

Page 14: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

13

AID (Automatic Interactive Detector) (a)

Es una método predictivo de segmentaciónjerárquica descendente, para una VD métrica.

Procede mediante la subdivisión sucesiva de unamuestra en una serie de grupos dicotómicosexcluyentes, con el fin de determinar qué VI’s, estánrelacionadas con una VD determinada.

Matemáticamente, constituye una aplicación delAnálisis de Varianza (ANOVA), ya que buscamaximizar la varianza intergrupos (S2 between) yminimiza la varianza intragrupos (S2 within). Utilizacomo prueba de significación, el test F (de Fisher).

Page 15: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

14

AID (Automatic Interactive Detector) (b)

Su principal ventaja radica en la simplicidad deloutput. El resultado es un diagrama de árbol.

El dendograma es un gráfico en forma de árbolinvertido que representa la forma en que seagrupan en clases los distintos elementos delanálisis tipológico.

En cada rama aparece un nodo indicando elnúmero de elementos del segmento, la leyenda dela variable explicativa y algún estadístico o test designificación.

Es similar al Análisis de Regresión Múltiple

Page 16: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

15

*

TodosN = 2364

0,15(*)

Menos de 35 añosN = 6600,27(*)

35 o más añosN = 1704

0,10(*)

Posee la casaN = 2530,11(*)

Algunos parientesen las cercanías

N = 5180,20(*)

Sin parientes en lascercanías

N = 1420,53(*)

No posee la casaN = 2650,27(*)

Con niños en laescuelaN = 460,24(*)

Sin niños en laescuelaN =960,67(*) CLAVES:

Xj = Categoría de la Variable XNj = Nº de sujetos en el Grupo jPj = Probabilidad media de laactitud o intención medida

Sierra Bravo, R. (1991), Diccionario Práctico de Estadística, Ed. Paraninfo, Madrid, 1991, entrada : AID, pág. 95

Probabilidad de Cambio de Residencia

Page 17: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

16

CHAID (Chi Square Automatic Interactive Detector) (a)(*)

Es un método de clasificación jerárquica,descendente y divisivo: inicialmente considera atodos los elementos como un solo grupo, yprogresivamente el algoritmo CHAID va dividiendo losgrupos anteriores hasta terminar en un subgrupo detamaño mínimo o de diferencias no significativas.

Es una extensión y una mejora del AID para una VDcategórica y varias VI’s que combinadas y eninteracción, permiten identificar segmentos. Estálimitado a VD nominales y ordinales y no hacesuposiciones de normalidad.(*) La calificación de AUTOMATIC se refiere a que la clasificación se obtiene automáticamente mediante elalgoritmo CHAID, y no depende de la interpretación y decisión del investigador.

Page 18: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

17

CHAID (Chi Square Automatic Interactive Detector) (b)

Los componentes básicos de CHAID son: Una omás VI’s o Predictoras, cuyos valores se utilizanpara definir los segmentos (V. demográficas,psicográficas, comportamentales); y una y solouna VD o Criterio, que debe ser una variablecategórica (nominal u ordinal) El CHAID ahorra mucho tiempo al investigador,evitando que analice cientos de tabulaciones cruzadasy cuadros bivariados yuxtapuestos, identificandorápida y fácilmente las relaciones significativas entrelas variables.

Page 19: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

18

KNOWLEDGE SEEKER

SexoEstado CivilNivel SocioeconómicoOcupaciónCiudadVe T.V.Oye RadioLee periódicoTiene hijos...etc.

DISPOSICION A COMPRAR UNA GELATINA LISTA PARA COMER

40%

NO DISPOSICION A COMPRAR UNA GELATINA LISTA PARA COMER

60%

D.F.

20%

MONTERREY

60%

GUADALAJARA

20%

HOMBRES

20%

MUJERES

80%

CON HIJOS90%

SIN HIJOS10%

A/B1%

C5%

D94%

Ciudad

Sexo

Tenencia de Hijos

NES

EJEMPLO DE APLICACIÓN DE CHAIDPerfil de consumidores potenciales de Gelatinas después de la prueba

Árbol de segmentación jerárquica descendente

Page 20: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

19

Después de que los entrevistados probaron las gelatinas, se obtuvo queun 40% estarían dispuestos a comprar la gelatina, mientras que un 60%no estarían dispuestos a adquirirla. Si elegimos a esta variable como VD,queremos saber cuál es el perfil (segmento) que SI estaría dispuesto acomprarla, es decir, ¿ quién forma el grupo del 40% ?. Para esto, seingresan muchas variables independientes VI en el modelo (Sexo, estadocivil, ocupación, nivel socioeconómico, etc.), para que el CHAID encuentrelas que significativamente se relacionan con la VD.El diagrama anterior nos dice que de todos los indicadores ingresados almodelo, encontró principalmente cuatro variables que predicen de manerasignificativa la disposición de compra de la gelatina; y que estas cuatrocaracterísticas formarán el perfil de nuestro comprador: Ciudad, Sexo,Tener Hijos y Nivel Socioeconómico ( mujeres, de Monterrey, conhijos y de NSE D).

INTERPRETACIÓN DEL EJEMPLO DE CHAIDPerfil del segmento de compradores potenciales

Page 21: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

20

ARGORITMO CHAIDEstadística X2 (Chi cuadrado)

2

2( ; ) 0X H ij ijP gl

i j ij

f FF

Valor de probabilidad que se observa en la relación entre el

Predictor y la VD que se presentará si el Predictor y la VD fueran estadísticamente independientes.

Gra

gl =

P

dos de libertad: (I-1)*(J-1), es decir, (columnas-1)*(filas-1)recuencia condicional o frecuencia empírica, valor que asume

el Predictor y el Criterio en la celda ij.

Frecuenci

F

=

ij

ij

f

F

a esperada o teórica bajo la hipótesis de independencia

Page 22: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

21

P-Value(Valor de probabilidad asociada a Chi cuadrado) (a)

REGLA DE DECISIÓN

P-value: Probabilidad asociada con laobtención de los resultados del estadístico X2

meramente por azar o casualidad. El P-valuemide la credibilidad de que la H0 sea cierta. Laposibilidad de que X2 sea debido al azar es igualal P-value.

SPSS calcula el valor de X2 e indica laprobabilidad –p-value- de que este estadísticohaya sido obtenido por azar.

Page 23: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

22

P-Value(Valor de probabilidad asociada a Chi cuadrado) (b)

REGLA DE DECISIÓN

The result of the test X2 is a “p-value”. The p-value isthe probability that the relationship is spurious, instatistical jargon this is the probability that the NullHypothesis is correct.

The p-values for each cross-tabulation of all theindependent variable are then ranked, and if the best(the smallest value) is below a specific treshold thenthat independent variable is chosen to split the roottree node.1

1Okell, Jamine. Neural Networks vs CHAID.En: www.relationship-marketing.com/crm_forum_write_papers

Page 24: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

23

P-Value(Valor de probabilidad asociada a Chi cuadrado) (c)

REGLA DE DECISIÓN

Cuando esta probabilidad es inferior a 0,05, (P α: Nivel deSignificación=5%) se suele rechazar la hipótesis deindependencia H0 de no relación entre las variables, paraaceptar la hipótesis alternativa H1 ,que indica que la relaciónentre las variables existe y es estadísticamente significativa yno se debe al azar.

Si P-value < P α H0 y H1

Page 25: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

24

PROCEDIMIENTO CHAIDEn cada etapa del análisis, CHAID divide el árbol enla variable del predictor que tenga el valor deprobabilidad o p-value más bajo, siempre y cuando elvalor p sea menor que el valor del nivel designificación (Pα = 0,05).

Un valor p de 0,05 significa que la relaciónobservada entre el predictor y la variable dependienteocurrirá meramente por azar, y por lo tanto es pocoprobable que estén relacionadas.

Si el predictor obtiene un valor más bajo, es menosprobable que se deba al azar, por lo tanto, cabesuponer que existe relación con la VD.

Page 26: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

25

FORTALEZAS DE CHAIDLa VD requerida por el modelo debe ser una variablecategórica (de nivel nominal u ordinal)Las particiones pueden ser dicotómicas o politómicas.Reduce la probabilidad de ser seleccionadas variablespredictoras con muchas categorías. Reduce categoriasfusionando aquellas que el algoritmo CHAID arroja como nosignificativas. Cuando las VI´s son ordinales requieren serdefinidas como ´libres´ a los efectos de permitir todas lascombinaciones dicotómicas posiblesEl investigador puede introducir una a una la variablespredictoras para realizar la partición.No hace supuestos de normalidad de las variables.Los segmentos son funciones explícitas de las variablespredictoras y pueden ser utilizadas para clasificar otrasmuestras.

Page 27: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

26

DEBILIDADES DE CHAID

La solución final obtenida contiene lasrestricciones del proceso de partición. Tiene las limitaciones propios de la pruebaX2.

Al ser un procedimiento clasificatoriodivisivo, se requiere partir, estimativamente,de al menos 1000 casos. Requiere un gran número de variablesexplicativas o predictores (VI’s) para realizarlos análisis.

Page 28: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

27

CHAID y DATA MINING

EL DATA MINING Es un conjunto de herramientas compues-

tas por técnicas estadísticas avanzadas y programas de inteligencia artificial (AI) que permiten al usuario acceder a los datos de la empresa y analizarlos.

La finalidad es extraer información del Data Warehouse para descubrir conocimientos (Knowledge Discovery). Se busca:

• Identificar Segmentos de los clientes más rentables.• Encontrar sus patrones históricos de consumo.• Extraer perfiles de clientes y de compras tipo.• Descubrir el modelo pronóstico del comportamiento

de compra probable.

Page 29: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

28

CHAID (AnswerTree) tiene más ventajas que lastécnicas tradicionales de Análisis Multivariado:Regresión Múltiple, Regresión Log-Lineal, AnálisisDiscriminante, y Análisis de Cluster.Es una poderosa herramienta de Data Mining porquepermite descubrir (knowledge discovery) en grandesbases de datos: segmentos significativos, perfiles desegmentos, identificación de patrones de conductas,predicción de comportamientos del consumidor,ganancias en las acciones sobre el target group,aplicación de reglas de decisión de incluir elementosen un determinado segmento.

CHAID y DATA MINING

Page 30: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

29

ANSWER TREE 2.0.1(1999)

2ª Parte

Page 31: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

30

ANSWER TREE 2.0.1 (1999)

Es un programa de SPSS Inc. que es un algoritmopara identificar segmentos y que facilita lavisualización de los mismos mediante: diagramas deárboles de segmentación, mapa del árbol, visorde nodos, gráficos de barras, tablas estadísticasde resumen, gráficos de Ganancias (Gains) ytabla de errores de clasificación (Misclassi-fication).

En cada etapa del análisis, CHAID divide al árbol enla variable del predictor que tenga el valor deprobabilidad más bajo o p-value, siempre y cuando elvalor p sea menor que valor de significaciónestadística (0,05) o Pα.

Page 32: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

31

ÁRBOLES DE CLASIFICACIÓN y SPSS 13.0 (2004)

SPSS Inc. a partir de 2004 decide incorporar los algoritmos CHAID, C&RT y QUEST que formaban parte de un módulo inde-pendiente ANSWER TREE, en el menú Análisis de SPSS 13.0 > Clasificar > sub-menú ÁRBOLES DE CLASIFICACIÓN. “ÁRBOLES DE CLASIFICACIÓN permite crear árboles de clasificación y decisión directamente en SPSS para ayudarle a identificar grupos y descubrir relaciones entre grupos y predecir eventos futuros. Se utiliza para segmentación, estratificación, predicción, reducción de datos, identificar interacciones, fundir categorías y categorizar variables continuas. Permite visualizar los resulta-dos del modelo de árbol en la ventana del dendograma” (http://www.spss.com/classification_trees/analysis.htm)

Page 33: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

32

EJERCICIO con ANSWER TREE

Fuente: www.ugr.es./~tluque >Ejemplo Libro >EJCHAID1.sav n = 2000 casos. Luque, Teodoro (2000): Técnicas de Análisis de Datos en Investigación de Mercado, Madrid: Pirámide, Cap. 8, pp. 361-370 .

VARIABLE DEPENDIENTE(Variable Explicada, Criterio, Variable Objetivo o Variable Target):

CAMEST: En los últimos dos años ha cambiado (o no) de establecimiento comercial habitual donde realiza sus compras?.

VARIABLES INDEPENDIENTES(Variables Explicativa, Predictiva, Predictor, o Variable de Origen) :

EDAD: 30 años, de 30 a 40, de 41 a 55 y más de 55 años.ESTUDIOS: Sin estudios, Primarios, FP-BUP, diplomado, licenciado.SEXO: Hombre o Mujer.SITUALABO: Situación laboral del cabeza de flia.:

empleado/desempleado.NIÑOS-4: Pertenece a una flia. con o sin hijos menores de 4 años.ESTRUCF: Unipersonal, matrimonio sin hijos, matrimonio con hijos,

bigeneracional, sólo hijos y otros.

Page 34: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

33

Page 35: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

34

Page 36: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

35

PASO a PASO con AnswerTree

1. Abrir el programa AnswerTree

2. En la ventana de inicio indicar: Abrir el Overview, Abrir unProyecto existente, o Abrir un Nuevo Proyecto.

3. Si es Nuevo Proyecto > Seleccionar la Fuente de Datos (SPSSdata file.sav) > Abrir > Carpeta Project1

4. Asistente para definir el Método de Crecimiento del árbol:

4.1. CHAID, Exhaustive CHAID, C&RT, and QUEST

4.2. Ventana de definición de las Variables Target y Predictores.

4.3. Definición máximo nivel de profundidad del árbol y mínimacantidad de casos en los Nodos Padres y los Nodos Hijos

5. Crecimiento automático del árbol (Tree > Grow Tree)

Page 37: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

36

VENTANAS de AnswerTree (1)

Page 38: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

37

VENTANAS de AnswerTree (2)

Page 39: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

38

VENTANAS de AnswerTree (3)

Page 40: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

39

VENTANAS de AnswerTree (4)

Page 41: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

40

VENTANAS de AnswerTree (5)

Page 42: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

41

VENTANAS de AnswerTree (6)

Page 43: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

42

VENTANAS de AnswerTree (7)

Page 44: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

43

VENTANAS de AnswerTree (8)

Page 45: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

44

VENTANAS de AnswerTree (9)

Page 46: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

45

VENTANAS de AnswerTree (10)

Page 47: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

46

VENTANAS de AnswerTree (11)

Page 48: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

47

VENTANAS de AnswerTree (12)

Page 49: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

48

VENTANAS de AnswerTree (13)

Page 50: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

49

VENTANAS de AnswerTree (14)

Page 51: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

50

VENTANAS de AnswerTree (15)

Page 52: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

51

VENTANAS de AnswerTree (16)

Page 53: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

52

VENTANAS de AnswerTree (17)

Page 54: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

53

VENTANAS de AnswerTree (18)

Page 55: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

54

VENTANAS de AnswerTree (19)

Page 56: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

55

VENTANAS de AnswerTree (20)

Nodo 3 Nodo 5

Page 57: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

56

VENTANAS de AnswerTree (21)

Page 58: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

57

VENTANAS de AnswerTree (22)

Page 59: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

58

VENTANAS de AnswerTree (23)

Page 60: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

59

VENTANAS de AnswerTree (24)

Page 61: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

60

VENTANAS de AnswerTree (25)

Page 62: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

61

VENTANAS de AnswerTree (25)Tabla de Ganancias (Node-by-Node)

Tabla que resumen en una instantánea los segmentos del árbol con una descripción de cada variable y la contribución de cada segmento

junto con el beneficio incremental.NODE: Identifica el número del nodo.NODE n: Indica el tamaño de cada nodo.NODE %: Expresa la proporción de cada nodo respecto de la muestra.RESP n: Indica el nº de casos pertenecientes a la categoría analizada.RESP %: Expresa la proporción de cada categoría representada en cada nodo sobre el total de la categoría en la muestra.GAIN %: Es la puntuación de ganancia de la categoría. Es la proporción de entrevistados de la categoría de cada nodo sobre el total de individuos que componen el segmento.INDEX %: Indica la relación entre la puntuación de ganancia de la categoría de cada segmento y la general de la muestra.

Page 63: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

62

VENTANAS de AnswerTree (26)

Page 64: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

63

VENTANAS de AnswerTree (27)

Page 65: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

64

VENTANAS de AnswerTree (28)

Page 66: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

65

VENTANAS de AnswerTree (29)

Page 67: INTRODUCCIÓN A LA SEGMENTACIÓN JERÁRQUICA...Parten de los casos individuales y a partir de una medida de distancia respecto de un centro de gravedad determinan la inclusión en

Autor: Prof. Rubén J. Rodríguez Estadística IILicenciatura en Sociología, UCES

66