Clasificación con Análisis Discriminante

Clasificación con Análisis Discriminante

Análisis Multivariante:

Investigación que da Resultados

Ing. Amir Madrid Garzón

Aplicaciones

• Fiel o no a una marca

• Me suscribiría o no a un determinado periódico

• Comprador / No comprador

• Apoya o no apoya

• Televidente o no televidente

Clasificación de objetos en grupos

• En calidad de consumidores seguramente habremos sido clasificados en grupos muchas veces, a menudo por parte de gente que sin saberlo está aplicando el análisis discriminante.

• Por ejemplo, sin duda ya habremos pasado por una experiencia de “categorización” semejante a la que tuvieron las siguientes personas:

Ejemplo 1

• Alicia Rodríguez y algunas amigas fueron a un restaurante de lujo a celebrar el final del primer año de universidad. La jefa de meseras, al darse cuenta de las clientes son universitarias y que no visten ropa cara, las acomoda en un rincón con mucha luz situado entre la entrada a la cocina y los baños de los caballeros. Quizá se haya equivocado al clasificar a Alicia y a sus amigas en la categoría de clientes que gastan poco y que dan propinas pequeñas.

Ejemplo 2

• Rodolfo Ramírez, luego de hacer la solicitud del seguro del automóvil, se da cuenta de que la póliza anual le costará casi lo mismo que el coche. Aunque en los cinco años que lleva conduciendo nunca ha tenido un accidente ni una sola infracción, la compañía anota que tiene menos de 25 años, no está casado y no ha recibido cursos de manejo.

Ejemplo 3

• Alfredo Montealbán, un mariscal de campo seleccionado para el equipo de estrellas de la liga colegial, no recibe ninguna llamada durante el reclutamiento de jugadores colegiales para la liga profesional. El servicio de reclutamiento de los equipos profesionales afirma que este jugador no tendría éxito en el fútbol profesional por se de baja estatura.

• Nos guste o no, los individuos y las empresas constantemente clasifican a las personas en grupos basándose en variables como la edad, escolaridad, ingresos, estado civil, peso físico y talla, tipo de automóvil que usan, indumentaria y promedio de puntos de calidad. Si bien quizá no se aplique específicamente el análisis discriminante, los principios en que se funda esta técnica matemática están presentes, es decir, a partir de un grupo de mediciones observadas podemos tratar de clasificar un individuo u objeto en un grupo.

Identificación de las variables descriptivas que mejor determinan la pertenencia al grupo.

• Se examinan a miembros de grupos conocidos, con objeto de averiguar cuáles variables nos ayudan más a diferenciar entre los miembros de cada uno.

• Por ejemplo, si trabajamos en préstamos para los consumidores, nos gustaría identificar las variables que mejor “discriminan” entrea) Prestatarios anteriores que han pagado su deuda a

tiempo

b) Prestatarios anteriores que no la han pagado

Riesgo crediticio (Préstamos)

• Un ejecutivo de préstamos de una compañía hipotecaria debe decidir si aprueba un préstamo hipotecario a un solicitante. Esta decisión se toma determinando si las características del solicitante se apegan más a las de personas que en el pasado pagaron debida y oportunamente sus préstamos que a las de aquellas que no cumplieron con los pagos.

• La información acerca de estos dos grupo, disponible a partir de registros pasados, incluiría variables de pronóstico como edad, ingresos, años viviendo en el presente domicilio, años en el trabajo actual, deudas pendientes, estado civil, estado de salud y posesión de ciertos bienes duraderos.

¿Por qué quiebran los negocios?

• Un investigador interesado en quiebras de negocios tal vez pueda agrupar las empresas de acuerdo a si quebraron o no con el paso del tiempo, con base en variables de pronóstico como ubicación, razones financieras o cambios en la administración.

• El reto consiste en encontrar variables discriminantes que puedan usarse en una ecuación de pronóstico que produzca una asignación de los individuos a los grupos y que sea mejor que una asignación al azar.

Servicio de Administración Tributaria

• Utiliza un análisis discriminante para comparar las declaraciones seleccionadas con las devoluciones compuestas hipotéticas del contribuyente normal (para distintos niveles de ingreso) con el fin de identificar las devoluciones y áreas más prometedoras para la auditoría.

Las revistas

• Se cuenta con información sobre la edad e ingresos referente a

• Suscriptores y no suscriptores de tres revistas

1. Buena condición física después de los 50

2. Aviso mensual de impuestos

3. Revista de juegos de video

Análisis Discriminante

• Útil si la muestra total puede dividirse en grupos basándose en una variable de criterio caracterizada por varias categorías conocidas.

• Muchos problemas en marketing implican la investigación de diferencias entre grupos de individuos.

• Se usa si la única variable de criterio es dicotómica (es decir, comprador, no comprador) o multidicotómica ( es decir, alto-medio-bajo) y por tanto no métrica.– ¿Cómo serán las ventas potenciales (buenas o malas) en un

territorio dado de mercado, con base en ciertas evaluaciones sobre el ingreso personal disponible por territorio, densidad de población, número de puntos de venta al detalle y demás?

Un buen vendedor

• El gerente de ventas de la CompañíaAlloy Steel está tratando de identificar qué determina a un buen vendedor, es decir, por qué algunos vendedores cumplen o rebasan sus cuotas y otros no.

• Al tratar de estudiar este asunto, el gerente de ventas recopila datos sobre los veinte vendedores de la compañía, incluyendo el cumplimiento o incumplimiento con la cuota, el número de años de experiencia en ventas de acero de aleación y el número de años de educación técnica formal.

• El gerente de ventas reunió los datos de experiencia y educación porque pensó que le podrían ayudar a identificar las características de un buen vendedor.

• En este conjunto de datos hay tres elementos de información sobre cada vendedor: una variable de criterio categórica, la cual es si cumplió o no con su cuota este año, y dos variables de pronóstico métricas.– El número de años de experiencia en ventas

de acero de aleación– El grado de educación técnica formal

• El gerente de ventas de la Compañía puede preguntar – ¿Qué tan bien se ajusta el discriminante a los

datos?– ¿Qué tan bueno es como pronóstico?

Aplicaciones

• En términos de características demográficas, ¿cuál es la diferencia entre los clientes que son leales a la tienda y los otros?

• ¿El consumo de alimentos congelados difiere entre los consumidores de refrescos frecuentes, moderado y esporádicos?

• ¿Qué características de estilo de vida distinguen a los compradores de abarrotes que se fijan en los precios de los que se fijan en la marca?

• Cuáles son las características demográficas que diferencian entre los clientes habituales de una cadena de supermercados y los clientes ocasionales?

• De acuerdo a sus perfiles demográficos y psicográficos, ¿Cuáles son las características que distinguen a los innovadores de los no innovadores?

Aplicaciones• ¿Difiere la atención a los medios en los segmentos de un

mercado?• En términos de estilo de vida, ¿cuáles son las diferencias

entre los clientes constantes de las cadenas regionales de tiendas departamentales y los clientes de las cadenas nacionales?

• ¿Cuáles son las características de los consumidores que responden a los cuestionarios por correo?

• ¿Cómo se diferencian, en sus niveles de lectura de ciertas revistas, los encuestados que muestran alto interés en un nuevo conjunto de descripciones conceptuales, de los que muestran poco interés?

• ¿Los vendedores de éxito hacen más visitas, ocupan más tiempo en las ventas y recorren más kilómetros que aquellos sin éxito?

Objetivo de ADM

• IDENTIFICAR y entender cuales son las diferencias (características distintivas) de los individuos en cada grupo

• PRONOSTICAR la probabilidad de que una persona pertenezca a una clase o grupo particular de los que se conocen dichas características distintivas.

ANÁLISIS DISCRIMINANTE

Técnica de clasificación para agrupar a los clientes y prospectos en dos o más categorías diferentes definidas previamente.

Permite asignar un individuo a un grupo definido a priori en función de una serie de características del mismo o de las respuestas dadas a una serie de preguntas (escalas de calificación)

NO REQUIERE DE NINGÚN CUESTIONARIO ESPECIAL

Discriminant Analysis

• The purpose of discriminant analysis is to correctly classify observations or people into homogeneous groups. The independent variables must be metric and must have a high degree of normality. Discriminant analysis builds a linear discriminant function, which can then be used to classify the observations. The overall fit is assessed by looking at the degree to which the group means differ (Wilkes Lambda or D2) and how well the model classifies. To determine which variables have the most impact on the discriminant function, it is possible to look at partial F values. The higher the partial F, the more impact that variable has on the discriminant function. This tool helps categorize people, like buyers and nonbuyers.

ANÁLISIS DISCRIMINANTE EN LA PRÁCTICA

• What characteristics best distinguish my various customer segments?

In marketing research this analytical technique is the study of the differences between two or more groups of objects with respect to several variables simultaneously. The objects are individual products or services and the variables are usually descriptive ratings of each of these products or services on several attributes. It is commonly linked to the use of perceptual mapping. A major application in marketing is to discern which attributes best distinguish or discriminate among the various objects.

• Explicar por qué los encuestados pertenecen a un cierto grupo

• Clasificar nuevos encuestados con base en sus calificaciones

• Determinar cuáles clientes son propensos a comprar un producto de una compañía.

• Decidir si un banco debe otorgar un crédito a una nueva compañía.

• Identificar pacientes que pueden estar en riesgo por problemas médicos.

¿CUÁNDO DEBEMOS UTILIZAR EL ANÁLISIS DISCRIMINANTE?

• Mapas perceptuales de posicionamiento.– Útiles al revelar

visualmente las posiciones competitivas actuales de los jugadores principales en una categoría de producto o servicio.

– Los tipos de productos o marcas son los grupos en la variable dependiente; las variables independientes son las calificaciones de desempeño de los atributos.


• Mapas de preferencias– Los tipos de productos o marcas son los grupos de la

variable dependiente (como en los mapas anteriores), y las preferencias de productos o marcas son las variables independientes.

– Dos maneras:– Pedir a los encuestados que ordenen los productos o

marcas en términos de una evaluación general o frecuencia de uso.

– Basar las preferencias en las calificaciones generales.


• Mapas de actitudes– El análisis indica cuáles actitudes son las más

propensas a poseer los usuarios o dueños de los productos o marcas. Los tipos de productos o marcas son los grupos de la variable dependiente (como en los mapas anteriores), y las calificaciones de los encuestados en los enunciados de las actitudes en cierta categoría son las variables independientes.


• Mapas de Estilos de vida– El análisis muestra cuáles actividades,

intereses, opiniones, etc. Son las que están más asociados con los usuarios más frecuentes de cada producto o marca.

– La variable dependiente consiste en los productos o marcas específicas; las variables independientes son las calificaciones de los encuestados sobre los enunciados de estilos de vida en general.

PREGUNTAS A RESPONDER– Administradores de ventas: Evaluar sus clientes

prospectos¿Cuáles son las características sociodemográficas y psicográficas, estilos de vida, etc. de los compradores de un producto determinado?

– ¿Cuáles son las características demográficas que diferencian entre los clientes habituales de una cadena de supermercados y los clientes ocasionales?

– ¿Es distinto el estilo de vida de los compradores de productos de alimentación sensibles al precio del estilo de vida de los sensibles a las marcas?

– ¿En qué se diferencian los consumidores que han respondido positivamente a una campaña de marketing directo a los que no lo han hecho?

PREGUNTAS A REPONDER

– ¿Qué marca de coche es más probable que compre un nuevo comprador en función de su perfil sociodemográfico?

– ¿Qué nivel de consumo de un producto (elevado, medio o bajo) es previsible que tengan los individuos recién incorporados al mercado en función de sus motivaciones de compra y utilización prevista del producto?

– Bancos y aseguradoras: ¿En qué categoría de riesgo crediticio se encuentra un cliente?

– En general, para discriminar diferentes grupos de individuos (personas físicas, empresas, productos, etc.) a partir de una serie de variables independientes.

Ejemplos ilustrativos

Cereal

• Deseamos saber si la cantidad de proteína y vitamina D influye en las evaluaciones que hacen los consumidores de los cereales.

• A cada uno de los diez consumidores que evalúan se les pide solamente clasificar el cereal en una de dos categorías: gustar versus disgustar.

• Los datos aparecen en el archivo “cereal.sav”• Las variables de pronóstico son:• X1: la cantidad de proteínas (en gramos) pro 2 onzas

servidas, y• X2: el % de requerimientos diarios mínimos de vitamina

D por dos onzas servidas.

Gráfico de dispersión de los datos

• Notamos que se puede lograr una discriminación perfecta con X1 si trazáramos una línea perpendicular al eje horizontal entre los valores de la escala 6 y 7.

• Por otra parte, no hay forma de que el uso de X2 sola nos condujera a separar los grupos.

• Dada esta imagen, no nos sorprendería que el mejor compuesto lineal resulte en favorecer X1 con un peso considerablemente mayor que el que X2 recibe.

¿Por qué no usar X1 sola, en vez de un compuesto de X1 y X2?

1. Los datos de la tabla representan sólo una muestra; es muy posible que observaciones adicionales demuestren que X1 sola no efectuará una discriminación perfecta entre los dos grupos.

2. No hemos tomado explícitamente en consideración ni la variabilidad sobre X1 versus X2 ni su correlación.

Una de las mejores características del AD es que todos los tres aspectos de los datos (centroide, varianza y correlación) son considerados al desarrollar el compuesto lineal que separe al máximo los grupos.

EJEMPLOS ILUSTRATIVOS

• Un investigador educativo desea saber qué variables discriminan entre los graduandos de preparatoria que deciden

1. Ir a la Universidad2. Ir a una escuela comercial o técnica3. No buscar más educación o entrenamiento.

• Para este propósito el investigador podría recolectar información en numerosas variables previamente a la graduación de los estudiantes. Después de la graduación, la mayoría de los estudiantes caería naturalmente en alguna de estas tres categorías.

• El AD se puede usar para predecir cuáles son las variables que mejor predicen la próxima elección educativa de los estudiantes.

http://www.statsoft.com/textbook/stathome.html?stdiscan.html&1

EJEMPLOS ILUSTRATIVOS

• Un investigador médico puede recabar diferentes variables relacionadas con el “background” de sus pacientes para aprender cuáles variables predicen mejor si un paciente es propenso a

1. Recuperarse por completo

2. Recuperarse parcialmente

3. No poder recuperarse

• Un biólogo puede registrar diferentes características de tipos (grupos) similares de flores, y luego realizar un AD para determinar el conjunto de características que permiten la mejor discriminación entre los grupos.

EJEMPLO ILUSTRATIVO MKT

• En un estudio de mercado cuyo objetivo consistió en determinar las características que diferencian entre los clientes actuales de una cadena de comida rápida y los que nunca han sido clientes de la cadena, se obtuvo información de 370 individuos, de edades comprendidas entre los 15 y los 50 años, consumidores de comida rápida en los últimos 3 meses.

1. Dicotómica. Cliente de al cadena (1= Sí. 2= No)2. Tipo de comida rápida preferida (Likert 1 al 7)3. Importancia dada a las promociones y descuentos (1-9)4. Número de veces al mes que van a la comida rápida.5. Número de veces al mes que van a otro restaurante.6. Edad del consumidor (en años)

La aplicación de un análisis discriminante permitirá conocer si los clientes habitualesde la cadena tienen un perfil distinto de los consumidores que nunca han sido clientesde la cadena y cuáles variables diferencian más entre los dos grupos.

Objetivos del curso1. Describir el concepto de análisis discriminante, sus

objetivos y sus aplicaciones a la investigación de mercados.

2. Sintetizar los procedimientos para efectuar análisis discriminante: formulación del problema, estimación de los coeficientes de la función discriminante, determinación de la significancia, interpretación y validación.

3. Detallar el análisis discriminante múltiple y su distinción del análisis discriminante de dos grupos.

4. Explicar el análisis discriminante progresivo y el procedimiento Mahalanobis.

Seguros y bancos• La técnica del Análisis Discriminante aplicada al sector

asegurador se ha dado en llamar "Insurance Scoring". Consiste en utilizar la experiencia histórica de la empresa para diseñar un modelo, aplicable a nuevos clientes, que nos asigna cada cliente a una cierta categoría con una cierta probabilidad, como por ejemplo predecir si un cliente será rentable o no para la compañía de seguros anticipando el riesgo de siniestro, pudiendo así ajustar la prima de riesgo. (MODULO BASE)

• La técnica del Análisis Discriminante aplicada al sector bancario se ha dado en llamar "Credit Scoring ". Consiste en utilizar la experiencia histórica de la empresa para diseñar un modelo, aplicable a nuevos clientes, que nos asigna cada cliente a una cierta categoría con una cierta probabilidad, como por ejemplo determinar la posibilidad de recobro de un cliente en base a ciertas variables como, salario, tiempo de amortización del préstamo, nº de hijos, etc. (MODULO BASE)

Ejemplo 1

• Un ejecutivo de préstamos de una compañía hipotecaria debe decidir si aprueba un préstamo hipotecario a un solicitante.

• Esta decisión se toma determinando si las características del solicitante se apegan más a las de personas que en el pasado pagaron debida y oportunamente sus préstamos que a las de aquellas personas que no cumplieron con los pagos.

• La información acerca de estos dos grupos, disponible a partir de registros pasados, incluiría factores como edad, ingresos, estado civil, deudas pendientes y posesión de ciertos bienes duraderos.

Ejemplo 2

• En el proyecto de tienda departamental se hizo un análisis discriminante de dos grupos para examinar si los entrevistados que estaban familiarizados con las tiendas (comparados con los que no lo estaban) asignaban una importancia relativa diferente a los ocho criterios de elección.

• La variable de criterio eran los dos grupos de familiaridad.

• Las variables de pronóstico eran la importancia concedida a los ocho criterios de selección.

Resultados

• La función discriminante fue significativa, señal de que había diferencias importantes entre los dos grupos.

• En comparación con los entrevistados que no estaban familiarizados, los entrevistados familiarizados concedían mayor importancia a la calidad de la mercancía, las políticas de devoluciones y cambios, el servicio del personal y las políticas de crédito y facturación.

Ejemplo 3

• Por término medio, las personas de los países de zonas templadas consumen más calorías por día que las de los trópicos, y una proporción mayor de la población de las zonas templadas vive en núcleos urbanos.

• Un investigador desea combinar esta información en una función para determinar cómo de bien un individuo es capaz de discriminar entre los dos grupos de países.

• El investigador considera además que el tamaño de la población y la información económica también pueden ser importantes.

Resultados

• El análisis discriminante permite estimar los coeficientes de la función discriminante lineal, que tiene el aspecto de la parte derecha de una ecuación de regresión lineal múltiple. Es decir, utilizando los coeficientes a, b, c y d, la función es:

• D = a * clima + b * urbanos + c * población + d * producto interior bruto per capita

• Si estas variables resultan útiles para discriminar entre las dos zonas climáticas, los valores de D serán diferentes para los países templados y para los tropicales.

• Si se utiliza un método de selección de variables por pasos, quizás no se necesite incluir las cuatro variables en la función.

Objetivos principales de AD

1. FUNCIONES DISCRIMINANTES (combinaciones lineales de variables de pronóstico) que discriminan mejor entre categorías de la variable de criterio (grupos).

2. DESCRIPCIÓN: Examinar si hay diferencias significativas entre los grupos en términos de las variables de pronóstico.

3. IMPORTANCIA RELATIVA: Determinar qué variables de pronóstico contribuyen o cuentan más para explicar las diferencias entre grupos.

4. PREDICCIÓN: Clasificar nuevos sujetos u objetos cuyos perfiles son conocidos, pero no su identidad, a uno los grupos.

5. EXACTITUD: Evaluar la exactitud de la clasificación.

• El reto consiste en encontrar El reto consiste en encontrar variables discriminantes que variables discriminantes que puedan usarse en una ecuación puedan usarse en una ecuación de predicción que produzca una de predicción que produzca una asignación de los individuos a asignación de los individuos a los grupos y que sea mejor que los grupos y que sea mejor que una asignación al azar.una asignación al azar.


• Es una técnica para analizar datos cuando una variable de criterio es categórica y las variables de pronóstico son de naturaleza de intervalo.

• Ejemplo:– Preferencia de una marca de PC (marca A, B

o C)– Calificaciones de los atributos de las PC en

una escala de Likert de siete puntos.


• El análisis discriminante resulta útil para construir un modelo predictivo para pronosticar el grupo de pertenencia de un caso a partir de las características observadas de cada caso.

• El procedimiento genera una función discriminante (o, para más de dos grupos, un conjunto de funciones discriminantes) basada en combinaciones lineales de las variables predictoras que proporcionan la mejor discriminación posible entre los grupos. Las funciones se generan a partir de una muestra de casos para los que se conoce el grupo de pertenencia; posteriormente, las funciones pueden ser aplicadas a nuevos casos que dispongan de medidas para las variables predictoras pero de los que se desconozca el grupo de pertenencia.

• Nota: La variable de agrupación puede tener más de dos valores. Los códigos de la variable de agrupación han de ser números enteros y es necesario especificar sus valores máximo y mínimo. Los casos con valores fuera de estos límites se excluyen del análisis.

Semejanzas y diferencias entre ANOVA, Regresión y Discriminante

ANOVA REGRESIÓN DISCRIMI-NANTE

Semejanzas

# de variables dependientes (criterio)

Una Una Una

# de variables independientes

Varias Varias Varias

Diferencias

Naturaleza de las variables dependientes

Métrica Métrica Categórica

Naturaleza de las variables independientes

Categórica Métrica Métrica

Regresión vs DiscriminanteLa variable de criterio tiene una distribución normal.

Las variables de pronóstico son fijas.

Las variables de pronóstico tienen una distribución normal.

La variable de criterio es fija.

Busca predecir el valor medio de la variable de criterio con base en los valores conocidos y fijos de las variables de pronóstico.

Busca encontrar una combinación lineal de variables de pronóstico que maximice la discriminación entre los grupos y minimice la probabilidad de clasificar incorrectamente a los individuos u objetos en grupos.

Se hacen ciertos supuestos con el fin de generar estimaciones de parámetros que tengan propiedades estadísticas deseables.

Aplica una estrategia para encotnrar una media y clasificar con exactitud individuos u objetos en grupos.

Estadísticos

• Para cada variable: – medias, desviaciones típicas, ANOVA univariado.

• Para cada análisis: – M de Box, matriz de correlaciones intra-grupos, matriz de

covarianzas intra-grupos, matriz de covarianzas de los grupos separados, matriz de covarianzas total. Para cada función discriminante canónica: autovalores, porcentaje de varianza, correlación canónica, lambda de Wilks, chi-cuadrado.

• Para cada función discriminante canónica: – autovalores, porcentaje de varianza, correlación canónica,

lambda de Wilks, chi-cuadrado. • Para cada paso:

– probabilidades previas, coeficientes de la función de Fisher, coeficientes de función no tipificados, lambda de Wilks para cada función canónica.

Datos

• La variable de agrupación debe tener un número limitado de categorías distintas, codificadas como números enteros.

• Las variables de pronóstico que sean nominales deben ser recodificadas, mediante la creación de nuevas variables, a valores numéricos que correspondan en algún sentido a las categorías originales. En el caso de variables con dos categorías, sus valores se pueden recodificar a valores 0 y 1. el valor 1 indicará la presencia de la cualidad correspondiente a una de las dos categorías, y el 0, la ausencia de dicha cualidad (en consecuencia, la presencia de la otra).

Categoría de referencia

• Cuando una variable presente más de dos categorías, deberán generarse tantas variables como el total de categorías menos uno. Cada nueva variable tomará valor 1 para una determinada categoría y 0 en el resto, de tal forma que los individuos en una misma categoría tomarán valor 1 en una misma variable y 0 en el resto. La categoría no considerada, o categoría referencia, estará representada por el valor 0 en todas las nuevas variables. Mediante este esquema de codificación, los coeficientes de las nuevas variables reflejarán el efecto de las categorías representadas respecto al efecto de la categoría de referencia.

Supuestos• Las variables de pronóstico o están altamente

correlacionadas entre sí.• La media y la varianza en una variable de pronóstico

no están correlacionadas.• La correlación entre dos variables de pronóstico es

constante a través de los grupos, (el experimento se realice en las mismas circunstancias y no debe haber diferentes fuentes de variación que haga que los grupos sean diferentes).

• Los valores (objetos o sujetos) deben ser independientes.

• Los valores de las variables de pronóstico deben tener una distribución normal .

Supuestos

• El procedimiento es más efectivo cuando la pertenencia al grupo es una variable verdaderamente categórica; si la pertenencia al grupo se basa en los valores de una variable continua (por ejemplo, un cociente de inteligencia alto respecto a uno bajo), considere el uso de la regresión lineal para aprovechar la información más rica ofrecida por la propia variable continua.

• Al llevar a cabo una clasificación, se supone a priori, que el resultado obtenido es tan confiable como lo indica el porcentaje de clasificaciones correctas obtenidas en la etapa de validación del modelo.

• De la misma manera que el Análisis Cluster, el objetivo del Análisis Discriminante es la clasificación de individuos en grupos. Sin embargo, tanto la técnica como la información obtenida a través de ambos métodos es distinta.

• En el Análisis Discriminante, el punto de partida es un colectivo de individuos clasificados en dos o más grupos. De estos individuos se conoce el valor de un número determinado de variables. Puesto que se conoce la existencia de esos grupos, parece lógico pensar que existen variables cuyo valor determina la pertenencia del individuo a uno u otro grupo. Los objetivos del Análisis Discriminante son:– La identificación de las variables que mejor discriminen entre

los grupos y la evaluación del poder discriminante de cada una de ellas.

– Asignar, con un cierto grado de riesgo, un individuo, que no forma parte de los datos iniciales, y del que se conoce el valor de las variables discriminantes, a uno de los grupos.

• La selección de las variables discriminantes es el paso inicial de esta técnica. Existen métodos estadísticos que permiten detectar que variables discriminan mejor unos grupos de otros, y, aunque antes de realizar el análisis se desconoce esta información, es conveniente introducir en el estudio todas las variables que pueden "explicar" la separación de los individuos en los distintos grupos.

• Una vez que se han seleccionado las variables discriminantes, el objetivo a conseguir es la elaboración de las funciones discriminantes, que son nuevas variables combinación lineal de las anteriores. Los coeficientes de la función discriminante indican el peso de cada variable en la función discriminante, y, una vez obtenidos estos coeficientes, se podrá asignar a cada individuo unos valores que permitirán asignarle a uno u otro grupo.

Análisis Discriminante simple en SPSS

Dos grupos o categorías.

PROCEDIMIENTO

I. Formulación del problema

II. Estimación de los coeficientes de la función discriminante.

III. Determinación de la significancia de la función discriminante.

IV. Interpretación de los resultados.

V. Evaluación de la validez del análisis.

I. Planteamiento del problema

• Identificar los ObjetivosObjetivos del análisis.

• Definir el Tamaño de muestra total:Tamaño de muestra total:– Por cada variable de pronóstico debe haber por lo

menos 20 encuestados para mantener resultados estables.

– Cuando los tamaños de los grupos o categorías son desiguales se requiere efectuar una ponderación.

• Calcular según tamaño de grupos


• Identificar la Variable de criterioVariable de criterio– Debe constar de dos, tres o máximo cuatro grupos o

categorías – Cuando tiene una escala de intervalo o de razón,

primero debe convertirse en categorías.– Opinión de marca, puede dividirse de una escala

Likert de 7 puntos en las categorías de desfavorable (1,2,3), neutra (4) y favorable (5,6 y 7).

– Se puede graficar la distribución de la variable dependiente y formar grupos del mismo tamaño escogiendo puntos apropiados de división para cada categoría.


• Muestra de análisis o de estimación:– Parte de la muestra total que se toma para estimar la función

discriminante. Aprox. 70% del total• Muestra de validación o de retención:

– Parte de la muestra total que se toma para verificar los resultados de la muestra de estimación. Aprox. 30% del total.

• Validación cruzada doble: – Cuando la muestra es bastante grande, puede dividirse a la

mitad. Luego se intercambian las mitades y se repite el análisis.• La muestra debe seguir la distribución total de la

muestra.• La validación debe realizarse varias veces y en cada

una la muestra debe dividirse en diversas parte de análisis y validación.


• Identificar las Variables de pronósticoVariables de pronóstico– Se eligen en base con un modelo teórico o de

investigaciones anteriores– Investigación exploratoria: Experiencia.

Visitantes de un centro vacacional

• Objetivo: Determinar las características más notables de las familias que han visitado cierto centro vacacional en los dos últimos años.

• Muestra total: 42 hogares

• Muestra de análisis: 30 hogares

• Muestra de validación: 12 hogares

Muestra de análisisResúmenes de casos

SI 50.2 5 8 3 43

SI 70.3 6 7 4 61

SI 62.9 7 5 6 52

SI 48.5 7 5 5 36

SI 52.7 6 6 4 55

SI 75.0 8 7 5 68

SI 46.2 5 3 3 62

SI 57.0 2 4 6 51

SI 64.1 7 5 4 57

SI 68.1 7 6 5 45

SI 73.4 6 7 5 44

SI 71.9 5 8 4 64

SI 56.2 1 8 6 54

SI 49.3 4 2 3 56

SI 62.0 5 6 2 58

NO 32.1 5 4 3 58

NO 36.2 4 3 2 55

NO 43.2 2 5 2 57

NO 50.4 5 2 4 37

NO 44.1 6 6 3 42

NO 38.3 6 6 2 45

NO 55.0 1 2 2 57

NO 46.1 3 5 3 51

NO 35.0 6 4 5 64

NO 37.3 2 7 4 54

NO 41.8 5 1 3 56

NO 57.0 8 3 2 36

NO 33.4 6 8 2 50

NO 37.5 3 2 3 48

NO 41.3 3 3 2 42

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

Visita alcentro

Ingresofamiliar actual

Opinión delos viajes

Importancia delas vacaciones

familiaresTamaño dela familia

Edad del jefedel hogar

Muestra de validaciónResúmenes de casos

SI 50.8 4 7 3 45

SI 63.6 7 4 7 55

SI 54.0 6 7 4 58

SI 45.0 5 4 3 60

SI 68.0 6 6 6 46

SI 62.1 5 6 3 56

NO 35.0 4 3 4 54

NO 49.6 5 3 5 39

NO 39.4 6 5 3 44

NO 37.0 2 6 5 51

NO 54.5 7 3 3 37

NO 38.2 2 2 3 49

1

2

3

4

5

6

7

8

9

10

11

12

Visita alcentro



Importanciade las

vacacionesfamiliares

Tamaño dela familia


Variable de criterio o agrupación

• VISITA: Las familias que visitaron el centro vacacional en los dos años anteriores fueron codificadas como 1. y las que no lo hicieron, como 2.

• Las muestras de análisis y de validación se equilibraron en términos de VISITA.

Variables de pronóstico

• INGRESO: Ingreso familiar anual

• VIAJE: Opinión de los viajes (Likert 9 puntos).

• VACACIONES: Importancia concedida a las vacaciones familiares (Likert 9 puntos).

• TAMAÑO: Tamaño de la familia

• EDAD: Edad del jefe del hogar

Introducción de Variables

• Seleccione una variable de agrupación con valores enteros y pulse en Definir rango para especificar las categorías de interés.

• Seleccione las variables independientes o de pronóstico. (Si la variable de agrupación no tiene valores enteros, la opción Recodificación automática en el menú Transformar creará una variable que los tenga).

Menú Analizar > Clasificar> Discriminante...

Definir rango

• Especifique los valores mínimo y máximo de la variable de agrupación para el análisis.

• Los valores mínimo y máximo deben ser números enteros.

• Los casos con valores fuera de este rango no se utilizan en el análisis discriminante, pero sí se clasifican en uno de los grupos existentes a partir de los resultados que obtengan en el análisis.

Seleccionar casos• Para seleccionar casos para el análisis:

– En el cuadro de diálogo Análisis discriminante, seleccione una variable de selección.

– Pulse en Valor para introducir un número entero como valor de selección.

• Sólo se utilizan los casos con el valor especificado en la variable de selección para derivar las funciones discriminantes. Tanto para los casos seleccionados como para los no seleccionados se generan resultados de clasificaciones y estadísticos.

• Este proceso ofrece un mecanismo para clasificar casos nuevos basados en datos previos o para dividir los datos en subconjuntos de análisis y de validación para realizar procedimientos de validación en el modelo generado.

II. Estimación de los coeficientes de la función discriminante.

• Método directo:

• Introducir simultáneamente todas las Introducir simultáneamente todas las variables de pronósticovariables de pronóstico que satisfacen el criterio de tolerancia, cualquiera que sea su poder de discriminación.

• Apropiado si, a partir de investigaciones anteriores o de un modelo teórico, el investigador quiere que la discriminación se base en todas las variables de pronóstico.

Métodos de estimación

• Método progresivo (por pasos):• Utiliza el análisis por pasos para controlar

la entrada y la salida de variables de pronóstico, las cuales se agregan en secuencia según su capacidad de discriminar entre grupos.

• Apropiado cuando el investigador quiere elegir un subconjunto de variables para incluirlas en la función discriminante.

Resumen del procesamiento para el análisis de casos

Resumen del procesamiento para el análisis de casos

30 71.4

0 .0

0 .0

0 .0

12 28.6

12 28.6

42 100.0

Casos no ponderadosVálidos

Códigos de grupo paraperdidos o fuera de rango

Perdida al menos unavariable discriminante

Perdidos o fuera de rangoambos, el código degrupo y al menos una delas variablesdiscriminantes.

No seleccionados

Total excluidos

Excluidos

Casos Totales

N Porcentaje

Botón Estadísticos

Descriptivos• Medias.

– Muestra la media y desviación típica totales y las medias y desviaciones típicas de grupo, para las variables de pronóstico.

• ANOVAs univariados– Realiza un ANOVA de un factor sobre la igualdad de las

medias de grupo para cada variable de pronóstico.• Test M de Box.

– Contraste sobre la igualdad de las matrices de covarianza de los grupos. Para tamaños de muestra suficientemente grandes, un valor de p no significativo quiere decir que no hay evidencia suficiente de que las matrices difieran. Esta prueba es sensible a las desviaciones de la normalidad multivariada.

Medias y desviaciones estándar.Estadísticos de grupo

60.520 9.8307 15 15.000

5.400 1.9198 15 15.000

5.800 1.8205 15 15.000

4.333 1.2344 15 15.000

53.733 8.7706 15 15.000

41.913 7.5511 15 15.000

4.333 1.9518 15 15.000

4.067 2.0517 15 15.000

2.800 .9411 15 15.000

50.133 8.2710 15 15.000

51.217 12.7952 30 30.000

4.867 1.9780 30 30.000

4.933 2.0998 30 30.000

3.567 1.3309 30 30.000

51.933 8.5740 30 30.000

Ingreso familiar actual

Opinión de los viajes

Importancia de lasvacaciones familiares

Tamaño de la familia

Edad del jefe del hogar











Visita al centroSI

NO

Total

Media Desv. típ.No

ponderados Ponderados

N válido (según lista)

Examen de medias y desviaciones

• Conviene antes de iniciar la estimación de las funciones discriminantes, analizar en detalle las variables de pronóstico del modelo.

• Parece que los grupos están más separados en términos de ingreso que de otras variables.

• Parece haber mayor separación en la importancia concedida a las vacaciones familiares que en la opinión sobre los viajes.

• La diferencia entre los dos grupos en cuanto a la edad del jefe del hogar es pequeña y la desviación estándar de esta variable es grande.

Matrices

• Matrices de coeficientes disponibles para las variables de pronóstico.

• Correlación intra-grupos. Muestra la matriz de correlaciones intra-grupos combinada, que se obtiene de promediar las matrices de covarianza individuales para todos los grupos antes de calcular las correlaciones.

• Covarianza intra-grupos. Muestra la matriz de covarianza intra-grupos combinada, la cual puede diferir de la matriz de covarianza total. La matriz se obtiene de promediar, para todos los grupos, las matrices de covarianza individuales.

• Covarianza de grupos separados. Muestra las matrices de covarianza de cada grupo por separado.

• Covarianza total. Muestra la matriz de covarianza para todos los casos, como si fueran una única muestra.

Matriz de Correlación intragrupos

• Matriz de correlación común del grupo: Correlación de Pearson entre las distintas variables de Pronóstico del modelo.

• Detecta si existe multicolinealidad en las variables pronóstico.• En este caso indica que hay pocas correlaciones entre las

variables de pronóstico. Es poco probable que se presente un problema de multicolinealidad, dando así estabilidad a los parámetros que vamos a estimar.

Matrices intra-grupo combinadas

1.000 .197 .091 .089 -.014

.197 1.000 .084 -.017 -.197

.091 .084 1.000 .070 .017

.089 -.017 .070 1.000 -.043

-.014 -.197 .017 -.043 1.000






Correlación



Importanciade las




Matriz de Covarianza intragruposMatrices intra-grupo combinadasa

76.831 3.350 1.555 .855 -1.070

3.350 3.748 .317 -.036 -3.252

1.555 .317 3.762 .150 .288

.855 -.036 .150 1.205 -.402

-1.070 -3.252 .288 -.402 72.667






Covarianza



Importanciade las




La matriz de covarianzas tiene 28 grados de libertada.

• Matriz de covarianza intragrupos: Calculada como media aritmética ponderada de las covarianzas dentro de cada grupo de clasificación.

• Se calcula para toda la muestra.

Matriz de Covarianza de grupos separados

Matrices de covarianzas

96.642 7.170 9.397 3.207 28.249

7.170 3.686 .157 -.214 -.243

9.397 .157 3.314 .357 -.057

3.207 -.214 .357 1.524 -2.762

28.249 -.243 -.057 -2.762 76.924

57.020 -.469 -6.287 -1.497 -30.388

-.469 3.810 .476 .143 -6.262

-6.287 .476 4.210 -.057 .633

-1.497 .143 -.057 .886 1.957

-30.388 -6.262 .633 1.957 68.410











Visita al centroSI

NO



Importanciade las




Matriz de Covarianza de grupos total

Matrices de covarianzasa

163.718 8.368 9.843 8.204 16.291

8.368 3.913 .784 .389 -2.147

9.843 .784 4.409 .832 1.892

8.204 .389 .832 1.771 1.039

16.291 -2.147 1.892 1.039 73.513






Visita al centroTotal



Importanciade las




La matriz de covarianzas total presenta 29 grados de libertad.a.

λ de Wilks (estadística U) y ANOVAs Univariados

• Es el cociente de la Suma de Cuadrados Intragrupos y la Suma de Cuadrados Total en un ANOVA simple para cada una de las variables de pronóstico por separado y tendiendo como factor la variable de criterio.

• La lambda de Wilks para un conjunto de p variables independientes mide las desviaciones dentro de cada grupo respecto a las desviaciones totales sin distinguir grupos, en el espacio p-dimensional generado por los valores de las p variables.

• Si λ 1: No existe diferencia entre las medias de los grupos en la variable considerada. Los grupos están mezclados.

• Si λ 0: Una gran parte de la variabilidad total es atribuible a la diferencia entre las medias de los distintos grupos.

Prueba F univariadas• Determina si cada una de las variables de pronóstico, tomada

de forma aislada, diferencia significativamente entre los grupos de la variable de criterio.

• Indica que cuando se consideran separadamente las variables de pronóstico, sólo el ingreso, la importancia de las vacaciones y el tamaño del hogar distinguen de manera significativa entre quienes visitaron un centro vacacional y quienes no lo hicieron.

Pruebas de igualdad de las medias de los grupos

.453 33.796 1 28 .000

.925 2.277 1 28 .143

.824 5.990 1 28 .021

.657 14.636 1 28 .001

.954 1.338 1 28 .257






Lambdade Wilks F gl1 gl2 Sig.

Test M de Box sobre la igualdad de las matrices de covarianza

• Contrasta hasta qué punto las matrices de varianzas-covarianzas para cada grupo o nivel de la variable pueden o no proceder de la misma población, es decir, difieren o no significativamente.

Logaritmo de los determinantes

5 10.773

5 10.071

5 11.349

Visita al centroSI

NO

Intra-grupos combinada

RangoLogaritmo deldeterminante

Los rangos y logaritmos naturales de losdeterminantes impresos son los de las matrices decovarianzas de los grupos.

Resultados de la prueba

25.964

1.393

15

3156.632

.141

M de Box

Aprox.

gl1

gl2

Sig.

F

Contrasta la hipótesis nula de que las matricesde covarianzas poblacionales son iguales.

Coeficientes de la función

• Coeficientes de clasificación de Fisher: Muestra los coeficientes de la “Función lineal de clasificación de Fisher” que pueden utilizarse directamente para la clasificación. Se obtiene un conjunto de coeficientes para cada grupo, y se asigna un caso al grupo para el que tiene una mayor puntuación discriminante.

• Coeficientes sin estandarizar: Muestra los coeficientes de la función discriminante sin estandarizar (los coeficientes brutos).

Resumen de las funciones canónicas discriminantes

Autovalores

1.786a 100.0 100.0 .801Función1

Autovalor % de varianza % acumuladoCorrelacióncanónica

Se han empleado las 1 primeras funciones discriminantescanónicas en el análisis.

a.

• Como hay dos grupos sólo se estima una función discriminante. • El valor propio asociado a esta función es 1.7862, que significa

100% de la varianza explicada.• La correlación canónica es una medida de la asociación entre

cada función discriminante y la variable de criterio.• La correlación canónica asociada con esta función es 0.8007. El

cuadrado de esta correlación, (0.8007)^2 = 0.64, indica que 64% de la varianza de la variable de criterio (VISITA) se explica con este modelo.

Correlación canónica y autovalores

• La correlación canónica y el autovalor asociado a una función son dos medidas, relacionadas con la Lambda de Wilks, que permitirán evaluar la información que aportará cada función discriminante en particular.

• La correlación canónica mide las desviaciones de las puntuaciones discriminantes entre grupos respecto a las desviaciones totales sin distinguir grupos.

• El autovalor mide las desviaciones de las puntuaciones discriminantes entre los grupos respecto a las desviaciones dentro de los grupos.

• En ambos casos, si el valor obtenido es grande la dispersión será debida a las diferencias entre grupos y, en consecuencia, la función discriminará mucho los grupos.

III. Determinación de la Significancia de la función discriminante.

• Se puede comprobar en forma estadística la hipótesis nula de que las medias en la población de todas las funciones discriminantes son de todos los grupos.

• Se basa en una transformación de chi cuadrada de la estadística λ de Wilks.

• En nuestro ejemplo, la λ de Wilks de 0.3589 se transforma en una chi cuadrada de 26.13 con 5 grados de libertad, que es significativo por arriba de 0.05.

Lambda de Wilks

.359 26.130 5 .000

Contraste delas funciones1

Lambdade Wilks Chi-cuadrado gl Sig.

Nota importante

• No tiene sentido interpretar los resultados si las funciones discriminantes estimadas no son estadísticamente significativas.

• Si se rechaza la hipótesis nula, lo que indica discriminación significativa, se puede proceder a interpretar los resultados.

IV. Interpretación de Resultados

• Coeficientes de discriminación: Interpretación semejante al análisis de regresión múltiple.

• El valor del coeficiente para una VP depende de las otras VP que se incluyan en el análisis.

• Pueden aplicarse a los valores directos de las variables en la muestra de análisis con fines de clasificación.

Coeficientes de las funciones canónicas discriminantes

.08477

.04964

.12028

.42739

.02454

-7.97548






(Constante)

1

Función

Coeficientes no tipificados

Función discriminante, tanto en valores estandarizados como no estandarizados.D = -7.975 +.085(70.3)+0.050(6)+.120(7)+.427(4)+.025(61)=2.3735

• Los signos de los coeficientes asociados con todas las variables de pronóstico son positivos, lo que indica que a más ingreso familiar, tamaño de la familia, importancia de las vacaciones familiares, opinión de los viajes y edad, es más probable que una familia visite un centro vacacional.

Coeficientes de las funciones canónicas discriminantes

.08477

.04964

.12028

.42739

.02454

-7.97548






(Constante)

1

Función

Coeficientes no tipificados


• Coeficientes estandarizados

• Revelan la Importancia relativa de las variables de pronóstico.

• En general, cuanto mayor sea el valor, mayor será la potencia discriminante de la función, comparada con las variables de pronóstico con coeficientes menores.

Coeficientes estandarizados de lasfunciones discriminantes canónicas

.74301

.09611

.23329

.46911

.20922






1

Función


• Correlaciones estructurales: • Correlaciones simples entre

cada variable de pronóstico y la función discriminante.

• Representan la varianza que comparten con la función la variable de pronóstico.

• Cuanto mayor sea la magnitud de una CE, más importante será la variable correspondiente de pronóstico.

Matriz de estructura

.822

.541

.346

.213

.164






1

Función

Correlaciones intra-grupo combinadas entrelas variables discriminantes y las funcionesdiscriminantes canónicas tipificadas Variables ordenadas por el tamaño de lacorrelación con la función.


• Centroide: Se promedian las puntuaciones discriminantes para todos los individuos dentro de un grupo o categoría particular para llegar a la media del grupo.

• Indican la ubicación más típica de un individuo de un grupo en particular.

• Una comparación de los centroides de los grupos muestra qué tan alejados están los grupos a lo largo de la función discriminante.

Funciones en los centroides de los grupos

1.291

-1.291

Visita al centroSI

NO

1

Función

Funciones discriminantes canónicas no tipificadasevaluadas en las medias de los grupos

Perfil de características

• Sería razonable trazar un perfil de los dos grupos en términos de las medias de las tres variables de pronóstico que parecen ser las más importantes.– Ingreso– Tamaño de la

familia– Importancia de las

vacaciones

Gráficos combinados

• Grupos combinados. Crea un diagrama de dispersión, con todos los grupos, de los valores en las dos primeras funciones discriminantes. Si sólo hay una función, en su lugar se muestra un histograma.

Gráficos por grupos separados

• Grupos separados. Crea diagramas de dispersión, de los grupos por separado, para los valores en las dos primeras funciones discriminantes. Si sólo hay una función se muestra un histograma en su lugar.

Gráficos por grupos separados

• Grupos separados. Crea diagramas de dispersión, de los grupos por separado, para los valores en las dos primeras funciones discriminantes. Si sólo hay una función se muestra un histograma en su lugar.

V. Evaluar la validez del AD

• Antes de interpretar con confianza algún resultado, es necesario validarlos.

Botón ClasificarCuadro de diálogo Análisis discriminante: Clasificar

Probabilidades previas

• Probabilidades previas. – Estos valores se utilizan para la clasificación. – Puede especificar que las probabilidades

previas sean iguales para todos los grupos (Todos los grupos iguales),

– Dejar que los tamaños de grupo observados en la muestra determinen las probabilidades de la pertenencia al grupo (Calcular según tamaños de grupos).

Probabilidades previas

Probabilidades previas para los grupos

.500 15 15.000

.500 15 15.000

1.000 30 30.000

Visita al centroSI

NO

Total

PreviasNo


Casos utilizados en elanálisis

En nuestro ejemplo se decidió que las probabilidades sean iguales para ambos grupos

Resultados para cada caso.• Se muestran, para cada caso, los códigos del

grupo real de pertenencia, el grupo pronosticado, las probabilidades posteriores y las puntuaciones discriminantes.

• Los sujetos se asignan a grupos basados en sus puntuaciones discriminantes y en una regla de clasificación apropiada (basada en el teorema de Bayes).

• En un AD de dos grupos se asignará un caso al grupo con el centroide más cercano.

Estadísticos por casos

1 2** .263 1 .609 1.252 1 .391 2.141 -.172

1 1 .299 1 .998 1.080 2 .002 13.115 2.330

1 1 .393 1 .996 .731 2 .004 11.814 2.146

1 1 .236 1 .567 1.407 2 .433 1.950 .105

1 1 .471 1 .814 .519 2 .186 3.467 .571

1 1 .033 1 1.000 4.562 2 .000 22.262 3.427

1 2** .519 1 .841 .416 1 .159 3.754 -.646

1 1 .969 1 .962 .001 2 .038 6.471 1.253

1 1 .822 1 .980 .050 2 .020 7.878 1.516

1 1 .414 1 .996 .667 2 .004 11.553 2.108

1 1 .190 1 .999 1.721 2 .001 15.166 2.603

1 1 .187 1 .999 1.740 2 .001 15.220 2.610

1 1 .690 1 .987 .159 2 .013 8.888 1.690

1 2** .555 1 .859 .349 1 .141 3.968 -.701

1 1 .446 1 .796 .582 2 .204 3.311 .528

2 2 .597 1 .991 .279 1 .009 9.676 -1.819

2 2 .394 1 .996 .725 1 .004 11.792 -2.143

2 2 .946 1 .971 .005 1 .029 7.024 -1.359

2 2 .487 1 .824 .482 1 .176 3.564 -.597

2 2 .699 1 .912 .149 1 .088 4.822 -.905

2 2 .646 1 .989 .211 1 .011 9.249 -1.750

2 2 .602 1 .879 .272 1 .121 4.246 -.769

2 2 .612 1 .883 .258 1 .117 4.304 -.783

2 2 .442 1 .794 .592 1 .206 3.287 -.522

2 2 .650 1 .897 .206 1 .103 4.531 -.837

2 2 .908 1 .974 .013 1 .026 7.281 -1.407

2 2 .520 1 .842 .414 1 .158 3.758 -.647

2 2 .609 1 .991 .261 1 .009 9.569 -1.802

2 2 .512 1 .993 .430 1 .007 10.485 -1.947

2 2 .431 1 .995 .621 1 .005 11.359 -2.079

1 2** .294 1 .651 1.101 1 .349 2.351 -.242

1 1 .195 1 .999 1.677 2 .001 15.032 2.586

1 1 .677 1 .905 .173 2 .095 4.692 .875

1 2** .539 1 .852 .377 1 .148 3.873 -.677

1 1 .226 1 .998 1.465 2 .002 14.385 2.502

1 1 .707 1 .914 .141 2 .086 4.868 .915

2 2 .902 1 .975 .015 1 .025 7.320 -1.414

2 2 .221 1 .544 1.497 1 .456 1.847 -.068

2 2 .934 1 .972 .007 1 .028 7.105 -1.374

2 2 .508 1 .836 .438 1 .164 3.689 -.629

2 2 .404 1 .765 .696 1 .235 3.056 -.457

2 2 .534 1 .993 .386 1 .007 10.265 -1.913

Númerode caso1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31u

32u

33u

34u

35u

36u

37u

38u

39u

40u

41u

42u

OriginalGrupo real

Grupopronosticado p gl

P(D>d | G=g)

P(G=g | D=d)

Distancia deMahalanobisal cuadrado

hasta elcentroide

Grupo mayor

Grupo P(G=g | D=d)

Distancia deMahalanobisal cuadrado

hasta elcentroide

Segundo grupo mayor

Función 1

Puntuacionesdiscriminantes

Caso no seleccionadou.

Caso mal clasificado**.

Tabla de resumen.• "Matriz de Confusión": Número de

sujetos correcta e incorrectamente clasificados a cada uno de los grupos, basándose en el total de la muestra.

• Los coeficientes discriminantes, estimados en la muestra de análisis, se multiplican por los valores de las variables de pronóstico en la muestra de validación para generar puntuaciones de discriminación para los sujetos de esta última muestra.

• Clasificación dejando uno fuera. Se clasifica cada caso del análisis mediante la función derivada a partir de todos los casos, excepto el propio caso. También conocido como método-U.

• El modelo discriminante se estima tantas veces como encuestados haya en la muestra.

• Se usa cuando no se puede tener una muestra de validación grande.

• Confiere una sensación de solidez de estimación al tomar a cada encuestado, uno por uno, como muestra de validación.

Validación cruzada con exclusión

Resultados de la clasificaciónResultados de la clasificaciónb,c,d

12 3 15

0 15 15

80.0 20.0 100.0

.0 100.0 100.0

11 4 15

2 13 15

73.3 26.7 100.0

13.3 86.7 100.0

4 2 6

0 6 6

66.7 33.3 100.0

.0 100.0 100.0

Visita al centroSI

NO

SI

NO

SI

NO

SI

NO

SI

NO

SI

NO

Recuento

%

Recuento

%

Recuento

%

Original

Validación cruzadaa

Original

Casos seleccionados

Casos no seleccionados

SI NO

Grupo de pertenenciapronosticado

Total

La validación cruzada sólo se aplica a los casos del análisis. En la validación cruzada, cada caso se clasificamediante las funciones derivadas a partir del resto de los casos.

a.

Clasificados correctamente el 90.0% de los casos agrupados originales seleccionados.b.

Clasificados correctamente el 83.3% de casos agrupados originales no seleccionados.c.

Clasificados correctamente el 80.0% de los casos agrupados validados mediante validación cruzadaseleccionados.

d.

Proporción de aciertos

• Porcentaje de casos bien clasificados.

• Se suman los elementos de la diagonal y se dividen entre el total de casos.

• Se espera que el porcentaje de sujetos bien clasificados con el AD sea por lo menos 25% mayor que el obtenido al azar.

Resultado de la clasificación

• Sujetos originales: 90% (27/30)– Inflada artificialmente, pues los datos de la estimación

son los mismos para la validación.• Validación cruzada: 80% (24/30).• Muestra de validación: 83.33 % (10/12).• Dados dos grupos del mismo tamaño, uno

esperaría por obra de la casualidad una proporción de aciertos de ½ = 50%.

• La mejora sobre el azar es de más de 25 % y se considera satisfactoria la validez del análisis discriminante.

Usar matriz de covarianzas

• Existe la opción de clasificar los casos utilizando una matriz de covarianzas intra-grupos o una matriz de covarianzas de los grupos separados.– Intra-grupos. Se utiliza la matriz de covarianza intra-

grupos combinada para clasificar los casos.– Grupos separados. Para la clasificación se utilizan

las matrices de covarianza de los grupos separados. Dado que la clasificación se basa en las funciones discriminantes y no en las variables originales, esta opción no siempre es equivalente a la discriminación cuadrática.

Evaluar riesgo crediticio

• Si usted es un oficial de préstamos en un banco, quiere poder identificar las características que indican si las personas van a fallar o no en un préstamo, y quiere usar esas características para identificar buenos y malos riesgos crediticios.

• 700 clientes a los que se les otorgó un préstamo.

• 150 prospectos

Preparando los datos para el análisis

• El establecer una semilla aleatoria le permite replicar la selección aleatoria de sujetos en este análisis.


• Para crear la variable de selección para validación.

• rv.bernoulli(0.7) • Esto hace que los valores

a validar sean generados aleatoriamente con una distribución Bernoulli y un parámetro de probabilidad de 0.7


• Sólo quiere usar “validar” con los sujetos que podrían ser usados para el modelo; es decir, los clientes previos.

• Sin embargo, hay 150 personas que corresponden a clientes potenciales en el archivo de datos.

• Para hacer los cálculos sólo para los clientes previos, use el botón Si…

• MISSING(impago) = 0


• Esto asegura que “validar” sólo se calculará para los sujetos sin valores perdidos en “impago”; es decir, para los clientes que recibieron previamente un préstamo.

• Aproximadamente el 70% de los clientes a los que se les había dado un préstamos tendrán un valor de 1.

• Estos clientes serán usados para crear el modelo.• Los clientes restantes a los que previamente se les había dado un

préstamo serán usados en la muestra de validación

Estadísticos

validar700

150

Válidos

Perdidos

N

validar

201 23.6 28.7 28.7

499 58.7 71.3 100.0

700 82.4 100.0

150 17.6

850 100.0

.00

1.00

Total

Válidos

SistemaPerdidos

Total

Frecuencia PorcentajePorcentaje

válidoPorcentajeacumulado

Corriendo el análisis

• Variable de criterio:• Impagos anteriores (0,1)

• Variables de pronóstico• Años con la empresa actual• Años en la dirección actual• Tasa de deuda sobre ingresos (x100)• Deuda de la tarjeta de crédito en miles

• Validar (1)

Botón Estadísticos

Botón Clasificar

Botón Guardar

Clasificando clientes como bajo o alto riesgo crediticio

• Las funciones de clasificación son usadas para asignar personas a los grupos.

• Hay una función separada para cada grupo. Para cada sujeto, se calcula una puntuación discriminante para cada función.

• El modelo discriminante asigna el sujeto al grupo cuya función de clasificación obtuvo la puntuación más alta.

Coeficientes de la función de clasificación

.277 .109

.145 .085

.291 .386

-.734 -.303

-3.485 -3.676

Años con la empresaactual

Años en la direcciónactual

Tasa de deuda sobreingresos (x100)

Deuda de la tarjeta decrédito en miles

(Constante)

No Sí

Impagos anteriores

Funciones discriminantes lineales de Fisher


• Los coeficientes para “Años con la empresa actual” y “Años en la dirección actual” son más pequeños para la función de clasificación SI, lo que significa que los clientes que vivieron en la misma dirección y trabajaron en la misma compañía por muchos años son menos propensos a incumplir con su pago de la deuda.

• De manera similar, los clientes con mayor deuda son más propensos a fallar.

Coeficientes de la función de clasificación

.277 .109

.145 .085

.291 .386

-.734 -.303

-3.485 -3.676





(Constante)

No Sí

Impagos anteriores

Funciones discriminantes lineales de Fisher


• Por ejemplo, considere el sujeto 701 y 703• El sujeto 701 ha tenido el mismo empleo por 16 años,

vivido en su domicilio actual por 13 años, y ha tenido una deuda equivalente al 10.9% de su ingreso, $540 de los cuales es de tarjeta de crédito.


• El modelo discriminante predice que hay sólo cerca de un 8% de probabilidad que la persona no pagará el préstamo, por lo que es un buen riesgo crediticio.

• El sujeto 703 ha tenido el mismo trabajo y vivido en la misma dirección por menos años y tiene más deudas, por lo que el modelo lo ve como un pobre riesgo crediticio.

Verificando supuestos

Colinealidad de las variables de pronóstico

• La Matriz de correlación intra-grupos muestra las correlaciones entre las variables de pronóstico.

• Las correlaciones más grandes ocurren entre Deuda de crédito en miles y las otras variables, pero es difícil decir si son lo suficientemente grandes como para preocuparse.

• Observe las diferencias entre la Matriz de estructura y los coeficientes estandarizados para estar seguro.

Matrices intra-grupo combinadas

1.000 .286 .104 .508

.286 1.000 .140 .290

.104 .140 1.000 .508

.508 .290 .508 1.000





Correlación

Años con laempresa

actual

Años en ladirección

actual

Tasa dedeuda sobre

ingresos(x100)

Deuda dela tarjetade créditoen miles

Correlación de las medias y varianzas de grupo

Estadísticos de grupo

9.5840 6.67766 375 375.000

8.8800 6.94239 375 375.000

8.8179 5.69545 375 375.000

1.2554 1.41769 375 375.000

5.1855 5.72737 124 124.000

6.3548 6.27836 124 124.000

14.4468 7.97554 124 124.000

2.3656 3.36732 124 124.000

8.4910 6.72386 499 499.000

8.2525 6.86476 499 499.000

10.2166 6.78238 499 499.000

1.5313 2.13087 499 499.000













Impagos anterioresNo

Sí

Total

Media Desv. típ.No


N válido (según lista)

Problema de heteroscedasticidad

• La tabla de estadísticos de grupo revela un problema potencialmente más serio.

• Para las cuatro variables de pronóstico, las medias de grupo más grandes están asociadas con desviaciones estándar mayores.

• En particular, observe “Tasa de deuda sobre ingresos” y “Deuda de la tarjeta de crédito en miles” para las cuales las medias y las desviaciones estándar para el grupo SI son considerablemente mayores.

• En análisis posteriores, podría considerar usar valores transformados de estas variables.

Homogeneidad de las matrices de covarianza

• Logaritmos del determinante son medidas de la variabilidad de los grupos. Entre más grandes los valores, los grupos tendrán mayor variabilidad.

• Grandes diferencias en los logaritmos de los determinantes indican grupos que tienen diferentes matrices de covarianza.


4 11.185

4 12.253

4 11.957


Sí





252.117

24.893

10

245917.2

.000

M de Box

Aprox.

gl1

gl2

Sig.

F


Homogeneidad de las matrices de covarianza

• La M de Box prueba el supuesto de igualdad de covarianzas entre los grupos.

• Ya que la prueba es significativa, debería requerir matrices separadas para ver si esto da resultados de clasificación radicalmente diferentes.


4 11.185

4 12.253

4 11.957


Sí





252.117

24.893

10

245917.2

.000

M de Box

Aprox.

gl1

gl2

Sig.

F


Evaluado la contribución de las variables de pronóstico

• Hay varias tablas que evalúan la contribución de cada variable de pronóstico al modelo, incluyendo – Pruebas de igualdad de las medias de los

grupos,– Coeficientes estandarizados de la función

discriminante– Matriz estructura.


• Mide el potencial de cada variable de pronóstico antes de crear el modelo. Cada prueba muestra los resultados de un ANOVA para la variable de pronóstico usando la variable de criterio como factor.

• Si el p-valor es mayor a 0.10, la variable probablemente no contribuye al modelo.

• En este ejemplo, cada variable es significativa en el modelo discriminante.


.920 43.262 1 497 .000

.975 12.911 1 497 .000

.871 73.534 1 497 .000

.949 26.597 1 497 .000







• Lambda de Wilks es otra medida del potencia de una variable. Valores más pequeños indican que la variable es mejor al discriminar entre grupos.

• La tabla sugiere que “Tasa de deuda sobre ingresos (x100)” es la mejor, seguida por “Años con la empresa actual”, Deuda en tarjeta de crédito en miles” y “Años en la dirección actual”


.920 43.262 1 497 .000

.975 12.911 1 497 .000

.871 73.534 1 497 .000

.949 26.597 1 497 .000






Coeficientes estandarizados de la función discriminante

• Los coeficientes estandarizados le permiten comparar variables medidas en diferentes escalas.

• Los coeficientes con mayo valor absoluto corresponden a variables con mayor capacidad discriminante.

• Esta tabla le baja importancia a “Tasa..” pero el orden se conserva.

Coeficientes estandarizados de lasfunciones discriminantes canónicas

-.784

-.295

.437

.649





1

Función


• Muestra la correlación de cada variable de pronóstico con la función discriminante.

• El orden es el mismo que el sugerido en las pruebas de igualdad de las medias de los grupos y es diferente del mostrado en la tabla de coeficientes estandarizados.


.644

-.494

.387

-.270





1

Función


¿Por qué la discrepancia?• La discrepancia se deba a la

colinealidad entre Años con la empresa actual y Deuda de la tarjeta de crédito en miles observada en la matriz de correlación.

• Ya que la matriz de estructura no se ve afectada por la colinealidad, es seguro decir que esta colinealidad ha inflado la importancia de “Años con la empresa actual” y “Deuda con la tarjeta de crédito en miles” en la tabla de coeficientes estandarizados.

• Por tanto, es “Tasa de deuda sobre ingresos (x100) la que mejor discrimina entre los que cumplen y los que no cumplen con la deuda.


.644

-.494

.387

-.270





1

Función


Evaluando el ajuste del modelo

• Además de las medidas para verificar la contribución de las variables de pronóstico a su modelo discriminante, se proveen la tabla de autovalores y la tabla de Lambda de Wils para ver qué tan bien se ajusta de manera global el modelo discriminante a los datos.

Autovalores

• Provee información acerca de la eficacia relativa de cada función discriminante.

• Cuando hay dos grupos, la correlación canónica es la medida más útil en la tabla, y es equivalente a la correlación de Pearson entre las puntuaciones discriminantes y los grupos.

Autovalores

.357a 100.0 100.0 .513Función1

Autovalor % de varianza % acumuladoCorrelacióncanónica

Se han empleado las 1 primeras funciones discriminantescanónicas en el análisis.

a.

Lambda de Wilks

• Mide qué tan bien cada función separa los sujetos en los grupos. Es igual a la proporción de la varianza total en las puntuaciones discriminantes no explicada por las diferencias entre los grupos.

• Valores más pequeños indican mayor poder discriminador de la función.

Lambda de Wilks

.737 151.007 4 .000



Lambda de Wilks

• El estadístico Chi-cuadrado asociado prueba la hipótesis que las medias de las funciones enlistadas son iguales entre los grupos.

• El p-valor pequeño indica que la función discriminante hace un mejor trabajo que el azar al separar los grupos.

Lambda de Wilks

.737 151.007 4 .000



Validación del modeloResultados de la clasificaciónb,c,d

281 94 375

30 94 124

74.9 25.1 100.0

24.2 75.8 100.0

278 97 375

31 93 124

74.1 25.9 100.0

25.0 75.0 100.0

106 36 142

10 49 59

95 55 150

74.6 25.4 100.0

16.9 83.1 100.0

63.3 36.7 100.0


Sí

No

Sí

No

Sí

No

Sí

No

Sí

Casos desagrupados

No

Sí

Casos desagrupados

Recuento

%

Recuento

%

Recuento

%

Original


Original

Casos seleccionados


No Sí


Total


a.



Clasificados correctamente el 74.3% de los casos agrupados validados mediante validación cruzada seleccionados.d.

Muestra de validación inicial

• La tabla de clasificación muestra los resultados prácticos de usar el modelo discriminante.

• De los casos usados para crear el modelo, 94 de 124 personas que no pagaron son clasificadas correctamente. 281 de 375 cumplidos son clasificados correctamente.

• 75.2% de los sujetos de la muestra de estimación fueron clasificados correctamente.

• La clasificación basada en los sujetos usados para crear el modelo tienden a ser muy “optimista” en el sentido que su tasa de clasificación es inflada.

Muestra de validación final

• La clasificación cruzada intenta corregir esto al clasificar cada sujeto mientras se deja afuera de los cálculos del modelo; sin embargo, este método es generalmente todavía más “optimista”.

• La muestra de validación final se obtiene al clasificar los clientes pasados que no fueron usados para crear el modelo.

• 77.1% de los sujetos no seleccionados en la estimación son clasificados correctamente por el modelo.

• Esto sugiere que, de manera global, su modelo es de hecho correcto en 3 de 4 veces.

• Los 150 sujetos desagrupados son los clientes prospectos, y los resultados simplemente dan una tabla de frecuencias del grupo al que son asignadas estas personas.

Especificando Matriz de covarianza de grupos separados.

• Ya que la M de Box es significativa, es útil correr un segundo análisis para ver si usar una matriz de covarianzas de grupos separados cambia la clasificación

Advertencia

La opción SEPARATE implica efectuar la clasificación en función de las matrices decovarianzas de los grupos para las funciones canónicas discriminantes, y no las delas variables originales. Si hay menos funciones que variables, esto puede generardiferencias.

Resultados de la clasificacióna,b

287 88 375

31 93 124

76.5 23.5 100.0

25.0 75.0 100.0

107 35 142

10 49 59

96 54 150

75.4 24.6 100.0

16.9 83.1 100.0

64.0 36.0 100.0


Sí

No

Sí

No

Sí

Casos desagrupados

No

Sí

Casos desagrupados

Recuento

%

Recuento

%

Original

Original

Casos seleccionados


No Sí


Total

Clasificados correctamente el 76.2% de los casos agrupados originales seleccionados.a.

Clasificados correctamente el 77.6% de casos agrupados originales no seleccionados.b.

• Los resultados de clasificación no han cambiado mucho, por lo que probablemente no es de utilidad o valor el usar matrices de covarianzas separadas.

• La M de Box puede ser muy sensible a archivos grandes de datos, que es justo lo que está pasando aquí.

Ajustando las probabilidades previas

• Muestra las probabilidades previas de pertenecer a un grupo.• A menos que se especifique otra cosa, se asume que un sujeto

tiene la misma probabilidad de ser cumplido o incumplido.• Las probabilidades previas son usadas junto con los datos para

determinar las funciones de clasificación. Al ajustar las probabilidades previas de acuerdo con los tamaños de los grupos puede mejorar la tasa de clasificación global.


.500 375 375.000

.500 124 124.000

1.000 499 499.000


Sí

Total

PreviasNo





.752 375 375.000

.248 124 124.000

1.000 499 499.000


Sí

Total

PreviasNo




Resultados de la clasificaciónb,c,d

356 19 375

75 49 124

94.9 5.1 100.0

60.5 39.5 100.0

355 20 375

77 47 124

94.7 5.3 100.0

62.1 37.9 100.0

137 5 142

31 28 59

130 20 150

96.5 3.5 100.0

52.5 47.5 100.0

86.7 13.3 100.0


Sí

No

Sí

No

Sí

No

Sí

No

Sí

Casos desagrupados

No

Sí

Casos desagrupados

Recuento

%

Recuento

%

Recuento

%

Original


Original

Casos seleccionados


No Sí


Total


a.



Clasificados correctamente el 80.6% de los casos agrupados validados mediante validación cruzada seleccionados.d.


• Las probabilidades previas ahora están basadas en los tamaños de los grupos.

• Previamente, el 75.2% de los sujetos son cumplidores, por lo que las funciones de clasificación ahora serán ponderadas de manera más cargadas a favor de clasificar sujetos cumplidores.

• La tasa global de clasificación es más alta para estas clasificaciones que para aquellas basadas en probabilidades previas iguales.

• Desafortunadamente, esto bajo el costo de clasificar mal un mayor porcentaje de incumplidores.

• Si necesita ser conservador en sus préstamos, entonces su meta es identificar a los incumplidores y mejor usaría probabilidades iguales. Si puede ser más agresivo en sus préstamos, entonces puede usar probabilidades desiguales.

Problemas que surgen del AR• Cuando se usa el análisis discriminante, es posible encontrar

problemas y dificultades que dan lugar a resultados imprecisos o engañosos.1. Se empleó un tamaño de muestra inadecuado. Debe ser por lo

menos el doble o el triple del número de variables aplicadas en la ecuación de regresión.

2. Las variables de pronóstico no se midieron adecuadamente durante el estudio, están mal expresadas o no fueron las correctas. En síntesis, no son las que tienen un efecto directo en la variable de criterio.

3. Multicorrelación (Variables de pronóstico muy correlacionadas.4. La verdadera relación entre la variable criterio y las de pronóstico

es no lineal, o tiene una forma poco usual.5. Los datos de la variable de criterio pueden ser de escasa

calidad, especialmente si las categorías fueron establecidas subjetivamente (por ejemplo: buenas/malas o cómodas/incómodas) y no objetivamente (cumplieron cuota/ no cumplieron)

Resumen

• Usando Análisis Discriminante, ha creado un modelo que clasifica a los clientes en alto y bajo riesgo crediticio.

• La M de Box mostró un posible problema con la heterogeneidad de las matrices de covarianza, aunque después de indagar un poco más, se descubrió que esto era probablemente un efecto del tamaño del archivo de datos.

• El uso de probabilidades previas desiguales para tomar ventaja del hecho que los cumplidores son más que los incumplidos resultó en una tasa de clasificación global mayor, pero con el costo de clasificar mal más incumplidos como cumplidos.

EJERCICIOS

• Considere los siguientes grupos de consumidores. El grupo 1 (G1) realiza sus compras en shoopings y el grupo 2 (G2) en outlets. Queremos establecer las diferencias de comportamiento entre estos dos grupos en base al ingreso y al número de compras que realizan en el año para poder decidir si un consumidor que tiene un ingreso de 60,000 y que realiza 25 compras por año puede clasificarse en alguno de esto dos grupos.

• La siguiente tabla muestra los datos para estas variables:

Grupo 1 Grupo 2Observaciones Ingreso Compras Ingreso Compras

1 60 18,4 75 19,62 85,5 16,8 52,8 20,83 64,8 21,6 64,8 17,24 61,5 20,8 43,2 20,45 87 23,6 84 17,66 110,1 19,2 49,2 17,67 108 17,6 59,4 168 82,8 22,4 66 18,49 69 20 47,4 16,410 93 20,8 33 18,811 51 22 51 1412 81 20 63 14,8

Piscinas

• Supongamos que la Compañía Piscinas Amir ha reunido datos de ingreso y tamaño de terrenos de grupos de propietarios de piscina y no propietarios, quienes viven en el sureste de Pennsilvania. Además, hay datos disponibles para cada grupo sobre actitudes hacia los baños de sol, en escala de 0 (detestar los baños de sol hasta 10 = extremadamente aficionado a tomar baños de sol.)

• Obtener un análisis discriminante• Probar si el modelo el bueno para pronosticar• Validar el modelo con dos métodos de

validación• A qué grupo pertenece una persona con las

siguientes características:– Ingreso anual: $12,000– Tamaño de terreno: 42,000 pie2

– Actitud hacia los baños de sol: 8

Calidad de profesor

• Se dice que en la Universidad de Texas no existen maestros intermedios, es decir, o son buenos o son malos; por lo que se analizaron 20 maestros con base en su capacidad docente (metodología de enseñanza, exámenes representativos, calificaciones justas), experiencia en el área de la materia y conocimiento en la misma; todo esto en una escala del 1-5 donde el uno significa bueno y el cinco malo, para ver si realmente se segmentaba de esta forma.

• Obtener el modelo discriminante• Probar si el modelo es bueno para segmentar

Resúmenes de casos

Bueno 1 1 1

Bueno 1 2 1

Bueno 1 1 1

Bueno 2 1 2

Bueno 1 1 1

Bueno 3 2 1

Bueno 1 1 1

Bueno 1 1 1

Bueno 2 1 1

Bueno 2 3 1

Malo 3 4 3

Malo 4 5 5

Malo 4 5 2

Malo 5 4 5

Malo 5 4 2

Malo 5 5 4

Malo 5 5 3

Malo 5 5 5

Malo 4 5 4

Malo 4 4 5

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

Calidad delprofesor

Capacidaddocente

Experienciaen el área

Conocimientode la materia

Preguntas

• Dé un ejemplo real o hipotético en el cual el análisis discriminatorio pudiera ser útil en el análisis de los datos de mercadotecnia.

• ¿Cuáles variables de pronóstico piensa que pudieran ser útiles para separar a los amantes de las caminatas y a los que no practican este deporte? Escoja dos variables cualesquiera de éstas y construya un diagrama de dispersión hipotético (utilice su imaginación) en un espacio bidimensional. Incluya una línea discriminatoria.

• Explique qué se entiende por cada uno de los siguientes conceptos: función discriminatoria, centroide, clasificación errónea.

• En la siguiente ilustración gráfica de un análisis discriminante de dos grupos:– ¿Cuáles líneas describen las dos dimensiones en que los

miembros del grupo han sido medidos?– ¿A lo largo de cuál línea está maximizada la variabilidad entre

grupos, dividida por la variabilidad dentro de grupo?– ¿Cuál línea representa el eje discriminante?– Suponiendo que queremos clasificar a los consumidores en los

grupos respectivos de modo que haya un mínimo de costo conexo con el error de clasificar a una persona en el grupo B cuando en realidad pertenece al grupo A, ¿Qué línea quisiéramos utilizar como base para la clasificación?

• Cuando se realiza un análisis discriminante en dos dimensiones, una línea discriminante sirve de límite al hacer las clasificaciones. ¿Qué forma de “divisor” geométrico habrá en un espacio de dos variables? ¿En un espacio de tres variables? ¿Y en un espacio de cuatro variables?

• Después de usar los datos de 100 personas para construir una función discriminante, un investigador prueba la función al determinar cuántos de esos 100 sujetos están clasificados correctamente. ¿Qué debilidad conlleva este procedimiento?

Documents

Clasificación con Análisis Discriminante