View
24
Download
2
Category
Preview:
DESCRIPTION
Examen Ing. Sistemas
Citation preview
EXAMEN UNIDAD 3EAP: Ing. Sistemas e Informtica Anlisis Multidimensional Ejercicio 1: Se elabor un test que tienen 04 escalas de tem. Se considera que las cuatro escalas sirven para diagnosticar, para discriminar entre paranoides, alcohlicos y personalidad lmite. Se eligieron 05 sujetos por grupo. Los datos son los siguientes:Paranoide E1 E2 E3 E4Alcohlicos E1 E2 E3 E4Personalidad Lmite E1 E2 E3 E4
5 8 7 2 4 9 6 5 6 7 6 3 8 8 9 2 7 8 7 3 7 4 6 8 5 4 7 9 8 2 6 6 6 3 5 9 4 2 6 8 4 4 1 6 8 2 3 5 7 3 2 5 5 2 1 4 6 4 3 5
Realice el Anlisis Discriminante e interpretar los resultados.
Mi variable de clasificacin fue ITEMSe definio el valomr minimo y mximo de sus categoras, que son 1 y 4Todas las variables sobrantes se colocaron dentro de la independientes del anlisis discriminante. Adems se selecciono el mtodo de paso a paso, ya que se realiza la introduccin de las variables explicativas en funcin de sus niveles de significancia.Dentro del anlisis discriminante, en el modo estadstico se evalu el lado descriptivo, dentro de esta la medias, y los ANOVAs univariados ya que muestran un anlisis de varianza para comprobar que las medidas de las variables explicativas son diferentes en los grupos.Mientras que en la zona de coeficientes de la funcin se uso la de Fisher y la de No tipificados para hacer predicciones sobre futuras observaciones. Ambos coeficientes producen las mismas predicciones.Siguiendo con mi desarrollo de analisis discriminantes en la zona de clasificacion seleccin dentro de vizualizacion que se muestre la tabla de resumen, ya que infroma el grado de predccion del modelo.
Estadsticos de grupo
ITEMMediaDesv. tp.N vlido (segn lista)
No ponderadosPonderados
E1Paranoide6,001,58155,000
Alcohlicos6,001,58155,000
Personalidad_Limite6,001,58155,000
E2Paranoide8,00,70755,000
Alcohlicos3,001,00055,000
Personalidad_Limite3,001,00055,000
E3Paranoide7,001,22555,000
Alcohlicos6,00,70755,000
Personalidad_Limite2,001,00055,000
E4Paranoide3,001,22555,000
Alcohlicos8,001,22555,000
Personalidad_Limite5,00,70755,000
TotalParanoide6,002,2242020,000
Alcohlicos5,752,1242020,000
Personalidad_Limite4,001,9192020,000
Aqu se muestra la diferencia entre las variables explicativas, la visualizacion de las medias tiene utilidad limitada pero revela que el grupo que aceptaria la oferta del servicio es aproximadamente EN E2 PARANOIDE ES MAYOR A LAS DEMAS CON 8.00EN E4 ALCOHOLICOS ES MAYOR A LAS DEMAS CON 8.00EN E1 PERSONALIDAD_LIMITE ES MAYOR CON 6.00 QUE EN LAS DEMAS .E2e2
Pruebas de igualdad de las medias de los grupos
Lambda de WilksFgl1gl2Sig.
Paranoide,25515,556316,000
Alcohlicos,25715,455316,000
Personalidad_Limite,28613,333316,000
En la siguiente tabla, nos proporciona pistas acerca de cuales variables explicativas nos van hacer utiles en nuestra funcion discriminante.Como se conoce se debe buscar la variable mas significativa, en la columna de lambda tendra que ser la menor y en la columna de F tendra que ser el mayor, asi vemos que es la variable PARANOIDE la mas significativa ademas porque esta en la columna de Sig tiene un valor de .000. Y TIENE LA MENOR LAMBDA CON 0.255 Y MAYOR EN F CON 15,556
Esta tabla muestruna lista de las variables mas significativas , ignorando las dems.La variable PARANOIDE se introduce en primer lugar seguida de PERSONALIDAD_LIMITE y ALCOHOLICOS.Se aprecia que ningina de las demas variables creo una diferencia significativa despues de ajustarse a las primeras tres variables.
Variables en el anlisis
PasoToleranciaF para salirLambda de Wilks
1Paranoide1,00015,556
2Paranoide,86711,247,286
Personalidad_Limite,8679,518,255
3Paranoide,8604,257,080
Personalidad_Limite,8548,938,121
Alcohlicos,9845,184,088
En la siguiente tabla se muestra las variables incluidas en el analisis en cada paso.Tolerance: Mide el grado de independencia de las variables explicativas (que no se parezcan), una tolerancia entre 0,7 y 1 es lo ideal, pero una tolerancia entre 0 y 0,69 problemas.Asi que esas 3 variables son las mas importantes para la prediccion de la funcion discriminante.
Variables no incluidas en el anlisis
PasoToleranciaTolerancia mn.F para entrarLambda de Wilks
0Paranoide1,0001,00015,556,255
Alcohlicos1,0001,00015,455,257
Personalidad_Limite1,0001,00013,333,286
1Alcohlicos,998,9985,512,121
Personalidad_Limite,867,8679,518,088
2Alcohlicos,984,8545,184,042
En esta tabla , nos proporciona informacin sobre las variables que compiten por entrar en la ecuacin, En cada paso se introduce la variable con menor lambda o con mayor F.Podemos ver lo que ya afirmamos arriba que la variable PARANOIDE se introduce primero, luego PERSONALIDAD_LIMITE y ALCOHOLICOS , Las dems variables estn fuera del rango de introduccin y extraccin de la F (2,71 3,84)
Proporciona un test mutivariado de diferencias significativas entre los grupos. Si este test no fuera significativo mayor a 0,05(en este caso es altamente significativo), no tendramos base suficiente para proceder con el DA.
Autovalores
FuncinAutovalor% de varianza% acumuladoCorrelacin cannica
dimension015,587a72,572,5,921
21,838a23,896,3,805
3,284a3,7100,0,470
Esta tabla mide la fuerza de relacin entre la variable predictora y los grupos. Se han empleado las 3 primeras funciones discriminantes cannicas en el anlisis.
Coeficientes estandarizados de las funciones discriminantes cannicas
Funcin
123
Paranoide-,561,485,783
Alcohlicos,689-,170,716
Personalidad_Limite,3051,030,134
En la siguiente tabla, se intenta cuantificar la importancia relativa de cada predictor en la funcin discriminante. De modo no sorprendente la variable PARANOIDE es otra vez el factor dominante, seguido por ALCOHOLICOS y PERSONALIDAD_LIMITE.Los signos debemos interpretarlos de la misma manera, Coeficientes elevados, tanto positivos como negativos, sern los que mas contribuirn a la discriminacin de las funciones.
Matriz de estructura
Funcin
123
Alcohlicos,684*-,289,669
Personalidad_Limite,444,869*-,220
Paranoide-,702,116,703*
Correlaciones intra-grupo combinadas entre las variables discriminantes y las funciones discriminantes cannicas tipificadas Variables ordenadas por el tamao de la correlacin con la funcin.
*. Mayor correlacin absoluta entre cada variable y cualquier funcin discriminante.
En la tabla muestra las correlaciones entre cada vairable y la funcin discriminante
Funciones en los centroides de los grupos
ITEMFuncin
123
E1,6921,805,392
E2-2,804,270-,521
E3-,856-1,482,552
E42,968-,593-,424
Funciones discriminantes cannicas no tipificadas evaluadas en las medias de los grupos
En esta tabla se determina las caracteristicas diferenciadoras de cada grupo, son el punto medio de cada grupo
Coeficientes de las funciones cannicas discriminantes
Funcin
123
Paranoide-,458,396,639
Alcohlicos,588-,145,611
Personalidad_Limite,272,921,120
(Constante)-1,722-5,224-7,826
Coeficientes no tipificados
Es esta tabla los coeficiente se pueden emplear para la prediccion de si aceptaran el servicio o si no lo aceptara
Coeficientes de la funcin de clasificacin
ITEM
E1E2E3E4
Paranoide6,9307,3396,4404,418
Alcohlicos5,4163,0285,0826,603
Personalidad_Limite8,1145,6384,6846,427
(Constante)-62,767-43,742-43,856-50,494
Funciones discriminantes lineales de Fisher
Esta tabla muestra los coeficientes de la funcion clasificacion(llamados coeficientes de clasificacion de fisher) utilizados para clasificar ITEM
Resultados de la clasificacina
ITEMGrupo de pertenencia pronosticadoTotal
E1E2E3E4
OriginalRecuentoE140015
E205005
E300505
E400055
%E180,0,0,020,0100,0
E2,0100,0,0,0100,0
E3,0,0100,0,0100,0
E4,0,0,0100,0100,0
a. Clasificados correctamente el 95,0% de los casos agrupados originales.b.
EL MODELO ES PRECISO EN UN 95% DE LOS CASOS, LO CUAL ES EXCELENTE
Ejercicio 2: En un estudio realizado por una compaa encuestadora a las regiones de: 1. Ancash2. La libertad3. Puno4. Cuzco5. Tumbes6. Tacna7. Cajamarca8. Piura9. Lima10. Arequipa11. Hunuco 12. Amazonas. Esta tiene las siguientes caractersticas medibles las cuales son ndice exportacin agrcola, ndice de produccin industrial, ndice de mortalidad, ndice de natalidad, poblacin alfabetizada, nmero de viviendas de material noble, numero de colegios e ndice de pobreza.
RegionesExportacProduccMortalidNatalidadPob_AlfabViviendasColegiosPobrez
127,8847,0762,2628,7620,51291571581,94
264,9245,8028,4974,8950,32267973855,82
375,2030,3221,9978,6333,41260863466,62
444,9541,6543,3560,0968,99112372381,55
537,4098,9781,3844,2149,44206575451,66
689,7276,1322,8249,3441,99231372753,60
733,9143,5694,6770,3142,70145367380,73
899,1221,9640,3563,4760,57219059723,04
953,3043,3593,1635,5175,31250269628,28
1051,5170,4065,3946,7339,20187177382,47
1162,7272,9083,6320,1159,63240051279,85
1253,3292,4294,6370,1874,07169766648,30
Realice el Anlisis de Cluster e interpretar los resultados.
Solucin 02:Anlisis Cluster de los Modelos Jerrquicos con SPSS Matriz de distancias: Esta matriz seala las distancias entre los individuos (ndice de exportacin agrcola, ndice de produccin industrial, ndice de mortalidad, ndice de natalidad, poblacin alfabetizada, nmero de viviendas de material noble, numero de colegios e ndice de pobreza..) segn la distancia eucldea al cuadrado. Esta matriz es simtrica y si la observamos veremos que el primer cluster observado estar formado por aquellos regiones ms cercamos (con menor distancia entre ellos) que son 1.1 y 5.5.
Matriz de distancias
Caso distancia eucldea al cuadrado
1:1 2:2 3:3 4:4 5:5 6:6 7:7 8:8 9:9 10:10 11:11 12:12
1:1 ,00015,06316,64123,36213,59217,22415,71833,36620,2628,66518,24829,032
2:2 15,063,0003,96413,01113,7395,41715,08311,17013,9739,77424,39215,756
3:3 16,6413,964,00017,78923,5118,83516,23610,04122,75015,08123,08923,730
4:4 23,36213,01117,789,00014,70116,3217,02221,64318,1388,09322,86112,249
5:5 13,59213,73923,51114,701,00011,43511,80827,80710,9274,79217,3016,715
6:6 17,2245,4178,83516,32111,435,00020,60912,44016,7608,31219,49416,395
7:7 15,71815,08316,2367,02211,80820,609,00024,94717,9546,92219,17010,788
8:8 33,36611,17010,04121,64327,80712,44024,947,00013,68625,69823,25120,210
9:9 20,26213,97322,75018,13810,92716,76017,95413,686,00016,10615,40510,686
10:10 8,6659,77415,0818,0934,7928,3126,92225,69816,106,00017,52012,426
11:11 18,24824,39223,08922,86117,30119,49419,17023,25115,40517,520,00016,892
12:12 29,03215,75623,73012,2496,71516,39510,78820,21010,68612,42616,892,000
Esta es una matriz de disimilaridades
2 Historial de conglomeracin: Nos va indicando el orden de las uniones y la distancia a la que lo hacen. Por ejemplo: Las dos columnas primeras columnas indican cuando se forman por primera vez un multicluster, es decir, un grupo de ms de dos individuos, que son el paso 2 con 2 y 5, con un valor de 3,964 y 4,792 respectivamente. Asi respectivamente.
Historial de conglomeracin
EtapaConglomerado que se combinaCoeficientesEtapa en la que el conglomerado aparece por primera vezPrxima etapa
Conglomerado 1Conglomerado 2Conglomerado 1Conglomerado 2
dimension01233,964004
25104,792005
3477,022006
4267,126107
55129,571206
64510,760358
72811,217409
84914,762609
92417,6777811
1011118,2480011
111219,6151090
3 Dendograma: En el Dendograma la distancia de agrupamiento aparece en el eje y los sujetos en el otro En nuestro ejemplo, en la primera etapa, se agrupan las regiones 2.2 y 3.3, despus las regiones 6.6:, 8.8; y 4.4.
Luego de haber visto el Dendograma repetimos el procedimiento y a travs de la opcin Guardar se le puede indicar que se guarde en forma de nuevas variables el grupo al que estara asociado cada pas. Por ejemplo podemos pedirle que se agrupe a los pases en tres grupos.
Cluster 1Cluster 2Cluster 3
LetoniaLituaniaEstoniaRepblica ChecaHungraPolonia Eslovaquia
Ejercicio 3: En la tabla siguiente se presentan las distancias, en kilmetros, entre las 8 ciudades europeas indicadas.MadridParisBruselasAmst.BerlnRomaLisboaLondres
Madrid0126015561735236020666441725
Paris12600296475110014371792465
Bruselas1556296019878915452088374
Amst.1735475198068517662267344
Berln23601100789685015292892996
Roma20661437154517661529027301902
Lisboa6441792208822672892273002257
Londres1725465374344996190222570
Realice el Anlisis Multidimensional e interpretar los resultados.
Escala inicial
Iteraciones para dos dimensiones
Coordenadas segn estmulos
Datos ptimamente escalados
Prueba de Bondad de Ajuste y StressMedidas de ajuste y stress
Stress bruto normalizado,00371
Stress-I,06088a
Stress-II,12992a
S-Stress,00683b
Dispersin explicada (D.A.F.),99629
Coeficiente de congruencia de Tucker,99815
PROXSCAL minimiza el stress bruto normalizado.
a. Factor para escalamiento ptimo = 1.004.
b. Factor para escalamiento ptimo = .990.
Como nuestro S-stress es bajo con un 0,006 podemos afirma que nuestros datos sirven para realizar un escalamiento multidimensional.6. Matriz de CoordenadasCoordenadas finales
Dimensin
12
Madrid,729,275
Paris-,195,322
Brucelas-,572,096
Berlin-,443-,343
Amsterdam-,427,137
Lisboa1,106-,001
Roma,151-,690
Londres-,350,203
En la tabla anterior se muestran las coordenadas de la ubicacin de cada ciudad de Europa.Grfica de las dimensiones encontradas
Recommended